LLM 相關三個月內文章 / 第 137 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這篇研究用資訊理論分析Transformer語言模型怎麼處理單字關係,把每一層當成資訊通道來量測資訊傳遞,並用資訊幾何在高維空間視覺化單字關聯。他們的方法比傳統attention分數更能揭露單字互動,也有助於找出Transformer各層學習時可能的問題。 相關文章 PubMed DOI 推理

這篇論文針對社群媒體等短篇非正式文本,提出辨識客觀性的任務,對資訊過濾和查證很有幫助。作者用兩階段方法,先用 OpenIE 和大型語言模型抓出主詞、謂語、受詞三個特徵,再用這些特徵輔助 BERT 或 RoBERTa 進行判斷。結果顯示,這方法比傳統模型準確率和 F1 分數都提升不少。 相關文章 PubMed DOI 推理

這篇論文提出 TSTBench,專為文字風格轉換設計的評測基準,整合13種主流方法和標準評估流程。作者在七個資料集上做了超過7000次實驗,深入分析現有挑戰,幫助解決TST領域的再現性和評估問題,為未來研究提供明確指引。 相關文章 PubMed DOI 推理

這項研究發現,把大型語言模型(像ChatGPT-4o)的洞見和傳統機器學習結合,能提升NASDAQ-100投資組合的預測表現。不同策略適合不同組合:技術面用純ML最好,基本面加LLM效果最明顯,基於熵的策略則ML和LLM混合最優。這顯示投資策略要依情境選擇合適的AI工具,對金融建模有新啟發。 相關文章 PubMed DOI 推理

這項研究發現,Google Gemini 在判斷急性胰臟炎嚴重度和治療建議上表現不錯,準確率達八成以上,且多數建議符合最新指引。不過,Gemini 有時會太早建議重症患者進食。整體來說,Gemini 有潛力成為急性胰臟炎臨床決策的輔助工具,尤其適合專科醫師不足時使用。 相關文章 PubMed DOI 推理

AI和機器學習正大幅改變加護病房決策支援,從傳統規則式進步到能早期預警和協助敗血症管理的預測模型。雖然提升照護品質,但在透明度、整合、偏誤和法規上仍有挑戰。安全有效運用需驗證、以人為本並跨領域合作。 相關文章 PubMed DOI 推理

這項研究發現,女性醫學生和醫師在用ChatGPT-4時,知識提升和自信心增加較明顯,雖然診斷準確率和滿意度與男性差不多。女性提問時AI較常出現虛構內容,但最終答案準確度仍相近。建議未來AI訓練要考慮性別差異,讓AI在醫療領域更公平有效。 相關文章 PubMed DOI 推理

ChatGPT 這類 AI 語言模型,已經用在皮膚科,幫忙解讀資料、協助診斷和提升醫病溝通。結合 CNN 等影像分析工具後,能整合文字和圖片資訊,讓診斷更精準。不過,ChatGPT 不能直接看圖,有時也會出錯,像病人隱私和醫師責任這些倫理問題還是要注意。未來有望發展更整合的 AI 系統,讓皮膚科照護更進步。 相關文章 PubMed DOI 推理

這項研究比較三種ChatGPT模型預測手腕X光骨齡和生長階段的準確度,結果都和專家評估高度一致。GPT-o1-pro骨齡預測最準,GPT-4o則在生長階段分類表現最佳。雖然還不能取代臨床判斷,但這些AI工具已展現初步評估的實用性,未來還需持續優化。 相關文章 PubMed DOI 推理

這項研究發現,Gemini 2.0的答案最容易閱讀,ChatGPT-4o和Gemini 2.0的回覆比ChatGPT-3.5更可靠、實用,且ChatGPT-4o的內容和指引最接近。整體來說,ChatGPT-4o和Gemini 2.0有機會成為風濕免疫科醫師的臨床決策好幫手。 相關文章 PubMed DOI 推理