LLM 相關三個月內文章 / 第 102 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

研究發現,醫學系新生用 ChatGPT-4.0 或線上資源,當下小考成績比只用校內教材的同學好。不過,一週後大家的知識保留差不多。也就是說,ChatGPT-4.0 有助於短期表現,但對短期記憶沒特別優勢,長期效果還要再研究。 相關文章 PubMed DOI 推理

這篇論文提出 UniMRE 架構,結合大型語言模型與醫學知識,能在標註資料很少的情況下,有效從非結構化文本中抽取醫療關係。UniMRE 會自動產生標籤並優化結果,實驗證明表現優於現有方法。 相關文章 PubMed DOI 推理

這項研究發現,GPT-4能從精神科住院病人的臨床紀錄中,準確評估RDoC症狀維度,且與臨床結果如住院天數、再入院風險有顯著關聯。顯示大型語言模型有潛力協助精神醫學研究與臨床照護,能有效萃取重要症狀資訊。 相關文章 PubMed DOI 推理

這項研究比較了ChatGPT-3.5和30位牙周病專科醫師對10個牙周病問題的回答,並用三點式李克特量表評分。結果發現,ChatGPT的答案準確且有參考價值,顯示它未來有機會成為牙周病臨床和研究上的可靠輔助工具。 相關文章 PubMed DOI 推理

這項研究開發了一個專門針對多種癌症和不同實驗室病理報告訓練的深度學習模型,能比一般大型語言模型更準確偵測轉移性癌症。透過評估模型不確定性,將難判斷的案例交給人工審查,能進一步提升召回率。結果證明,結合客製化模型和不確定性棄權機制,可有效自動辨識病理報告中的轉移性癌症。 相關文章 PubMed DOI 推理

這篇研究評估9種大型語言模型在生醫NLP任務的信心校準能力,發現它們原本的校準表現普遍不好,可能影響實際應用安全。作者提出新指標Flex-ECE,能考慮部分正確答案,並證實用事後校準方法能大幅改善模型可信度。 相關文章 PubMed DOI 推理

2024年10月研究發現,ChatGPT幫高血壓和高LDL患者設計的飲食菜單,和地中海飲食、DASH飲食指引其實不太符合,得分都偏低。雖然AI會建議減重、運動、少鹽等,但很少提到植物固醇,也沒提到戒菸或酒精。整體來說,ChatGPT的建議還算OK,但菜單內容還不夠貼近專業指引。未來若給AI更明確、個人化的指令,效果可能會更好。 相關文章 PubMed DOI 推理

**重點整理:** 作者利用GPT-3.5產生的基因嵌入(gene embeddings),來捕捉基因體資料中的生物學資訊。他們開發了新的假說檢定方法,把這些由大型語言模型(LLM)得到的資訊納入分析,讓這些檢定在實際基因體研究中,比傳統方法更有統計效力。 相關文章 PubMed DOI 推理

這項研究發現,有加提示的ChatGPT-4o在台灣牙醫師國考口腔病理選擇題表現最佳,正確率達90%,比未加提示的ChatGPT-4o(88.6%)和ChatGPT-4(79.6%)都高。新版模型在「找出不同選項」題型特別突出,但在圖片和病例題上三者差不多。整體來說,有加提示的ChatGPT-4o最適合牙醫學生準備口腔病理學。 相關文章 PubMed DOI 推理

**重點整理:** 這項研究發現,DeepSeek-R1 語言模型在根據文字病歷描述診斷口腔疾病時,準確率高達 91.6%,表現優於 ChatGPT-4o 和人類醫師。雖然 DeepSeek-R1 無法判讀影像,但在以文字資訊輔助口腔醫學診斷方面,展現出很大的潛力。 相關文章 PubMed DOI 推理