LLM 相關三個月內文章 / 第 18 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這項研究發現,ChatGPT-4.0在ITI植牙認證考試的表現已經跟合格牙醫師差不多,明顯比ChatGPT-3.5好。雖然AI有潛力成為牙科專業的輔助工具,但還需要進一步研究,尤其是針對能看懂影像和影片的AI模型。 相關文章 PubMed DOI 推理

這項研究提出結合特徵摘要、思路鏈推理和混合型RAG架構的新提示工程方法,能提升大型語言模型判讀胸部CT報告、診斷肺部疾病的準確度。用2,965份報告測試,結果比傳統深度學習和其他提示法更準,外部驗證也表現優異。此方法不僅提升可解釋性,也有助臨床更精確診斷。 相關文章 PubMed DOI 推理

AI,像 ChatGPT,現在在醫師助理教育越來越普遍,能幫忙解答問題、整理重點,也支援個人化學習。不只提升行政效率,還能協助臨床決策。不過,使用上還是有倫理上的疑慮。整體來說,AI 對 PA 教育發展很有幫助。 相關文章 PubMed DOI 推理

過去研究多只偵測技術債或臭蟲其中一種,也很少用深度學習。這篇研究提出用LSTM、GRU和Transformer(BERT、GPT-3)等模型來辨識和分類軟體註解裡的技術債和臭蟲,資料來自主流程式庫。結果顯示,Transformer表現最好,GPT-3準確率最高達0.984,能有效提升軟體品質評估,對學界和業界都很有幫助。 相關文章 PubMed DOI 推理

這篇綜述主要討論 RAG 技術如何應用在醫療領域的大型語言模型,並整理現有資料集、技術和評估方式。多數研究用英文或中文資料,且偏好 GPT-3.5/4 這類專有模型。現階段缺乏統一的評估標準,對倫理問題的討論也不夠。未來需要更多研究,確保 RAG 在醫療應用上既安全又有效。 相關文章 PubMed DOI 推理

這項回溯性研究發現,ChatGPT-4在解讀乳房超音波報告並用BI-RADS分類結節時,表現比資淺放射科醫師更好,和資深醫師差不多。它預測惡性腫瘤的準確度高(AUC 0.82,準確率80.63%,敏感度90.56%,特異度73.51%)。若把ChatGPT-4納入影像判讀流程,能進一步提升醫師診斷準確率,減少不同醫師間的判讀差異。 相關文章 PubMed DOI 推理

這項研究發現,家長用ChatGPT提供的活動建議後,自閉症兒童的身體活動量明顯增加。家長普遍覺得這些建議實用又有趣。雖然結果很有潛力,但還需要更多研究來確認ChatGPT的長期效果。 相關文章 PubMed DOI 推理

一個全新AI風險評分系統AIRIS,結合大型語言模型和RAG技術,能更精確預測皮膚鱗狀細胞癌患者的不良預後。和現有標準(BWH、AJCC8)相比,AIRIS在預測復發、轉移和死亡上表現更好,風險分組也更一致,顯示AI有助提升癌症預後工具。 相關文章 PubMed DOI 推理

**重點整理:** 一個大型語言模型(LLM)被訓練來根據MRI報告分類分支型胰管內乳頭狀黏液性腫瘤(BD-IPMNs)。它的準確度跟放射科住院醫師差不多,比實習醫師還要好,而且速度快很多。這個LLM有機會幫助更有效率又準確地根據MRI結果分類BD-IPMNs。 相關文章 PubMed DOI 推理

這項研究比較五款主流大型語言模型解讀胸部CT報告的能力,發現GPT-4表現最佳,尤其在選擇題上最準確。微調後的GPT-3.5-Turbo也有明顯進步。整體來說,選擇題比開放式問答更容易答對。不同疾病和器官系統的結果有差異。結果顯示,優化後的AI模型有助於提升胸部CT解讀,對外科手術規劃很有幫助。 相關文章 PubMed DOI 推理