LLM 相關三個月內文章 / 第 149 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這項研究發現,ChatGPT在泌尿動力學相關問題上,無論是理論還是實務題,答對率都只有一半,且無法正確解讀圖譜或提供可靠文獻。整體來說,ChatGPT只能當作輔助查詢工具,無法取代專業醫師,也無法提升檢查品質。 相關文章 PubMed DOI 推理

MedAESQA 資料集專為提升大型語言模型在醫療問答的表現而設計,內含 40 個真實醫療問題,每題有 30 答案(人類與 AI 產生),並附上相關科學文獻摘要。每個答案都經人工評估正確性與來源相關性,目的是讓 AI 回答更貼近事實、具科學根據。 相關文章 PubMed DOI 推理

這項研究發現,ChatGPT-4 和 ChatGPT-4o 翻譯乳房攝影和超音波報告,比 Google Gemini 更能讓病患看得懂、覺得貼心。年紀較大或沒做過乳房攝影的人,對AI報告評價更高;教育程度高的人則較挑剔。大多數人都覺得AI翻譯比傳統醫療用語好,顯示AI有助提升病患理解和醫病溝通。 相關文章 PubMed DOI 推理

MacKay 團隊用大型語言模型,能從自由書寫的心臟超音波報告中,自動抓出結構化資料,大幅減少人工處理和錯誤。這展現 AI 在心臟麻醉和手術照護資料處理上的效率與準確性提升。 相關文章 PubMed DOI 推理

這項研究發現,用 ChatGPT-4o 簡化韓文肝臟切除手術同意書,確實讓內容更好懂,但也可能省略了一些重要細節和風險資訊,讓同意書看起來不夠專業或完整。未來應加強確保關鍵資訊不被漏掉,並評估病患實際的理解情況。 相關文章 PubMed DOI 推理

許多脊椎相關的病患衛教資料,閱讀難度太高,超過多數人能理解的程度。研究發現,這些資料平均要有美國高中二年級程度才能看懂,遠高於建議的國中一年級水準。用 ChatGPT-4o 重寫後,內容變得更簡單易懂,資訊也沒跑掉。AI 工具確實能幫助醫療資訊更親民,但未來還要加上圖像和更友善的呈現方式,才能照顧到所有病患。 相關文章 PubMed DOI 推理

這項研究用YouTube留言分析鴉片類藥物混用經驗,並分辨正負面影響。團隊運用GPT-3.5 Turbo等AI技術,準確辨識高風險用藥和過量風險,F1-score高達0.95,優於傳統方法。結果顯示,AI分析社群媒體有助於更了解鴉片危機,並提升介入策略效果。 相關文章 PubMed DOI 推理

這篇文獻回顧指出,GPT類模型適合用在醫療溝通、報告撰寫等任務,BERT類模型則較適合做分類和知識挖掘。由於兩者架構不同,適用場景也不一樣,醫療人員應根據實際需求選擇合適的模型。 相關文章 PubMed DOI 推理

這項研究發現,給大型語言模型(如GPT-4o和Llama-3.3-70B)明確的標註指引,能大幅提升它們從中風CT報告擷取重點的準確度,其中GPT-4o表現最好。結果強調,清楚的指引對提升醫療自動化資料擷取很重要。 相關文章 PubMed DOI 推理

這項研究發現,GPT-4o在判斷岩石圖片的基本特徵時,表現跟人類很接近,但在較專業的岩石特徵上還有進步空間。雖然還沒完全取代人類,但LMMs未來有機會協助甚至部分取代人類做知覺判斷,也為後續相關研究提供了參考標準。 相關文章 PubMed DOI 推理