LLM 相關三個月內文章 / 第 101 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

研究發現,大型語言模型(如 GPT-4 等)在預測兒童記憶與暗示性方面,準確率達 65%,比專業人員的 57% 更高,尤其在預測錯誤記憶上表現突出。雖然 LLMs 有潛力協助法醫面談,但實際應用前還需進一步研究驗證。 相關文章 PubMed DOI 推理

這項研究比較開源與專有大型語言模型在產生病人易懂的胸部CT放射報告上的表現。結果顯示,開源的Llama-3-70b表現接近甚至超越部分專有模型。GPT-3.5-Turbo在可讀性最佳,Claude-3-Opus和Gemini-Ultra在病人友善度和正確性上表現突出。整體來說,開源模型已具備媲美專有模型的潛力。 相關文章 PubMed DOI 推理

這項研究開發了一套結合抗噪語音辨識和大型語言模型的系統,能自動從救護車錄音產生急診診斷摘要,即使環境吵雜也沒問題。這方法讓院前電子病歷完成時間從20分鐘縮短到14分鐘,大幅提升急診效率,未來也有望應用在醫療品質評估和疾病預測等領域。 相關文章 PubMed DOI 推理

這項研究開發了一套新方法,能不用細部標註就自動分析全口X光片的牙齒狀況。它結合牙齒分割、用大型語言模型從報告自動抓取資訊,再自動配對標註。實驗結果顯示,這方法比傳統方式更準確,表現接近牙醫學生和專科醫師,證明自動化牙科影像分析很有潛力。 相關文章 PubMed DOI 推理

這篇綜述聚焦對話式AI在高齡者社會照護的應用,整理2019年後相關研究,探討導入方式、易用性、接受度及對福祉的影響,也分析最佳實務與研究缺口。結果將有助未來AI在高齡照護的發展,特別關注可近性、倫理及成效,預計2025年9月公布。 相關文章 PubMed DOI 推理

**重點整理:** 科學家批評 OpenAI 的比賽沒有遵守既有的文化遺產保護規範和指引,認為這個競賽忽略了重要的倫理和保存標準。 相關文章 PubMed DOI 推理

這項研究發現,OpenAI的GPT模型在系統性回顧的文獻篩選上,表現跟人工審查者差不多甚至更好。研究團隊提出「multiprompt screening」方法,讓GPT在複雜情境下更精準,並開發了R套件AIscreenR,方便大家標準化流程,推動GPT成為高品質回顧的第二位審查者。 相關文章 PubMed DOI 推理

這項研究發現,ChatGPT-4o在解讀心臟內心電圖時,隨著臨床資訊增加,準確率從57%提升到66%。雖然它在部分特徵判讀上表現不錯,但遇到複雜案例還是有困難。整體來說,ChatGPT-4o有潛力,但還不適合直接用在臨床,需再進一步改進和驗證。 相關文章 PubMed DOI 推理

這項研究發現,Llama 2 13b 等開源大型語言模型,在從門診信件中擷取癲癇相關資訊(如癲癇類型、發作型態、用藥)表現優於傳統工具,F1 分數最高達 0.90。顯示 LLMs 有助提升醫療資訊擷取效率,但模型選擇和限制仍需注意。 相關文章 PubMed DOI 推理

這項研究發現,GPT-4能準確從胰臟囊腫的放射科報告中自動擷取重要臨床資訊,準確率高達92–99%,僅在囊腫數量上略低(81%)。這代表未來可用AI快速建立大型醫療資料庫,減少人工整理時間,對長期追蹤和AI醫療研究很有幫助。 相關文章 PubMed DOI 推理