LLM 相關三個月內文章 / 第 34 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這篇研究發現,Aidoc AI在臨床上偵測頭部CT的顱內出血表現很好,放射科醫師用起來敏感度高、特異性也很棒。ChatGPT-4 Turbo也能準確從報告中抓出ICH,顯示自動化監控AI很有潛力。不過,Aidoc在某些掃描儀(像Philips)或影像雜訊多時,偽陽性會比較多。整體來說,持續監控AI表現很重要,結合大型語言模型能提升效率與可靠度。 相關文章 PubMed DOI 推理

這篇系統性回顧分析了大型語言模型在牙顎顏面放射學的應用,包括診斷、治療建議、考題作答和報告生成。雖然LLMs在這些任務上展現潛力,但準確率落差大(33%到92.5%),表現還不夠穩定,未來還需要更多改進和驗證,才能真正用在臨床實務上。 相關文章 PubMed DOI 推理

這篇系統性回顧指出,AI在發炎性腸道疾病的診斷、預測和治療上很有潛力,應用包括多組學分析、語言模型和穿戴式監測。不過,臨床廣泛使用前,還需更多研究來確保安全、隱私和實際效果。 相關文章 PubMed DOI 推理

這項研究用先進語言模型(像GPT-4、LLAMA3、Mistral)來產生法文藥物錯誤通報的合成資料,解決醫療AI缺乏真實資料的問題。專家和AI都認為這些合成資料很逼真,訓練出來的分類器在真實資料上表現也不錯(F1-score最高0.78),證明合成資料對藥物錯誤分析很有幫助。 相關文章 PubMed DOI 推理

這項研究發現,GPT-4生成的急診到住院交班摘要大致準確且實用,但約有6%案例因資訊遺漏或描述錯誤產生安全疑慮。AI摘要的實用性會受是否有會診影響。多數醫護人員對AI摘要持正面態度,但也發現有藥物、檢驗數據遺漏或病人狀況判斷錯誤。建議在廣泛導入前,需進一步優化AI並蒐集臨床回饋。 相關文章 PubMed DOI 推理

這項研究用 diphones(能捕捉音素間轉換的語音單位)來取代單一音素,作為腦波轉文字語音的中介步驟,有效提升解碼準確率。在 Brain-to-Text 2024 測試中,音素錯誤率降到 15.34%,單字錯誤率 5.77%,表現比過去的方法更好。 相關文章 PubMed DOI 推理

GS-DTI 是一套全新藥物-靶點交互預測工具,結合分子圖形轉換器、蛋白質語言模型和三維結構資訊,並用對比式學習和多任務損失提升準確度和解釋性。它在新藥物或新靶點預測上表現特別好,還能找出蛋白質結合口袋,程式碼和資料都已公開。 相關文章 PubMed DOI 推理

這篇研究介紹 FHIR Workbench 工具,能用四種評測資料集來測試大型語言模型(LLMs)對 FHIR 醫療資料標準的理解和應用。結果發現,商業模型(如 GPT-4o、Gemini)在結構化任務表現最佳,但所有模型在把臨床紀錄轉成 FHIR 資源時都很吃力。FHIR Workbench 有助於推動 LLMs 在醫療資料領域的發展。 相關文章 PubMed DOI 推理

作者提出一套新方法,結合 Fpocket 幾何口袋偵測和大型語言模型,能自動找出並排序對藥物開發重要的蛋白質結合口袋。這方法用 LLMs 從文獻擷取胺基酸層級的結合資訊,大幅減少人工整理。作者也公開了基準資料集和工具,方便大家使用。 相關文章 PubMed DOI 推理

這項研究發現,Microsoft Copilot(GPT-4)在診斷肺栓塞時,能在九成以上案例中把PE列入前十大鑑別診斷,風險評估也比傳統Wells score更準。不過,雖然特異性和陽性預測值很高,敏感度偏低。整體來說,Copilot有潛力輔助醫師,但還需要更多實際驗證。 相關文章 PubMed DOI 推理