LLM 相關三個月內文章 / 第 108 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

認知偏誤常讓醫療決策出錯,對病人造成傷害。大型語言模型(LLMs)進入臨床後,可能會延續甚至加劇這些偏誤,但也有機會用客觀數據協助減少錯誤。本文討論 LLMs 如何影響醫療決策中的認知偏誤,以及它們可能帶來的風險與助益。 相關文章 PubMed DOI 推理

**重點整理:** 目前開源的視覺-語言模型(VLMs)在急性照護診斷任務上的表現很差(正確率≤40.4%),相比之下,GPT-4o 的正確率有68.1%。這顯示如果要讓開源VLMs適合用在急診和加護病房,還需要進行專門的訓練。 相關文章 PubMed DOI 推理

SynergyBug 是一套自動化錯誤偵測和修復系統,結合 BERT 與 GPT-3,能自動找出並修正軟體錯誤,減少人工介入。它分析錯誤回報和日誌,準確率高達 98.79%,表現比傳統方法更好,適合大規模應用,但還是需要人工監督來避免偏誤。 相關文章 PubMed DOI 推理

這項研究發現,不管是母語還是非母語讀者,他們在閱讀時大腦和大型語言模型的對齊情形都很接近,顯示人類閱讀有共通的運算機制。不過,像語言能力和專注力等個人差異,會影響這種對齊,尤其在非母語讀者身上更明顯。結果說明LLMs不只模擬人類閱讀,也能反映不同族群的差異。 相關文章 PubMed DOI 推理

MedKA 是一種新方法,結合醫學知識圖譜來提升醫療大型語言模型的表現。它建立了高品質臨床問答資料集訓練模型,並提出新評估指標檢查答案正確性。實驗證明,MedKA 在準確度和事實一致性上都比現有醫療 LLM 更好,特別是在用藥和診斷建議上。程式碼和資料已公開。 相關文章 PubMed DOI 推理

這項研究推出Bio-Copilot,一個結合AI與專家知識的生物資訊系統,能分析大量omics資料。它在多項生物資訊任務中表現優於現有AI(如GPT-4o),任務完整度也很高。Bio-Copilot還能建立詳細的人類肺細胞圖譜並發現罕見細胞,展現強大分析能力。這證明AI結合專家知識能加速生物學新發現。 相關文章 PubMed DOI 推理

研究發現,大型語言模型(如 GPT-4 等)在預測兒童記憶與暗示性方面,準確率達 65%,比專業人員的 57% 更高,尤其在預測錯誤記憶上表現突出。雖然 LLMs 有潛力協助法醫面談,但實際應用前還需進一步研究驗證。 相關文章 PubMed DOI 推理

這項研究比較開源與專有大型語言模型在產生病人易懂的胸部CT放射報告上的表現。結果顯示,開源的Llama-3-70b表現接近甚至超越部分專有模型。GPT-3.5-Turbo在可讀性最佳,Claude-3-Opus和Gemini-Ultra在病人友善度和正確性上表現突出。整體來說,開源模型已具備媲美專有模型的潛力。 相關文章 PubMed DOI 推理

這項研究開發了一套結合抗噪語音辨識和大型語言模型的系統,能自動從救護車錄音產生急診診斷摘要,即使環境吵雜也沒問題。這方法讓院前電子病歷完成時間從20分鐘縮短到14分鐘,大幅提升急診效率,未來也有望應用在醫療品質評估和疾病預測等領域。 相關文章 PubMed DOI 推理

這項研究開發了一套新方法,能不用細部標註就自動分析全口X光片的牙齒狀況。它結合牙齒分割、用大型語言模型從報告自動抓取資訊,再自動配對標註。實驗結果顯示,這方法比傳統方式更準確,表現接近牙醫學生和專科醫師,證明自動化牙科影像分析很有潛力。 相關文章 PubMed DOI 推理