LLM 相關三個月內文章 / 第 135 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這項研究發現,GPT-4o在從臨床紀錄擷取症狀的整體表現中等,但在辨識泌尿症狀上非常厲害,精確度甚至達到100%。顯示GPT-4o在特定醫療領域的應用很有潛力,但如果要擴大到其他症狀,還需要再加強。 相關文章 PubMed DOI 推理

這項研究用MIMIC-III資料庫,比較ClinicalBERT和GPT-4在預測住院病人出院診斷的表現。結果顯示,ClinicalBERT在各疾病類別的F1分數都比GPT-4高,但需要較多運算資源。GPT-4雖然精確度較低,但召回率高、能處理較長文本,也不用事先訓練。兩種GPT-4提示法中,二元投票法表現稍好。 相關文章 PubMed DOI 推理

重點整理: 這項研究針對災難情境中,生成式AI和代理型AI所提出建議的一致性進行量化評估,結果發現AI的建議目前還不夠可靠,還無法取代專家判斷,特別是在關鍵時刻。 相關文章 PubMed DOI 推理

大型語言模型像 GPT-4 雖然在醫療領域應用越來越多,但因為缺乏真實世界的感官和動作基礎,容易出現推理錯誤或倫理問題。論文提醒,若把這些 AI 當成知識代理人而非輔助工具,可能會對臨床實務帶來風險。 相關文章 PubMed DOI 推理

這項研究發現,ChatGPT-4o 在自動化資料清理上,對大多數變數的正確率都很高(超過92%),但在尿液葡萄糖這項表現較差(約70%且不穩定)。整體來說,ChatGPT-4o 有潛力,但還需要進一步研究來克服現有的限制。 相關文章 PubMed DOI 推理

越來越多病患安全研究依賴 MAUDE 資料庫,作者提出結合 ETL 流程和大型語言模型的方法,能標準化並提升事件通報的分析品質。以內視鏡夾為例,這方法可有效萃取結構化和敘述性資料,發現新見解,提升透明度,幫助臨床醫師決策,也鼓勵更多人利用開放安全資料庫研究。 相關文章 PubMed DOI 推理

這項研究發現,GPT-4o能有效將英文出院病歷同時摘要並翻譯成西班牙文,幫助美國拉丁裔病患克服醫療語言障礙。大多數AI生成的摘要內容正確、清楚,但有些還能再精簡。整體來說,GPT-4o在提升醫療溝通上很有潛力,但摘要簡潔度還有進步空間。 相關文章 PubMed DOI 推理

這項研究發現,ChatGPT-4o用自由文字回答皮膚科診斷時,比選擇題表現更好。把病患資料加到圖片上,並沒有提升準確度。ChatGPT-4o可當作皮膚科教學輔助,但不能取代學生自行判斷。AI在醫學教育的應用還需要相關規範來確保倫理。 相關文章 PubMed DOI 推理

這篇研究比較三種自動化方法擷取癌症相關基因,發現BioBERT(transformer模型)表現最好,召回率和F1-score都最高。GPT-4o效果也不錯,但需要較多運算資源。NER模型(如SciSpaCy)表現不一,規則式方法雖然精確但容易漏掉基因。建議大規模文本探勘時,可考慮混合不同方法,兼顧準確度和效能。 相關文章 PubMed DOI 推理

這項研究發現,ChatGPT-4能自動從甲狀腺超音波報告中準確擷取U分數,和專家結果高度一致,尤其在多結節病例也表現優異。雖然部分錯誤來自報告內容不明確,但整體來說,LLM有助提升臨床報告一致性並減少人力。不過,正式應用前還需解決透明度、隱私和偏見等問題。 相關文章 PubMed DOI 推理