LLM 相關三個月內文章 / 第 140 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這項研究發現,大型語言模型(LLMs)雖然無法直接準確偵測機械通氣流量不足,但用 Claude-3.5 產生的神經網路程式碼,表現甚至超越專家手動設計的模型。這代表 LLMs 很有潛力協助自動化臨床 AI 模型開發,但實際應用前還需要更多驗證和倫理審查。 相關文章 PubMed DOI 推理

多數婦科衛教資料寫得太難,超過國小六年級的閱讀程度,病患常常看不懂。這篇研究發現,用AI(像ChatGPT等)產生或簡化的內容雖然變短,但用詞反而更難懂,還是沒辦法達到建議的簡單程度,有時甚至更複雜。結論是,目前AI還不適合直接用來簡化衛教資料,臨床上要特別注意,未來AI也要加強把關,確保資訊真的好懂。 相關文章 PubMed DOI 推理

這篇研究提出 GPTRadScore,用 GPT-4 來評估多模態大型語言模型描述 CT 影像的表現,比傳統指標更符合臨床需求。實驗發現,GPTRadScore 的評分和醫師高度一致,也比 BLEU、ROUGE 更貼近實際。微調 RadFM 後,準確度明顯提升。總結來說,GPTRadScore 很適合評估放射科模型,微調也能大幅提升模型表現。 相關文章 PubMed DOI 推理

SyRACT 框架用三種方法提升生醫文件層級關係抽取:把任務變成問答、用 PubMed 資料減少幻覺、設計專屬 chain-of-thought 推理流程。實驗顯示,SyRACT 在 CDR、GDA、ADE 三個資料集的 F1 分數都比傳統 LLM 提示法高,精確度、推理力和可解釋性都更好。程式碼和資料已公開。 相關文章 PubMed DOI 推理

AI-HOPE 是一款開源 AI 工具,讓臨床研究人員用自然語言就能分析癌症臨床和基因資料,完全不用寫程式。它會自動解讀需求、分析本地資料,確保安全,並找出重要關聯。實測能準確找出基因突變和癌症預後的關聯,幫助推動精準醫療研究。 相關文章 PubMed DOI 推理

生成式AI在心理健康領域應用越來越多,像是協助診斷、治療和支援醫師,特別用於偵測憂鬱症、自殺風險及聊天機器人。雖然能提升服務可近性、減輕醫師負擔,但實際應用和安全性仍有限,且有隱私、偏見和治理等倫理疑慮。作者提出GenAI4MH框架,強調需有完善防護措施,確保AI應用安全又合乎倫理。 相關文章 PubMed DOI 推理

這項研究提出一套由GPT-4o等大型語言模型輔助的內容分析方法(LACA),協助建立主題編碼本並自動標註醫院網路評論。研究在馬來西亞53家私人醫院、近1.5萬則評論上測試,結合機器學習和GPT-4o過濾假評論,並與人工合作開發41個主題,標註一致性高。主題再歸納成六大類,涵蓋醫療服務與病患經驗。此方法分析大量評論快速又省成本,能即時協助醫院改善品質。 相關文章 PubMed DOI 推理

這項研究開發了一套結合醫療語言解析器和微調大型語言模型的AI系統,能自動從臨床紀錄中擷取乳癌治療時程。模型在Mayo Clinic和Stanford的大型資料集上驗證,準確度高於傳統方法。這個開源工具已打包好,方便使用,有助於快速整理大規模癌症治療資料,減少人工處理負擔。 相關文章 PubMed DOI 推理

這項研究比較五種深度學習模型預測中國類流感(ILI)發生率的表現,資料涵蓋2014至2024年。結果顯示,TiDE模型在全國及南方地區預測最準確,北方地區則各模型表現都較差。開發過程中,ChatGPT協助程式撰寫與除錯,大幅提升效率,展現AI輔助能強化疫情預測與公衛應變能力。 相關文章 PubMed DOI 推理

這項研究比較用英文和中文資料訓練的大型語言模型在中國醫師國考的表現。結果發現,不論訓練語言,大多數模型都能及格,中文模型Baichuan表現最佳。英文模型在醫學倫理和政策題目上甚至有時更優。多模型交叉驗證答案能明顯提升正確率。整體來說,中文模型略勝一籌,主要是訓練資料差異造成的。 相關文章 PubMed DOI 推理