LLM 相關三個月內文章 / 第 88 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這項研究比較多種大型語言模型在回答眼瞼下垂相關問題的表現,發現GPT-4o在英文回答最優,Qwen2.5則在中文表現突出。雖然AI有助於病人衛教和醫師諮詢,但臨床應用前還需更多驗證和調整,顯示AI有提升多語言醫療溝通的潛力。 相關文章 PubMed DOI 推理

最新研究發現,人類大腦在理解語意時,會把單字和周圍單字的神經反應結合起來,這跟transformer語言模型的自我注意力機制很像。大腦也會編碼單字在句子裡的位置,類似模型的「位置編碼」。而且,大腦加權上下文單字的方式,跟語言模型的self-attention權重也很接近,顯示兩者語言處理策略可能相似。 相關文章 PubMed DOI 推理

作者提出 cxt 深度學習模型,採用 transformer 架構,能從基因體資料推斷共祖時間。不同於傳統機率模型,cxt 直接從模擬資料學習,將突變「翻譯」成祖先重組圖。其準確度與現有方法相當甚至更佳,泛化能力強、易於擴展,還能提供預測不確定性,為族群遺傳推論帶來更靈活且大規模的應用新方向。 相關文章 PubMed DOI 推理

大型語言模型如 ChatGPT、Claude、Gemini,正逐步改變肝胰膽外科手術,包括自動化文件、輔助決策、手術規劃及病患監測。不過,資料隱私、AI 錯誤、倫理、教育及醫療不平等等問題仍待解決。未來需發展專業化模型、強化醫師與 AI 合作,並建立完善倫理規範,才能安全有效地應用於臨床。 相關文章 PubMed DOI 推理

罕見疾病診斷困難,因資料少且基因多樣。本研究評估大型語言模型(LLMs)在基因排序的表現,發現GPT-4表現最佳,但對知名基因有偏好且受輸入順序影響。採用分批處理可提升準確度並減少偏誤,有助加快罕見疾病基因鑑定與診斷。程式碼可在 GitHub 下載。 相關文章 PubMed DOI 推理

這項研究發現,ChatGPT-4o 在小兒急診診斷上表現比醫師還好,甚至連複雜案例也能大多答對。先進的聊天機器人有潛力協助醫師處理急診,但應該當作輔助工具,不能取代醫師,且需訂出明確的 AI 與醫師合作流程。 相關文章 PubMed DOI 推理

調查發現,許多生物統計學家已用大型語言模型(LLMs)提升程式撰寫和寫作效率,但因錯誤和可靠性問題,仍需謹慎驗證。多數人希望有系統訓練和實用指引。研究也提出八大原則,協助生物統計學家負責任且有效運用LLMs。 相關文章 PubMed DOI 推理

這項研究比較四種大型語言模型(LLM)在協助罕見兒童疾病藥物超適應症資訊檢索的表現,發現GPT-4o表現最好,優於Scopus AI。雖然有時LLM給的參考文獻品質甚至比人類還高,但結果會因查詢內容不同而有落差。LLM能加快資訊搜尋,但還是需要專業人員審核,確保正確性。 相關文章 PubMed DOI 推理

這項研究用7,903筆放射腫瘤科資料微調LLaMA2-7B和Mistral-7B模型,提升它們在治療建議、治療選擇和ICD-10診斷預測三大任務的表現。微調後模型的準確度和臨床相關性都明顯進步,超過六成AI產生的治療方案被醫師認可,顯示未來在臨床應用上很有潛力。 相關文章 PubMed DOI 推理

三款中國熱門大型語言模型(Qwen、Erine、Baichuan)在臨床應用時,對性別、族群、收入和健保狀態都有明顯偏見,常高估男性、高收入和有保險者,低估少數族群及低收入者。這些偏見會影響醫療教育、診斷和治療建議,因此持續檢視並減少偏見非常重要。 相關文章 PubMed DOI 推理