LLM 相關三個月內文章 / 第 69 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

大型語言模型的出現引發了對其可能生成誤導性或虛假資訊的討論,這被稱為「胡說八道」。這個詞暗示這些模型能產生看似可信的內容,但不一定符合事實。雖然有觀點認為這些模型會發表未經驗證的陳述,但也有人認為,只要有適當的保障措施,它們可以避免這種情況。最終,語言模型的「胡說八道」傾向與其設計和使用方式有關,類似於人類在不同情境下可能不遵循真實性的情況。 相關文章 PubMed DOI

馬鈴薯基因-疾病知識庫(PotatoG-DKB)旨在協助研究人員獲取和整理馬鈴薯基因與疾病的相關資訊。這個專案運用自然語言處理和大型語言模型,從2,906篇PubMed文章中提取數據,建立了包含22種實體類型的知識庫,涵蓋5,206個節點和9,443條關係。還推出了互動式可視化平台——馬鈴薯基因-疾病知識入口(PotatoG-DKP),幫助生物學家和育種者深入了解馬鈴薯的致病機制及抗病性。更多資訊可至 https://www.potatogd.com.cn/ 查詢。 相關文章 PubMed DOI

這篇評論探討大型語言模型(LLMs),如ChatGPT、GPT-3.5和GPT-4在醫療領域的應用潛力,強調謹慎實施和專業支持的重要性。它們可協助醫學教育、研究、臨床實踐及護理,例如設計課程、提供個性化學習、協助科學寫作和數據分析、增強醫學影像及決策能力,還能改善病患溝通和護理效率。儘管LLMs展現潛力,但仍需解決倫理、同理心缺乏及偏見等挑戰,未來研究應針對這些問題,以確保其在醫學中的有效與合乎倫理使用。 相關文章 PubMed DOI

這項研究評估了OpenAI的GPT-4o在波蘭的牙科考試(LDEK)中的表現,並與人類考生進行比較。GPT-4o的正確率為70.85%,在保守牙科和假牙牙科表現較佳,但在兒童牙科和矯正牙科則較差。臨床案例問題的準確性明顯低於事實性問題。研究顯示,GPT-4o在牙科教育中有輔助潛力,但在臨床推理和批判性思維上仍不及人類考生,特別是在複雜情境中。 相關文章 PubMed DOI

這項研究顯示,人工智慧聊天機器人如ChatGPT和Google Gemini在澄清緩和醫療的誤解上非常有效。研究人員分析了三十個相關陳述,結果發現ChatGPT準確分類了28個,真陽性率達93.3%;而Google Gemini則完美分類所有陳述。統計分析顯示兩者表現無顯著差異。整體來看,這些聊天機器人能提升病人對緩和醫療的認知,並改善服務的可及性。 相關文章 PubMed DOI

最近,OpenAI的ChatGPT在醫療和教育領域的應用引起關注。一項研究評估了ChatGPT在牙科考試中的表現,發現其在知識性問題上達到80%的準確率,尤其是ChatGPT 4在牙科入學考試中表現優異,知識性問題準確率高達94%。雖然在數學分析方面表現不佳,但整體來看,ChatGPT有潛力提升牙科教育和實踐,特別是在特定領域的進一步改進上。 相關文章 PubMed DOI

在評估心房顫動患者的中風風險時,抗凝治療的必要性至關重要。CHA₂DS₂-VASc 分數是常用工具,但傳統計算依賴醫生手動輸入或結構化數據。為了改善風險評估,研究開發了一種檢索增強生成(RAG)方法,從非結構化臨床筆記中提取風險因素。該方法結合 Llama3.1 語言模型,測試結果顯示在識別高血壓和糖尿病等風險因素上,RAG 模型的表現優於結構化數據。這有助於提升 CHA₂DS₂-VASc 分數,改善心房顫動患者的抗凝治療指導。 相關文章 PubMed DOI

這篇論文探討預訓練大型語言模型(LLMs)在科學文本總結的有效性,指出傳統評估方法如 $n$-gram 和嵌入比較無法充分評估科學摘要的理解和關鍵內容識別。為了解決這些問題,作者提出了面向的度量(FM),利用LLMs進行高級語義匹配,並根據不同面向評估摘要。他們還推出了一個新的科學摘要數據集(FD),並附有詳細註釋。研究結果顯示,FM提供了一個更一致的評估框架,且較小的微調模型在科學領域的表現可與LLMs相媲美,顯示出改進的潛力。 相關文章 PubMed DOI

這項研究探討如何透過微調提升開源大型語言模型(LLMs)在醫學證據摘要的表現。雖然專有模型通常更有效,但也存在透明度不足和依賴供應商的風險。研究人員使用包含8,161對系統性回顧摘要的MedReview數據集,對三個開源模型—PRIMERA、LongT5和Llama-2進行微調。結果顯示,微調後這些模型的表現顯著提升,特別是LongT5在零樣本設定中表現接近GPT-3.5,甚至有些小型模型超越了大型模型。這顯示微調開源LLMs能有效提升其在專業任務中的表現,成為專有模型的可行替代方案。 相關文章 PubMed DOI

本研究探討ChatGPT作為焦慮症患者心理治療師的有效性與可接受性。透過4週的介入,399名來自沙烏地阿拉伯的參與者評估了AI心理治療的經驗。結果顯示,91.2%的使用者認為ChatGPT準確,89.6%有治療經驗,36.1%報告嚴重焦慮。參與者對隱私和倫理的擔憂也被提及。城市居民和女性對ChatGPT的評價較高。結論是,ChatGPT有潛力補充傳統心理治療,改善心理健康護理的可及性。 相關文章 PubMed DOI