LLM 相關三個月內文章 / 第 125 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這項研究評估了三個大型語言模型(LLMs)—ChatGPT-3.5、ChatGPT-4.0 和 Google Gemini 在回答乙型肝炎病毒(HBV)相關問題的表現。醫療專業人員對其準確性進行評分,並評估可讀性。 主要發現包括: - 所有 LLM 在主觀問題上得分高,ChatGPT-4.0 準確性最高。 - 在客觀問題上,ChatGPT-4.0 準確率為 80.8%,優於其他兩者。 - ChatGPT-4.0 在診斷上表現佳,Google Gemini 在臨床表現強勁。 - 所有 LLM 的可讀性分數高於標準八級,對一般讀者來說可能過於複雜。 結果顯示,LLMs,特別是 ChatGPT-4.0,可能成為有關 HBV 的資訊工具,但不應取代醫生的個人化建議。 相關文章 PubMed DOI

這項研究旨在利用現代數據技術提升中醫病例記錄的可及性與分析能力。研究分析了679份來自新安醫學王仲期醫師的病例,涵蓋41種疾病,並建立了模式層來整合數據與可視化。透過大型語言模型(LLM),自動識別病例中的關鍵資訊,並建立中醫病例知識圖譜。開發的查詢系統在性能評估中表現優異,顯示結合LLM與知識圖譜能顯著提升中醫資訊檢索的效率與準確性,未來將擴展數據集與精進查詢系統。 相關文章 PubMed DOI

這篇文章探討了ChatGPT在診斷常見心律不整的潛力,研究分析了20,000名心律異常病患的電子病歷。結果顯示,ChatGPT的敏感度達93%、特異度89%、正確預測值91%及負確預測值92%。ROC曲線分析的AUC為0.743,顯示其診斷表現相當優秀。研究指出,ChatGPT的診斷能力與臨床專家相當,顯示其在輔助臨床決策及改善病人結果方面的潛力。 相關文章 PubMed DOI

與年齡相關的黃斑變性(AMD)在老年人中引起廣泛關注,近期人工智慧(AI)的進展使得相關研究興趣大增。這項文獻計量分析針對1992至2023年間的AI在AMD研究進行系統評估,使用Web of Science核心合集資料,分析出版量、影響力及研究趨勢。結果顯示美國產出最多,墨爾本大學為主要機構,且深度學習模型的開發及早期檢測成為研究重點。此分析為未來研究提供了重要指引,促進該領域的合作。 相關文章 PubMed DOI

噬菌體是專門感染細菌的病毒,對微生物生態系統非常重要。了解噬菌體的生物學,尤其是其蛋白質功能,對研究至關重要。雖然透過宏基因組測序已發現許多新噬菌體,但因多樣性和註解不足,許多蛋白質功能仍不明確。為此,我們開發了GOPhage工具,利用噬菌體基因組的模組化結構來進行蛋白質註解。GOPhage顯著提高了對分歧蛋白和不常見功能蛋白的註解準確性,並能處理無同源性搜索結果的蛋白質,顯示出其在噬菌體研究中的潛力。 相關文章 PubMed DOI

這項研究探討使用ChatGPT來製作以病人為中心的前列腺活檢病理報告,旨在幫助病人理解複雜的醫學術語。研究人員根據國家綜合癌症網絡的指導方針,合成了35份報告並進行評估。結果顯示,AI生成的報告在醫生和病理學家的評價中大多準確且完整,雖然需要一些修改,但修改速度比撰寫原創報告快。這顯示ChatGPT有助於改善醫療提供者與病人之間的溝通,值得進一步研究。 相關文章 PubMed DOI

大型語言模型(LLMs)在臨床實踐中有潛力提升病人教育與賦權,提供更個人化的醫療服務。然而,目前對其在病人照護中的應用資訊仍不夠完整。本系統性回顧分析了2022至2023年間的89項相關研究,主要集中於GPT-3.5和GPT-4,應用於回答醫療問題、生成病人資訊等。研究指出設計和輸出方面的限制,包括缺乏針對醫療的優化及數據透明度等問題。此回顧為LLMs在醫療環境中的應用與評估提供了基礎框架。 相關文章 PubMed DOI

這項研究評估了多種大型語言模型(LLMs)在處理眼科緊急情況的表現,並與英國國民健康服務(NHS)111的系統進行比較。研究涵蓋21個緊急情境問題,測試的模型包括ChatGPT-3.5、Google Bard、Bing Chat和ChatGPT-4.0。結果顯示,93%的LLM回應至少得分為「良好」,顯示它們提供的資訊正確且無重大錯誤。整體來看,這些模型在提供即時資訊和指導方面,顯示出作為有效工具的潛力,能提升患者護理及醫療可及性。 相關文章 PubMed DOI

視覺語言模型(VLMs)在跨模態推理上表現優異,因為它們能整合視覺與語言特徵。最近的進展集中在透過提示學習進行微調,以適應不同任務。TCP方法雖然能增強VLM的泛化能力,但固定的文本模板可能無法捕捉細微的類別差異。 為了解決這個問題,我們提出了自定義文本生成的類別感知提示調整(CuTCP),利用大型語言模型生成更具描述性的提示,提升模型對已知與未見類別的區分能力。實驗顯示,CuTCP在新類別上改善了0.74%,並在11個多樣化的圖像數據集上整體提升了0.44%。這證明CuTCP有效增強了模型的適應性與泛化能力,特別是在細粒度分類任務中。 相關文章 PubMed DOI

這項研究比較了ChatGPT和Google Gemini在回答周邊動脈疾病(PAD)相關問題的表現。共評估72個常見問題和63個基於歐洲心臟病學會指導方針的問題。結果顯示,ChatGPT在準確性和滿意度上優於Google Gemini,分別有70.8%和69.8%的回答獲得最高評分GQS 5,而Google Gemini則為55.6%和50.8%。不過,Google Gemini的回應速度較快。總體來看,ChatGPT在準確性和滿意度上表現更佳。 相關文章 PubMed DOI