LLM 相關三個月內文章 / 第 122 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這項研究評估了四個大型語言模型(LLMs)在心理健康診斷和治療的能力,包括Gemini 2.0、Claude 3.5、ChatGPT-3.5和ChatGPT-4。主要發現顯示,ChatGPT-4在診斷憂鬱症和PTSD方面優於人類專業人士,但在複雜案例如早期精神分裂症的準確率僅55%。LLMs提供的治療建議較為多樣,但專業人士則偏好具體的精神科諮詢。總體來看,雖然LLMs能協助診斷和治療計畫,但在複雜情況下仍需專業監督。 相關文章 PubMed DOI

自2023年以來,ChatGPT-4在醫療領域取得顯著進展,特別是在分析電子病人報告結果(ePROs)方面,對癌症病人的症狀監測及早期介入至關重要。本研究探討了ChatGPT-4分析三十位癌症病人四週的ePRO數據的可行性,並模擬醫療專業人員提供建議。結果顯示,ChatGPT-4在數據準確性和同理心方面表現良好,改善了醫護溝通並減輕了壓力。未來研究將著重於增強AI在癌症護理中的應用,促進醫病共同決策。 相關文章 PubMed DOI

**引言:** 隨著新藥物的開發,早期乳腺癌的存活率大幅提升,但化療等系統性治療仍可能造成患者壓力。許多患者透過搜尋引擎或網站尋找資訊,而人工智慧(AI)的使用也日益普及,但這些資訊的可靠性尚不明確。 **材料與方法:** 本研究比較了AI(ChatGPT 3.5和4.0)、Google及PINK(針對乳腺癌患者的應用程式)提供的資訊,涵蓋十九種已批准藥物及一種待批准藥物的副作用,並根據處方資訊計算一致性分數。 **結果:** ChatGPT 3.5的最高一致性分數為67.5%,其次是ChatGPT 4.0的67.0%,PINK為59.5%,Google則為40.0%。在特定類別中,PINK在化療方面表現最佳,ChatGPT 4.0在靶向治療中最佳,ChatGPT 3.5在內分泌治療中最佳。 **結論:** AI及專業線上資訊對早期乳腺癌系統性治療副作用提供相對可靠的資訊,但與處方資訊的一致性有限,醫療諮詢仍是最可靠的資訊來源。 相關文章 PubMed DOI

這項研究評估了多種人工智慧模型在識別外科器械方面的表現,包括ChatGPT-4、ChatGPT-4o、Gemini和SID 2.0。研究使用92張高解析度圖像,涵蓋25種器械,並根據準確度等指標進行評估。結果顯示,ChatGPT-4o的準確度最高,達89.1%,而Gemini表現最差,僅44.6%。雖然這些模型能有效分類外科器械,但在精確識別特定器械類型上仍面臨挑戰,顯示出進一步開發的必要性,以提升準確度並確保病人安全。 相關文章 PubMed DOI

這項研究探討大型語言模型(LLM)LLaMA 2 在臨床護理的應用,特別是解釋複雜的護理路徑模型。傳統的診斷系統繁瑣且需頻繁更新。研究人員訓練 LLaMA 2,並測試其根據假設病人案例提供臨床建議的能力。結果顯示,LLaMA 2 在檢索診斷和建議管理步驟方面準確率高,平均節點準確率為 0.91,邊緣準確率為 0.92,顯示其在醫療資訊檢索上的潛力。未來研究應著重於提升 LLM 的可解釋性及與臨床流程的整合。 相關文章 PubMed DOI

這項研究探討了兩種大型語言模型(LLMs)在胃腸科臨床實踐中的應用,分別是自訂的GPT模型和傳統的GPT-4o。研究發現,自訂模型在15個臨床問題中正確回答了8個,而研究員則回答了10個。傳統的GPT-4o表現最佳,正確率達14/15。雖然兩種模型的表現略低於專家醫生,但顯示出在病人諮詢等專業任務中的潛力。研究強調了RAG技術的重要性及臨床醫師監督的必要性。 相關文章 PubMed DOI

這項評估針對五種大型語言模型(LLMs)在重症護理藥物治療問題上的表現進行測試,結果顯示ChatGPT-4的準確性最高,達71.6%。LLMs在知識回憶問題上表現較好,但在知識應用問題上則不及藥學博士學生(學生準確性81%)。使用思考鏈提示可提升ChatGPT-4的準確性至77.4%。這顯示LLMs在特定領域仍需進一步訓練,以改善其應用能力,對於全面藥物管理的使用應謹慎。 相關文章 PubMed DOI

這項研究探討了多模態大型語言模型(LLMs),特別是GPT-4o和Claude Sonnet 3.5,如何結合文本與視覺資訊進行醫療診斷。研究在120個臨床案例中進行測試,結果顯示在只有文本的情況下,GPT-4o的準確率為70.8%,遠超醫生的39.5%。當加入圖片時,所有參與者的表現都有提升,尤其是醫生的準確率增幅最明顯。GPT-4o在有圖片的情況下達到84.5%,而醫生則為78.8%。這顯示LLMs在視覺數據處理上仍需加強,以達到人類醫生的表現。 相關文章 PubMed DOI

這篇論文探討將大型語言模型(LLMs)整合進基因改進(GI)框架的可能性,並基於先前的研究,結合Gin Java GI工具包與OpenAI LLMs,生成JCodec工具的程式碼編輯。研究評估了三種不同的LLMs和提示,涵蓋五個真實軟體專案。結果顯示,LLMs生成的編輯雖然數量較少,但成功編譯和通過測試的機率較高,OpenAI模型達77%的成功率。簡單提示的效果優於複雜提示。質性分析指出LLM編輯的常見失敗點,顯示LLMs在GI搜尋過程中有潛力,但仍需克服有效性挑戰。 相關文章 PubMed DOI

這項研究評估了兩個大型語言模型(LLMs),ERNIE Bot 和 ChatGPT,在回答肝癌介入放射學問題的有效性,特別是針對經動脈化療栓塞(TACE)和肝動脈灌注化療(HAIC)。共設計38個問題,由10位專業人士評估兩者的回答。結果顯示,ERNIE Bot 在中文環境中表現較佳,而 ChatGPT 在英文環境中更優。研究強調根據語言選擇合適的 LLM 以提供準確的治療資訊,但也指出兩者都需人工審查以確保資訊可靠性。 相關文章 PubMed DOI