LLM 相關三個月內文章 / 第 120 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這項研究評估了三個大型語言模型(LLMs)—ChatGPT 4.0、AtlasGPT 和 Gemini—在識別血管內神經外科手術報告中的程序術語(CPT)代碼的效果。分析了30份手術記錄後,AtlasGPT 表現最佳,正確識別35.3%的 CPT 代碼,ChatGPT 緊隨其後,正確率為35.1%,而 Gemini 僅有8.9%。統計分析顯示這些模型之間的表現差異顯著。研究指出,雖然這些模型能部分識別 CPT 代碼,但進一步訓練可提升準確性,並可能降低醫療成本。 相關文章 PubMed DOI

這項研究探討心理概念重疊的問題,這種重疊讓數據解釋變得複雜,增加了參與者的負擔。研究引入了一種名為嵌入式語義分析方法(ESAA),利用自然語言處理技術檢測心理量表中的冗餘。透過OpenAI的text-embedding-3-large模型,ESAA生成高維語義向量,並用層次聚類識別相似項目。 研究進行了三個實驗,評估ESAA在識別相似項目、區分不同項目及揭示冗餘方面的有效性。結果顯示,ESAA表現穩定且優於基於GPT-4的聊天機器人,顯示其在心理研究中的潛力。 相關文章 PubMed DOI

這項研究提出了一個創新的人工智慧解決方案,幫助泰國老年患者進行藥物管理,特別是解讀藥物標籤。研究測試了兩種模型:一個是結合EasyOCR和Qwen2-72b-instruct的兩階段模型,另一個是使用Qwen2-72b-VL的單階段視覺問答模型。兩者都以零樣本方式運作,並利用增強檢索生成技術。結果顯示,兩階段模型準確率高達94%,在上下文回憶和語義相似性方面表現優異,而單階段模型則反應更快,適合高流量環境。這項研究強調了人工智慧在醫療保健中的應用潛力。 相關文章 PubMed DOI

這項研究評估了四個大型語言模型(LLMs)在心理健康診斷和治療的能力,包括Gemini 2.0、Claude 3.5、ChatGPT-3.5和ChatGPT-4。主要發現顯示,ChatGPT-4在診斷憂鬱症和PTSD方面優於人類專業人士,但在複雜案例如早期精神分裂症的準確率僅55%。LLMs提供的治療建議較為多樣,但專業人士則偏好具體的精神科諮詢。總體來看,雖然LLMs能協助診斷和治療計畫,但在複雜情況下仍需專業監督。 相關文章 PubMed DOI

自2023年以來,ChatGPT-4在醫療領域取得顯著進展,特別是在分析電子病人報告結果(ePROs)方面,對癌症病人的症狀監測及早期介入至關重要。本研究探討了ChatGPT-4分析三十位癌症病人四週的ePRO數據的可行性,並模擬醫療專業人員提供建議。結果顯示,ChatGPT-4在數據準確性和同理心方面表現良好,改善了醫護溝通並減輕了壓力。未來研究將著重於增強AI在癌症護理中的應用,促進醫病共同決策。 相關文章 PubMed DOI

**引言:** 隨著新藥物的開發,早期乳腺癌的存活率大幅提升,但化療等系統性治療仍可能造成患者壓力。許多患者透過搜尋引擎或網站尋找資訊,而人工智慧(AI)的使用也日益普及,但這些資訊的可靠性尚不明確。 **材料與方法:** 本研究比較了AI(ChatGPT 3.5和4.0)、Google及PINK(針對乳腺癌患者的應用程式)提供的資訊,涵蓋十九種已批准藥物及一種待批准藥物的副作用,並根據處方資訊計算一致性分數。 **結果:** ChatGPT 3.5的最高一致性分數為67.5%,其次是ChatGPT 4.0的67.0%,PINK為59.5%,Google則為40.0%。在特定類別中,PINK在化療方面表現最佳,ChatGPT 4.0在靶向治療中最佳,ChatGPT 3.5在內分泌治療中最佳。 **結論:** AI及專業線上資訊對早期乳腺癌系統性治療副作用提供相對可靠的資訊,但與處方資訊的一致性有限,醫療諮詢仍是最可靠的資訊來源。 相關文章 PubMed DOI

這項研究評估了多種人工智慧模型在識別外科器械方面的表現,包括ChatGPT-4、ChatGPT-4o、Gemini和SID 2.0。研究使用92張高解析度圖像,涵蓋25種器械,並根據準確度等指標進行評估。結果顯示,ChatGPT-4o的準確度最高,達89.1%,而Gemini表現最差,僅44.6%。雖然這些模型能有效分類外科器械,但在精確識別特定器械類型上仍面臨挑戰,顯示出進一步開發的必要性,以提升準確度並確保病人安全。 相關文章 PubMed DOI

這項研究探討大型語言模型(LLM)LLaMA 2 在臨床護理的應用,特別是解釋複雜的護理路徑模型。傳統的診斷系統繁瑣且需頻繁更新。研究人員訓練 LLaMA 2,並測試其根據假設病人案例提供臨床建議的能力。結果顯示,LLaMA 2 在檢索診斷和建議管理步驟方面準確率高,平均節點準確率為 0.91,邊緣準確率為 0.92,顯示其在醫療資訊檢索上的潛力。未來研究應著重於提升 LLM 的可解釋性及與臨床流程的整合。 相關文章 PubMed DOI

這項研究探討了兩種大型語言模型(LLMs)在胃腸科臨床實踐中的應用,分別是自訂的GPT模型和傳統的GPT-4o。研究發現,自訂模型在15個臨床問題中正確回答了8個,而研究員則回答了10個。傳統的GPT-4o表現最佳,正確率達14/15。雖然兩種模型的表現略低於專家醫生,但顯示出在病人諮詢等專業任務中的潛力。研究強調了RAG技術的重要性及臨床醫師監督的必要性。 相關文章 PubMed DOI

這項評估針對五種大型語言模型(LLMs)在重症護理藥物治療問題上的表現進行測試,結果顯示ChatGPT-4的準確性最高,達71.6%。LLMs在知識回憶問題上表現較好,但在知識應用問題上則不及藥學博士學生(學生準確性81%)。使用思考鏈提示可提升ChatGPT-4的準確性至77.4%。這顯示LLMs在特定領域仍需進一步訓練,以改善其應用能力,對於全面藥物管理的使用應謹慎。 相關文章 PubMed DOI