LLM 相關三個月內文章 / 第 126 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這項研究評估了ChatGPT在回答慢性腎病(CKD)常見問題的可靠性與重現性。研究人員分析了85個問題,最終納入60個進行評估。兩位腎臟科醫生對答案進行1到4的評分,結果顯示85%的問題得分為1,表示可靠性低,只有11.7%得分為2,3.3%得分為3。重複問題的答案相似度在80%到100%之間。總體來看,雖然大多數答案質量不高,但ChatGPT在CKD問題上的回應仍具可靠性和高重現性。 相關文章 PubMed DOI

本系統性回顧評估大型語言模型(LLMs)在黑色素瘤護理中的應用、優點與挑戰。透過PubMed和Scopus資料庫搜尋截至2024年7月23日的研究,納入九項研究,分為病人教育、診斷和臨床管理三類。結果顯示,LLMs在病人教育上準確性高,但可讀性常超過建議水平;在診斷上,多模態LLMs如GPT-4V能區分黑色素瘤與良性病變,但準確性受影響;在管理建議上,ChatGPT較為可靠,但仍需加強個性化決策能力。未來研究應聚焦於利用多樣化的皮膚科數據庫進行模型微調。 相關文章 PubMed DOI

這項研究探討了訓練過的GPT-4模型對初級風濕病住院醫師臨床決策的影響。結果顯示,使用訓練過的AI模型的住院醫師在處理炎症性關節炎案例時,表現明顯優於未訓練的同儕。評估使用修訂版IDEA (R-IDEA)系統,AI在各項評估中得分顯著較高。此外,調查顯示60%的住院醫師支持將AI作為輔助工具,認為能提升他們的能力並減輕疲勞。總之,訓練過的GPT-4可有效支持住院醫師,改善臨床推理及管理技能。 相關文章 PubMed DOI

聊天機器人和自然語言處理(NLP)在放射學的應用正逐漸受到重視。這篇綜述評估了15篇系統性回顧,指出這些技術能提升臨床決策和病人參與,但也面臨標準化協議不足的挑戰,影響其在臨床中的可靠性。此外,NLP與醫療設備的整合研究仍有待加強。未來應優先制定安全部署的標準,並解決數據隱私和算法偏見等倫理問題,以促進病人護理的改善。 相關文章 PubMed DOI

本研究針對腰椎狹窄症(LSS)進行,目的是建立一個自動化放射報告生成系統,利用視覺語言模型簡化MRI診斷過程。我們使用生成圖像到文本模型,並透過GPT-4增強其理解能力。結果顯示,模型能生成語義準確且語法正確的報告,並在性能評估中表現良好。這項研究顯示視覺語言模型在醫學影像報告自動化中的潛力,可能有助於減輕放射科醫生的工作負擔。 相關文章 PubMed DOI

本研究評估了兩種人工智慧工具,M4CXR 和 ChatGPT-4o,在解讀胸部 X 光片的診斷能力。研究分析了826張影像,結果顯示M4CXR在準確性和一致性上均優於ChatGPT,診斷準確性分別為60-62%和42-45%。M4CXR在解剖定位的準確性達76-77.5%,而ChatGPT僅36-36.5%。研究強調這些技術的互補潛力,建議結合人工智慧與臨床判斷,以提升病患護理結果。 相關文章 PubMed DOI

這項研究評估了ChatGPT-4o在急性心臟病案例中的表現,並與心臟科醫生和急診醫生進行比較。結果顯示,ChatGPT-4o和心臟科醫生的準確性均達100%,而急診醫生較低。ChatGPT-4o反應最快,且在準確性和完整性上得分最高。研究顯示,ChatGPT-4o的表現優於人類醫生,顯示其在臨床決策支持上的潛力,但人類監督仍然對安全整合AI進醫療至關重要。 相關文章 PubMed DOI

肺癌,特別是非小細胞肺癌(NSCLC),對健康影響深遠,超過60%的患者需接受放射治療。及時治療能提高生存率,因此準確的腫瘤分割至關重要。傳統手動分割耗時且可能延誤治療。雖然已有深度學習模型,但假陽性率高。為解決此問題,我們開發了EXACT-Net,這是一個自動分割模型,結合電子健康紀錄(EHR)和預訓練的大型語言模型(LLM),有效減少假陽性,專注於真陽性結節。根據十名NSCLC患者的CT掃描數據,我們的方法成功檢測結節增長250%,顯示整合視覺與語言信息能顯著提升模型性能,為醫學影像的多模態AI應用開創新局。 相關文章 PubMed DOI

這項研究評估了三種大型語言模型(LLMs)—ChatGPT-3.5、ChatGPT-4 和 Gemini Advanced—在創建和改善乾眼症患者教育材料的效果。研究人員使用了三個提示來生成新的材料和重寫現有內容。結果顯示,生成的材料質量高、易懂且準確,但內容實用性不足。重寫現有材料時,ChatGPT-4 和 Gemini Advanced 成功降低了可讀性,且誤導性資訊很少,但只有ChatGPT-4保持了高質量。整體而言,這項研究顯示大型語言模型,特別是ChatGPT-4,對提升乾眼症患者教育材料的質量和可及性具有潛力。 相關文章 PubMed DOI

這項研究探討了大型語言模型GPT-4在檢測社交焦慮症狀的效果,共有51名德國成年人參加。他們在線上訪談前填寫了社交焦慮自我報告問卷(SPIN)。結果顯示,GPT-4的預測與自我報告分數之間有強烈相關性(r = 0.79),F1準確率達到0.84。作者建議需進一步研究,以在更大且多樣的樣本中驗證這些結果。 相關文章 PubMed DOI