原始文章

這項系統性回顧分析了137篇經過同行評審的研究,探討生成式人工智慧聊天機器人在健康建議上的表現。結果顯示,研究報告標準差異大,主要集中在外科、醫學和基層醫療。大部分研究針對治療、診斷或疾病預防,但幾乎全數(99.3%)使用的都是無法訪問的封閉源碼大型語言模型,且對其特徵描述不足。此外,多數研究未提及提示工程,只有少數討論倫理、法規及病人安全。這些結果顯示需改善報告標準,建議開發聊天機器人評估報告工具(CHART),以提升臨床評估與整合的效果。 PubMed DOI


站上相關主題文章列表

研究發現三款大型語言模型在醫療決策上的表現,ChatGPT最優,其次是Google的Bard和Bing的AI。結果顯示ChatGPT提供更易懂且符合指引的醫療建議,對初級醫生學習和臨床決策有潛力,但還需更多整合到教育中。 PubMed DOI

2022年11月,ChatGPT推出後受到人們對大型語言模型(LLMs)在各領域的興趣,尤其是醫療保健的關注。綜述了65篇研究文章,探討對話式LLMs在醫療保健中的應用和關注點。大部分研究聚焦在摘要和醫學知識查詢,強調可靠性和偏見問題。雖然LLMs在提供準確資訊方面有潛力,但在複雜健康任務上仍有挑戰。未來研究需加強LLMs在醫療保健中的可靠性,解決偏見和隱私問題。在運用LLMs於醫療保健上,法律、社會和技術層面的努力至關重要。 PubMed DOI

使用大型語言模型如OpenAI的ChatGPT提供胃腸肝臟疾病醫療建議的趨勢增加,但目前準確性仍有疑慮。研究指出,這些模型在胃腸肝臟疾病領域的回應準確率偏低,可能帶來安全風險,因為提供錯誤資訊可能對醫療系統造成負擔或延誤治療。 PubMed DOI

大型語言模型(LLMs)如ChatGPT在醫療上有好處,但也引起道德疑慮。研究探討了LLMs在醫學上的道德議題,提到了優點如數據分析和決策支持,也指出了公平性、偏見和隱私等疑慮。強調在醫療上使用LLMs時,需要道德指導、人類監督和批判性評估。 PubMed DOI

這項研究系統性回顧了生成性大型語言模型(LLMs)在臨床環境,特別是電子健康紀錄(EHRs)的應用。儘管自然語言處理技術進步,LLMs在臨床實踐中的整合仍有限,面臨多重挑戰。研究分析了自2023年以來的76篇相關文獻,發現包括提示工程的使用、少數多模態數據的應用、評估指標的多樣性,以及臨床決策中的偏見和幻覺等問題。未來需改進計算技術和標準化評估,以提升LLMs在醫療中的可靠性。總之,LLMs在病人護理上有潛力,但仍需克服重大障礙。 PubMed DOI

最近調查顯示,48%的消費者使用生成式AI查詢健康資訊,但對於AI聊天機器人在緊急護理建議的回應質量研究仍然不足。一項針對四款免費AI聊天機器人的研究發現,雖然它們在清晰度和可理解性上表現良好,但準確性和來源可靠性卻相當低。危險信息的出現率在5%到35%之間,且各機器人之間差異不大。研究建議應加強對AI聊天機器人的研究與規範,並強調諮詢醫療專業人員的重要性,以避免潛在風險。 PubMed DOI

這篇評論探討了對話式大型語言模型(LLMs)在醫療保健的應用及其相關問題,特別是在2022年11月ChatGPT推出後的情況。總結了截至2023年9月1日的65篇經過同行評審的研究,主要來自PubMed、ACM和IEEE等資料庫。研究多集中於ChatGPT,應用範疇包括摘要、醫學知識查詢等。評論指出的擔憂有可靠性、偏見、隱私及公眾接受度。雖然LLMs在摘要和一般醫學知識上有潛力,但在複雜任務上表現不佳。未來研究應加強LLMs的可靠性,並探討偏見和隱私問題的根源,強調需有法律、社會及技術措施來解決這些挑戰。 PubMed DOI

大型語言模型(LLMs)在臨床實踐中有潛力提升病人教育與賦權,提供更個人化的醫療服務。然而,目前對其在病人照護中的應用資訊仍不夠完整。本系統性回顧分析了2022至2023年間的89項相關研究,主要集中於GPT-3.5和GPT-4,應用於回答醫療問題、生成病人資訊等。研究指出設計和輸出方面的限制,包括缺乏針對醫療的優化及數據透明度等問題。此回顧為LLMs在醫療環境中的應用與評估提供了基礎框架。 PubMed DOI

最近大型語言模型(LLMs)在即時搜尋和多語言支持上有了顯著進展,但提供健康資訊的安全性仍然很重要。針對七個公開的LLMs進行的評估顯示,英語回應中沒有臨床錯誤,但294個非英語回應中有7個出現錯誤。雖然48%的回應有有效引用,但39%的英語引用來自.com網站,質量堪憂。此外,英語回應的閱讀水平普遍較高,非英語回應也相對複雜。這些結果顯示LLMs在準確性和可讀性上仍需改進,持續的基準測試是必要的。 PubMed DOI

大型語言模型(LLMs)在臨床醫學中展現出潛力,能改善決策支持、診斷及醫學教育。不過,將其整合進臨床流程需徹底評估,以確保可靠性、安全性及倫理性。本系統性回顧調查了LLMs在臨床環境中的評估方法,發現大多數研究集中於一般領域的LLMs,醫學領域的研究較少。準確性是最常評估的參數。儘管對LLMs的興趣上升,研究中仍存在限制與偏見,未來需建立標準化框架,確保其安全有效地應用於臨床實踐。 PubMed DOI