原始文章

這項研究探討AI聊天機器人對骨肉瘤患者護理的影響,分析其風險與好處。研究者向三個聊天機器人提出與診斷、治療和康復相關的問題,並根據五個指標評估其回答。結果顯示,聊天機器人在相關性和平衡性方面表現良好,但在數據基礎、完整性和事實準確性上得分較低。GPT-4在同理心方面得分最高,但在治療和康復問題的可行性較低。整體而言,雖然AI有潛力,但在準確性和可及性上仍有待改善,影響其臨床應用。 PubMed DOI


站上相關主題文章列表

消費者使用AI聊天機器人查詢癌症資訊,但資訊品質尚未經評估。研究使用驗證工具評估4個AI聊天機器人提供的癌症資訊,發現資訊品質良好、無錯誤,但易懂性中等、操作性較差。內容以大學程度撰寫。AI聊天機器人可提供正確資訊,但操作性有限,應視為醫療資訊輔助。 PubMed DOI

研究用DISCERN標準評估AI聊天機器人對常見癌症問題回答的品質,發現ChatGPT比Bing AI表現較好。AI在醫療上有潛力,但仍需改進,尤其在癌症等重要領域,以避免給患者和家人帶來誤解或壓力。 PubMed DOI

研究比較了不同AI聊天機器人在正顎手術中的表現,結果顯示回答品質高、可靠性佳,但易讀性需高學歷。ChatGPT-4有創意,OpenEvidence則回答相似。儘管聊天機器人提供高品質答案,仍建議諮詢專業醫師。 PubMed DOI

越來越多人用大型語言模型的AI聊天機器人來提供醫學資訊,包括骨骼健康。研究發現三個熱門聊天機器人在回答骨骼健康問題時表現不同,ChatGPT 4.0最好。但有限制,如回答不一致或不完整、來源不當,缺乏考慮患者背景。需訂定指引,負責任地使用AI聊天機器人提供骨骼健康資訊。 PubMed DOI

AI ChatGPT自2022年11月問世後,在全球大受歡迎。它能提供關於疾病和治療的資訊,包括肉瘤。一項研究比較ChatGPT對肉瘤問題的回答與專家指南,發現回答的質量中位數得分為25分中的18.3分。研究指出,在尋求醫學資訊時要謹慎,尤其是對於罕見疾病如肉瘤。 PubMed DOI

社群媒體常被用來找健康資訊,AI聊天機器人如ChatGPT-3.5、Bing Chat和Google Bard也在發展中。研究發現,Bing Chat和Google Bard比ChatGPT更具同理心。醫療AI聊天機器人應提供正確且安全的資訊,對醫護人員而言尤為重要。 PubMed DOI

研究發現AI聊天機器人在回答癌症患者問題時表現優異,比腫瘤學家更具同理心且易懂。這顯示機器人有潛力提供良好的回應,但仍需進一步研究其對患者護理的全面影響。 PubMed DOI

這項研究評估了OpenAI的ChatGPT-4和Google的Bard在回答前列腺癌新療法<sup>177</sup>Lu-PSMA-617的準確性、可讀性和簡潔性。結果顯示,ChatGPT-4的回答準確性較高(得分2.95對2.73),但Bard的可讀性更佳(得分2.79對2.94)。兩者在簡潔性上相似。ChatGPT-4的錯誤資訊較少(16.6%),而Bard則有較多誤導性資訊。總體來看,這兩個AI仍需改進,才能成為病人尋求相關資訊的可靠來源。 PubMed DOI

這項研究探討了開放存取的人工智慧軟體ChatGPT在回答與骨科手術相關的病人問題的準確性。研究聚焦於六種手術,包括前交叉韌帶重建和全髖關節置換等。研究者向ChatGPT提出標準問題,並將其回答與專家意見比較,結果顯示平均得分為2.43,顯示與專家意見有一定一致性。研究指出,ChatGPT可能成為病人了解手術選擇的有用工具,但仍需進一步研究以驗證結果並探討其在外科實踐中的應用。 PubMed DOI

這項研究評估了大型語言模型(LLM)聊天機器人對於常見病人問題(如下背痛)的回答準確性和可讀性。研究分析了30個由臨床醫師制定的問題,結果顯示120個回答中,55.8%準確,42.1%不準確,1.9%不清楚。治療和自我管理的回答較準確,但風險因素的回答最不準確。整體可讀性被評為「相當困難」,平均得分為50.94。此外,70%-100%的回答都包含健康建議的免責聲明。研究建議,雖然LLM聊天機器人對病人教育有幫助,但準確性和可靠性可能因主題而異,影響病人理解。 PubMed DOI