Physician Assessment of ChatGPT and Bing Answers to American Cancer Society's Questions to Ask About Your Cancer.
醫師評估 ChatGPT 和必應答案對美國癌症協會提出的有關您的癌症問題的評估。 Am J Clin Oncol 2024-02-28

研究用DISCERN標準評估AI聊天機器人對常見癌症問題回答的品質，發現ChatGPT比Bing AI表現較好。AI在醫療上有潛力，但仍需改進，尤其在癌症等重要領域，以避免給患者和家人帶來誤解或壓力。 PubMed DOI

Performance of AI chatbots on controversial topics in oral medicine, pathology, and radiology.
人工智慧聊天機器人在口腔醫學、病理學和放射學爭議性議題上的表現。 Oral Surg Oral Med Oral Pathol Oral Radiol 2024-03-29

研究評估了6個口腔醫學領域的人工智慧聊天機器人，發現GPT-4在口腔放射學和整體表現方面表現最佳。其中23.50%的引用資料是虛假的，建議開發者應加入引用驗證器以確保資訊準確性。 PubMed DOI

Evaluation of AI-generated responses by different artificial intelligence chatbots to the clinical decision-making case-based questions in oral and maxillofacial surgery.
口腔顎面外科臨床決策案例問題對不同人工智慧聊天機器人生成的回應的評估。 Oral Surg Oral Med Oral Pathol Oral Radiol 2024-04-03

研究比較了不同聊天機器人在口腔顎面外科問題上的表現，結果顯示它們的準確性普遍不高，GPT-4在開放式問題上表現較好。這表明聊天機器人在臨床決策中可能不夠可靠。 PubMed DOI

Physician and Artificial Intelligence Chatbot Responses to Cancer Questions From Social Media.
醫師和人工智慧聊天機器人對社群媒體上癌症問題的回應。 JAMA Oncol 2024-05-16

研究發現AI聊天機器人在回答癌症患者問題時表現優異，比腫瘤學家更具同理心且易懂。這顯示機器人有潛力提供良好的回應，但仍需進一步研究其對患者護理的全面影響。 PubMed DOI

Performance of ChatGPT-4 and Bard chatbots in responding to common patient questions on prostate cancer 177Lu-PSMA-617 therapy.
ChatGPT-4 和 Bard 聊天機器人在回答有關前列腺癌 177Lu-PSMA-617 治療的常見病人問題中的表現。 Front Oncol 2024-07-29

這項研究評估了OpenAI的ChatGPT-4和Google的Bard在回答前列腺癌新療法177Lu-PSMA-617的準確性、可讀性和簡潔性。結果顯示，ChatGPT-4的回答準確性較高（得分2.95對2.73），但Bard的可讀性更佳（得分2.79對2.94）。兩者在簡潔性上相似。ChatGPT-4的錯誤資訊較少（16.6%），而Bard則有較多誤導性資訊。總體來看，這兩個AI仍需改進，才能成為病人尋求相關資訊的可靠來源。 PubMed DOI

Assessment of Artificial Intelligence Chatbot Responses to Common Patient Questions on Bone Sarcoma.
人工智慧聊天機器人對骨肉瘤常見病人問題回答的評估。 J Surg Oncol 2024-10-29

這項研究探討AI聊天機器人對骨肉瘤患者護理的影響，分析其風險與好處。研究者向三個聊天機器人提出與診斷、治療和康復相關的問題，並根據五個指標評估其回答。結果顯示，聊天機器人在相關性和平衡性方面表現良好，但在數據基礎、完整性和事實準確性上得分較低。GPT-4在同理心方面得分最高，但在治療和康復問題的可行性較低。整體而言，雖然AI有潛力，但在準確性和可及性上仍有待改善，影響其臨床應用。 PubMed DOI

Accuracy of Prospective Assessments of 4 Large Language Model Chatbot Responses to Patient Questions About Emergency Care: Experimental Comparative Study.
大型語言模型聊天機器人對患者急救問題的前瞻性評估準確性：實驗比較研究。 J Med Internet Res 2024-11-04

最近調查顯示，48%的消費者使用生成式AI查詢健康資訊，但對於AI聊天機器人在緊急護理建議的回應質量研究仍然不足。一項針對四款免費AI聊天機器人的研究發現，雖然它們在清晰度和可理解性上表現良好，但準確性和來源可靠性卻相當低。危險信息的出現率在5%到35%之間，且各機器人之間差異不大。研究建議應加強對AI聊天機器人的研究與規範，並強調諮詢醫療專業人員的重要性，以避免潛在風險。 PubMed DOI

Evaluating AI Chatbot Responses to Postkidney Transplant Inquiries.
評估 AI 聊天機器人對腎臟移植後詢問的回應。 Transplant Proc 2025-01-15

這項研究評估了三款AI聊天機器人—ChatGPT 4.0、Claude 3.0和Gemini Pro—以及Google在回答腎臟移植後常見問題的表現。研究使用5點李克特量表評估回應質量，並透過病人教育材料評估工具（PEMAT）檢視可理解性和可行性。結果顯示，回應質量高（中位分數4），可理解性良好（中位72.7%），但可行性較差（中位20%）。可讀性較難，Claude 3.0提供最可靠的回應，而ChatGPT 4.0則在可理解性上表現突出。Google在各項指標上未能超越這些聊天機器人。 PubMed DOI

ChatGPT and oral cancer: a study on informational reliability.
ChatGPT 與口腔癌：資訊可靠性的研究。 BMC Oral Health 2025-01-20

這項研究評估了ChatGPT-3.5在回答口腔癌相關問題的準確性，因為早期診斷對患者結果影響重大。研究中提出20個問題，並由醫療專家評估其回答。結果顯示，51.25%的答案被評為非常好，46.25%為好，僅2.5%可接受。專家評分間無顯著差異。雖然ChatGPT提供的資訊可靠，但引用的81篇文獻中，只有13篇是合法的科學文章，10篇為假文獻，其餘則來自各種網站。總體而言，ChatGPT的資訊值得參考，但需謹慎對待其引用來源。 PubMed DOI

Evaluating artificial intelligence chatbots for patient education in oral and maxillofacial radiology.
評估人工智慧聊天機器人在口腔與顏面放射學中對病人教育的應用。 Oral Surg Oral Med Oral Pathol Oral Radiol 2025-03-05

這項研究比較了三款AI聊天機器人—ChatGPT-3.5、Gemini 1.5 Pro和Copilot—在回答口腔與顏面放射學常見問題的表現。研究選取了十五個問題，並由三位OMR專家根據科學準確性、易懂性和滿意度進行評估。結果顯示，雖然聊天機器人在科學準確性上無顯著差異，但整體文本較為複雜，需較高的閱讀水平。研究強調，與醫療專業人員驗證AI生成資訊對改善病患護理和安全性的重要性。 PubMed DOI

原始文章

站上相關主題文章列表