原始文章

這項研究評估了婦科腫瘤學中醫生與AI聊天機器人(如ChatGPT和Bard)對常見臨床問題的回答質量。研究中,五位醫生和兩個AI平台回答了十個問題。結果顯示,醫生的回答在76.7%的情況下被評為最佳,明顯優於ChatGPT(10%)和Bard(13.3%)。醫生的準確率為86.7%,而AI的準確率則分別為60%和43%。這顯示醫生的回答質量和準確性高於AI,並提醒大家在尋求醫療建議時要謹慎使用AI。 PubMed DOI


站上相關主題文章列表

子宮頸癌和乳腺癌對女性健康影響深遠,常因污名化和錯誤資訊導致診斷延遲。為評估ChatGPT對這些癌症的回答準確性,進行了一項線上調查,並與十位醫生的回答進行比較。結果顯示,ChatGPT在準確性上表現優於醫生,但在一致性和可讀性方面仍有待加強。整體而言,ChatGPT在提供初步資訊上具潛力,但未來需改善其可靠性和一致性,以更好地協助有健康問題的個體。 PubMed DOI

這項研究評估了三款生成式AI聊天機器人—Chat GPT-4、Claude和Bard—在回答子宮內膜異位症問題的準確性。九位婦產科醫生對十個常見問題的回答進行評分,結果顯示Bard平均得分3.69,Chat GPT 4.24,Claude 3.7。雖然這些機器人的回答大多正確,但仍不夠全面,Chat GPT的表現最佳。研究強調持續評估這些聊天機器人的必要性,以確保能提供準確且全面的資訊,並指出隨著生成式AI在醫療領域的普及,進一步研究的重要性。 PubMed DOI

這項研究評估了五款AI聊天機器人對口腔癌問題的回應,包括Bing、GPT-3.5、GPT-4、Google Bard和Claude。經過專家評估,GPT-4獲得最高質量分數(17.3),而Bing最低(14.9)。Bard在可讀性上表現最佳,GPT-4和Bard在同理心及引用準確性方面也表現突出。整體來看,GPT-4提供的回應質量最高,但大多數聊天機器人在同理心和準確引用上仍有待加強。 PubMed DOI

這項研究評估了ChatGPT-4o在臨床腫瘤學問題上的表現,並與傳統血液腫瘤學教科書進行比較。共評估37個與實體器官腫瘤相關的治療問題,結果顯示ChatGPT-4o的平均得分為7.83,優於教科書的7.0,且具統計意義(p < 0.01)。在10個案例中,ChatGPT-4o提供了更準確的資訊,並在26個案例中表現出更清晰的回答。研究強調定期更新的重要性,顯示ChatGPT-4o在腫瘤學的潛力,但需專家驗證以確保可靠性。 PubMed DOI

這項研究評估了GPT-4和BioMistral 7B兩個大型語言模型在回答罕見疾病病人詢問的表現,並與醫生的回應進行比較。結果顯示,GPT-4的表現優於醫生和BioMistral 7B,回應被認為正確且具同理心。BioMistral 7B的回應則部分正確,而醫生的表現介於兩者之間。專家指出,雖然LLMs能減輕醫生負擔,但仍需嚴格驗證其可靠性。GPT-4在溝通上表現佳,但需注意回應的變異性和準確性。 PubMed DOI

這項研究評估了兩個AI聊天機器人,ChatGPT和ChatSonic,針對腹腔鏡修補腹股溝疝氣的問題所提供的回答質量。研究者提出十個問題,並由兩位外科醫生使用全球質量評分(GQS)和修改版的DISCERN評分來評估。結果顯示,ChatGPT的回答質量較高,獲得了良好的評分,而ChatSonic的表現稍遜。雖然兩者都有潛力,但在可靠性和質量上的不一致性,顯示在臨床使用前仍需進一步驗證。 PubMed DOI

這項研究評估了AI聊天機器人LilyBot(基於ChatGPT-4)對卵巢癌問題的回答準確性,並與婦科腫瘤學專家進行比較。研究人員從線上病患論壇收集問題,請十位專業人士回答,然後由八位獨立醫療專業人員評估這些回答。結果顯示,LilyBot在回答的正確性和完整性上均優於專業人士,尤其在免疫療法和基因療法方面表現突出。這顯示像LilyBot的AI聊天機器人能有效提供卵巢癌的可靠臨床資訊。 PubMed DOI

這項研究比較GPT-4和中國腫瘤科醫師回答癌症病患問題的表現。結果顯示,GPT-4在病患衛教的答案較完整,正確性和安全性也不輸醫師,但在醫療決策上正確率較低,偶爾還會出現危險錯誤。醫師和病患對同理心的感受也不同。總結來說,GPT-4適合用於衛教,但在醫療決策上仍需醫師把關。 PubMed DOI

這項初步研究發現,ChatGPT 3.5回答腦血管問題時,比醫師更完整、有同理心,正確率也差不多,但用詞較艱深,一般人可能看不懂。未來可考慮結合AI和醫師意見,幫助病患更好溝通。 PubMed DOI

這項研究發現,ChatGPT-4.0在乳癌治療建議上,只有46%完全符合專家團隊意見,且重複問答一致性僅39%。它在早期乳癌表現較好,但遇到複雜或基因相關情境就明顯不足,常缺乏臨床細節。總結來說,目前ChatGPT在乳癌多專科照護上,準確度和穩定性都有限,使用時要特別小心。 PubMed DOI