原始文章

人工智慧(AI)在醫療領域的應用日益增多,尤其是在臨床決策和教育方面。針對胚胎移植,我們請九個聊天機器人撰寫300字的科學論文,探討改善成功率的方法。結果顯示,雖然總共提出43條建議,但只有3條(15.8%)是基於堅實證據。有效的建議包括「超聲引導胚胎移植」、「單胚胎移植」和「使用柔性導管」。相對地,一些有爭議的建議如「植入前基因檢測」則被頻繁提及。研究結果顯示,現有AI在提供可靠建議方面仍有待加強,患者和醫生需謹慎對待這些建議。 PubMed DOI


站上相關主題文章列表

ChatGPT是OpenAI開發的聊天機器人,被用在腎移植研究。研究指出,雖然ChatGPT對主題有基本了解,但缺乏精確和充足資訊。它回答問題時沒有提供參考資料,提供的資料也不夠準確。雖然可協助數據收集,但應謹慎使用,不可單獨憑它做出醫療決定,因為資料可能不準確或缺失。 PubMed DOI

研究比較了基於GPT-3.5的AI聊天機器人和神經學醫師在臨床案例中的診斷和決策表現。結果顯示,AI聊天機器人在神經學領域的表現相當不錯,正確率高達85%,並能提供96.1%的案例充分理由。研究指出AI可作為神經學臨床推理的輔助工具,未來應用前景廣闊。 PubMed DOI

研究評估了ChatGPT-4在撰寫生育保育相關生物醫學評論的表現。結果顯示,ChatGPT-4能夠撰寫相關且引用參考文獻的文章,但引文和參考文獻方面有不準確之處。雖然抄襲程度低,相關性高,但深度和時效性較差。建議ChatGPT-4可用於撰寫科學評論時作為輔助工具,但不宜單獨使用。 PubMed DOI

醫護人員利用AI聊天機器人快速取得資訊,但AI生成的化療方案準確性尚未經研究。研究發現,ChatGPT和Bing用於模擬癌症患者的化療方案,ChatGPT得5分、Bing得4分,兩者差異不大。AI聊天機器人有潛力生成化療方案,但仍有限制,在臨床應用上需謹慎。 PubMed DOI

研究比較三個AI聊天機器人在提供產科文獻參考資料的可靠度,發現Google Bard最準確,而ChatGPT和Chatsonic較不準確。使用AI做科學寫作和文獻搜尋時要小心,但AI與研究人員合作或許有助於進步病患護理。 PubMed DOI

研究比較了AI輔助的ChatGPT諮詢和傳統面對面互動對不孕症患者的影響。結果顯示,ChatGPT諮詢讓患者更滿意且諮詢時間更短,但在理解、人口統計和諮詢後行動方面則差不多。AI輔助諮詢在生殖醫學領域有潛力,但長期影響和臨床結果仍需更多研究。AI或許可成為有效替代方案,提升患者滿意度和醫療效率。進一步研究可能影響未來醫療實務和政策,尤其是AI整合的議題。 PubMed DOI

這項研究評估了三款AI聊天機器人—ChatGPT、Bard和Bing—在提供有關輸精管結紮手術資訊的效果。研究者向每個機器人提出十個常見問題,並由三位泌尿科醫生根據回答的清晰度、準確性和證據基礎進行評分。結果顯示,ChatGPT的表現最佳,平均評分為1.367,明顯優於Bard和Bing。整體來看,這些AI聊天機器人能提供大部分準確的資訊,對患者而言是有用的資源,尤其是ChatGPT最為準確且簡潔。 PubMed DOI

這項研究評估了ChatGPT 3.5在提供乳癌資訊的有效性。研究人員提出20個常見問題,並根據準確性、臨床一致性和可讀性進行評估。結果顯示,平均準確性得分為1.88,臨床一致性得分為2.79,回答平均字數為310字,但可讀性較差,Flesch Kincaid指數為37.9。研究發現,24%的回答是錯誤的,41%的回答缺乏真實參考文獻,建議病患在依賴ChatGPT獲取醫療資訊時要特別謹慎。 PubMed DOI

這項研究評估了婦科腫瘤學中醫生與AI聊天機器人(如ChatGPT和Bard)對常見臨床問題的回答質量。研究中,五位醫生和兩個AI平台回答了十個問題。結果顯示,醫生的回答在76.7%的情況下被評為最佳,明顯優於ChatGPT(10%)和Bard(13.3%)。醫生的準確率為86.7%,而AI的準確率則分別為60%和43%。這顯示醫生的回答質量和準確性高於AI,並提醒大家在尋求醫療建議時要謹慎使用AI。 PubMed DOI

在人工智慧時代,許多病人會在線上尋找健康資訊。本研究評估了三個人工智慧聊天機器人(ChatGPT、Gemini、Copilot)提供的泌尿生殖系統癌症治療資訊的可靠性。評審結果顯示,ChatGPT和Gemini的資訊質量中等,分別得41分和42分,而Copilot得分較低(35分)。整體可理解性偏低,只有Gemini的可行性得分達60%。這顯示病人需謹慎使用這些工具,因為它們提供的資訊質量和可靠性普遍不高,且難以理解。 PubMed DOI