原始文章

這項德國研究發現,醫師和醫學生用ChatGPT查職業性肺病資料時,在找有害物質等研究任務上表現較好,也覺得自己專業知識有提升。但在臨床決策(像是否通報職業病)時,自己查資料的答對率反而更高。總結:ChatGPT適合輔助醫學研究,但臨床決策還是不能只靠它。 PubMed DOI


站上相關主題文章列表

這項研究評估了ChatGPT對臨床問題的回答,與人類撰寫的網站Pearls4Peers.com進行比較,重點在可用性和可靠性。研究發現,ChatGPT的回答質量有顯著差異,約14%的回答被認為不實用,13%不準確。與人類來源相比,ChatGPT在可用性和可靠性方面的表現均不佳,超過30%的情況下表現不如人類。總體來看,這顯示在臨床決策中使用ChatGPT需謹慎。 PubMed DOI

2022年11月,OpenAI推出了ChatGPT,引發了對其在醫學領域有效性的討論。研究專注於ChatGPT對髕股疼痛的回答能力,並比較一般民眾、非骨科醫生及專家的評價。使用12個問題進行評估,結果顯示專家對ChatGPT的評分普遍較低,尤其在複雜問題上。雖然ChatGPT提供的資訊質量不錯,但隨著問題複雜度增加,其表現下降,顯示出人類專業知識在醫療中的重要性。 PubMed DOI

這項研究探討了ChatGPT-4在將醫學術語翻譯成病人易懂語言的效果,並與不同醫師群體進行比較。研究評估了105個醫學術語,結果顯示ChatGPT-4的準確率達到100%,超過專科醫師(98.1%)、住院醫師(93.3%)和一般醫師(84.8%)。這些差異具有統計學意義,顯示ChatGPT-4在病人教育上是個可靠工具。不過,研究也強調醫療專業人員在臨床決策中的重要性仍不可或缺。 PubMed DOI

這項研究評估了ChatGPT 3.5和4.0在藥物諮詢服務中的表現。結果顯示,ChatGPT 3.5在80%的案例中提供了不錯的答案,而ChatGPT 4.0的表現更佳,98%的回應與醫生的回答相似或更好。不過,兩者的回應都缺乏參考文獻,有時也未能充分解決臨床相關問題。雖然ChatGPT 4.0的答案品質相當高,但在提供參考和臨床解釋方面的不足,顯示它不太適合成為臨床環境中的主要資訊來源。 PubMed DOI

這項研究探討了ChatGPT-4在牙科領域進行基於證據的決策的可行性。兩位牙醫與ChatGPT-4互動,分析五個臨床情境,並參考Cochrane、ADA和PubMed的文獻。結果顯示,ChatGPT-4表現穩定,能有效識別相關證據並提供摘要,節省臨床醫師的時間。不過,它無法提供直接的網頁連結到引用的文章,這是個限制。總體而言,ChatGPT-4在EBDM中顯示出潛力,但臨床醫師仍需負責評估證據和做出決策。 PubMed DOI

這項研究評估了ChatGPT在提供慢性疾病患者教育方面的表現,特別針對炎症性腸病(IBD),並與專科醫生的回應進行比較。結果顯示,ChatGPT的整體品質評分與專科醫生相似,且在信息完整性上有明顯優勢。雖然準確性無顯著差異,但在患者和醫生共同回應時,ChatGPT表現較差。研究建議在健康信息創建和評估中,應納入患者的參與,以提升質量和相關性。 PubMed DOI

這項研究評估了手部手術相關的線上醫療資訊,並比較了Google、ChatGPT-3.5和ChatGPT-4.0的回應。研究針對腕隧道症候群、網球肘和富血小板血漿用於拇指關節炎三個問題進行分析。 主要發現包括: 1. **可讀性**:Google的回應較易讀,平均在八年級水平,而ChatGPT則在大學二年級水平。低共識主題的可讀性普遍較差。 2. **可靠性與準確性**:ChatGPT-4的可靠性與3.5相似,但低共識主題的可讀性較低,準確性差異不大。 3. **覆蓋範圍**:ChatGPT-4和Google在疾病原因和程序細節的覆蓋上有所不同,但在解剖學和病理生理學上相似。 總結來說,雖然ChatGPT能提供可靠的醫療資訊,但可讀性較差,醫療提供者需注意其局限性。 PubMed DOI

這項研究發現,ChatGPT-4在有選擇題選項時,答對率超過86%,但沒選項時最低只有61.5%。它在管理問題上比診斷問題更容易出錯。雖然GPT-4能處理臨床資訊,但不是真的懂臨床情境。未來如果和專業醫療人員搭配,有機會幫助臨床工作,但還需要更多測試來確保安全和有效。 PubMed DOI

Bagde 等人(2023)系統性回顧發現,ChatGPT 在醫學和牙醫領域的研究、教育及臨床決策上有潛力,但目前仍有準確性、可靠性和倫理等問題待解決,需更多高品質研究來驗證其效益。 PubMed DOI

這項研究比較了ChatGPT-3.5和4在職業風險預防選擇題的表現,GPT-3.5正確率56.8%,GPT-4為73.9%。兩者在專業題目上都容易出錯,且錯誤類型相似。雖然GPT-4表現較好,但在職業健康領域應用上仍有限。建議持續驗證、訓練和針對地區調整,以提升可靠度。 PubMed DOI