原始文章

這項研究評估了ChatGPT在麻醉學和疼痛醫學的問題解決能力,特別是在韓語環境中,並比較了GPT-4、GPT-3.5和CLOVA X的表現。分析了398道問題後發現,GPT-4的準確率(67.8%)顯著高於GPT-3.5(37.2%)和CLOVA X(36.7%),而後兩者之間無顯著差異。此外,GPT-4在英語翻譯問題上的表現(75.4%)也優於韓語問題。研究強調了AI在醫學教育的潛力,但也提醒在非英語環境中應用時需謹慎,並建議進一步改進。 PubMed DOI


站上相關主題文章列表

研究比較了ChatGPT的GPT-3.5和GPT-4模型在解答韓國外科醫師考試問題時的表現,結果顯示GPT-4準確率高達76.4%,明顯勝過GPT-3.5的46.8%。GPT-4在各專業領域都表現穩定,但仍需搭配人類專業知識和判斷力。 PubMed DOI

研究比較了ChatGPT和GPT-4在沒有圖像的骨科住院醫師考試(OITE)上的表現。ChatGPT在PGY-1級別回答問題的準確率為54.3%,並有47.2%引用來源,期刊影響因子為5.4。GPT-4在PGY-5級別回答問題的準確率為73.6%,並有87.9%引用來源,期刊影響因子為5.2。結果顯示GPT-4優於平均PGY-5級別,顯示明顯進步。AI有潛力提升醫學教育和醫療服務效率。 PubMed DOI

ChatGPT是OpenAI開發的AI,擅長自然直覺回答。雖然有時會出錯,但經過訓練改進。新版GPT-4預計比GPT-3.5多40%正確回答。在英文表現優秀,現正評估其他語言的醫學資訊。在日本醫學研究中,GPT-4比GPT-3.5表現更好,正確率達81.5%。有潛力成為醫師診斷輔助工具,符合日本醫學執照考試標準。透過持續學習,ChatGPT可成為醫學專業人士的決策支援系統。 PubMed DOI

研究比較了日本住院醫師和 GPT-4 在使用 GM-ITE 考題時的臨床能力。結果顯示,GPT-4 在特定疾病、婦產科和內科方面表現較好,但在醫學訪談、一般實踐和精神科方面表現較差。GPT-4 在困難問題上表現較佳,但在簡單問題上表現較差。年度比較也呈現不同結果。這些發現揭示了人工智慧在醫學教育和實踐中的優勢和限制。 PubMed DOI

研究發現ChatGPT在台灣核子醫學專業考試中表現優異,尤其在理論知識和臨床醫學方面。然而,在醫學法規問題上稍嫌不足。研究使用GPT-4和思維鏈方法提升人工智慧表現,建議問題適中且含較多英文單詞可提高準確性。人工智慧可協助評估考試難度,確保公平性,在醫療教育和多語環境中展現潛力,未來進步將提升其在醫學領域的實用性。 PubMed DOI

台灣醫療好,2022和2023年醫師考試數據顯示ChatGPT-4準確率介於63.75%到93.75%,最高93.75%在2022年2月。眼科、乳房外科、整形外科、骨科和普通外科表現較差。透過“思維鏈”方法,ChatGPT-4準確率提升至90%以上,在台灣醫師考試表現優異。 PubMed DOI

人工智慧語言模型被研究應用在教育、學術和臨床領域,顯示可解答醫學問題,對醫學教育有幫助。研究發現ChatGPT在回答問題上表現準確,但在生成文章時有錯誤。雖然在醫療上有潛力,但仍需監督因應潛在錯誤和能力限制。 PubMed DOI

這項研究評估了ChatGPT-3.5在肺病學考試中的表現,並與三年級醫學生進行比較。研究分為兩組:244名法語醫學生和ChatGPT,後者以無上下文(V1)和有上下文(V2)兩種格式測試。結果顯示,V1在放射學和胸外科表現佳,但在病理學和藥理學上不理想;V2則在所有類別中表現更準確,並在開放式問題上優於學生。V2通過考試的比例超過62.1%,而V1未能通過。總體而言,ChatGPT的表現與醫學生相似,受問題格式和複雜度影響,尤其在需要臨床判斷的任務上表現不佳。 PubMed DOI

這項研究回顧了ChatGPT在醫學執照考試的表現,分析了2022年1月到2024年3月間的45項研究。結果顯示,GPT-4的準確率達81%,優於GPT-3.5的58%。GPT-4在29項考試中通過26項,並在17個案例中超越醫學生。雖然翻譯問題提升了GPT-3.5的表現,但對GPT-4無影響。兩者在問題類型上表現不同,GPT-3.5在短文本問題上較佳,而開放式問題則都面臨挑戰。研究強調了GPT-4在醫學教育的潛力,但也指出準確性不一致及各國知識差異的挑戰,旨在提供教育者和政策制定者相關資訊。 PubMed DOI

一項研究比較了麻醉學研究員與ChatGPT在美國麻醉學委員會標準化口試中的表現。雖然研究員在某些主題上得分較高,但整體得分差異不大。考官能輕易辨識ChatGPT的回答,並指出其回答通常冗長且缺乏重點,雖然內容相關。研究顯示,ChatGPT的答案在評分上相當,但因冗長和不夠具體而被視為較劣。這項研究指出,隨著進一步訓練,像ChatGPT的人工智慧有潛力成為麻醉學訓練和考試準備的有用工具。 PubMed DOI