原始文章

這項研究發現,AI大型語言模型在婦產科診斷上,整體表現比住院醫師更好,尤其在時間壓力大或不同語言時更明顯。最強的AI模型診斷準確率高達88%,而住院醫師平均只有65%,且年資越高表現越好。AI對資淺醫師幫助最大,能大幅提升診斷正確率。整體來說,AI有助於提升婦產科訓練和臨床診斷的準確性與穩定性。 PubMed DOI


站上相關主題文章列表

這項研究分析了大型語言模型(LLMs),特別是GPT-3.5和GPT-4,在婦產科教育中的表現。研究比較了2020至2023年間116道考題的得分,結果顯示GPT-4的平均得分為79.31,與住院醫師的得分相當,顯示其表現優異。特別是在婦產科問題上,GPT-4的得分高達90.22,顯示其在該領域的強大能力。研究強調,雖然LLMs如GPT-4展現出潛力,但仍需注意其局限性,應作為人類專業知識的輔助工具。 PubMed DOI

人工智慧(AI)在醫療領域的應用對醫學實踐影響深遠,尤其在教育、診斷和治療方面。本研究評估了OpenAI的ChatGPT在卡塔爾急診醫學住院醫師考試中的表現,並與住院醫師的成績進行比較。結果顯示,ChatGPT在所有考試類別中均表現優於住院醫師,但高年級住院醫師的及格率卻下降,顯示考試成績與實際技能之間的脫節,可能與COVID-19疫情對教育的影響有關。總體而言,ChatGPT在急診醫學領域展現出強大的理論知識,顯示其作為醫學教育輔助工具的潛力。 PubMed DOI

本研究探討AI模型(如GPT-3.5和GPT-4)在急診科生成病症鑑別診斷的表現,並與急診科醫師的準確性進行比較。結果顯示,ChatGPT-4的準確率為85.5%,略高於ChatGPT-3.5的84.6%和醫師的83%。特別是在腸胃主訴方面,ChatGPT-4的準確性達87.5%。研究顯示AI模型在臨床決策中具潛在應用價值,建議未來進一步探索AI在醫療中的應用。 PubMed DOI

這項研究評估了三種先進的人工智慧語言模型(AI-LLMs)在解讀心臟胎兒監護圖(CTG)影像的表現,對於監測胎兒健康至關重要。測試的模型包括ChatGPT-4o、Gemini Advanced和Copilot,並與初級醫生和資深醫生的解讀進行比較。結果顯示,ChatGPT-4o得分最高(77.86),接近資深醫生(80.43),在解讀深度上表現特別優秀。研究顯示,AI-LLMs,尤其是ChatGPT-4o,可能提升診斷準確性,改善婦產科病人護理。 PubMed DOI

這項研究發現,ChatGPT-3.5和4.0在產科超音波問題和報告分析上,比Microsoft Copilot表現更好,尤其在準確度和一致性方面。不過,所有AI工具偶爾還是會出錯,建議臨床使用時一定要有醫師把關。 PubMed DOI

AI在婦產科醫學應用越來越廣,像機器學習和ChatGPT能提升診斷和治療效率,也幫助循證醫療。不過,大家還是會擔心AI的準確度和可靠性。AI應該當作醫師的輔助工具,不能完全取代臨床判斷。未來會持續強化個人化醫療,AI應用也會越來越普及,幫助改善病患照護品質。 PubMed DOI

這項研究發現,ChatGPT-4o寫病史的品質跟住院醫師差不多,但速度快很多(只要40秒,醫師要15分鐘)。雖然AI有助提升效率和品質,但資料安全和隱私問題還沒解決,實際應用前還需要更多研究,特別是在複雜病例和不同臨床環境下的表現。 PubMed DOI

這項研究發現,DeepSeek-R1 AI 能有效協助加護病房住院醫師診斷複雜重症,讓診斷正確率從 27% 提升到 58%,AI 自己的正確率則是 60%。有 AI 幫忙時,住院醫師不只診斷更準確,速度也更快,鑑別診斷品質也提升。整體來說,這類 AI 未來很有機會成為加護病房醫師的重要幫手。 PubMed DOI

研究發現,ChatGPT在診斷50個口腔病灶案例時,準確度和專業醫師差不多,表現比Microsoft Copilot好。兩種AI都有潛力協助牙醫臨床診斷,尤其是ChatGPT表現最突出。 PubMed DOI

這項研究發現,ChatGPT-4o 回答子宮內膜異位症相關問題的表現,和人類專家差不多,品質、正確性和安全性都不輸專家。雖然專家多能分辨 AI 回答,但 AI 仍有潛力協助病人獲取健康資訊。未來還需進一步研究 AI 在臨床應用的風險與接受度。 PubMed DOI