原始文章

這項可行性研究探討了人工智慧(AI)在婦科腫瘤學決策中的潛力,分析了五個虛構的婦科癌症案例。不同經驗的醫生與AI語言模型(如Chat-GPT 4.0、Google Gemini和Bing-Copilot)共同評估這些案例。研究發現,AI能有效提供治療建議,且與醫生的評估高度一致,特別是Chat-GPT在建議的清晰度上表現優異。然而,在複雜案例中,仍需人類的解釋。研究建議進一步探索AI在真實病人數據中的應用,並發展混合決策模型,以提升AI在臨床實踐中的整合性。 PubMed DOI


站上相關主題文章列表

這項可行性研究探討了人工智慧(AI),特別是Chat-GPT在急性婦產科緊急情況中的應用。研究中使用了十個虛構案例,Chat-GPT提供的分診和管理建議經過人類專家的審查。結果顯示,Chat-GPT的分診結果與人類評估者相近,管理建議也獲得高評價,顯示其具備提供結構化建議的能力。不過,評估者指出在緊急程度的感知上有些微差異,強調人類監督的重要性。總體而言,研究建議將Chat-GPT與人類專業知識結合,以確保最佳病人護理。 PubMed DOI

本研究評估了人工智慧(AI),特別是OpenAI的自然語言處理技術,對胸腔多學科腫瘤委員會(MTB)決策的幫助。研究納入2023年1月至6月診斷為非小細胞肺癌的52位病患,AI模型生成的建議與MTB決策的一致性達76%,Kappa指數為0.59,手術建議的一致性更高,重複案例後達92.3%。結果顯示,AI可成為多學科腫瘤委員會決策的有力支持工具。 PubMed DOI

這項研究評估了ChatGPT和Gemini在複雜腫瘤病例中的醫療決策有效性,並與多學科腫瘤委員會(MTB)專家進行比較。研究在墨西哥城的醫療中心進行,回顧了98個病例。結果顯示,AI系統在影像學檢查的協議程度較低,但在手術和放射治療方面則中等。ChatGPT在手術和化療決策上表現優於Gemini。研究指出,這兩個AI系統在腫瘤學上有潛力,但仍需進一步研究以提升其臨床應用。 PubMed DOI

這項研究比較了兩個人工智慧模型,ChatGPT-4o (Omni) 和 Gemini-pro,在婦科腫瘤學的臨床問題解決上。研究分析了700個問題,結果顯示Omni在準確性和遵循臨床指導方針上明顯優於Gemini-pro。基本開放式問題的平均得分分別為5.9和5.1,複雜問題則為5.6和4.2。Omni的回應更準確,且隨著時間表現持續改善,顯示其在臨床應用中的潛力。 PubMed DOI

這項研究評估大型語言模型(LLMs)在根據病患醫療紀錄生成早期乳腺癌治療選項的準確性。使用2024年初的多學科團隊會議紀錄,測試了三個AI模型:Claude3-Opus、GPT4-Turbo和LLaMa3-70B。結果顯示,Claude3-Opus準確率86.6%,GPT4-Turbo為85.7%,LLaMa3-70B則為75.0%。兩者在輔助內分泌和靶向治療上表現良好,但在輔助放射治療上則有高估的情況。研究建議需進一步探討這些模型在臨床上的實際應用。 PubMed DOI

這項研究發現,ChatGPT-4o在協助乳房疾病手術規劃時,雖然能給出清楚且結構良好的建議,但在手術細節和風險評估上還不夠完善,且回答內容需要較高的閱讀理解能力。現階段它只能當作輔助工具,無法取代專業醫師,未來還需更多開發和專家驗證才能臨床應用。 PubMed DOI

AI在婦產科醫學應用越來越廣,像機器學習和ChatGPT能提升診斷和治療效率,也幫助循證醫療。不過,大家還是會擔心AI的準確度和可靠性。AI應該當作醫師的輔助工具,不能完全取代臨床判斷。未來會持續強化個人化醫療,AI應用也會越來越普及,幫助改善病患照護品質。 PubMed DOI

這項研究發現,雖然ChatGPT-4o和腫瘤委員會在治療建議上各自有高度一致性,但兩者的建議常常不同。醫師普遍較認同腫瘤委員會的決策,且這差異有統計意義。顯示目前AI還無法取代專家處理複雜癌症個案的臨床判斷。 PubMed DOI

研究團隊把GPT-4和專業腫瘤醫學工具結合,開發出能自主做臨床決策的AI代理。測試20個複雜癌症案例時,AI選對工具的機率有87.5%,臨床決策正確率91%,引用指引正確率75.5%。這套系統比單用GPT-4準確率高出許多,證明結合語言模型和專業工具能大幅提升癌症照護決策品質。 PubMed DOI

這項研究發現,GPT-4在乳癌和婦科癌症治療建議上表現尚可,乳癌案例與專家意見一致率最高達84%。雖然經過多次提示後表現有提升,但在正確性、完整性及手術、基因檢測建議上仍有限制。未來AI可輔助臨床決策,但專家把關還是很重要。 PubMed DOI