原始文章

這項研究發現,GPT-4在乳癌和婦科癌症治療建議上表現尚可,乳癌案例與專家意見一致率最高達84%。雖然經過多次提示後表現有提升,但在正確性、完整性及手術、基因檢測建議上仍有限制。未來AI可輔助臨床決策,但專家把關還是很重要。 PubMed DOI


站上相關主題文章列表

這項研究評估了ChatGPT-4o在多學科肉瘤腫瘤委員會中的決策支持效果。研究設計了五個病患案例,並由專家小組評估AI的建議。專家根據理解能力、治療建議、術後護理等五個類別進行評分,結果顯示ChatGPT-4o的平均分數為3.76,外科專業得分最高(4.48),而放射腫瘤科得分較低。研究指出,雖然ChatGPT-4o在外科決策上有潛力,但在其他領域仍需改進,臨床醫師應了解其優缺點,以便更好地應用於臨床。 PubMed DOI

這項可行性研究探討了人工智慧(AI)在婦科腫瘤學決策中的潛力,分析了五個虛構的婦科癌症案例。不同經驗的醫生與AI語言模型(如Chat-GPT 4.0、Google Gemini和Bing-Copilot)共同評估這些案例。研究發現,AI能有效提供治療建議,且與醫生的評估高度一致,特別是Chat-GPT在建議的清晰度上表現優異。然而,在複雜案例中,仍需人類的解釋。研究建議進一步探索AI在真實病人數據中的應用,並發展混合決策模型,以提升AI在臨床實踐中的整合性。 PubMed DOI

這項研究評估大型語言模型(LLMs)在根據病患醫療紀錄生成早期乳腺癌治療選項的準確性。使用2024年初的多學科團隊會議紀錄,測試了三個AI模型:Claude3-Opus、GPT4-Turbo和LLaMa3-70B。結果顯示,Claude3-Opus準確率86.6%,GPT4-Turbo為85.7%,LLaMa3-70B則為75.0%。兩者在輔助內分泌和靶向治療上表現良好,但在輔助放射治療上則有高估的情況。研究建議需進一步探討這些模型在臨床上的實際應用。 PubMed DOI

這項研究評估了多學科腫瘤委員會(MTBs)與GPT-4人工智慧在癌症病患管理中的決策一致性。研究於2021年2月至2023年6月在安卡拉大學醫院進行,涵蓋610名癌症病患。結果顯示,GPT-4的預測與MTB決策的相容性得分為3.59,顯示高度一致性,但有10.2%的案例得分低於可接受範圍,需進一步審查。專家發現GPT-4在12.9%到25.8%的案例中不適當,顯示其在複雜或罕見案例中的限制。整體而言,GPT-4在腫瘤決策中具輔助潛力。 PubMed DOI

這項研究發現,ChatGPT-4o在協助乳房疾病手術規劃時,雖然能給出清楚且結構良好的建議,但在手術細節和風險評估上還不夠完善,且回答內容需要較高的閱讀理解能力。現階段它只能當作輔助工具,無法取代專業醫師,未來還需更多開發和專家驗證才能臨床應用。 PubMed DOI

這項研究比較GPT-4和中國腫瘤科醫師回答癌症病患問題的表現。結果顯示,GPT-4在病患衛教的答案較完整,正確性和安全性也不輸醫師,但在醫療決策上正確率較低,偶爾還會出現危險錯誤。醫師和病患對同理心的感受也不同。總結來說,GPT-4適合用於衛教,但在醫療決策上仍需醫師把關。 PubMed DOI

這項研究發現,雖然ChatGPT-4o和腫瘤委員會在治療建議上各自有高度一致性,但兩者的建議常常不同。醫師普遍較認同腫瘤委員會的決策,且這差異有統計意義。顯示目前AI還無法取代專家處理複雜癌症個案的臨床判斷。 PubMed DOI

這項研究發現,ChatGPT-4.0在乳癌治療建議上,只有46%完全符合專家團隊意見,且重複問答一致性僅39%。它在早期乳癌表現較好,但遇到複雜或基因相關情境就明顯不足,常缺乏臨床細節。總結來說,目前ChatGPT在乳癌多專科照護上,準確度和穩定性都有限,使用時要特別小心。 PubMed DOI

研究團隊把GPT-4和專業腫瘤醫學工具結合,開發出能自主做臨床決策的AI代理。測試20個複雜癌症案例時,AI選對工具的機率有87.5%,臨床決策正確率91%,引用指引正確率75.5%。這套系統比單用GPT-4準確率高出許多,證明結合語言模型和專業工具能大幅提升癌症照護決策品質。 PubMed DOI

這項研究發現,GPT-4在臨床倫理兩難情境下,能給出明確且積極的建議,與倫理原則的符合度高達86%。不過,遇到墮胎或代理孕母等議題時表現較弱,最低僅60%。雖然GPT-4有助於臨床決策,但偶爾會出錯或無法完全遵守倫理標準,實際應用上還是有侷限。 PubMed DOI