原始文章

多學科腫瘤委員會由各類醫療專家組成,對癌症患者的治療計畫至關重要,雖然面臨物流和財務挑戰,但仍能顯著提升生存率。本研究評估大型語言模型在頭頸部腫瘤委員會的推薦程序有效性,使用參數高效微調和上下文學習等方法。結果顯示,治療方案一致性達86%,醫學上可辯護的建議達98%。參數高效微調表現優於上下文學習,且較大商業模型通常效果更佳。建議增強數據集並納入更新指導方針,以提升模型在醫療決策中的準確性,值得進一步研究。 PubMed DOI


站上相關主題文章列表

研究評估了ChatGPT在乳腺腫瘤討論會中的應用,結果顯示70%一致。兩位醫師對其表現給予正面評價,顯示大型語言模型在臨床決策中有潛力,但醫師需了解其限制。 PubMed DOI

研究比較了ChatGPT 3.5對乳腺癌患者的治療建議與腫瘤委員會的建議,結果顯示兩者在患者檔案一致性方面有差異。然而,由於語言模型偶爾會出現不準確情況,目前不適合當腫瘤委員會的支援工具。婦產科腫瘤專家在使用語言模型時應謹慎,並考慮其潛在優勢和限制。 PubMed DOI

研究比較四個大型語言模型(LLMs)與專家醫師在協助精準腫瘤學臨床決策的表現。LLMs提供更多治療方案,但品質和可信度不如專家。然而,部分LLMs提出的治療方案獲得委員會認可。研究建議LLMs可提供協助,但無法取代人類專家。 PubMed DOI

研究比較ChatGPT 4和Gemini Advanced在頭頸癌治療建議上的表現,發現ChatGPT 4較Gemini Advanced更遵循指引且治療規劃更全面。兩者在支持腫瘤學評估方面表現不錯,但仍有改進空間。研究強調持續更新和驗證的重要性,以更好整合人工智慧到醫療實務。 PubMed DOI

研究比較五種大型語言模型對乳腺癌治療建議的一致性,發現GPT4與腫瘤委員會最符合,其次是GPT3.5、Llama2和Bard。GPT4在放射治療方面表現一致,但在基因檢測建議上有差異。研究指出,大型語言模型應用於臨床前,仍需進一步技術和方法改進。 PubMed DOI

研究發現,在協助頭頸部癌症患者的腫瘤委員會決策中使用AI模型ChatGPT 3.5和ChatGPT 4.0,能提供資訊和臨床建議,但有時會提出多治療選項,甚至建議不符合指引的治療方式。結論指出,AI目前僅能當輔助工具,因為準確性和資訊來源有限。 PubMed DOI

一項研究評估了大型語言模型(LLMs)在回答醫學腫瘤學考試問題時的準確性和安全性。最佳的LLM以高準確度回答問題,但錯誤引起了安全疑慮,這表明有必要開發和評估LLMs,以改善臨床醫學腫瘤學等高風險臨床環境中醫護人員的經驗和病人護理。 PubMed DOI

隨著人工智慧工具的普及,患者和醫療專業人員越來越依賴這些工具提供的醫療資訊。本研究評估了五個大型語言模型(LLaMA 1、PaLM 2、Claude-v1、GPT-3.5和GPT-4)在2044個腫瘤學相關問題上的表現。結果顯示,GPT-4在與人類基準比較中表現最佳,達到第50百分位以上。雖然GPT-4的準確率高達81.1%,但所有模型仍存在顯著錯誤率,顯示出持續評估這些AI工具的重要性,以確保其安全應用於臨床實踐。 PubMed DOI

這篇論文探討流行病學和臨床癌症登記在改善腫瘤醫療及研究中的重要性,特別是在癌症影響日益擴大的情況下。文中指出醫療數據的多樣性帶來挑戰,使得腫瘤手動記錄變得困難。研究提出利用大型語言模型(LLMs)將非結構化醫療報告轉換為德國基本腫瘤數據集所需的結構化格式。結果顯示,將LLMs整合進醫院數據管理或癌症登記系統,能顯著提升癌症數據的質量與完整性,對於有效的診斷、治療及療效評估至關重要。這項研究為人工智慧在醫療數據處理及癌症護理中的潛力提供了新的見解。 PubMed DOI

這項研究評估了兩個版本的 ChatGPT—4o 和 4.0—在提供復發性和轉移性頭頸部鱗狀細胞癌 (HNSCC) 治療建議的表現。結果顯示,兩者主要提供手術、緩和醫療或系統性治療的一般建議。ChatGPT 4o 的反應速度比 4.0 快 48.5%。雖然兩者在臨床建議的質量上表現良好,但仍需經驗豐富的醫師進行驗證,因為有時會建議不符合當前指導方針的選項。因此,這些 AI 模型可作為輔助工具,但不應取代臨床判斷。 PubMed DOI