原始文章

這項研究評估大型語言模型(LLMs)在根據病患醫療紀錄生成早期乳腺癌治療選項的準確性。使用2024年初的多學科團隊會議紀錄,測試了三個AI模型:Claude3-Opus、GPT4-Turbo和LLaMa3-70B。結果顯示,Claude3-Opus準確率86.6%,GPT4-Turbo為85.7%,LLaMa3-70B則為75.0%。兩者在輔助內分泌和靶向治療上表現良好,但在輔助放射治療上則有高估的情況。研究建議需進一步探討這些模型在臨床上的實際應用。 PubMed DOI


站上相關主題文章列表

這項研究評估了四個大型語言模型(LLMs)在前列腺癌治療相關的資訊檢索和風險評估任務中的表現,特別針對第四期患者。研究使用350份模擬報告,並針對三個風險評估任務和七個資訊檢索任務進行評估。結果顯示,所有模型在資訊檢索任務中表現良好,但在風險評估上差異明顯,ChatGPT-4-turbo表現最佳。儘管結果令人鼓舞,研究仍提醒可能的誤解會影響臨床決策,並呼籲進一步研究以驗證結果的普遍性。 PubMed DOI

這項研究探討大型語言模型(LLMs)在耳鼻喉科手術腫瘤建議中的潛力。研究比較了多學科腫瘤委員會(MDT)與兩個LLMs(ChatGPT-4o和Llama 3)的建議。結果顯示,ChatGPT-4o與MDT的符合率為84%,Llama 3則為92%。兩者都能識別第一線治療選擇,且MDT的建議在28%的案例中被模型採納。雖然LLMs的建議受到正面評價,但研究強調應用於輔助決策,而非取代專業醫師,特別是考量數據保護問題。Llama 3的本地運行特性顯示出臨床應用潛力。 PubMed DOI

多學科團隊(MDTs)在癌症護理中非常重要,但需要專家投入大量時間,導致醫療成本上升。最近大型語言模型(LLMs)的進展,可能提升臨床決策的效率,並降低MDT的相關成本。 一項針對171名新診斷前列腺癌患者的研究比較了兩個LLMs(chatGPT-4和Claude-3-Opus)與MDT會議的建議。結果顯示,LLMs的遵循率高達93%。不一致的情況主要因為臨床資訊不足。研究顯示,LLMs能生成準確的治療建議,未來有潛力簡化MDT流程,讓專家專注於更複雜的案例,並降低醫療成本。 PubMed DOI

本研究評估了人工智慧(AI),特別是OpenAI的自然語言處理技術,對胸腔多學科腫瘤委員會(MTB)決策的幫助。研究納入2023年1月至6月診斷為非小細胞肺癌的52位病患,AI模型生成的建議與MTB決策的一致性達76%,Kappa指數為0.59,手術建議的一致性更高,重複案例後達92.3%。結果顯示,AI可成為多學科腫瘤委員會決策的有力支持工具。 PubMed DOI

多學科腫瘤委員會(MTBs)在癌症治療決策中扮演重要角色,但常面臨案例過載,影響決策品質。臨床決策支持系統(CDSSs)雖已引入協助醫師,但使用仍有限。大型語言模型(LLMs)如ChatGPT的出現,為提升CDSS的效率提供新機會。 OncoDoc2專注於乳腺癌管理,研究探討LLMs如何透過提示工程技術(PETs)改善其可用性。使用200個乳腺癌患者摘要進行評估,結果顯示最佳方法結合Mistral和OpenChat模型,達到不錯的準確率,但與金標準建議的匹配度仍低,顯示LLMs在醫療決策中仍需進一步發展。 PubMed DOI

這項研究探討大型語言模型(LLMs)在自動生成腫瘤影像檢查申請的臨床歷史的應用,資料來自207名接受CT掃描的癌症患者。研究顯示,GPT-4在提取關鍵腫瘤學參數方面表現優異,F1分數達0.983。LLM生成的歷史中,主要診斷、急性症狀及相關手術的出現頻率均高於原始歷史,且差異具統計意義。放射科醫生更偏好LLM生成的歷史,認為其提供更完整的解讀,降低傷害風險。總之,LLM能準確創建全面的腫瘤影像臨床歷史,受到醫生青睞。 PubMed DOI

本研究探討大型語言模型(LLMs)在膀胱癌管理中的表現。研究設計了100個臨床問題,評估六種LLMs的回應準確性。結果顯示,Claude-3.5-Sonnet以89.33%準確率最佳,ChatGPT-4為85.67%。GPT-3.5-Turbo經過兩階段訓練後,準確率從74.33%提升至100%。研究顯示,針對性訓練能顯著改善模型表現,並指出策略性改進可克服專業醫學應用中的限制。 PubMed DOI

這項研究評估了多學科腫瘤委員會(MTBs)與GPT-4人工智慧在癌症病患管理中的決策一致性。研究於2021年2月至2023年6月在安卡拉大學醫院進行,涵蓋610名癌症病患。結果顯示,GPT-4的預測與MTB決策的相容性得分為3.59,顯示高度一致性,但有10.2%的案例得分低於可接受範圍,需進一步審查。專家發現GPT-4在12.9%到25.8%的案例中不適當,顯示其在複雜或罕見案例中的限制。整體而言,GPT-4在腫瘤決策中具輔助潛力。 PubMed DOI

這項研究發現,GPT-4在乳癌和婦科癌症治療建議上表現尚可,乳癌案例與專家意見一致率最高達84%。雖然經過多次提示後表現有提升,但在正確性、完整性及手術、基因檢測建議上仍有限制。未來AI可輔助臨床決策,但專家把關還是很重要。 PubMed DOI

大型語言模型在腫瘤醫學有潛力協助臨床決策、資料整理及病患溝通,對醫師和病患都有幫助。不過,也有幻覺、泛化和倫理等問題需注意。LLMs應當作為輔助工具,幫助醫師提升癌症照護品質,而非取代醫師角色。 PubMed DOI