原始文章

多學科腫瘤委員會(MTBs)在癌症治療決策中扮演重要角色,但常面臨案例過載,影響決策品質。臨床決策支持系統(CDSSs)雖已引入協助醫師,但使用仍有限。大型語言模型(LLMs)如ChatGPT的出現,為提升CDSS的效率提供新機會。 OncoDoc2專注於乳腺癌管理,研究探討LLMs如何透過提示工程技術(PETs)改善其可用性。使用200個乳腺癌患者摘要進行評估,結果顯示最佳方法結合Mistral和OpenChat模型,達到不錯的準確率,但與金標準建議的匹配度仍低,顯示LLMs在醫療決策中仍需進一步發展。 PubMed DOI


站上相關主題文章列表

研究探討大型語言模型如ChatGPT在乳癌管理上的應用,發現準確性有差異。儘管有潛力,但需注意準確性不一致和依賴提示等挑戰,強調驗證和監督的重要性。 PubMed DOI

研究比較五種大型語言模型對乳腺癌治療建議的一致性,發現GPT4與腫瘤委員會最符合,其次是GPT3.5、Llama2和Bard。GPT4在放射治療方面表現一致,但在基因檢測建議上有差異。研究指出,大型語言模型應用於臨床前,仍需進一步技術和方法改進。 PubMed DOI

這項研究評估了 ChatGPT 和 Google Bard 兩個大型語言模型在婦科癌症管理問題上的表現。結果顯示,這兩個模型對於一些常見問題的回答大多準確,如子宮頸癌篩檢和 BRCA 相關問題。然而,面對更複雜的案例時,它們的表現較差,常缺乏對地區指導方針的了解。儘管如此,這些模型仍能提供病人和照護者在管理和後續步驟上的實用建議。結論指出,LLMs 雖無法取代專業醫療建議,但可作為輔助工具,提供資訊和支持。 PubMed DOI

醫療領域,特別是腫瘤學,面臨許多挑戰,如腫瘤委員會會議繁忙、討論時間短,以及護理品質的擔憂。為了解決這些問題,越來越多人關注整合臨床決策支持系統(CDSSs)來協助醫生管理癌症護理。然而,CDSSs在臨床上的應用仍然有限。2022年OpenAI推出的ChatGPT引發了對大型語言模型(LLMs)作為CDSS的興趣。我們進行了一項回顧,評估LLMs在醫療專科,特別是腫瘤學中的有效性,並比較使用者看法與實際表現,以探討其在改善癌症護理結果的可行性。 PubMed DOI

乳腺癌仍是全球健康的重要議題,亟需改善預測和管理復發的方法。本研究介紹了一個基於人工智慧的臨床決策支持系統(AI-CDSS),利用ChatGPT提升預測準確性。研究開發了一個機器學習模型,使用三軍總醫院2004至2016年的乳腺癌患者數據進行訓練和驗證。模型表現良好,曲線下面積(AUC)達0.80。AI-CDSS在臨床應用中顯示出個性化治療和增強患者參與的潛力,但仍需在不同臨床環境中進一步驗證其有效性。 PubMed DOI

這項研究探討小型語言模型(SLM)在乳腺癌護理決策中的潛力,並針對大型語言模型(LLM)面臨的挑戰進行分析。研究人員根據德國乳腺癌指導方針,開發了名為BC-SLM的開源模型,並在臨床前模擬中評估其準確性。研究涉及20個虛構病人檔案,BC-SLM與多學科腫瘤委員會(MTB)的一致性率為86%,顯示出良好的初步臨床準確性。這項研究為SLM在腫瘤學的應用提供了有希望的證據,並強調了決策過程的透明度和數據安全性。 PubMed DOI

這項研究評估了大型語言模型(LLMs)在複雜婦科癌症案例中的表現,主要針對三個模型:ChatGPT-4、Gemini Advanced和Copilot。研究使用了十五個臨床案例,六位專家根據多項指標評估模型的回應。結果顯示,Gemini Advanced的準確率最高,達81.87%,而ChatGPT-4和Copilot分別為61.60%和70.67%。雖然ChatGPT-4在遵循治療指導方針上稍好,但Gemini Advanced在答案的深度和焦點上更具優勢。研究指出,這些模型在婦科腫瘤學的臨床應用中有潛力,但仍需進一步精煉和評估。 PubMed DOI

多學科團隊(MDTs)在癌症護理中非常重要,但需要專家投入大量時間,導致醫療成本上升。最近大型語言模型(LLMs)的進展,可能提升臨床決策的效率,並降低MDT的相關成本。 一項針對171名新診斷前列腺癌患者的研究比較了兩個LLMs(chatGPT-4和Claude-3-Opus)與MDT會議的建議。結果顯示,LLMs的遵循率高達93%。不一致的情況主要因為臨床資訊不足。研究顯示,LLMs能生成準確的治療建議,未來有潛力簡化MDT流程,讓專家專注於更複雜的案例,並降低醫療成本。 PubMed DOI

這項研究探討如何利用臨床實踐指導(CPGs)來強化大型語言模型(LLMs),以改善針對 COVID-19 的門診治療決策。研究開發了三種整合 CPGs 的方法:二元決策樹、程式輔助圖形構建和思考鏈少量提示,並以零樣本提示作為基準。結果顯示,所有 LLMs 在有 CPG 增強的情況下表現優於零樣本提示,特別是二元決策樹在自動評估中表現最佳。這顯示出帶有 CPG 的 LLMs 能提供更準確的治療建議,未來應用潛力廣泛。 PubMed DOI

這項研究評估大型語言模型(LLMs)在根據病患醫療紀錄生成早期乳腺癌治療選項的準確性。使用2024年初的多學科團隊會議紀錄,測試了三個AI模型:Claude3-Opus、GPT4-Turbo和LLaMa3-70B。結果顯示,Claude3-Opus準確率86.6%,GPT4-Turbo為85.7%,LLaMa3-70B則為75.0%。兩者在輔助內分泌和靶向治療上表現良好,但在輔助放射治療上則有高估的情況。研究建議需進一步探討這些模型在臨床上的實際應用。 PubMed DOI