原始文章

這項研究探討小型語言模型(SLM)在乳腺癌護理決策中的潛力,並針對大型語言模型(LLM)面臨的挑戰進行分析。研究人員根據德國乳腺癌指導方針,開發了名為BC-SLM的開源模型,並在臨床前模擬中評估其準確性。研究涉及20個虛構病人檔案,BC-SLM與多學科腫瘤委員會(MTB)的一致性率為86%,顯示出良好的初步臨床準確性。這項研究為SLM在腫瘤學的應用提供了有希望的證據,並強調了決策過程的透明度和數據安全性。 PubMed DOI


站上相關主題文章列表

研究探討大型語言模型如ChatGPT在乳癌管理上的應用,發現準確性有差異。儘管有潛力,但需注意準確性不一致和依賴提示等挑戰,強調驗證和監督的重要性。 PubMed DOI

研究比較三款大型語言模型在乳癌臨床上的表現,結果指出GPT-4.0在反饋質量、相關性和應用性方面表現最佳,勝過GPT-3.5和Claude2。GPT-4.0提供更詳盡的反饋,在各臨床領域表現優異,尤其在心理社會支持和治療決策方面。研究強調LLMs的潛力,特別是GPT-4.0,在乳癌臨床應用上的重要性,並呼籲在醫療環境中持續優化和評估準確性。 PubMed DOI

研究比較五種大型語言模型對乳腺癌治療建議的一致性,發現GPT4與腫瘤委員會最符合,其次是GPT3.5、Llama2和Bard。GPT4在放射治療方面表現一致,但在基因檢測建議上有差異。研究指出,大型語言模型應用於臨床前,仍需進一步技術和方法改進。 PubMed DOI

這項研究評估了大型語言模型(LLMs)驅動的聊天機器人,如ChatGPT 3.5、CoPilot和Gemini,在提供前列腺癌資訊的有效性,並與官方病人指南進行比較。研究使用25個專家驗證的問題,根據準確性、及時性、完整性和可理解性進行評估。結果顯示,ChatGPT 3.5的表現優於其他模型,證明其為可靠的資訊來源。研究強調在健康領域持續創新AI應用的重要性,並建議未來探討AI回應中的潛在偏見及其對病人結果的影響。 PubMed DOI

乳腺癌仍是全球健康的重要議題,亟需改善預測和管理復發的方法。本研究介紹了一個基於人工智慧的臨床決策支持系統(AI-CDSS),利用ChatGPT提升預測準確性。研究開發了一個機器學習模型,使用三軍總醫院2004至2016年的乳腺癌患者數據進行訓練和驗證。模型表現良好,曲線下面積(AUC)達0.80。AI-CDSS在臨床應用中顯示出個性化治療和增強患者參與的潛力,但仍需在不同臨床環境中進一步驗證其有效性。 PubMed DOI

這項研究評估了三個大型語言模型(LLMs)—ChatGPT、ERNIE Bot 和 ChatGLM—在回答乳腺癌相關問題的表現,特別針對中國的情境。分析了60個腫瘤科醫生提出的問題,結果顯示: - ChatGPT 提供了最多的全面回答,佔66.7%。 - 三個模型在乳腺癌治療問題上的準確率都很低,平均僅44.4%。 - ERNIE Bot 的回答較短。 - 可讀性評分無顯著差異。 總體來看,這些模型可作為乳腺癌資訊工具,但在專業治療問題上不可靠,應在醫療專業人員指導下使用。 PubMed DOI

多學科團隊(MDTs)在癌症護理中非常重要,但需要專家投入大量時間,導致醫療成本上升。最近大型語言模型(LLMs)的進展,可能提升臨床決策的效率,並降低MDT的相關成本。 一項針對171名新診斷前列腺癌患者的研究比較了兩個LLMs(chatGPT-4和Claude-3-Opus)與MDT會議的建議。結果顯示,LLMs的遵循率高達93%。不一致的情況主要因為臨床資訊不足。研究顯示,LLMs能生成準確的治療建議,未來有潛力簡化MDT流程,讓專家專注於更複雜的案例,並降低醫療成本。 PubMed DOI

多學科腫瘤委員會(MTBs)在癌症治療決策中扮演重要角色,但常面臨案例過載,影響決策品質。臨床決策支持系統(CDSSs)雖已引入協助醫師,但使用仍有限。大型語言模型(LLMs)如ChatGPT的出現,為提升CDSS的效率提供新機會。 OncoDoc2專注於乳腺癌管理,研究探討LLMs如何透過提示工程技術(PETs)改善其可用性。使用200個乳腺癌患者摘要進行評估,結果顯示最佳方法結合Mistral和OpenChat模型,達到不錯的準確率,但與金標準建議的匹配度仍低,顯示LLMs在醫療決策中仍需進一步發展。 PubMed DOI

子宮頸癌是全球健康的重要議題,尤其在資源有限的地區。這項研究探討大型語言模型(LLMs)在子宮頸癌管理中的潛力,評估了九個模型的準確性和可解釋性。結果顯示,ChatGPT-4.0 Turbo表現最佳,得分為2.67,顯示其在提供可靠回應方面的有效性。研究還利用LIME增強模型的可解釋性,對醫療專業人員建立信任至關重要。雖然專有模型表現良好,但醫學專用模型的表現未如預期,未來仍需進一步研究以了解LLM在醫療中的應用。 PubMed DOI

這項研究評估大型語言模型(LLMs)在根據病患醫療紀錄生成早期乳腺癌治療選項的準確性。使用2024年初的多學科團隊會議紀錄,測試了三個AI模型:Claude3-Opus、GPT4-Turbo和LLaMa3-70B。結果顯示,Claude3-Opus準確率86.6%,GPT4-Turbo為85.7%,LLaMa3-70B則為75.0%。兩者在輔助內分泌和靶向治療上表現良好,但在輔助放射治療上則有高估的情況。研究建議需進一步探討這些模型在臨床上的實際應用。 PubMed DOI