原始文章

這項研究探討小型語言模型(SLM)在乳腺癌護理決策中的潛力,並針對大型語言模型(LLM)面臨的挑戰進行分析。研究人員根據德國乳腺癌指導方針,開發了名為BC-SLM的開源模型,並在臨床前模擬中評估其準確性。研究涉及20個虛構病人檔案,BC-SLM與多學科腫瘤委員會(MTB)的一致性率為86%,顯示出良好的初步臨床準確性。這項研究為SLM在腫瘤學的應用提供了有希望的證據,並強調了決策過程的透明度和數據安全性。 PubMed DOI


站上相關主題文章列表

研究評估了ChatGPT在乳腺腫瘤討論會中的應用,結果顯示70%一致。兩位醫師對其表現給予正面評價,顯示大型語言模型在臨床決策中有潛力,但醫師需了解其限制。 PubMed DOI

初步研究評估基於變壓器的語言模型ChatGPT對乳癌治療的應用。研究發現ChatGPT提供治療選項的一般性答案,但缺乏具體建議,且在特定病例的治療方案上有錯誤。結果顯示ChatGPT在臨床上有潛力,但尚未能提供乳癌患者個別化的治療建議。 PubMed DOI

研究比較了ChatGPT 3.5對乳腺癌患者的治療建議與腫瘤委員會的建議,結果顯示兩者在患者檔案一致性方面有差異。然而,由於語言模型偶爾會出現不準確情況,目前不適合當腫瘤委員會的支援工具。婦產科腫瘤專家在使用語言模型時應謹慎,並考慮其潛在優勢和限制。 PubMed DOI

研究探討大型語言模型如ChatGPT在乳癌管理上的應用,發現準確性有差異。儘管有潛力,但需注意準確性不一致和依賴提示等挑戰,強調驗證和監督的重要性。 PubMed DOI

研究比較三款大型語言模型在乳癌臨床上的表現,結果指出GPT-4.0在反饋質量、相關性和應用性方面表現最佳,勝過GPT-3.5和Claude2。GPT-4.0提供更詳盡的反饋,在各臨床領域表現優異,尤其在心理社會支持和治療決策方面。研究強調LLMs的潛力,特別是GPT-4.0,在乳癌臨床應用上的重要性,並呼籲在醫療環境中持續優化和評估準確性。 PubMed DOI

研究比較五種大型語言模型對乳腺癌治療建議的一致性,發現GPT4與腫瘤委員會最符合,其次是GPT3.5、Llama2和Bard。GPT4在放射治療方面表現一致,但在基因檢測建議上有差異。研究指出,大型語言模型應用於臨床前,仍需進一步技術和方法改進。 PubMed DOI

這項研究評估了大型語言模型(LLMs)驅動的聊天機器人,如ChatGPT 3.5、CoPilot和Gemini,在提供前列腺癌資訊的有效性,並與官方病人指南進行比較。研究使用25個專家驗證的問題,根據準確性、及時性、完整性和可理解性進行評估。結果顯示,ChatGPT 3.5的表現優於其他模型,證明其為可靠的資訊來源。研究強調在健康領域持續創新AI應用的重要性,並建議未來探討AI回應中的潛在偏見及其對病人結果的影響。 PubMed DOI

這項研究評估了 ChatGPT 和 Google Bard 兩個大型語言模型在婦科癌症管理問題上的表現。結果顯示,這兩個模型對於一些常見問題的回答大多準確,如子宮頸癌篩檢和 BRCA 相關問題。然而,面對更複雜的案例時,它們的表現較差,常缺乏對地區指導方針的了解。儘管如此,這些模型仍能提供病人和照護者在管理和後續步驟上的實用建議。結論指出,LLMs 雖無法取代專業醫療建議,但可作為輔助工具,提供資訊和支持。 PubMed DOI

乳腺癌仍是全球健康的重要議題,亟需改善預測和管理復發的方法。本研究介紹了一個基於人工智慧的臨床決策支持系統(AI-CDSS),利用ChatGPT提升預測準確性。研究開發了一個機器學習模型,使用三軍總醫院2004至2016年的乳腺癌患者數據進行訓練和驗證。模型表現良好,曲線下面積(AUC)達0.80。AI-CDSS在臨床應用中顯示出個性化治療和增強患者參與的潛力,但仍需在不同臨床環境中進一步驗證其有效性。 PubMed DOI

這項研究評估了三個大型語言模型(LLMs)—ChatGPT、ERNIE Bot 和 ChatGLM—在回答乳腺癌相關問題的表現,特別針對中國的情境。分析了60個腫瘤科醫生提出的問題,結果顯示: - ChatGPT 提供了最多的全面回答,佔66.7%。 - 三個模型在乳腺癌治療問題上的準確率都很低,平均僅44.4%。 - ERNIE Bot 的回答較短。 - 可讀性評分無顯著差異。 總體來看,這些模型可作為乳腺癌資訊工具,但在專業治療問題上不可靠,應在醫療專業人員指導下使用。 PubMed DOI