Large Language Models for Therapy Recommendations Across 3 Clinical Specialties: Comparative Study.
跨越三個臨床專業領域的治療建議大型語言模型:比較研究。
J Med Internet Res 2023-11-16
Evaluation of large language models in breast cancer clinical scenarios: a comparative analysis based on ChatGPT-3.5, ChatGPT-4.0, and Claude2.
大型語言模型在乳癌臨床情境中的評估:基於ChatGPT-3.5、ChatGPT-4.0和Claude2的比較分析。
Int J Surg 2024-04-26
Evolution of publicly available large language models for complex decision-making in breast cancer care.
乳腺癌護理中用於複雜決策的大型語言模型的公開演進。
Arch Gynecol Obstet 2024-05-28
How do large language models answer breast cancer quiz questions? A comparative study of GPT-3.5, GPT-4 and Google Gemini.
大型語言模型如何回答乳腺癌測驗問題?GPT-3.5、GPT-4 和 Google Gemini 的比較研究。
Radiol Med 2024-08-14
這項研究評估了三個大型語言模型(LLMs)—GPT-3.5、GPT-4 和 Google Gemini(Bard)在回答60道乳腺癌護理相關的多選題的表現。結果顯示,GPT-4的準確率最高,正確回答了95%的問題,接著是GPT-3.5的90%和Google Gemini的80%。研究還發現,來自公共數據庫的問題與乳腺放射科醫師新制定的問題在答案準確性上並無顯著差異,顯示LLMs在乳腺癌護理方面有良好的應用潛力,但仍需進一步訓練以提升表現。
PubMedDOI
Exploring the role of artificial intelligence, large language models: Comparing patient-focused information and clinical decision support capabilities to the gynecologic oncology guidelines.
探索人工智慧與大型語言模型的角色:比較以病人為中心的信息與臨床決策支持能力對婦科腫瘤學指導方針的影響。
Int J Gynaecol Obstet 2024-08-20
這項研究評估了 ChatGPT 和 Google Bard 兩個大型語言模型在婦科癌症管理問題上的表現。結果顯示,這兩個模型對於一些常見問題的回答大多準確,如子宮頸癌篩檢和 BRCA 相關問題。然而,面對更複雜的案例時,它們的表現較差,常缺乏對地區指導方針的了解。儘管如此,這些模型仍能提供病人和照護者在管理和後續步驟上的實用建議。結論指出,LLMs 雖無法取代專業醫療建議,但可作為輔助工具,提供資訊和支持。
PubMedDOI
Leveraging Large Language Models for Precision Monitoring of Chemotherapy-Induced Toxicities: A Pilot Study with Expert Comparisons and Future Directions.
利用大型語言模型精確監測化療引起的毒性:與專家比較的初步研究及未來方向。
Cancers (Basel) 2024-08-29
Evaluating the Capabilities of Generative AI Tools in Understanding Medical Papers: Qualitative Study.
評估生成式 AI 工具在理解醫學論文中的能力:質性研究。
JMIR Med Inform 2024-09-04