原始文章

這項研究探討大型語言模型(LLMs),如ChatGPT-3.5和GPT-4,在風濕性疾病治療計畫的潛力,並與臨床風濕病學委員會(RB)的計畫進行比較。結果顯示,68.8%的案例中RB的計畫更受偏好,GPT-4和GPT-3.5則分別為16.3%和15.0%。GPT-4在一線治療中較受青睞,且與RB的計畫在安全性上無顯著差異。雖然LLMs生成的計畫安全且高品質,但RB的計畫在遵循指導方針和整體品質上表現更佳,建議需進一步研究以提升LLMs的臨床應用。 PubMed DOI


站上相關主題文章列表

臨床前研究指出,像ChatGPT這樣的大型語言模型可能有助於區分炎症性風濕疾病與其他疾病。一項研究比較了ChatGPT-4的診斷準確性與風濕病專家在患者數據上的表現,結果顯示ChatGPT-4在正確診斷方面與專家相當,尤其在炎症性風濕疾病案例中。雖然在檢測疾病方面敏感度高,但特異性較低。總結來說,ChatGPT-4可能是診斷炎症性風濕疾病的實用工具。 PubMed DOI

研究發現ChatGPT-4在診斷和治療建議方面表現不錯,尤其在手術治療建議上。然而,仍需進一步研究以驗證結果,並強調人工智慧無法完全取代專家臨床判斷。未來應擴大研究範圍,探索人工智慧在醫療保健領域的更多應用價值。 PubMed DOI

使用大型語言模型(LLMs)如ChatGPT在風濕病學中,特別是對於Sjögren's綜合症,展現了提供個人化科學資訊的潛力。研究指出ChatGPT有助於區分Sjögren's綜合症與其他風濕病,但也提醒需注意其限制,如過度簡化和不準確。在臨床判斷和模型優化之間取得平衡至關重要。LLMs有潛力,但培訓和使用需謹慎,確保提供最佳患者照護。 PubMed DOI

研究比較了ChatGPT和GPT-4在回答西班牙醫學考試中風濕病學問題的表現,結果顯示兩者在準確度和臨床推理能力方面表現優秀。ChatGPT準確率為66.43%,臨床推理中位數為4.5;GPT-4則達93.71%的準確率,臨床推理中位數為4.67。研究指出這些模型可作為風濕病學教育的有用補充。 PubMed DOI

研究評估使用ChatGPT向病人提供醫學資訊,並比較ChatGPT-3.5和ChatGPT-4的表現。結果顯示ChatGPT-4準確性較佳,回答也較完整。雖然ChatGPT有應用價值,但仍需謹慎確保病人安全及護理品質,並進一步研究在醫學領域使用大型語言模型的可行性。 PubMed DOI

研究發現GPT-4在醫學案例初步診斷、檢查和治療方面表現最佳,尤其在常見疾病方面。商業LLMs有潛力用於醫學問答,但仍需加強。開源LLMs則可應對數據隱私和培訓透明度需求。強調強大且受監管的AI模型在醫療保健領域的重要性。 PubMed DOI

研究評估了大型語言模型在醫療保健領域的應用,尤其是在改善患者護理方面。使用MIMIC-III數據庫的電子健康記錄,測試了這些模型在識別特定疾病患者方面的效能。GPT-4在辨識COPD、CKD、PBC和Cancer Cachexia患者方面表現優異,而ChatGPT和LLaMA3則稍遜。儘管LLMs有潛力,但在臨床應用前仍需解決錯誤、解釋不足和倫理問題。進一步研究將有助於提升模型訓練和設計,以更好地應用於醫療保健。 PubMed DOI

這項研究評估了幾個商業可用的大型語言模型(LLMs)在提供治療建議時,與美國骨科醫學會(AAOS)針對肩袖撕裂和前交叉韌帶(ACL)損傷的臨床指導方針(CPGs)的符合度。分析了48項CPGs,結果顯示70.3%的回應與指導方針一致,ChatGPT-4的符合率最高(79.2%),而Mistral-7B最低(58.3%)。研究指出,雖然LLMs能提供一致建議,但缺乏透明的資料來源,限制了其作為臨床支持工具的可靠性,未來應擴大評估範圍以減少偏見。 PubMed DOI

這項研究評估了ChatGPT-4在生成骨科疾病治療建議的有效性,並與美國骨科醫學會的指導方針及醫師計畫進行比較。主要發現包括: 1. ChatGPT-4的建議與AAOS指導方針一致性達90%。 2. 與主治醫師的建議一致性為78%。 3. 在骨折及關節炎案例中表現優異,但腕管綜合症表現不佳。 4. 不一致主要出現在腕管綜合症及其他特定損傷。 5. 雖然ChatGPT-4能提供準確建議,但在考量患者特定因素時仍需醫師的批判性評估。 總之,ChatGPT-4在骨科治療中具輔助潛力,但需專業監督。 PubMed DOI

這項研究評估了三個大型語言模型(LLMs)—ChatGPT-3.5、ChatGPT-4 和 Google Gemini,針對糖皮質激素誘導的骨質疏鬆症(GIOP)及其預防和治療的美國風濕病學會指導方針的表現。研究發現,Google Gemini 的答案較為簡潔,但 ChatGPT-4 在準確性和全面性上表現更佳,特別是在病因學和指導方針相關問題上。ChatGPT-3.5 和 ChatGPT-4 的自我修正能力顯著提升,而 Google Gemini 則無明顯差異。總體來看,ChatGPT-4 是最佳選擇。 PubMed DOI