原始文章

這項研究打造了專為慢性下背痛設計的臨床決策支援系統,結合大型語言模型、RAG和LtM提示,讓AI更貼近專家思考。客製化的CLBP-GPT在準確性、相關性等表現都勝過現有主流模型,能提供更精確、完整的診斷與治療建議,有助提升患者的個人化照護品質。 PubMed DOI


站上相關主題文章列表

這項研究探討大型語言模型(LLMs),如ChatGPT-3.5和GPT-4,在風濕性疾病治療計畫的潛力,並與臨床風濕病學委員會(RB)的計畫進行比較。結果顯示,68.8%的案例中RB的計畫更受偏好,GPT-4和GPT-3.5則分別為16.3%和15.0%。GPT-4在一線治療中較受青睞,且與RB的計畫在安全性上無顯著差異。雖然LLMs生成的計畫安全且高品質,但RB的計畫在遵循指導方針和整體品質上表現更佳,建議需進一步研究以提升LLMs的臨床應用。 PubMed DOI

這項研究評估了大型語言模型(LLM)聊天機器人對於常見病人問題(如下背痛)的回答準確性和可讀性。研究分析了30個由臨床醫師制定的問題,結果顯示120個回答中,55.8%準確,42.1%不準確,1.9%不清楚。治療和自我管理的回答較準確,但風險因素的回答最不準確。整體可讀性被評為「相當困難」,平均得分為50.94。此外,70%-100%的回答都包含健康建議的免責聲明。研究建議,雖然LLM聊天機器人對病人教育有幫助,但準確性和可靠性可能因主題而異,影響病人理解。 PubMed DOI

這項研究評估了大型語言模型(LLMs),如ChatGPT和Copilot,對於低背痛(LBP)醫療建議的有效性。研究在蒙特利爾大學進行,針對27個常見問題進行回答,並由物理醫學科醫師評估其有效性、安全性和實用性。結果顯示,ChatGPT在有效性得分3.33,安全性3.19,實用性3.60;而Copilot則分別為3.18、3.13和3.57。臨床背景對結果影響不大,顯示LLMs在低背痛自我管理中具有可靠性,未來在病人照護中有潛力。 PubMed DOI

這項研究評估了大型語言模型(LLMs),如ChatGPT和Claude,在脊椎病理的外科決策及放射影像解讀的有效性,並與經驗豐富的脊椎外科醫生進行比較。結果顯示,雖然LLMs能詳細描述MRI影像,但在準確識別病變及外科決策上表現不佳,準確率僅20%,遠低於外科醫生的100%。研究建議LLMs在輔助影像解讀和決策上有潛力,但需進一步發展以克服現有限制,並強調AI研究人員與臨床專家的合作重要性。 PubMed DOI

這項研究評估了大型語言模型(LLM)聊天機器人對於常見病人問題(如下背痛)的回答準確性和可讀性。分析了30個問題,結果顯示120個回答中,55.8%準確,42.1%不準確,1.9%不清楚。治療和自我管理的回答較準確,風險因素則最不準確。可讀性平均得分為50.94,顯示文本相對困難。此外,70%-100%的回答都有健康建議的免責聲明。總體而言,雖然LLM聊天機器人有潛力,但準確性和可讀性差異可能影響病人理解。 PubMed DOI

這項研究探討如何利用大型語言模型(LLMs)預測慢性下背痛患者的安慰劑反應者,透過分析患者的訪談內容。安慰劑效應是指患者因期待而從無效治療中獲得疼痛緩解,了解影響因素對非藥物疼痛管理很重要。研究者重新分析了兩項臨床試驗的數據,開發的預測模型在新數據上的準確率達74%。結果顯示,LLMs能揭示與安慰劑反應相關的心理社會因素,並識別情緒相關的語言模式,為理解治療結果中的生物心理社會因素提供新視角。 PubMed DOI

這項研究探討如何利用臨床實踐指導(CPGs)來強化大型語言模型(LLMs),以改善針對 COVID-19 的門診治療決策。研究開發了三種整合 CPGs 的方法:二元決策樹、程式輔助圖形構建和思考鏈少量提示,並以零樣本提示作為基準。結果顯示,所有 LLMs 在有 CPG 增強的情況下表現優於零樣本提示,特別是二元決策樹在自動評估中表現最佳。這顯示出帶有 CPG 的 LLMs 能提供更準確的治療建議,未來應用潛力廣泛。 PubMed DOI

慢性疼痛影響超過20%的人口,對個人和經濟造成重大影響。有效的疼痛評估工具對改善患者生活至關重要。這項研究探討使用大型語言模型(如GPT-4)來評估患者的書面敘述(WNs)。分析43份纖維肌痛症患者的WNs後,結果顯示GPT-4的評估與專家評分高度一致,且專家認為其評分和解釋通常合適。這表明GPT-4能有效增強WNs的評估,為慢性疼痛管理提供新方法。 PubMed DOI

這項研究發現,GPT-4在為膝關節骨關節炎患者產出個人化自我管理衛教內容時,表現比臨床醫師更快、更完整且更精確。不過,GPT-4有時用詞太複雜,對健康識讀較低的患者不夠友善。未來建議AI與醫師共同審查,才能兼顧品質與安全。 PubMed DOI

這項研究發現,結合RAG技術的AI模型能產生比一般AI更優質、可讀性更高且重複性較低的下背痛衛教資料,但內容仍未達臨床標準。AI在提升衛教品質上有潛力,但還需進一步改進,才能真正應用於臨床。 PubMed