原始文章

這項研究評估了GPT-4和PaLM2兩個大型語言模型在分析偏頭痛文獻的有效性,特別是針對偏頭痛藥物的臨床試驗摘要進行情感分析。由於偏頭痛影響超過十億人,且新研究不斷出現,需有效分析相關資訊。研究從FDA批准的藥物中提取名稱,並使用PubMed的相關標題進行摘要識別。結果顯示,兩個模型對藥物的正面評價與現有治療指導一致,建議這些模型可作為提升偏頭痛研究文獻回顧效率的工具。 PubMed DOI


站上相關主題文章列表

研究評估了OpenAI的GPT和GPT-4在比較人類審查員時,對臨床研究論文標題和摘要的辨識表現。結果顯示,這些模型在篩選超過24,000個標題和摘要時表現準確且敏感,並展現了推理能力並修正錯誤。這些人工智慧模型有潛力優化審查流程、節省時間,並提升臨床研究品質,而非取代研究人員。 PubMed DOI

系統性回顧很重要,但耗時。大型語言模型如GPT-4可加速,但與人類表現仍有差異。研究發現GPT-4在某些領域表現良好,但受機會和數據集影響。調整後表現下降,尤其在數據提取和篩選任務。給予提示後,在篩選文獻方面表現與人類相當。建議使用語言模型時謹慎,但在特定條件下可匹敵人類。 PubMed DOI

這項研究評估了五個大型語言模型(LLMs)對常見偏頭痛相關查詢的回答準確度。結果顯示,ChatGPT-4.0的準確率最高,達到96.7%,而其他LLMs提供的準確回答率為83.3%至90%不等。這項研究凸顯了LLMs在協助偏頭痛教育和管理方面的潛力。 PubMed DOI

這項研究探討了一種三層篩選方法,利用GPT-3.5和GPT-4來提升雙相情感障礙治療的系統性回顧中標題和摘要的篩選效率。篩選分為三個層次:研究設計、目標患者及介入措施。結果顯示,GPT-4在敏感性和特異性上表現良好,顯示其在系統性回顧中的應用潛力。未來研究可考慮將此方法擴展至其他領域,以評估其更廣泛的有效性。 PubMed DOI

這項研究評估大型語言模型(LLMs)在系統性回顧和統合分析中的摘要篩選效果。研究人員使用Python腳本,與多種LLMs互動,包括ChatGPT 3.5和4.0、Google PaLM 2等,並將其表現與人類專家的納入決策進行比較。結果顯示,ChatGPT v4.0的準確率超過90%,顯示其在摘要篩選上的潛力。雖然LLMs尚無法完全取代人類專家,但能顯著提升篩選效率,未來可能改變相關工作流程。 PubMed DOI

偏頭痛是一種常見且成本高的神經系統疾病,雖然有多種非藥物和數位治療選擇,但患者常缺乏資訊。本研究探討使用ChatGPT管理偏頭痛的效果,發現其能清楚地處理症狀描述、提供可信資源和治療選項。透過十次互動分析,ChatGPT的回應通常相關且具同理心,促進了用戶參與。不過,來源引用不一致和某些地方的可理解性不足仍需改善。總體來看,ChatGPT對尋求偏頭痛資訊的患者有潛力,但數位健康素養仍然重要,需持續評估AI系統的影響。 PubMed DOI

這項研究評估了大型語言模型ChatGPT在系統性回顧和統合分析中的表現,特別是在脊髓刺激後情緒功能的數據上。結果顯示,ChatGPT在標題和摘要篩選的準確率為70.4%,而全文篩選的準確率為68.4%。在數據整合方面,ChatGPT的準確率達到100%。雖然在篩選任務中表現中等,但在數據整合上表現優異。研究指出,人工智慧能提升系統性回顧的效率,但仍需人類監督以確保研究質量。 PubMed DOI

這項研究評估了三種大型語言模型(LLMs)—Copilot、GPT-3.5 和 GPT-4—在提供抗瘧疾藥物對系統性紅斑狼瘡(SLE)使用的準確性和完整性。研究設計了十三個問題,兩位風濕病學專家對模型回應進行評分。結果顯示,雖然準確性高,但完整性差異明顯:Copilot 38.5%,GPT-3.5 55.9%,GPT-4 92.3%。特別是在「作用機制」和「生活方式」方面,GPT-4 完整性達100%。研究指出,GPT-4 有潛力改善病人對 SLE 治療的理解,但仍需進一步研究以克服臨床應用的限制。 PubMed DOI

這項研究評估了GPT-4在回答疼痛管理相關的臨床藥理學問題上的表現。醫療專業人員提出了有關藥物相互作用、劑量和禁忌症的問題,GPT-4的回應在清晰度、詳細程度和醫學準確性上獲得了高評價。結果顯示,99%的參與者認為回應易懂,84%認為信息詳細,93%表示滿意,96%認為醫學準確。不過,只有63%認為信息完整,顯示在藥物動力學和相互作用方面仍有不足。研究建議開發專門的AI工具,結合即時藥理數據庫,以提升臨床決策的準確性。 PubMed DOI

慢性疼痛影響超過20%的人口,對個人和經濟造成重大影響。有效的疼痛評估工具對改善患者生活至關重要。這項研究探討使用大型語言模型(如GPT-4)來評估患者的書面敘述(WNs)。分析43份纖維肌痛症患者的WNs後,結果顯示GPT-4的評估與專家評分高度一致,且專家認為其評分和解釋通常合適。這表明GPT-4能有效增強WNs的評估,為慢性疼痛管理提供新方法。 PubMed DOI