原始文章

這項研究評估了一個大型語言模型(LLM)在監測兒童注意力不足過動症(ADHD)藥物副作用的有效性。研究回顧了2015至2022年間社區初級醫療網絡中6至11歲ADHD兒童的電子健康紀錄。LLaMA模型經過ADHD相關臨床筆記訓練,並與醫療紀錄進行人工審查,顯示高敏感性(87.2%)和特異性(86.3%),AUC為0.93。主要發現包括:模型不受性別或保險類型影響,電話就診的副作用詢問記錄顯著低於其他就診方式。研究結論指出,LLM可有效衡量護理質量並改善ADHD藥物管理。 PubMed DOI


站上相關主題文章列表

研究使用LLMs提升兒童健康識字能力,結果顯示LLMs能根據年級提供定制回應,但在六年級以下表現不佳。然而,它們可提供各種資訊,有助青少年了解健康資訊。需要進一步研究驗證其準確性和有效性。 PubMed DOI

研究發現使用大型語言模型(LLM)檢視臨床醫師在監測ADHD兒童副作用時,發現LLM在辨識副作用詢問文件化方面表現準確,並無偏見。電話診療中副作用詢問較少,與診所/遠距健康診療不同,且興奮劑和非興奮劑處方有差異。LLM可應用於各種臨床記錄,包括電話診療,有助評估基層醫療中ADHD藥物管理品質,找出改進空間。 PubMed DOI

這項初步研究顯示,針對慢性病兒童的病患教育資源有明顯不足,並評估大型語言模型(LLMs)在提供適合發展階段解釋的能力。研究結果發現,兩個常用的LLMs能夠生成準確且有效的回應,幫助兒科病患理解複雜的醫療資訊。這顯示LLMs可能成為提升病患理解與參與臨床環境的重要工具。 PubMed DOI

這項研究評估了大型語言模型(LLMs)在藥物審查中的表現,特別是劑量錯誤、藥物相互作用及基因組學建議的能力。研究測試了四個LLM,發現ChatGPT在劑量方案上表現良好,但對simvastatin的問題有例外。所有LLM都能識別warfarin的相互作用,但錯過metoprolol和verapamil的相互作用。Claude-Instant在治療監測上提供適當建議,而Gemini在基因組學上表現不錯。研究指出,LLM在藥物審查中有潛力,但整合進醫療系統對病人安全至關重要。 PubMed DOI

這項研究強調大型語言模型(LLMs)在臨床任務中的可靠性,特別是針對認知測試(如MMSE和CDR)的信息提取。經過分析135,307份臨床筆記,最終使用765份進行比較,結果顯示ChatGPT(GPT-4)在準確率、敏感性和精確度上均優於LlaMA-2。研究指出,ChatGPT在減少錯誤和幻覺方面表現較佳,並可能改善癡呆症的識別與治療。總之,這強調了對LLMs進行嚴格評估的重要性,以便更好地整合到醫療實踐中。 PubMed DOI

這項研究探討如何利用大型語言模型(LLMs)來識別青少年抑鬱症訪談中的心理治療結果。作者建立了一個編碼框架,能夠捕捉多樣的治療結果,並評估五個開源LLM的分類能力。實驗結果顯示,這些模型能有效分類31種結果,ROC曲線下面積得分在0.6到1.0之間,成功識別出友誼和學業表現等重要結果。研究強調了臨床數據的應用,顯示詳細編碼治療結果的可行性,並有助於量化重要結果。 PubMed DOI

這項研究評估大型語言模型(LLMs)在改善電子處方流程中的有效性,特別是針對用藥指示的清晰度和個人化。研究人員根據巴西的電子處方標準,開發了以病人為中心的指導方針,並測試了三種不同的提示。結果顯示,第三個提示顯著提升了輸出的適切性,達到94.3%的可接受性,且個人化評價也相當高。雖然封閉源LLM在前兩個提示中出現性別偏見,但第三個提示成功消除了這種偏見。整體而言,這項研究顯示LLMs在促進醫療溝通方面的潛力。 PubMed DOI

這項研究探討大型語言模型(LLMs)在分類與心理健康相關的電子健康紀錄(EHRs)術語的有效性,並與臨床專家的判斷進行比較。研究使用了來自美國50多家醫療機構的數據,分析了因心理健康問題入院的病人EHR。結果顯示,LLM與臨床醫生在術語的廣泛分類上達成高一致性(κ=0.77),但在具體的心理健康(κ=0.62)和身體健康術語(κ=0.69)上則較低,顯示出LLM的變異性。儘管如此,研究強調了LLM在自動化編碼和預測建模中的潛力。 PubMed DOI

大型語言模型(LLMs)正在改變病患用藥管理的教育方式,提供易於取得的資訊,協助醫療決策。這些AI工具能詳細說明藥物相互作用、副作用及緊急護理協議,幫助病患做出明智的用藥選擇。不過,仍有挑戰,如錯誤資訊的風險及缺乏個別病患數據的準確性問題。當病患過度依賴AI建議時,安全性問題更為突出。這篇分析探討了LLMs的能力與限制,並強調監管監督的重要性,以確保這些工具輔助而非取代專業醫療建議。 PubMed DOI

這項研究評估了三種大型語言模型(LLMs)—Copilot、GPT-3.5 和 GPT-4—在提供抗瘧疾藥物對系統性紅斑狼瘡(SLE)使用的準確性和完整性。研究設計了十三個問題,兩位風濕病學專家對模型回應進行評分。結果顯示,雖然準確性高,但完整性差異明顯:Copilot 38.5%,GPT-3.5 55.9%,GPT-4 92.3%。特別是在「作用機制」和「生活方式」方面,GPT-4 完整性達100%。研究指出,GPT-4 有潛力改善病人對 SLE 治療的理解,但仍需進一步研究以克服臨床應用的限制。 PubMed DOI