Public Health Discussions on Social Media: Evaluating Automated Sentiment Analysis Methods.
社交媒體上公共衛生討論：評估自動情感分析方法。 JMIR Form Res 2025-01-08

這項研究比較了多種情感分析方法，包括手動編碼、自然語言處理工具（VADER、TEXT2DATA、LIWC-22）和ChatGPT 4.0，針對有關鴉片類藥物危機的YouTube評論進行分析。研究發現，LIWC-22在估算負面情感方面表現優異，而VADER在分類負面評論上最佳。自然語言處理工具與手動編碼的一致性一般，ChatGPT 4.0表現較差。建議使用VADER和LIWC-22來分析不平衡數據集，特別是負面情緒的情況下。 PubMed DOI

Using Large Language Models to Detect and Understand Drug Discontinuation Events in Web-Based Forums: Development and Validation Study.
使用大型語言模型檢測和理解網路論壇中的藥物中斷事件：開發與驗證研究。 J Med Internet Res 2025-01-30

這項研究探討如何利用大型語言模型（LLMs），如BART和GPT-4，從MedHelp論壇的用戶評論中識別藥物停用事件（DDEs）。DDEs對藥物依從性和病人結果至關重要，但研究仍不多。研究人員建立了一個靈活的框架，並發布了首個開源DDE數據集，以促進後續研究。結果顯示，GPT-4o在識別根本原因上表現優異，而BART在檢測DDEs方面最有效。這項研究顯示了LLMs在分析公開數據的潛力，並鼓勵進一步探索。 PubMed DOI

GPT meets PubMed: a novel approach to literature review using a large language model to crowdsource migraine medication reviews.
GPT 與 PubMed 相遇：使用大型語言模型進行文獻回顧的新方法，以群眾外包偏頭痛藥物評價。 BMC Neurol 2025-02-19

這項研究評估了GPT-4和PaLM2兩個大型語言模型在分析偏頭痛文獻的有效性，特別是針對偏頭痛藥物的臨床試驗摘要進行情感分析。由於偏頭痛影響超過十億人，且新研究不斷出現，需有效分析相關資訊。研究從FDA批准的藥物中提取名稱，並使用PubMed的相關標題進行摘要識別。結果顯示，兩個模型對藥物的正面評價與現有治療指導一致，建議這些模型可作為提升偏頭痛研究文獻回顧效率的工具。 PubMed DOI

Exploring the Capacity of Large Language Models to Assess the Chronic Pain Experience: Algorithm Development and Validation.
探索大型語言模型評估慢性疼痛經驗的能力：演算法開發與驗證。 J Med Internet Res 2025-03-31

慢性疼痛影響超過20%的人口，對個人和經濟造成重大影響。有效的疼痛評估工具對改善患者生活至關重要。這項研究探討使用大型語言模型（如GPT-4）來評估患者的書面敘述（WNs）。分析43份纖維肌痛症患者的WNs後，結果顯示GPT-4的評估與專家評分高度一致，且專家認為其評分和解釋通常合適。這表明GPT-4能有效增強WNs的評估，為慢性疼痛管理提供新方法。 PubMed DOI

Which social media platforms facilitate monitoring the opioid crisis?
這個標題可以翻譯為：「哪些社群媒體平台有助於監測鴉片類藥物危機？」 PLOS Digit Health 2025-04-28

社群媒體有助於追蹤鴉片類藥物的使用和過量情形，但Reddit、X/Twitter等平台的資料存取政策常變動，對研究有風險。這項研究分析11個平台，發現TikTok、YouTube、Facebook也很有潛力。多平台並用能擴大涵蓋族群，也能降低單一平台失效對研究的影響。 PubMed DOI

Using Large Language Models for sentiment analysis of health-related social media data: empirical evaluation and practical tips.
運用大型語言模型進行健康相關社群媒體資料的情感分析：實證評估與實用建議 AMIA Annu Symp Proc 2025-05-26

這篇論文比較了 GPT-3.5-Turbo、FLAN-T5 和 BERT 等大型語言模型在健康社群媒體情感分析的表現。結果顯示，LLMs 比傳統工具（像 VADER）表現更好，但準確度還有進步空間。透過調整提示語和微調，尤其是 BERT，效果會更好。研究也建議未來要在標註資料少的情況下，持續優化這些模型。 PubMed

Enhancing Substance Use Detection in Clinical Notes with Large Language Models.
利用大型語言模型提升臨床紀錄中物質使用偵測能力 Res Sq 2025-06-05

這篇研究用標註過的出院摘要，建立大規模資料集，並用多種大型語言模型來偵測八種物質使用情形。經過微調的 Llama-DrugDetector-70B 模型，對大多數物質的偵測準確率很高（F1 分數 ≥ 0.95），但像鴉片類藥物和多重物質使用的偵測還有進步空間。整體來說，LLM 有助提升臨床紀錄中物質使用的辨識，但還需要更多研究才能廣泛應用。 PubMed DOI

Improving Suicidal Ideation Detection in Social Media Posts: Topic Modeling and Synthetic Data Augmentation Approach.
提升社群媒體貼文中自殺意念偵測：主題建模與合成資料增強方法 JMIR Form Res 2025-06-11

這項研究發現，社群媒體上關於自殺的討論常忽略弱勢族群的議題。研究團隊用AI生成補足這些缺漏主題的資料，讓機器學習模型訓練更全面。結果顯示，加入這些合成資料後，模型偵測自殺意念的準確度提升，有助於打造更包容的線上自殺風險偵測工具。 PubMed DOI

Identifying Opioid Overdose and Opioid Use Disorder and Related Information from Clinical Narratives Using Large Language Models.
利用大型語言模型從臨床敘述中辨識Opioid過量、Opioid使用障礙及相關資訊 AMIA Jt Summits Transl Sci Proc 2025-06-12

這項研究比較多種大型語言模型，發現經過微調的GatorTronGPT在從臨床紀錄中擷取鴉片類藥物過量和使用障礙的關鍵資訊上表現最佳。結果顯示，生成式LLM能有效協助擷取相關資訊，對後續研究和介入措施很有幫助。 PubMed

Applying language models for suicide prevention: evaluating news article adherence to WHO reporting guidelines.
應用語言模型於自殺防治：評估新聞報導對WHO報導指引的遵循情形 Npj Ment Health Res 2025-06-23

這項研究發現，像ChatGPT-4這類大型語言模型，能準確評估自殺新聞是否符合WHO指引，結果和人工審查者高度一致。代表AI有機會協助媒體負責任地報導自殺議題，能即時、大規模給記者回饋，對推動公共衛生很有幫助。 PubMed DOI

原始文章

站上相關主題文章列表