這篇論文比較了 GPT-3.5-Turbo、FLAN-T5 和 BERT 等大型語言模型在健康社群媒體情感分析的表現。結果顯示,LLMs 比傳統工具(像 VADER)表現更好,但準確度還有進步空間。透過調整提示語和微調,尤其是 BERT,效果會更好。研究也建議未來要在標註資料少的情況下,持續優化這些模型。 PubMed
這篇研究發現,大型語言模型在沒經過特別訓練下,結合檢索增強生成(RAG)和提示工程,能有效自動摘要專業資訊,表現不錯。不過,還是會遇到像網頁爬蟲限制和偶爾誤解任務等問題,未來還需要進一步優化。 PubMed