原始文章

短文本聚類面臨詞彙共現的挑戰,但研究顯示大型語言模型(LLMs)能有效生成嵌入,捕捉語義細微差異,改善聚類結果。透過高斯混合模型,聚類效果比傳統方法如doc2vec和潛在狄利克雷分配更明顯且易解釋。人類評審和生成型LLM的驗證顯示高一致性,顯示LLM能縮短聚類產出與解釋的距離。此外,LLM與人類編碼的比較揭示了兩者的偏見,質疑傳統將人類編碼視為最終標準的做法。 PubMed DOI


站上相關主題文章列表

這項研究探討如何利用大型語言模型(LLM)分析媒體對中國的態度,以香港的《東方日報》為例。研究強調分析媒體數據集對理解公眾意見的重要性,並指出傳統方法常忽略隱性態度。研究使用Martin和White的框架來分類態度,並運用Meta的開源Llama2(13b)模型進行分析,針對40,000條與中國相關的表達進行量化。結果顯示,LLM能有效識別顯性和隱性態度,準確率約80%,與人類編碼者相當。研究也討論了實施過程中的挑戰及其解決策略。 PubMed DOI

這項研究探討如何利用大型語言模型(LLMs)從日本的肺癌放射學報告中提取資訊並進行聚類分析。隨著自然語言處理在醫學領域的應用增加,研究針對非英語醫學數據集的挑戰進行探討。使用MedTxt-RR數據集,研究發現腫瘤大小在73.3%的報告中被準確識別,腫瘤位置和側別則在83%的報告中被識別。結果顯示,無監督的LLM方法在資訊提取和聚類上優於傳統監督方法,顯示出LLM在提升放射學報告效用的潛力。 PubMed DOI

這項研究探討了如何利用自然語言處理(NLP)分析精神醫療機構的專業發展訓練反饋。研究者針對「使用意圖」和「開放式反饋」進行分析,使用了主題建模、情感分析和基於大型語言模型(LLM)的聚類方法。結果顯示,主題建模對短小的「使用意圖」回應效果不佳,情感分析也無法準確捕捉情感基調。相對而言,LLM的聚類方法能有效生成有意義的聚類,顯示其在分析學習者反饋中的潛力。未來研究應進一步探索LLM在不同數據集的應用。 PubMed DOI

這項研究探討如何利用大型語言模型(LLMs)來進行大規模的人類記憶實驗,特別是針對自然敘事的分析。研究發現,隨著敘事長度增加,記憶表現會改善,但參與者常常只會總結長敘事,而非回憶具體細節。當敘事順序被打亂時,回憶表現顯著下降,但識別表現穩定,顯示參與者仍能根據理解重建故事。研究還利用LLM生成的文本嵌入來測量敘事的語義相似度,與回憶可能性有強相關性,顯示LLMs在記憶研究中的潛力。 PubMed DOI

文件分類在自然語言處理(NLP)中非常重要,應用於情感分析、內容推薦和資訊檢索等領域。本文探討Meta AI的LLaMA2在提升英文文件分類的能力。實驗結果顯示,LLaMA2在WOS-5736數據集上表現優於傳統方法,精確度和召回率更高。此外,我們分析了LLaMA2的可解釋性,找出影響分類的關鍵特徵。這些發現顯示先進語言模型在改善分類結果及理解文件結構方面的潛力,推進了NLP的研究方法。 PubMed DOI

這項研究探討大型語言模型(LLMs)在分析線上護理論壇專家文本的應用,目的是提升主題分析的效率。研究過程包括數據收集、主題建模、人為分類及LLMs的主題詮釋。結果顯示,人為詮釋與LLMs生成的詮釋有80%的相似度,且在三分之二的主題上達成共識。LLMs能識別子主題並提供額外見解,增強分析深度,但在質性研究中整合這些模型仍需謹慎。總體而言,LLMs在自動化質性數據詮釋方面展現潛力。 PubMed DOI

這項研究提出了一個新框架,結合大型語言模型(LLMs)提取的臨床特徵,以改善癌症亞型的分類。傳統方法多只專注於組學數據,忽略了臨床背景的價值。研究利用基於BERT的模型,從病理報告中提取結構化特徵,並與組學數據結合,透過自編碼器增強信息。經過奇異值分解(SVD)和光譜聚類後,結果顯示在六個癌症數據集上表現優於現有方法,強調了臨床特徵在多組學分析中的重要性,並展示了LLMs在精準醫療中的潛力。 PubMed DOI

這項研究分析了七種大型語言模型(LLMs)在潛在內容分析的有效性,並與人類標註者進行比較。研究涵蓋情感、政治傾向、情感強度和諷刺檢測。結果顯示,無論是人類還是LLMs,在情感和政治分析上表現一致,LLMs的可靠性通常超過人類。不過,人類在情感強度評分上較高,兩者在諷刺檢測上都面臨挑戰。總體來看,LLMs,特別是GPT-4,能有效模仿人類的分析能力,但人類專業知識仍然重要。 PubMed DOI

大型語言模型(LLMs)能理解和產生自然語言,正改變醫療、教育、金融等產業,提升效率和準確度。不過,LLMs也有倫理、偏見和高運算成本等問題。本文分析其發展、應用和限制,並探討未來趨勢。 PubMed DOI

這項研究發現,LLM像ChatGPT-4o能快速抓到結構和後勤主題,但人類分析師更能掌握情感和心理細節。結合兩者分析,有助提升健康研究的廣度和深度。作者建議未來可採用這種混合方式。 PubMed DOI