Diminished diversity-of-thought in a standard large language model.
標準大型語言模型中思想多樣性的減少。 Behav Res Methods 2024-01-09

研究發現GPT-3.5在模擬人類行為上有限制，容易出現「正確答案」效應。即使改變資料或答案，結果仍一致。有研究顯示GPT-3.5傾向右派價值觀。這顯示在社會科學中使用大型語言模型存在挑戰，也引發對未來由AI主導可能帶來的思想單一性的擔憂。 PubMed DOI

The potential of generative AI for personalized persuasion at scale.
生成式人工智慧在大規模個性化說服中的潛力。 Sci Rep 2024-02-29

使用像ChatGPT這樣的大型語言模型，根據收件人的心理特徵製作個性化訊息，可以大幅提升訊息的影響力。研究發現，在1788名參與者中，由ChatGPT生成的個性化訊息在各個領域和心理特徵上比非個性化訊息更具說服力。這顯示了大型語言模型在自動化和擴展個性化說服方面的潛力，提高了效果和效率。這些發現對研究人員、從業者和一般大眾都具有重要意義。 PubMed DOI

Evaluating the persuasive influence of political microtargeting with large language models.
評估政治微定位與大型語言模型的說服影響。 Proc Natl Acad Sci U S A 2024-06-07

最新的語言模型進步了，可以用來做政治微目標定位，但對個人影響還不確定。一項研究發現，使用GPT-4生成的訊息有說服力，但微目標定位並沒有顯著增加說服力。這表示語言模型的優勢可能在於一般訊息的說服力，而非個人化訊息。研究人員已提供GPTarget2024數據集給未來研究使用。 PubMed DOI

Scale matters: Large language models with billions (rather than millions) of parameters better match neural representations of natural language.
規模重要性：擁有數十億（而非數百萬）參數的大型語言模型更能匹配自然語言的神經表徵。 bioRxiv 2024-07-15

最新研究利用先進語言模型研究人腦處理語言方式。模型提升語言能力，但神經科學研究未跟上。研究者用不同大小模型觀察其捕捉大腦語言資訊能力，發現大模型預測神經活動較佳。研究指出，隨模型增大，最佳神經信號預測層轉移到較早層，顯示大腦處理語言有組織層次結構。 PubMed DOI

The political preferences of LLMs.
LLMs 的政治偏好。 PLoS One 2024-07-31

您的分析指出大型語言模型（LLMs）中存在的政治偏見問題。透過對24個對話型LLM進行測試，發現它們在政治問題上主要偏向左派觀點。雖然五個基礎模型的表現不佳，但這也讓結果的可靠性受到質疑。此外，研究顯示LLMs可以透過有監督的微調受到特定政治取向影響，這對公共話語的塑造有重要意義。這些潛在的偏見可能影響社會認知與決策，因此在開發和使用LLMs時，必須仔細考量其政治影響。 PubMed DOI

The Limitations of Large Language Models for Understanding Human Language and Cognition.
大型語言模型在理解人類語言和認知方面的局限性。 Open Mind (Camb) 2024-09-04

這段論述指出大型語言模型（LLMs）在理解人類語言的學習與演變上有其限制。主要有兩個觀點： 1. **功能與機制的差異**：雖然LLMs能生成類似人類的語言，但其學習過程與人類不同。人類透過多種感官互動學習語言，而LLMs主要依賴文本數據，這使得它們的相似性只是表面現象。 2. **語言行為的範疇**：人類的語言使用範圍更廣，而LLMs的設計限制了它們對語言意義的理解及自然互動的能力。因此，LLMs應被視為輔助語言研究的工具，而非語言理論本身，這強調了謹慎應用的必要性。 PubMed DOI

Larger and more instructable language models become less reliable.
更大且更具可指導性的語言模型變得不那麼可靠。 Nature 2024-09-25

目前增強大型語言模型的策略主要是透過擴大模型規模、數據量和計算能力，並進行後處理和微調。然而，這樣的調整可能會影響模型的可靠性。我們的研究發現，雖然模型在簡單任務上表現不錯，但在低難度領域的準確性卻不穩定，特別是人類監督能夠發現的錯誤。早期模型常避免回答，而新模型則可能給出看似合理但實際錯誤的回應。這顯示出對通用人工智慧的重新設計是必要的，尤其是在需要可預測錯誤的應用中。 PubMed DOI

Use of large language models as a scalable approach to understanding public health discourse.
大型語言模型作為理解公共衛生話語的可擴展方法。 PLOS Digit Health 2024-10-16

這項研究探討大型語言模型（LLMs）在分析社交媒體貼文，評估公眾對疫苗接種態度的應用。研究人員比較了不同LLMs的表現，包括GPT模型和開源替代品，並與基於規則的情感分析工具進行對比。結果顯示，使用表現最佳的LLMs進行少量提示能獲得最佳效果，而其他方法則有較高的誤分類風險。研究強調LLMs在公共衛生領域的潛力，建議將其納入公共衛生監測，以提升對健康政策公眾意見的評估能力。 PubMed DOI

Large language models (LLMs) as agents for augmented democracy.
大型語言模型 (LLMs) 作為增強民主的代理人。 Philos Trans A Math Phys Eng Sci 2024-11-13

這篇文章探討如何利用大型語言模型（LLMs）來分析和預測公民的政策偏好，特別是針對巴西2022年總統候選人的政府計畫。研究採用訓練-測試交叉驗證，結果顯示LLMs在預測個人政治選擇上表現優於傳統的投票假設，且在估算整體偏好時也更準確。這項研究顯示LLMs能捕捉複雜的政治細微差異，為未來的數據增強研究提供了新方向，並與參與式治理和數位創新主題相關聯。 PubMed DOI

Deploying large language models for discourse studies: An exploration of automated analysis of media attitudes.
部署大型語言模型於話語研究：媒體態度自動分析的探索。 PLoS One 2025-01-09

這項研究探討如何利用大型語言模型（LLM）分析媒體對中國的態度，以香港的《東方日報》為例。研究強調分析媒體數據集對理解公眾意見的重要性，並指出傳統方法常忽略隱性態度。研究使用Martin和White的框架來分類態度，並運用Meta的開源Llama2（13b）模型進行分析，針對40,000條與中國相關的表達進行量化。結果顯示，LLM能有效識別顯性和隱性態度，準確率約80%，與人類編碼者相當。研究也討論了實施過程中的挑戰及其解決策略。 PubMed DOI

原始文章

站上相關主題文章列表