Bias of AI-generated content: an examination of news produced by large language models.
人工智慧生成內容的偏見：對大型語言模型生成的新聞進行檢驗。 Sci Rep 2024-03-07

LLMs透過AIGC改變生活，但需了解其限制。研究發現ChatGPT等LLM生成的內容存在性別、種族偏見，歧視女性、黑人。ChatGPT偏見最少，且能拒絕有偏見提示。 PubMed DOI

Current safeguards, risk mitigation, and transparency measures of large language models against the generation of health disinformation: repeated cross sectional analysis.
大型語言模型對抗生成健康虛假資訊的當前防護措施、風險緩解和透明度措施：重複橫斷面分析。 BMJ 2024-03-28

研究評估了防止大型語言模型（LLMs）生成健康虛假資訊的保護措施。測試四個LLMs，發現有些保護措施有漏洞，有些持續生成虛假資訊。研究建議加強監管、透明度和定期審計，以防止LLMs散播健康虛假資訊。 PubMed DOI

Evaluating the persuasive influence of political microtargeting with large language models.
評估政治微定位與大型語言模型的說服影響。 Proc Natl Acad Sci U S A 2024-06-07

最新的語言模型進步了，可以用來做政治微目標定位，但對個人影響還不確定。一項研究發現，使用GPT-4生成的訊息有說服力，但微目標定位並沒有顯著增加說服力。這表示語言模型的優勢可能在於一般訊息的說服力，而非個人化訊息。研究人員已提供GPTarget2024數據集給未來研究使用。 PubMed DOI

The political preferences of LLMs.
LLMs 的政治偏好。 PLoS One 2024-07-31

您的分析指出大型語言模型（LLMs）中存在的政治偏見問題。透過對24個對話型LLM進行測試，發現它們在政治問題上主要偏向左派觀點。雖然五個基礎模型的表現不佳，但這也讓結果的可靠性受到質疑。此外，研究顯示LLMs可以透過有監督的微調受到特定政治取向影響，這對公共話語的塑造有重要意義。這些潛在的偏見可能影響社會認知與決策，因此在開發和使用LLMs時，必須仔細考量其政治影響。 PubMed DOI

Large Language Models Can Enable Inductive Thematic Analysis of a Social Media Corpus in a Single Prompt: Human Validation Study.
大型語言模型能夠在單一提示中啟用社交媒體語料庫的歸納主題分析：人類驗證研究。 JMIR Infodemiology 2024-08-29

這項研究探討生成性大型語言模型（LLMs）在分析公共健康相關社交媒體內容的可行性，特別是疫苗言論。研究發現，LLMs通常能有效識別人類專家所關注的主題，且錯誤信息出現率較低。雖然LLMs的分析深度不及人類專家，但專家認為其生成的主題仍然合理且相關。總體來看，LLMs在處理健康相關社交媒體內容方面展現出顯著潛力，未來可能有助於公共健康策略的制定與社區關注的理解。 PubMed DOI

Large language models and their big bullshit potential.
大型語言模型及其巨大的胡說潛力。 Ethics Inf Technol 2024-10-07

大型語言模型的出現引發了對其可能生成誤導性或虛假資訊的討論，這被稱為「胡說八道」。這個詞暗示這些模型能產生看似可信的內容，但不一定符合事實。雖然有觀點認為這些模型會發表未經驗證的陳述，但也有人認為，只要有適當的保障措施，它們可以避免這種情況。最終，語言模型的「胡說八道」傾向與其設計和使用方式有關，類似於人類在不同情境下可能不遵循真實性的情況。 PubMed DOI

Large language models (LLMs) and the institutionalization of misinformation.
大型語言模型 (LLMs) 與錯誤資訊的制度化。 Trends Cogn Sci 2024-10-11

對於大型語言模型（LLMs）可能擴散錯誤資訊的擔憂是合理的，因為這些模型生成的內容難以與可信來源區分，容易造成真實與虛假資訊的混淆。這可能導致錯誤資訊的強化，讓人們難以辨別事實。使用者互動和分享這些內容，可能形成反饋循環，進一步鞏固錯誤資訊。這樣的情況可能影響民主過程、信任機構，甚至造成社會分裂。因此，推廣媒體素養、批判性思維及事實查核機制非常重要。同時，提升LLMs訓練和資訊來源的透明度，能減少錯誤資訊的風險，確保科技能增進我們對現實的理解。 PubMed DOI

Medical large language models are susceptible to targeted misinformation attacks.
醫學大型語言模型易受針對性錯誤資訊攻擊。 NPJ Digit Med 2024-10-24

這項研究指出大型語言模型（LLMs）在醫學應用中存在重大脆弱性，只需操控模型權重的1.1%就能注入錯誤的生物醫學資訊，並在輸出中擴散。儘管如此，模型在其他生物醫學任務上的表現仍然不變。研究測試了1,025個錯誤的生物醫學事實，凸顯了LLMs在醫療領域的安全性和信任問題。結果強調了需要採取保護措施、驗證流程及謹慎的存取管理，以確保這些模型在醫療實踐中的安全可靠。 PubMed DOI

Large language models (LLMs) as agents for augmented democracy.
大型語言模型 (LLMs) 作為增強民主的代理人。 Philos Trans A Math Phys Eng Sci 2024-11-13

這篇文章探討如何利用大型語言模型（LLMs）來分析和預測公民的政策偏好，特別是針對巴西2022年總統候選人的政府計畫。研究採用訓練-測試交叉驗證，結果顯示LLMs在預測個人政治選擇上表現優於傳統的投票假設，且在估算整體偏好時也更準確。這項研究顯示LLMs能捕捉複雜的政治細微差異，為未來的數據增強研究提供了新方向，並與參與式治理和數位創新主題相關聯。 PubMed DOI

Comparing large Language models and human annotators in latent content analysis of sentiment, political leaning, emotional intensity and sarcasm.
比較大型語言模型與人類標註者在情感、政治傾向、情緒強度和諷刺的潛在內容分析中的表現。 Sci Rep 2025-04-03

這項研究分析了七種大型語言模型（LLMs）在潛在內容分析的有效性，並與人類標註者進行比較。研究涵蓋情感、政治傾向、情感強度和諷刺檢測。結果顯示，無論是人類還是LLMs，在情感和政治分析上表現一致，LLMs的可靠性通常超過人類。不過，人類在情感強度評分上較高，兩者在諷刺檢測上都面臨挑戰。總體來看，LLMs，特別是GPT-4，能有效模仿人類的分析能力，但人類專業知識仍然重要。 PubMed DOI

原始文章

站上相關主題文章列表