Fostering effective hybrid human-LLM reasoning and decision making.
促進有效的混合人類-LLM 推理與決策。 Front Artif Intell 2025-01-23

現代大型語言模型（LLMs）引起了廣泛關注，展現出驚人的能力，但有時也會出錯，顯示出人工智慧在日常生活中的潛力與挑戰。雖然許多研究致力於改善這些模型，但人類與LLM的合作動態仍待深入探討。本文強調未來研究應優先考慮人類與LLM的互動，並指出可能妨礙合作的偏見，提出解決方案，並概述促進相互理解及提升團隊表現的研究目標，以改善推理與決策過程。 PubMed DOI

Explicitly unbiased large language models still form biased associations.
明確無偏的大型語言模型仍然形成偏見聯想。 Proc Natl Acad Sci U S A 2025-02-20

這項研究指出，雖然大型語言模型（LLMs）在明確的社會偏見測試中表現良好，但它們仍可能隱藏著類似人類的偏見。研究人員提出了兩種新方法來測量這些隱性偏見：LLM詞彙聯想測試和LLM相對決策測試。結果顯示，在種族、性別、宗教和健康等四個社會類別中，八個價值對齊的模型仍存在顯著的刻板印象偏見，顯示這些模型雖然在標準評估中看似無偏，但實際上反映了社會偏見。 PubMed DOI

Comparing diversity, negativity, and stereotypes in Chinese-language AI technologies: an investigation of Baidu, Ernie and Qwen.
比較中文AI技術中的多樣性、負面性和刻板印象：對百度、Ernie和Qwen的調查。 PeerJ Comput Sci 2025-03-26

這項研究探討了中國的人工智慧工具偏見，特別是百度搜尋引擎及兩個大型語言模型（LLMs）Ernie和Qwen。研究分析了240個社交群體的數據，發現LLMs的觀點比百度更廣泛，但百度和Qwen產生負面內容的頻率高於Ernie。結果顯示語言模型中存在中等程度的刻板印象，可能會助長有害的看法。研究強調在推動全球人工智慧發展時，公平性和包容性的重要性。 PubMed DOI

Measuring gender and racial biases in large language models: Intersectional evidence from automated resume evaluation.
測量大型語言模型中的性別和種族偏見：來自自動化履歷評估的交叉證據。 PNAS Nexus 2025-03-27

研究顯示，基於人工智慧的決策，特別是大型語言模型（LLMs），在評估求職者時存在顯著偏見。約361,000份履歷被評估後發現，女性候選人通常獲得較高評分，而黑人男性則常被低估，儘管他們的資格相似。這導致聘用機率出現1-3個百分點的差異，且在不同職位和群體中一致。這突顯了進一步調查偏見成因及發展減輕策略的必要性，以促進社會公平。 PubMed DOI

Sociodemographic biases in medical decision making by large language models.
大型語言模型在醫療決策中的社會人口偏見。 Nat Med 2025-04-08

這項研究評估了九個大型語言模型在醫療領域的表現，分析了1,000個急診案例的170萬個輸出結果。結果顯示，標記為黑人、無家可歸者或自我認同為LGBTQIA+的案例，常被建議進行緊急護理或心理健康評估，且有時缺乏臨床正當理由。相對而言，高收入案例則較常建議進行高級影像檢查。這些偏差可能加劇健康不平等，強調了評估和減輕LLMs偏見的重要性，以確保醫療建議的公平性。 PubMed DOI

Stereotypical bias amplification and reversal in an experimental model of human interaction with generative artificial intelligence.
在生成式人工智慧的人際互動實驗模型中，刻板印象偏見的放大與逆轉。 R Soc Open Sci 2025-04-10

這項研究探討了生成式人工智慧，特別是OpenAI的GPT-3.5，如何影響性別刻板印象。透過四個實驗，782名參與者的結果顯示，使用刻板印象特徵的AI建議會加強偏見，而反刻板印象的建議則能有效消除這些偏見，雖然說服力較弱。研究強調，若無適當的保障措施，生成式AI可能加劇偏見，但在適當管理下，卻能幫助消除偏見，凸顯理解AI對社會影響的重要性。 PubMed DOI

Detecting implicit biases of large language models with Bayesian hypothesis testing.
使用貝葉斯假設檢驗檢測大型語言模型的隱性偏見。 Sci Rep 2025-04-11

這篇論文探討大型語言模型（LLMs）中的社會偏見問題，提出一個新框架，將偏見檢測視為假設檢驗。虛無假設表示沒有隱性偏見，並使用二元選擇問題來評估開源和專有LLMs的偏見。研究涵蓋ChatGPT、DeepSeek-V3和Llama-3.1-70B等模型，使用的數據集包括BBQ和CrowS-Pairs。結果顯示，貝葉斯因子能更有效地量化偏見，並且LLMs在英法數據集中的偏見行為通常一致，微小變異可能源於文化差異。 PubMed DOI

Emergent social conventions and collective bias in LLM populations.
大型語言模型（LLM）族群中新興的社會規範與集體偏見 Sci Adv 2025-05-14

這項研究發現，AI語言模型代理人在互動時，會自發形成社會慣例，甚至產生集體偏見。一小群立場堅定的對立代理人，也可能影響整體慣例。這顯示AI有能力自主建立社會規範，對確保AI符合人類價值觀很重要。 PubMed DOI

Exploring the occupational biases and stereotypes of Chinese large language models.
中國大型語言模型對職業的偏見與刻板印象探討 Sci Rep 2025-05-28

這篇研究分析五款中國主流大型語言模型，發現它們在性別、地區、年齡和學歷上都有明顯偏見，尤其是ChatGLM最嚴重。Tongyiqianwen有時會因隱私問題拒絕生成內容。論文也討論偏見來源，並提供改進建議，對未來更道德地使用這些模型很有參考價值。 PubMed DOI

Potential to perpetuate social biases in health care by Chinese large language models: a model evaluation study.
中國大型語言模型在醫療保健中延續社會偏見的潛在風險：一項模型評估研究 Int J Equity Health 2025-07-15

三款中國熱門大型語言模型（Qwen、Erine、Baichuan）在臨床應用時，對性別、族群、收入和健保狀態都有明顯偏見，常高估男性、高收入和有保險者，低估少數族群及低收入者。這些偏見會影響醫療教育、診斷和治療建議，因此持續檢視並減少偏見非常重要。 PubMed DOI

原始文章

站上相關主題文章列表