原始文章

這項研究指出,雖然大型語言模型(LLMs)在明確的社會偏見測試中表現良好,但它們仍可能隱藏著類似人類的偏見。研究人員提出了兩種新方法來測量這些隱性偏見:LLM詞彙聯想測試和LLM相對決策測試。結果顯示,在種族、性別、宗教和健康等四個社會類別中,八個價值對齊的模型仍存在顯著的刻板印象偏見,顯示這些模型雖然在標準評估中看似無偏,但實際上反映了社會偏見。 PubMed DOI


站上相關主題文章列表

大型語言模型(LLMs),像是GPT-3.5-turbo和GPT-4,對醫療專業人員有潛在的協助能力,但可能帶有訓練數據中的偏見,影響其在醫療情境中的有效性。本研究分析這些模型在預測住院、費用和死亡率時的表現,發現它們對白人族群的預測較高,且在困難醫療情況下過於樂觀。這些偏見反映了醫療不平等,強調了進一步研究的必要性,以減少語言模型中的偏見,確保所有病患都能獲得公平和準確的醫療結果。 PubMed DOI

這項研究探討大型語言模型(LLMs)在推薦系統中作為「公平性識別者」的角色,重點在於它們識別和促進公平推薦的能力。研究人員分析了MovieLens和LastFM數據集,並比較了有無公平性策略的變分自編碼器(VAE)生成的推薦。他們發現LLMs能有效識別不公平的推薦,並提出用公平VAE生成的替代品來改善推薦的公平性。結果顯示,這種方法顯著提升了性別基礎群體的公平性與效用比率,實現了公平性與效用的更好平衡。 PubMed DOI

研究顯示,基於人工智慧的決策,特別是大型語言模型(LLMs),在評估求職者時存在顯著偏見。約361,000份履歷被評估後發現,女性候選人通常獲得較高評分,而黑人男性則常被低估,儘管他們的資格相似。這導致聘用機率出現1-3個百分點的差異,且在不同職位和群體中一致。這突顯了進一步調查偏見成因及發展減輕策略的必要性,以促進社會公平。 PubMed DOI

這項研究評估了九個大型語言模型在醫療領域的表現,分析了1,000個急診案例的170萬個輸出結果。結果顯示,標記為黑人、無家可歸者或自我認同為LGBTQIA+的案例,常被建議進行緊急護理或心理健康評估,且有時缺乏臨床正當理由。相對而言,高收入案例則較常建議進行高級影像檢查。這些偏差可能加劇健康不平等,強調了評估和減輕LLMs偏見的重要性,以確保醫療建議的公平性。 PubMed DOI

這項研究探討了生成式人工智慧模型中的偏見,特別是這些偏見如何影響醫療環境中的臨床決策。研究使用OpenAI的GPT-4模擬醫生在資源有限的情況下選擇病人。結果顯示,醫生在種族、性別、年齡等方面存在顯著偏見,男性醫生偏好男性病人,女性醫生則偏好女性病人。此外,政治立場和性取向也影響醫生的選擇。研究強調,若不採取適當措施,這些偏見可能對病人結果造成不利影響。 PubMed DOI

這篇論文探討大型語言模型(LLMs)中的社會偏見問題,提出一個新框架,將偏見檢測視為假設檢驗。虛無假設表示沒有隱性偏見,並使用二元選擇問題來評估開源和專有LLMs的偏見。研究涵蓋ChatGPT、DeepSeek-V3和Llama-3.1-70B等模型,使用的數據集包括BBQ和CrowS-Pairs。結果顯示,貝葉斯因子能更有效地量化偏見,並且LLMs在英法數據集中的偏見行為通常一致,微小變異可能源於文化差異。 PubMed DOI

作者用三種大型語言模型(Mistral、Llama3、Haiku)產生大量自由聯想詞彙,並和人類的 SWOW 資料集對照,建立了新的 LWOW 資料集。這讓我們能直接比較人類和 LLMs 的概念知識組織,並用語意啟動模擬來驗證模型,也能用來研究人類和 LLMs 的隱性偏見。 PubMed DOI

這篇研究分析五款中國主流大型語言模型,發現它們在性別、地區、年齡和學歷上都有明顯偏見,尤其是ChatGLM最嚴重。Tongyiqianwen有時會因隱私問題拒絕生成內容。論文也討論偏見來源,並提供改進建議,對未來更道德地使用這些模型很有參考價值。 PubMed DOI

三款中國熱門大型語言模型(Qwen、Erine、Baichuan)在臨床應用時,對性別、族群、收入和健保狀態都有明顯偏見,常高估男性、高收入和有保險者,低估少數族群及低收入者。這些偏見會影響醫療教育、診斷和治療建議,因此持續檢視並減少偏見非常重要。 PubMed DOI

TL;DR: 大型語言模型(像ChatGPT)不只會有明顯的社會偏見,也會出現像人類一樣的隱性偏見,這些偏見常常不容易被發現。研究發現,AI和人類都會對社經地位較低的人有負面看法,而且AI的偏見更嚴重。大家也比較難察覺AI的偏見,卻比較容易發現自己的。要讓AI負責任地使用,這些偏見問題一定要正視。 PubMed DOI