Unmasking and Quantifying Racial Bias of Large Language Models in Medical Report Generation.
揭示和量化大型語言模型在醫學報告生成中的種族偏見。 ArXiv 2024-03-06

大型語言模型如GPT-3.5-turbo和GPT-4在醫療保健領域有潛力，但可能受到訓練時的偏見影響，影響其在醫療環境中的實用性。研究指出，這些模型可能對白人族群預測較高的醫療成本和較長的住院時間，並對困難醫療情況下的存活率持過於樂觀的看法。未來需研究減少語言模型中的偏見，特別是在醫療保健領域，確保對所有患者公平且準確評估。 PubMed DOI

What Goes In, Must Come Out: Generative Artificial Intelligence Does Not Present Algorithmic Bias Across Race and Gender in Medical Residency Specialties.
資料進去，結果出來：生成式人工智慧在醫學住院專科中並未呈現跨種族和性別的演算法偏見。 Cureus 2024-03-22

研究發現AI在醫學領域沒有偏見，強調解決不平等問題對抗AI偏見的重要性。呼籲消除醫學領域的性別障礙，強調高質量數據對減輕AI偏見的作用。強調確保醫療和教育領域的AI應用公平無偏見。 PubMed DOI

Constructing synthetic datasets with generative artificial intelligence to train large language models to classify acute renal failure from clinical notes.
使用生成人工智慧建立合成數據集，以訓練大型語言模型，從臨床記錄中分類急性腎衰竭。 J Am Med Inform Assoc 2024-04-16

研究比較了用語言模型訓練的分類器在合成與真實臨床註記上的表現，以辨識急性腎衰竭。結果顯示，使用這兩種訓練數據在檢測急性腎衰竭時表現相似，顯示合成數據可能已足夠，不需從受保護健康資訊中取得訓練數據。 PubMed DOI

Large Language Models for Synthetic Tabular Health Data: A Benchmark Study.
合成表格健康數據的大型語言模型：基準研究。 Stud Health Technol Inform 2024-08-23

這篇論文探討基於變壓器的大型語言模型（LLMs）在生成合成表格健康數據的有效性，並與生成對抗網絡（GANs）進行比較，這對遵循隱私法規的醫療研究非常重要。研究分析了Pythia LLM Scaling Suite，模型參數從1400萬到10億，結果顯示較大的LLM在性能上優於GAN，甚至最小的LLM也能達到相似效果。此外，訓練數據集大小與模型性能呈正相關。論文還討論了在醫療領域實施LLM的挑戰與考量。 PubMed DOI

Unmasking and quantifying racial bias of large language models in medical report generation.
揭示與量化大型語言模型在醫療報告生成中的種族偏見。 Commun Med (Lond) 2024-09-10

大型語言模型（LLMs），像是GPT-3.5-turbo和GPT-4，對醫療專業人員有潛在的協助能力，但可能帶有訓練數據中的偏見，影響其在醫療情境中的有效性。本研究分析這些模型在預測住院、費用和死亡率時的表現，發現它們對白人族群的預測較高，且在困難醫療情況下過於樂觀。這些偏見反映了醫療不平等，強調了進一步研究的必要性，以減少語言模型中的偏見，確保所有病患都能獲得公平和準確的醫療結果。 PubMed DOI

A toolbox for surfacing health equity harms and biases in large language models.
一個揭示大型語言模型中健康公平危害和偏見的工具箱。 Nat Med 2024-09-23

大型語言模型（LLMs）在滿足健康資訊需求上有潛力，但也可能加劇健康不平等。本研究針對Med-PaLM 2模型，提供識別醫療答案中偏見的資源與方法，並提出一個評估框架及七個對抗性查詢的數據集EquityMedQA。研究強調多樣化評估策略的重要性，並呼籲來自不同背景的評審者參與。雖然無法完全確定AI系統是否促進公平健康結果，但此方法旨在增強可及性與公平醫療。 PubMed DOI

Large language models and synthetic health data: progress and prospects.
大型語言模型與合成健康數據：進展與前景。 JAMIA Open 2024-10-28

隨著醫療保健對先進分析的需求增加，合成健康數據的使用變得愈加重要，尤其是在獲取真實健康數據的挑戰下。大型語言模型（LLMs）的進展為生成合成健康數據提供了新機會，但也帶來潛在風險。本文綜述了合成健康數據生成（SHDG）及LLM的研究，探討生成對抗網絡等機器學習模型的現狀與局限性。SHDG面臨的挑戰包括評估指標、數據效率、健康公平等，雖然LLMs在某些方面顯示潛力，但深入研究其優缺點仍然至關重要。 PubMed DOI

Large language models generating synthetic clinical datasets: a feasibility and comparative analysis with real-world perioperative data.
大型語言模型生成合成臨床數據集：可行性及與真實世界圍手術數據的比較分析。 Front Artif Intell 2025-02-20

這項研究探討使用OpenAI的GPT-4o生成合成臨床數據，以解決隱私法規和數據稀缺的問題。研究分為兩個階段：第一階段根據13個臨床參數創建了6,166個案例的結構化數據集，數據合理且準確；第二階段則利用真實的圍手術期數據集VitalDB生成數據，結果顯示92.31%的參數與VitalDB相似，且大多數參數間無顯著差異。研究顯示GPT-4o能有效生成反映實際臨床數據的合成數據，未來應進一步提高數據真實性並探索大型語言模型的潛力。 PubMed DOI

Utility-based Analysis of Statistical Approaches and Deep Learning Models for Synthetic Data Generation With Focus on Correlation Structures: Algorithm Development and Validation.
基於效用的統計方法和深度學習模型在合成數據生成中的分析：關注相關結構的算法開發與驗證。 JMIR AI 2025-03-20

最近生成對抗網絡（GANs）和大型語言模型（LLMs）的進展，提升了醫療數據的生成與增強，對機器學習應用至關重要，尤其在數據隱私受到關注的情況下。研究評估了多種合成數據生成（SDG）方法的有效性，並以隨機森林為基準，分析其在下游任務中的表現。結果顯示，統計方法如synthpop在各種情況下表現優於深度學習方法，特別是在小型數據集上。研究強調特徵與目標變量的相關性對模型效用影響更大，synthpop顯示出更高的穩健性。 PubMed DOI

Inherent Bias in Large Language Models: A Random Sampling Analysis.
大型語言模型中的固有偏見：隨機抽樣分析。 Mayo Clin Proc Digit Health 2025-04-10

這項研究探討了生成式人工智慧模型中的偏見，特別是這些偏見如何影響醫療環境中的臨床決策。研究使用OpenAI的GPT-4模擬醫生在資源有限的情況下選擇病人。結果顯示，醫生在種族、性別、年齡等方面存在顯著偏見，男性醫生偏好男性病人，女性醫生則偏好女性病人。此外，政治立場和性取向也影響醫生的選擇。研究強調，若不採取適當措施，這些偏見可能對病人結果造成不利影響。 PubMed DOI

原始文章

站上相關主題文章列表