Potential and Limitations of ChatGPT 3.5 and 4.0 as a Source of COVID-19 Information: Comprehensive Comparative Analysis of Generative and Authoritative Information.
ChatGPT 3.5和4.0作為 COVID-19 資訊來源的潛力與限制：生成式和權威資訊的全面比較分析。 J Med Internet Res 2024-01-10

研究比較了ChatGPT 3.5和4.0生成的COVID-19資訊準確性，發現4.0表現更好。雖然這些模型有潛力提供可靠資訊，但還是建議使用者查證其他可信來源以避免誤導。WHO的官方回應也是重要參考。 PubMed DOI

Unleashing the power of AI: Assessing the reliability of ChatGPT in disseminating breast cancer awareness.
釋放人工智慧的力量：評估 ChatGPT 在傳播乳腺癌意識中的可靠性。 J Educ Health Promot 2024-09-13

這項研究探討了ChatGPT在提供乳腺癌健康資訊的有效性，並與CDC網站進行比較。研究使用技術接受模型，強調易用性和有用性，並針對患者和公眾的常見問題進行質性分析，聚焦於定義、預防、診斷和治療四個主題。結果顯示，ChatGPT使用友好且提供準確資訊，來源可靠，能增強乳腺癌知識的獲取。不過，它缺乏問責性，回應也可能隨時間變化。總體而言，ChatGPT在傳播乳腺癌資訊和提升公眾認識方面顯示出潛力。 PubMed DOI

An Observational Study to Evaluate Readability and Reliability of AI-Generated Brochures for Emergency Medical Conditions.
一項觀察性研究以評估人工智慧生成的急救醫療條件手冊的可讀性和可靠性。 Cureus 2024-10-01

本研究評估了ChatGPT與Google Gemini生成的急救醫療手冊在可讀性和可靠性上的差異。結果顯示，兩者在字數、句子數、可讀性及可靠性上並無顯著差異，但ChatGPT的內容較為詳細，字數多32.4%。雖然Gemini的可讀性稍高，但在特定主題上，兩者的表現各有優劣。研究強調需針對特定主題進行深入評估，以提升病患資訊的質量。 PubMed DOI

Ensuring Accuracy and Equity in Vaccination Information From ChatGPT and CDC: Mixed-Methods Cross-Language Evaluation.
確保來自 ChatGPT 和 CDC 的疫苗資訊準確性與公平性：混合方法跨語言評估。 JMIR Form Res 2024-10-30

在數位時代，像ChatGPT這樣的大型語言模型逐漸成為健康照護資訊的重要來源，特別是對於面臨保險和語言障礙的人。雖然這些模型的使用日益普遍，但提供的資訊質量卻不一。這項研究比較了ChatGPT和CDC在英語及西班牙語中提供的疫苗接種資訊，強調健康公平的重要性。結果顯示，兩者的資訊準確且易於理解，但可讀性常超過建議水平，特別是ChatGPT的英語回應。研究指出，改善可讀性和語言公平性對於服務多元族群至關重要。 PubMed DOI

Generative artificial intelligence writing open notes: A mixed methods assessment of the functionality of GPT 3.5 and GPT 4.0.
生成式人工智慧撰寫開放筆記：GPT 3.5 和 GPT 4.0 功能的混合方法評估。 Digit Health 2024-11-04

這項研究探討了OpenAI的ChatGPT 3.5和GPT 4.0在生成針對病人的臨床筆記時的表現，針對2型糖尿病、重度抑鬱症和懷疑腸癌三種病症進行分析。主要發現包括：生成的筆記比原始的更長，且使用了更多的代名詞；可讀性要求較高，特別是ChatGPT 3.5；同理心表現更佳；醫學準確性方面，ChatGPT 4.0的評價較高。總體來看，雖然增強了情感和同理心，但語言複雜性也提高，可能影響醫學準確性。 PubMed DOI

Comparing new tools of artificial intelligence to the authentic intelligence of our global health students.
比較人工智慧的新工具與我們全球健康學生的真實智慧。 BioData Min 2024-12-19

這項研究評估了生成式人工智慧（如ChatGPT-4o）在全球健康領域的資訊素養，與研究生的論文進行比較。54名學生中有28人參加，結果顯示他們普遍認為AI生成的論文不如自己的作品，平均滿意度僅2.39（滿分5分）。雖然AI生成的729個參考文獻中54%是真實的，但46%是虛構的，且只有26.5%與論文內容相關。學生指出AI的速度和創新主題能力，但也強調其準確性和可靠性不足，特別是在公共健康資訊上，這引發了對於誤導可信來源的擔憂。 PubMed DOI

Analyzing the Effectiveness of AI-Generated Patient Education Materials: A Comparative Study of ChatGPT and Google Gemini.
分析 AI 生成的病患教育材料的有效性：ChatGPT 與 Google Gemini 的比較研究。 Cureus 2024-12-26

這項研究比較了ChatGPT和Google Gemini生成的病患教育指南，主題包括MRI檢查、乳房攝影篩檢及MR環境中的物品安全性。研究發現，ChatGPT的平均字數和句子數都高於Google Gemini，但可讀性分數顯示ChatGPT的內容更易讀。相似性分數方面，ChatGPT的分數較低，顯示其內容與現有文本的相似度較低。整體來看，雖然兩者在可靠性上相似，但在可讀性和相似性上有所不同。 PubMed DOI

Comparing AI and human-generated health messages in an Arabic cultural context.
在阿拉伯文化背景下比較人工智慧與人類生成的健康訊息。 Glob Health Action 2025-02-18

這項研究探討了AI生成與人類生成的道路安全訊息在阿聯酋廣告牌宣傳中的有效性，特別針對阿拉伯語使用者。研究使用GPT-4創造15條AI訊息，並由三位專家製作另外15條人類訊息。經過186名參與者的評分，結果顯示AI訊息情感更正面，且可讀性無顯著差異。雖然兩者評價都高，但人類訊息在清晰度上稍勝一籌。這項研究強調了AI在公共傳播中的潛力，並指出理解受眾對AI內容反應的重要性。 PubMed DOI

Content Analysis of Social Determinants of Health Accelerator Plans Using Artificial Intelligence: A Use Case for Public Health Practitioners.
使用人工智慧進行健康加速計畫的社會決定因素內容分析：公共衛生從業者的應用案例。 J Public Health Manag Pract 2025-02-26

這項研究探討大型語言模型（LLMs），特別是GPT-4o，在公共衛生文件分析中的應用，像是社區健康改善計畫。研究比較了GPT-4o的半自動化輸出與人類分析師的表現。主要發現包括： 1. **準確性**：GPT-4o的抽象準確率為79%，錯誤17次；人類分析師則為94%，錯誤8次。數據綜合方面，GPT-4o準確率僅50%，錯誤9次。 2. **時間效率**：GPT-4o在數據抽象上耗時較少，但考慮到提示工程和修正錯誤，實際節省不明顯。 3. **謹慎態度**：建議公共衛生專業人員謹慎使用生成式AI，權衡資源節省與準確性問題。總之，GPT-4o在公共衛生內容分析上有潛力，但需注意其限制。 PubMed DOI

AI Chatbots as Sources of STD Information: A Study on Reliability and Readability.
AI 聊天機器人作為性病資訊的來源：可靠性和可讀性的研究。 J Med Syst 2025-04-03

這項研究評估了四款AI聊天機器人（ChatGPT、Gemini、Perplexity和Copilot）提供的性傳播疾病資訊的可靠性和可讀性。結果顯示，Perplexity和Copilot的資訊較為可靠，但所有聊天機器人的可讀性都未達到建議的六年級標準，對健康素養較低的使用者來說過於複雜。研究強調了改善AI健康資訊準確性和可及性的必要性，以便讓更多人能理解。 PubMed DOI

原始文章

站上相關主題文章列表