原始文章

這項研究探討AI生成的健康資訊與CDC提供的資訊差異,重點在情感、可讀性和品質。透過語言期待理論,分析了不同來源內容對可信度的影響。比較了CDC和ChatGPT 3.5各20條資訊,並進行品質評估。 主要發現包括: 1. **情感**:ChatGPT的內容較多負面情感,常出現憤怒、悲傷和厭惡的詞彙。 2. **可讀性**:CDC的訊息更易讀,ChatGPT則需較高閱讀年級。 3. **品質**:CDC的資訊在品質評估中得分較高,顯示更可靠。 研究強調公共衛生專業人員需教育大眾理解AI生成健康資訊的複雜性,並建議健康素養計畫應涵蓋這類內容的品質與可讀性討論。 PubMed DOI


站上相關主題文章列表

研究比較了ChatGPT 3.5和4.0生成的COVID-19資訊準確性,發現4.0表現更好。雖然這些模型有潛力提供可靠資訊,但還是建議使用者查證其他可信來源以避免誤導。WHO的官方回應也是重要參考。 PubMed DOI

這項研究探討了ChatGPT在提供乳腺癌健康資訊的有效性,並與CDC網站進行比較。研究使用技術接受模型,強調易用性和有用性,並針對患者和公眾的常見問題進行質性分析,聚焦於定義、預防、診斷和治療四個主題。結果顯示,ChatGPT使用友好且提供準確資訊,來源可靠,能增強乳腺癌知識的獲取。不過,它缺乏問責性,回應也可能隨時間變化。總體而言,ChatGPT在傳播乳腺癌資訊和提升公眾認識方面顯示出潛力。 PubMed DOI

本研究評估了ChatGPT與Google Gemini生成的急救醫療手冊在可讀性和可靠性上的差異。結果顯示,兩者在字數、句子數、可讀性及可靠性上並無顯著差異,但ChatGPT的內容較為詳細,字數多32.4%。雖然Gemini的可讀性稍高,但在特定主題上,兩者的表現各有優劣。研究強調需針對特定主題進行深入評估,以提升病患資訊的質量。 PubMed DOI

在數位時代,像ChatGPT這樣的大型語言模型逐漸成為健康照護資訊的重要來源,特別是對於面臨保險和語言障礙的人。雖然這些模型的使用日益普遍,但提供的資訊質量卻不一。這項研究比較了ChatGPT和CDC在英語及西班牙語中提供的疫苗接種資訊,強調健康公平的重要性。結果顯示,兩者的資訊準確且易於理解,但可讀性常超過建議水平,特別是ChatGPT的英語回應。研究指出,改善可讀性和語言公平性對於服務多元族群至關重要。 PubMed DOI

這項研究探討了OpenAI的ChatGPT 3.5和GPT 4.0在生成針對病人的臨床筆記時的表現,針對2型糖尿病、重度抑鬱症和懷疑腸癌三種病症進行分析。主要發現包括:生成的筆記比原始的更長,且使用了更多的代名詞;可讀性要求較高,特別是ChatGPT 3.5;同理心表現更佳;醫學準確性方面,ChatGPT 4.0的評價較高。總體來看,雖然增強了情感和同理心,但語言複雜性也提高,可能影響醫學準確性。 PubMed DOI

這項研究評估了生成式人工智慧(如ChatGPT-4o)在全球健康領域的資訊素養,與研究生的論文進行比較。54名學生中有28人參加,結果顯示他們普遍認為AI生成的論文不如自己的作品,平均滿意度僅2.39(滿分5分)。雖然AI生成的729個參考文獻中54%是真實的,但46%是虛構的,且只有26.5%與論文內容相關。學生指出AI的速度和創新主題能力,但也強調其準確性和可靠性不足,特別是在公共健康資訊上,這引發了對於誤導可信來源的擔憂。 PubMed DOI

這項研究比較了ChatGPT和Google Gemini生成的病患教育指南,主題包括MRI檢查、乳房攝影篩檢及MR環境中的物品安全性。研究發現,ChatGPT的平均字數和句子數都高於Google Gemini,但可讀性分數顯示ChatGPT的內容更易讀。相似性分數方面,ChatGPT的分數較低,顯示其內容與現有文本的相似度較低。整體來看,雖然兩者在可靠性上相似,但在可讀性和相似性上有所不同。 PubMed DOI

這項研究探討了AI生成與人類生成的道路安全訊息在阿聯酋廣告牌宣傳中的有效性,特別針對阿拉伯語使用者。研究使用GPT-4創造15條AI訊息,並由三位專家製作另外15條人類訊息。經過186名參與者的評分,結果顯示AI訊息情感更正面,且可讀性無顯著差異。雖然兩者評價都高,但人類訊息在清晰度上稍勝一籌。這項研究強調了AI在公共傳播中的潛力,並指出理解受眾對AI內容反應的重要性。 PubMed DOI

這項研究探討大型語言模型(LLMs),特別是GPT-4o,在公共衛生文件分析中的應用,像是社區健康改善計畫。研究比較了GPT-4o的半自動化輸出與人類分析師的表現。 主要發現包括: 1. **準確性**:GPT-4o的抽象準確率為79%,錯誤17次;人類分析師則為94%,錯誤8次。數據綜合方面,GPT-4o準確率僅50%,錯誤9次。 2. **時間效率**:GPT-4o在數據抽象上耗時較少,但考慮到提示工程和修正錯誤,實際節省不明顯。 3. **謹慎態度**:建議公共衛生專業人員謹慎使用生成式AI,權衡資源節省與準確性問題。 總之,GPT-4o在公共衛生內容分析上有潛力,但需注意其限制。 PubMed DOI

這項研究評估了四款AI聊天機器人(ChatGPT、Gemini、Perplexity和Copilot)提供的性傳播疾病資訊的可靠性和可讀性。結果顯示,Perplexity和Copilot的資訊較為可靠,但所有聊天機器人的可讀性都未達到建議的六年級標準,對健康素養較低的使用者來說過於複雜。研究強調了改善AI健康資訊準確性和可及性的必要性,以便讓更多人能理解。 PubMed DOI