原始文章

腕管症候群(CTS)是一種常見病症,受到醫療界和大眾的重視。本研究分析了社交媒體平台上有關CTS的資訊質量,並與大型語言模型(LLMs)如ChatGPT和Google Bard的資訊進行比較。研究涵蓋80部YouTube和Instagram影片,發現LLMs提供的資訊質量顯著高於社交媒體影片。醫療專業人士創作的影片得分較高,但53.8%的影片由非醫療作者製作,顯示專業性不足。結論強調需增加醫療專業人士在社交媒體上的參與,以提升正確知識的傳播。 PubMed DOI


站上相關主題文章列表

ChatGPT是一種AI技術,可幫助病人,但在手部外科領域的回答需評估其正確性和適切性。研究比較了ChatGPT和Google在提供腕隧道手術資訊的表現。Google簡單易懂,ChatGPT則較詳細,建議尋求外科醫生協助。需進一步研究以確認對病人理解的影響。 PubMed DOI

研究發現,ChatGPT提供的醫學資訊品質不佳,甚至可能有危險。資訊品質高與醫師評分正相關。醫學人工智慧有潛力,但需改進準確性和可靠性。持續研究發展對提升醫療人工智慧應用、改善患者教育和知情同意流程至關重要。 PubMed DOI

這項研究比較了兩個來源的腕管釋放手術病人資訊質量與可讀性:Every Informed Decision Online (EIDO) 小冊子和 AI 語言模型 ChatGPT。結果顯示,ChatGPT 的資訊質量較高,DISCERN 評分為 71 分(滿分 80),而 EIDO 為 62 分(p=0.014)。雖然 ChatGPT 的內容質量較佳,但可讀性較複雜,Flesch-Kincaid 分數為 12.3,顯示閱讀年齡較高,EIDO 則為 7.5。總結來說,ChatGPT 雖然資訊質量好,但理解上可能較有挑戰。 PubMed DOI

這項研究比較了ChatGPT 3.5版本與前五名Google搜尋結果在腕隧道症候群問題上的準確性、完整性和簡潔性。三位整形外科醫生使用李克特量表評估回應。結果顯示,ChatGPT和Google的準確性與完整性相似,但ChatGPT的回答更簡潔。雖然ChatGPT對於尋求簡單資訊的患者來說很有幫助,但不應取代定期更新的學術網站,因為它可能缺乏最新資料,且有提供不準確資訊的風險。 PubMed DOI

這項研究探討了深下腹皮瓣(DIEP)乳房重建的資訊質量,並比較了社交媒體平台(SMPs)與大型語言模型(LLMs)如ChatGPT和Google Bard的內容。分析了50個英語和西班牙語的視頻,結果顯示LLMs的資訊質量明顯較高,ChatGPT和Google Bard的平均DISCERN分數分別為54和61.17,屬於良好質量。而SMPs的得分則低得多,顯示38%的視頻由非醫療作者製作,突顯了可靠資訊的缺口。研究強調學術整形外科醫生需提供高質量資訊以改善病患教育。 PubMed DOI

這項研究評估了三種大型語言模型(LLMs)—ChatGPT 3.5、ChatGPT 4.0 和 Google Bard—在提供青少年特發性脊柱側彎(AIS)資訊的效果。研究人員針對AIS的常見問題設計了10個關鍵問題,並由專業醫生評估這些模型的回答。結果顯示,只有26%的回答被評為「優秀」,其中ChatGPT 4.0表現最佳,達39%。雖然這些模型在清晰度和同理心上表現不錯,但仍需改進,特別是在語言適用性和情境理解方面。整體而言,這項研究顯示了LLMs在病人教育中的潛力。 PubMed DOI

這項研究評估了兩個AI平台(Gemini和ChatGPT)對手部和手腕手術常見問題的回答質量。共提出12個問題,分析48個回答,使用三種評分工具進行評估。結果顯示,回答的平均分數為55.7(良好)、57.2%(足夠)和4.4。手腕相關問題的回答質量顯著高於手部問題,且Gemini在評分上優於ChatGPT。雖然AI的回答通常被評為良好,但質量因平台和問題類型而異,了解這些差異對病人尋求資訊至關重要。 PubMed DOI

YouTube 是重要的醫療資訊來源,但許多影片內容不準確或有偏見。本研究探討大型語言模型(LLMs)評估醫療影片質量的能力。研究人員收集了專家評估過的影片,並讓二十個 LLMs 使用 DISCERN 工具進行評分。結果顯示,LLMs 的評分通常高於專家,且一致性範圍廣泛。加入評分指導方針後,模型表現有所改善。研究顯示某些 LLMs 能有效評估醫療影片質量,未來可作為獨立專家系統或增強傳統推薦系統,解決線上健康內容的質量問題。 PubMed DOI

這項研究比較了GPT-4和Google在腕隧道手術(CTS)常見問題上的回應差異。主要發現包括: 1. **問題類型**:兩者都提供事實性資訊,但Google更注重技術細節。 2. **可讀性**:Google的回應可讀性較高,Flesch閱讀分數更好。 3. **回應長度**:Google的答案通常較短。 4. **數字準確性**:GPT-4的數字回應範圍較廣。 總體來說,GPT-4提供更詳細的技術見解,有助於病患教育,而Google則提供更易懂的資訊。這研究強調了醫療情境中AI與搜尋引擎的資訊傳遞差異。 PubMed DOI

旋轉袖肌腱撕裂是常見的肩部傷害,會影響功能和生活品質。隨著人們越來越依賴人工智慧大型語言模型(AI LLMs)獲取健康資訊,評估其資訊質量和可讀性變得重要。一項研究針對此傷害生成50個問題,分析了多個AI模型及Google搜尋的回應。結果顯示,雖然有改進潛力,但目前的AI LLM在醫療資訊的質量和可讀性上仍不足,未來需持續評估並提升其表現,以更好地支持病人教育。 PubMed DOI