Evaluation of Patient Education Materials From Large-Language Artificial Intelligence Models on Carpal Tunnel Release.
大型語言人工智慧模型在腕管釋放手術上患者教育資料的評估。 Hand (N Y) 2024-04-25

ChatGPT是一種AI技術，可幫助病人，但在手部外科領域的回答需評估其正確性和適切性。研究比較了ChatGPT和Google在提供腕隧道手術資訊的表現。Google簡單易懂，ChatGPT則較詳細，建議尋求外科醫生協助。需進一步研究以確認對病人理解的影響。 PubMed DOI

Does the Information Quality of ChatGPT Meet the Requirements of Orthopedics and Trauma Surgery?
ChatGPT的資訊品質是否符合骨科和創傷外科的需求？ Cureus 2024-06-17

研究發現，ChatGPT提供的醫學資訊品質不佳，甚至可能有危險。資訊品質高與醫師評分正相關。醫學人工智慧有潛力，但需改進準確性和可靠性。持續研究發展對提升醫療人工智慧應用、改善患者教育和知情同意流程至關重要。 PubMed DOI

Artificial Intelligence as a Consent Aid for Carpal Tunnel Release.
人工智慧作為腕管釋放手術的同意輔助工具。 Cureus 2024-07-26

這項研究比較了兩個來源的腕管釋放手術病人資訊質量與可讀性：Every Informed Decision Online (EIDO) 小冊子和 AI 語言模型 ChatGPT。結果顯示，ChatGPT 的資訊質量較高，DISCERN 評分為 71 分（滿分 80），而 EIDO 為 62 分（p=0.014）。雖然 ChatGPT 的內容質量較佳，但可讀性較複雜，Flesch-Kincaid 分數為 12.3，顯示閱讀年齡較高，EIDO 則為 7.5。總結來說，ChatGPT 雖然資訊質量好，但理解上可能較有挑戰。 PubMed DOI

ChatGPT: a Concise Google Alternative for People Seeking Accurate and Comprehensive Carpal Tunnel Syndrome Information.
尋求準確且全面的腕管綜合症資訊的簡明 Google 替代方案。 Hand Surg Rehabil 2024-08-05

這項研究比較了ChatGPT 3.5版本與前五名Google搜尋結果在腕隧道症候群問題上的準確性、完整性和簡潔性。三位整形外科醫生使用李克特量表評估回應。結果顯示，ChatGPT和Google的準確性與完整性相似，但ChatGPT的回答更簡潔。雖然ChatGPT對於尋求簡單資訊的患者來說很有幫助，但不應取代定期更新的學術網站，因為它可能缺乏最新資料，且有提供不準確資訊的風險。 PubMed DOI

Quality of Video Content Related to Deep Inferior Epigastric Perforator Flap Breast Reconstruction: Social Media Platforms Versus Large Language Models.
深下腹壁穿支皮瓣乳房重建相關視頻內容的質量：社交媒體平台與大型語言模型的比較。 Ann Plast Surg 2024-08-16

這項研究探討了深下腹皮瓣（DIEP）乳房重建的資訊質量，並比較了社交媒體平台（SMPs）與大型語言模型（LLMs）如ChatGPT和Google Bard的內容。分析了50個英語和西班牙語的視頻，結果顯示LLMs的資訊質量明顯較高，ChatGPT和Google Bard的平均DISCERN分數分別為54和61.17，屬於良好質量。而SMPs的得分則低得多，顯示38%的視頻由非醫療作者製作，突顯了可靠資訊的缺口。研究強調學術整形外科醫生需提供高質量資訊以改善病患教育。 PubMed DOI

Is the information provided by large language models valid in educating patients about adolescent idiopathic scoliosis? An evaluation of content, clarity, and empathy : The perspective of the European Spine Study Group.
大型語言模型提供的資訊在教育患者關於青少年特發性脊柱側彎方面是否有效？內容、清晰度和同理心的評估：歐洲脊柱研究小組的觀點。 Spine Deform 2024-11-04

這項研究評估了三種大型語言模型（LLMs）—ChatGPT 3.5、ChatGPT 4.0 和 Google Bard—在提供青少年特發性脊柱側彎（AIS）資訊的效果。研究人員針對AIS的常見問題設計了10個關鍵問題，並由專業醫生評估這些模型的回答。結果顯示，只有26%的回答被評為「優秀」，其中ChatGPT 4.0表現最佳，達39%。雖然這些模型在清晰度和同理心上表現不錯，但仍需改進，特別是在語言適用性和情境理解方面。整體而言，這項研究顯示了LLMs在病人教育中的潛力。 PubMed DOI

Generative Artificial Intelligence Responses to Common Patient-Centric Hand and Wrist Surgery Questions: A Quality and Usability Analysis.
針對常見病人中心的手部和手腕手術問題的生成式人工智慧回應：質量和可用性分析。 J Hand Surg Asian Pac Vol 2025-01-08

這項研究評估了兩個AI平台（Gemini和ChatGPT）對手部和手腕手術常見問題的回答質量。共提出12個問題，分析48個回答，使用三種評分工具進行評估。結果顯示，回答的平均分數為55.7（良好）、57.2%（足夠）和4.4。手腕相關問題的回答質量顯著高於手部問題，且Gemini在評分上優於ChatGPT。雖然AI的回答通常被評為良好，但質量因平台和問題類型而異，了解這些差異對病人尋求資訊至關重要。 PubMed DOI

Evaluating the quality of medical content on YouTube using large language models.
使用大型語言模型評估 YouTube 上醫療內容的質量。 Sci Rep 2025-03-23

YouTube 是重要的醫療資訊來源，但許多影片內容不準確或有偏見。本研究探討大型語言模型（LLMs）評估醫療影片質量的能力。研究人員收集了專家評估過的影片，並讓二十個 LLMs 使用 DISCERN 工具進行評分。結果顯示，LLMs 的評分通常高於專家，且一致性範圍廣泛。加入評分指導方針後，模型表現有所改善。研究顯示某些 LLMs 能有效評估醫療影片質量，未來可作為獨立專家系統或增強傳統推薦系統，解決線上健康內容的質量問題。 PubMed DOI

GPT-4 as a Source of Patient Information for Carpal Tunnel Surgery: A Comparative Analysis Against Google Web Search.
GPT-4 作為腕管手術病患資訊的來源：與 Google 網頁搜尋的比較分析。 J Am Acad Orthop Surg 2025-03-26

這項研究比較了GPT-4和Google在腕隧道手術（CTS）常見問題上的回應差異。主要發現包括： 1. **問題類型**：兩者都提供事實性資訊，但Google更注重技術細節。 2. **可讀性**：Google的回應可讀性較高，Flesch閱讀分數更好。 3. **回應長度**：Google的答案通常較短。 4. **數字準確性**：GPT-4的數字回應範圍較廣。總體來說，GPT-4提供更詳細的技術見解，有助於病患教育，而Google則提供更易懂的資訊。這研究強調了醫療情境中AI與搜尋引擎的資訊傳遞差異。 PubMed DOI

Can popular AI large language models provide reliable answers to frequently asked questions about rotator cuff tears?
流行的 AI 大型語言模型能否提供有關旋轉袖撕裂的常見問題的可靠答案？ JSES Int 2025-04-04

旋轉袖肌腱撕裂是常見的肩部傷害，會影響功能和生活品質。隨著人們越來越依賴人工智慧大型語言模型（AI LLMs）獲取健康資訊，評估其資訊質量和可讀性變得重要。一項研究針對此傷害生成50個問題，分析了多個AI模型及Google搜尋的回應。結果顯示，雖然有改進潛力，但目前的AI LLM在醫療資訊的質量和可讀性上仍不足，未來需持續評估並提升其表現，以更好地支持病人教育。 PubMed DOI

原始文章

站上相關主題文章列表