原始文章

網路與人工智慧(AI)已改變現代醫學,讓醫療資訊更易獲取,但病人的自主權仍需依賴清晰準確的資訊。本文評估AI生成的足踝手術資訊質量與可讀性,結果顯示AI生成的資訊可讀性差,準確性與質量不如人類生成的資料。AI的資訊理解需要更高的教育水平,可能會誤導病人。因此,建議在臨床諮詢中使用來自專業機構的資訊,因為目前AI在知情同意過程中的應用證據仍不足。 PubMed DOI


站上相關主題文章列表

研究發現AI聊天機器人(如ChatGPT、Google Bard和Bing AI)生成的足踝狀況教育資料準確率低(不到60%),包含10種常見狀況。ChatGPT準確率46.2%,Google Bard和Bing AI分別36.5%和28.0%。總結來說,AI聊天機器人提供的資訊準確性有限,不如AOFAS推薦的FootCareMD.org網站。 PubMed DOI

研究比較了OpenAI ChatGPT Chatbot和FootCareMD®提供的足踝外科資訊。結果顯示,FootCareMD®的資訊易讀性高且品質優於ChatGPT。研究指出,AI查詢可能提供高級資訊,但可靠性較低。在診斷治療足踝狀況時,應考慮資訊品質。 PubMed DOI

這項研究指出,網路醫療資訊在骨科領域的使用越來越普遍,但也面臨品質挑戰。研究評估了25個網站,並針對10個網站使用髖部資訊評分系統(HISS)進行分析。最初的平均分數為9.5,顯示品質不佳。經過ChatGPT的建議後,分數提升至21.5,顯示出優秀的品質。結果顯示,ChatGPT能顯著改善線上病人資訊的品質,成為骨科醫生創建教育材料的有力工具,雖然無法取代專業知識,但能提升醫療資訊的可及性與品質。 PubMed DOI

這項研究探討了在足踝外科領域中,醫生能否區分由人工智慧(特別是ChatGPT 3.0)生成的摘要與人類撰寫的摘要。研究中,九位醫生參加了盲測,結果顯示他們的準確率僅為50.5%,幾乎等同於隨機猜測。評審者的經驗和對人工智慧的熟悉度對準確性影響不大,且評審者之間的可靠性隨時間下降。這顯示人工智慧生成的摘要與人類撰寫的相似度高,讓識別變得困難。 PubMed DOI

這項研究強調健康素養對健康結果的重要性,並評估生成式人工智慧在重寫旋轉袖損傷病人教育材料的有效性,目標是達到八年級的閱讀水平。研究收集了來自頂尖骨科醫院的教育材料,並利用人工智慧簡化語言。結果顯示可讀性顯著改善,字數也減少,顯示人工智慧能有效創造易懂的教育內容。研究建議醫院管理者和骨科醫生考慮使用這些工具,以提升教育材料的清晰度和有效性。 PubMed DOI

膝關節骨關節炎(OA)對患者生活品質影響深遠,常需手術。雖然全膝關節置換術(TKA)常見,但年輕的單側膝關節OA患者可能更適合高胫骨截骨術(HTO)。有效的患者教育至關重要,但許多線上健康資訊對一般人來說過於複雜。研究探討定制版ChatGPT是否能提升膝關節OA和HTO的教育可讀性與準確性。結果顯示,微調後的ChatGPT在可讀性和資訊質量上均有顯著改善,顯示定制AI工具能讓醫療資訊更易理解。 PubMed DOI

本研究評估六款生成式AI聊天機器人在鎖骨骨折管理教育中的效果,包括ChatGPT 4、Gemini 1.0等。雖然可讀性分數無顯著差異,但Microsoft Copilot和Perplexity的回答質量明顯優於其他模型。整體來看,這些AI模型在病患教育中表現良好,特別是Microsoft Copilot和Perplexity,適合用於提供鎖骨骨折相關資訊。 PubMed DOI

這項研究指出,西班牙語患者在獲取骨科教育材料時面臨語言障礙和可讀性問題。評估77份美國骨科醫師學會的西班牙語材料後發現,沒有一份符合建議的六年級閱讀水平。使用ChatGPT-4簡化後,53%的材料達到建議水平,但準確性和實用性仍需改善。研究強調持續創建清晰且文化適宜的教育資源的重要性,並建議進一步研究以納入患者反饋。 PubMed DOI

這項研究評估了骨科手術的線上病患教育材料(OPEMs)的可讀性,結果顯示這些材料的可讀性都超過建議的六年級水平,無論是英文還是西班牙文。研究針對六種常見手術,分析了57份英文和56份西班牙文的OPEMs,並使用五種可讀性測試。經過ChatGPT重寫後,英文OPEMs的可讀性從9.6降至7.7,西班牙文則從9.5降至8.3,且字數、複雜詞彙和長句子都有明顯減少,準確性仍然保持。這顯示人工智慧工具能有效提升OPEMs的可讀性,讓病患更容易理解。 PubMed DOI

這項研究評估了四個人工智慧模型在生成脊椎手術病患教育材料的有效性,主要針對腰椎椎間盤切除術、脊椎融合術和減壓椎板切除術。結果顯示,DeepSeek-R1 的可讀性最佳,Flesch-Kincaid 分數介於 7.2 到 9.0 之間,而 ChatGPT-o3 的可讀性最低,超過 10.4。所有模型的資訊品質均低於 60,顯示出「公平」的品質,主要因缺乏參考資料。研究強調改善引用實踐及個性化 AI 生成健康資訊的必要性,未來應整合互動元素和病患反饋,以提升準確性和可及性。 PubMed DOI