這項研究評估大型語言模型(LLMs)在心臟康復教育回應的可讀性。使用Gunning Fog、Flesch Kincaid和Flesch Reading Ease分數後發現,ChatGPT 3.5、Copilot和Gemini的回應可讀性不符合美國建議的年級水平。其中,Gemini和Copilot的回應比ChatGPT 3.5更易讀。雖然LLMs在心血管康復教育上有潛力,但仍需改善可讀性,以更有效地教育患者。 PubMed
這項研究探討大型語言模型(LLMs)在為癌症倖存者及其照顧者創建教育材料的有效性,特別針對弱勢群體。研究比較了三個模型(GPT-3.5 Turbo、GPT-4 和 GPT-4 Turbo)在生成30個癌症護理主題內容的表現,目標是達到六年級的閱讀水平,並提供西班牙語和中文翻譯。 主要發現包括:LLMs整體表現良好,74.2%符合字數限制,平均質量分數為8.933,但只有41.1%達到所需閱讀水平。翻譯準確率高,西班牙語96.7%、中文81.1%。常見問題有範圍模糊和缺乏可行建議。GPT-4表現優於GPT-3.5 Turbo,使用項目符號提示效果更佳。 結論指出,LLMs在創建可及的教育資源方面潛力大,但需改善閱讀水平和內容全面性,未來研究應結合專家意見和更好數據以提升有效性。 PubMed DOI