原始文章

這項研究評估了Google Gemini和Microsoft Copilot在肥胖藥物及外科管理的表現,特別是它們對美國糖尿病協會(ADA)和美國臨床內分泌學會(AACE)指導方針的遵循情況。研究發現,Microsoft Copilot在完整性上表現優異(10/10),而Google Gemini僅有一半問題(5/10)回答完整。Google Gemini拒絕回答兩個問題,建議諮詢醫生。雖然兩者都未顯示偏見,但Microsoft Copilot的部分回應則有偏見。這顯示出AI工具在肥胖管理上的潛力與表現差異。 PubMed DOI


站上相關主題文章列表

ChatGPT被學生、研究人員和病患廣泛使用,方便取得資訊。研究評估了ChatGPT在評估2型糖尿病患者肥胖狀況的可信度。內分泌學家向ChatGPT提問20個問題,結果顯示在評估肥胖方面表現完全可靠,但在治療方面還有進步的空間。ChatGPT提供了全面的回應,但無法取代以患者為中心的醫療專業人員管理方式。 PubMed DOI

研究評估人工智慧回答肥胖手術問題的品質和易讀性,使用不同LLMs提供答案,由肥胖手術醫生評估。結果顯示像ChatGPT-4這樣的模型能提供適當回答,但表現有差異。臨床使用AI需謹慎,提供監督很重要。未來需進一步研究LLMs如何改善肥胖手術醫療服務和決策。 PubMed DOI

這項研究探討了像ChatGPT這樣的AI聊天機器人在提供第二型糖尿病和代謝症候群的營養管理指導上的有效性。研究重點包括飲食管理、營養照護過程及1500卡路里菜單規劃。雖然兩位營養師的評估大致一致,但ChatGPT的建議在減重、能量缺口、人體測量及身體活動等方面存在明顯不足,且NCP的輸出不完整。儘管如此,營養師對其回應的清晰度評價良好。結論指出,ChatGPT可作為從業者的輔助工具,但使用者需了解其局限性。 PubMed DOI

這項研究評估了AI語言模型ChatGPT在減重手術指導的能力,並與人類外科醫生進行比較。研究中提出五個臨床情境,詢問ASMBS認證的外科醫生和ChatGPT。結果顯示,ChatGPT在簡單案例中與外科醫生一致性高,特別是在不建議手術的情況下。ChatGPT的建議有60%符合ASMBS指導方針,而外科醫生則100%遵循。雖然ChatGPT顯示潛力,但缺乏人類醫生的深度和個性化見解,改善其在複雜病人情境的訓練可能提升醫療有效性。 PubMed DOI

這項研究評估了三種AI模型—ChatGPT-4、ChatGPT-3.5和Google Gemini—在提供多囊卵巢症候群(PCOS)資訊的有效性。結果顯示,ChatGPT-4和3.5在回答準確性和質量上優於Gemini,但Gemini的可讀性較高,讓回答更易懂。此外,Gemini的錯誤資訊傾向較低。總體來看,ChatGPT-4和3.5在臨床上可成為教育患者的有用工具,未來AI技術的進步可能進一步提升其效用。 PubMed DOI

這項研究評估了AI聊天機器人在為肥胖患者提供營養建議的表現,分析了兩個案例:一位35歲男性和一位65歲女性。研究測試了十種不同的AI,並由註冊營養師評估其準確性、完整性和重現性。 **主要發現:** - 在第一個案例中,ChatGPT 3.5的準確率最高(67.2%),而Copilot最低(21.1%)。ChatGPT 3.5和4.0的完整性得分最佳(87.3%)。 - 第二個案例中,無一聊天機器人準確率超過50%,ChatGPT 4.0和Claude的完整性最佳(77.8%)。 - 蛋白質攝取建議存在不一致性,部分機器人建議增加,部分則建議減少。 **結論:** 研究指出,通用型AI在複雜健康情境下的飲食建議效果有限,無法取代專業營養師。 PubMed DOI

本研究探討三款人工智慧聊天機器人——Gemini、Microsoft Copilot 和 ChatGPT 4.0 在制定個人化減重飲食計畫的有效性。結果顯示,這些機器人生成的飲食計畫在營養質量上表現良好,但在宏量營養素和脂肪酸的平衡上仍有不足。特別是,ChatGPT 4.0 在熱量準確性方面表現最佳,而Gemini的計畫變異性較大。總體而言,這些AI工具能提供有用的飲食建議,但仍需與營養專業人士的知識相輔相成。 PubMed DOI

本研究探討了ChatGPT和Google Gemini兩個人工智慧工具在創建有關肥胖、高血壓和高三酸甘油脂血症的患者教育指南的有效性。結果顯示,ChatGPT生成的內容較長,但在可讀性和可靠性上與Google Gemini相似。雖然Google Gemini的易讀性得分稍高,但差異不顯著。總體而言,這兩個工具都能有效滿足患者的教育需求,適應不同的內容長度和複雜度。 PubMed DOI

這項研究評估了兩個AI模型,ChatGPT-4o和ChatGPT-4,為一位20歲女性肥胖者制定1800卡路里的飲食計畫,並與2022年土耳其飲食指南(TDG-2022)比較。結果顯示,兩者的菜單與建議不一致,卡路里含量低於標準,且關鍵營養素如脂肪、碳水化合物、鉀和鈣的含量也未達標。總體而言,這些AI模型在飲食規劃上有重大限制,無法取代營養師的專業建議,使用時需謹慎。 PubMed DOI

臨床醫師越來越重視大型語言模型(LLMs)在肥胖服務中的應用,因為它們有助於提升護理的可及性和效率。不過,對於這些模型的科學準確性和同理心表達仍有疑慮。最近研究顯示,ChatGPT-3能有效模仿人類營養師的回應,而比較ChatGPT-4與人類營養師的研究結果顯示,兩者在科學正確性、可理解性、同理心和可行性上表現相似。這些結果顯示,先進的LLMs在肥胖治療中可能提供有價值的支持,但仍需進一步研究其在其他情境中的有效性。 PubMed DOI