原始文章

這項研究評估了一個公開的人工智慧大型語言模型(LLM)在回答模擬病人關於美學乳房整形手術問題的表現。專家根據準確性、全面性等標準評分,總體得分為7.3分,乳房增大7.0分、乳房懸吊術7.6分、乳房縮小手術7.4分,對乳房植入物的知識得分為6.7分。儘管有些限制,研究顯示AI LLM可成為病人教育的有用工具,並可能隨著機器學習進步而改善。 PubMed DOI


站上相關主題文章列表

腹部整形手術是處理美容和功能問題的常見手術,但患者和外科醫師溝通不足會影響決策。研究發現使用大型語言模型(LLMs)如ChatGPT-3.5、Claude、Gemini和CoPilot回答手術前問題。LLMs間易讀性和質量有差異,ChatGPT-3.5需要高理解水平,Claude提供最適切建議,CoPilot最貼近患者,提供全面資訊。LLMs各有特點和限制,在醫療保健中使用時需謹慎選擇。 PubMed DOI

醫學研究人員越來越多地使用先進的語言模型(LLMs),如ChatGPT-4和Gemini,來改善乳腺相關疾病的診斷。本研究評估這些模型在複雜醫學分類系統中的應用能力,以協助整形外科醫生做出更好的診斷和治療決策。 研究中創建了五十個臨床情境來評估分類準確性,結果顯示Gemini的準確率高達98%,而ChatGPT-4為71%。Gemini在多個分類系統中表現優於ChatGPT-4,顯示出其在整形外科實踐中的潛力,未來有望增強診斷支持和決策能力。 PubMed DOI

人工智慧(AI)在整形外科的應用潛力巨大,能提升病人照護的各個階段,包括術前規劃、手術執行和術後管理。一項研究比較了OpenAI的ChatGPT-4o(omni)和Alphabet的Gemini Advanced兩個AI模型在持續醫學教育(CME)文章的學習能力。結果顯示,人類住院醫師在閱讀後的分數明顯提升,而Gemini Advanced的表現更佳,顯示AI在醫學教育中可作為有效的輔助工具,幫助縮短理論與實踐之間的差距。 PubMed DOI

這項研究評估了大型語言模型(LLMs),如ChatGPT和Google Bard,對美學整形手術的回應可靠性,並與經驗豐富的外科醫生的見解進行比較。研究分析了三十位患者對皮膚填充劑、肉毒桿菌注射和眼瞼手術等問題的回應。十三位外科醫生根據可及性、準確性和實用性評估了LLM的回應。結果顯示,雖然聊天機器人的回應通常清晰且準確,但缺乏來源透明度限制了其可信度。研究建議在依賴LLMs作為主要信息來源時需謹慎,並呼籲進一步研究以增強其在醫療保健中的可靠性。 PubMed DOI

這項研究介紹了PlasticSurgeryGPT,一個專為整形外科設計的語言模型,經過微調以適應25,389篇研究摘要,旨在提升臨床決策、外科教育及研究表現。數據來自2010至2024年間的PubMed,並已預處理以便訓練。模型基於GPT-2架構,評估結果顯示PlasticSurgeryGPT在生成整形外科內容上表現優於通用模型。研究強調特定領域的語言模型在整形外科的潛力,並建議未來可探索更多數據和更大模型以進一步改善。 PubMed DOI

這項研究發現,Google Gemini AI 回答乳房重建手術常見問題時,大多內容正確、完整且相關,但 APPs 給的品質評分比外科醫師低。AI 回答的閱讀難度偏高,部分病患可能較難理解。雖然 Gemini 有潛力成為衛教工具,但病患仍應諮詢專業醫師以獲得個人化建議。 PubMed DOI

這項研究發現,ChatGPT-4o在協助乳房疾病手術規劃時,雖然能給出清楚且結構良好的建議,但在手術細節和風險評估上還不夠完善,且回答內容需要較高的閱讀理解能力。現階段它只能當作輔助工具,無法取代專業醫師,未來還需更多開發和專家驗證才能臨床應用。 PubMed DOI

AI(像 ChatGPT)在整形外科教育有潛力,能協助學習和考試,但內容偶有錯誤,證據也還不夠多。AI 可輔助基礎教學和技能評估,但無法取代專業醫師。未來需更多研究、提升技術及明確規範,才能安全有效應用。 PubMed DOI

這項研究發現,ChatGPT在回答四種常見整形外科手術的病人問題時,表現穩定且清楚,對衛教有幫助。不過,它無法給予個人化建議,建議還是要搭配專業醫師使用。未來可加強個人化功能,並在臨床實際測試。 PubMed DOI

這項研究比較了公開AI模型(如ChatGPT 4o)和自訂模型(Pyolo8)在乳房重建手術後對稱性評估的表現。兩者和專家評分有中到高度一致,ChatGPT在溝通上特別突出。不過,研究團隊認為AI不宜直接與病人互動,避免誤解和情緒問題。總結來說,AI能協助評估,但專業醫師的監督和同理心仍不可取代。 PubMed DOI