原始文章

最近在人工智慧(AI)和大型語言模型(LLMs)方面的進展,特別是在皮膚科,顯示出良好的潛力。本研究比較了Claude 3 Opus和ChatGPT(GPT-4)在分析皮膚鏡影像以檢測黑色素瘤的表現。結果顯示,Claude 3 Opus在惡性區分上表現較佳,敏感度和特異度均高於ChatGPT。雖然兩者在診斷上有其潛力,但仍存在錯誤,強調了AI與臨床醫生合作的重要性,以開發更可靠的診斷工具。 PubMed DOI


站上相關主題文章列表

ChatGPT是OpenAI研發的語言模型,用來處理語言相關任務。我們在皮膚科的多重選擇題測試中發現,ChatGPT-4的表現優異,得分高達90.5%,超越了一般70-72%的通過標準。這顯示人工智慧在臨床問題回答上有潛力,但在處理複雜病例時仍需謹慎以確保患者安全。 PubMed DOI

研究比較了ChatGPT-3.5和ChatGPT-4在皮膚科知識和臨床決策上的表現,結果顯示ChatGPT-4表現更好,準確率超過80%,尤其在回答臨床圖片問題時表現優異。研究建議雖然人工智慧有助於皮膚科知識,但不應取代醫生決策,應支持AI發展以提升醫療水準。 PubMed DOI

Chat GPT 在皮膚科醫療案例中測試,對專業醫師資訊能正確辨識疾病的比例為56%,對非專業人士資訊為38%。雖然能提供鑑別診斷,但在初級或次級護理環境中並未明顯提高診斷準確性。結果顯示Chat GPT的診斷率與非專業人士相近,但低於專業醫師。 PubMed DOI

大型語言模型如BARD、BingAI和ChatGPT-4正被運用在醫療領域,提供醫學資訊和指導。研究顯示,ChatGPT在黑色素瘤臨床指南方面表現較佳,但所有模型仍有限制。未來研究應該著重整合專業數據和專家知識,以提升模型性能,更好地支援患者護理。 PubMed DOI

研究比較了OpenAI的ChatGPT在小兒皮膚科的表現,結果顯示醫師通常比ChatGPT更準確,但ChatGPT-4.0在某些情況下表現不錯。研究建議這類人工智慧工具可輔助醫師,但強調改進和醫師監督的重要性。 PubMed DOI

大型語言模型(LLMs)如GPT-4o、Claude 3 Opus和Gemini 1.5 Pro在解讀病患病史和影像檢查結果上有潛力。研究比較它們在Radiology Diagnosis Please Cases數據的表現,發現Claude 3 Opus在解決放射學測驗案例時表現最佳。這些LLMs可能有助於放射科醫師更準確地評估和描述影像檢查結果。 PubMed DOI

人工智慧(AI)在醫學,特別是皮膚科的應用,正逐漸改變醫療保健。根據一項對20項研究的回顧,ChatGPT在提升臨床實踐和病人支持方面展現了潛力。AI與皮膚科的結合,讓醫療服務有了重大進展,因為ChatGPT的對話能力和知識分享功能,讓病人和醫療提供者都能受益。隨著AI技術的持續進步,ChatGPT被視為推動醫療創新的重要角色。 PubMed DOI

這項研究評估了新推出的AI模型Claude 3 Opus在診斷和規劃頭頸部鱗狀細胞癌(HNSCC)治療的效果,並與ChatGPT 4.0進行比較。研究於2024年3月進行,涵蓋50例HNSCC病例,並將AI模型的建議與傳統的多學科腫瘤委員會(MDT)建議進行對比。結果顯示,Claude 3 Opus在診斷準確性上優於ChatGPT 4.0,且提供的治療建議與MDT一致。雖然在臨床建議和解釋方面表現相當,但Claude 3未引用資訊來源。總體而言,Claude 3 Opus顯示出作為診斷工具的潛力,建議在臨床環境中使用。 PubMed DOI

這項研究評估大型語言模型(LLMs)在解釋乳腺影像報告及提供臨床建議的表現,分為兩個步驟: 1. **文本評估**:比較十個LLMs與放射科醫師在100道BI-RADS選擇題上的準確率。Claude 3.5 Sonnet表現最佳(90%),超過一般放射科醫師(78%)和乳腺放射科醫師(82%)。 2. **視覺評估**:測試五個多模態LLMs在100張乳腺超音波影像上的表現,Claude 3.5 Sonnet以59%準確率領先。 研究顯示,雖然LLMs在文本評估中表現良好,但視覺診斷能力有限,需在放射科醫師監督下使用,以避免誤診。 PubMed DOI

這項研究評估了兩個大型語言模型(LLMs),GPT-4o 和 Claude 3 Opus,在根據病歷和屍體CT掃描識別死亡原因的能力。研究涵蓋100個經解剖確認的成人案例。結果顯示,GPT-4o在根本死亡原因的準確率為78%、72%和78%,而Claude 3 Opus則為72%、56%和75%。在即時死亡原因方面,GPT-4o的準確率較低,分別為55%、58%和62%,而Claude 3 Opus稍高,為60%、62%和63%。整體而言,兩者在診斷死亡原因上表現不俗。 PubMed DOI