原始文章

一項針對98個耳鼻喉科案例的研究評估了ChatGPT-4和Llama2的診斷準確性及建議的適當性。結果顯示,ChatGPT-4在82%的案例中正確診斷,優於Llama2的76%。在額外檢查建議上,ChatGPT-4的相關性為88%,Llama2則為83%。治療適當性方面,ChatGPT-4達80%,Llama2為72%。雖然兩者表現不錯,但仍有不適當建議的情況,顯示需進一步改進及人類監督以確保安全應用。 PubMed DOI


站上相關主題文章列表

研究發現ChatGPT在初步診斷和治療方案上表現不錯,但提出進一步檢查時表現較差。兩位耳鼻喉科醫師認為ChatGPT對常見測試有共識,但對一些重要測試則看法不同。總結來說,ChatGPT在喉喉學和頭頸部疾病領域有應用潛力,尤其在診斷和治療方面。 PubMed DOI

研究比較了ChatGPT對耳鼻喉科臨床案例的回應和耳鼻喉科專家的表現。透過設定情境和案例,評估了難易度,檢視了ChatGPT回答的正確性和一致性。持續測試了5天以確保穩定性。結果顯示ChatGPT在耳鼻喉診斷上有潛力,但在回答穩定性和識別臨床元素方面仍有限制。 PubMed DOI

研究評估了使用ChatGPT 3.5和4處理牙源性鼻竇炎臨床情境。專家審查回應後發現,ChatGPT4的表現較佳,尤其在眼眶膿腫情境。結果顯示AI工具有助於臨床決策,但仍需進一步研究。 PubMed DOI

研究發現ChatGPT在耳鼻喉科診斷、治療建議和康復指導方面表現不錯,但在手術步驟描述上有不足,缺乏關鍵細節和風險提供。ChatGPT可提供基本資訊,但無法取代耳鼻喉科醫師的臨床專業知識。為了更好地幫助醫師,需持續改進醫療人工智慧技術。 PubMed DOI

ChatGPT-4在鼻科臨床案例中提供正確初步診斷的比例為62.5%,並建議7.5%-30.0%的案例需進行額外檢查和治療。其回應穩定性中等至高,且不受案例難度影響。建議在臨床實務中仍需醫師判斷為主。 PubMed DOI

自2023年初以來,ChatGPT在醫療研究中備受矚目,尤其在協助醫師做臨床判斷方面表現出色。一項研究評估了ChatGPT在辨識、診斷和處理耳鼻喉科症狀患者的表現,結果顯示ChatGPT在20個臨床案例中與五位耳鼻喉科醫師相比,表現有顯著差異。儘管ChatGPT回答問題時有些許變化,但被視為具潛力的聊天機器人,可協助醫護人員做出明智決策,並有進一步發展和改進的潛力。 PubMed DOI

研究發現GPT-4在醫學案例初步診斷、檢查和治療方面表現最佳,尤其在常見疾病方面。商業LLMs有潛力用於醫學問答,但仍需加強。開源LLMs則可應對數據隱私和培訓透明度需求。強調強大且受監管的AI模型在醫療保健領域的重要性。 PubMed DOI

研究發現ChatGPT-4在耳鼻喉科病例管理中表現良好,對患者提供了許多有用建議,雖然有時會建議額外檢查。在診斷準確率方面有改進空間,但在初步診斷上有潛力成為耳鼻喉科醫師的輔助工具。 PubMed DOI

這項研究評估了ChatGPT-4在分析耳鼻喉科影像時的一致性,涉及40名患者。結果顯示,ChatGPT-4在影像解讀的平均一致性分數為2.46,僅在15%的案例中準確分析影像,且與醫生的高一致性僅12.5%。它建議的額外檢查次數顯著高於臨床醫師,且主要診斷準確率僅20%到25%。整體而言,雖然ChatGPT-4在主要診斷上有一定效率,但在影像分析及檢查建議的可靠性較低。 PubMed DOI

這項研究評估了ChatGPT-4o在分析懷疑喉部惡性腫瘤的臨床纖維內視鏡視頻的表現,並與專家醫師進行比較。研究在一所醫療中心對20名患者進行,結果顯示該人工智慧在30%的案例中正確診斷惡性腫瘤,並在90%的案例中將其列為前三名診斷。雖然敏感性高,但特異性有限,影像分析一致性得分為2.36(滿分5分)。總體而言,ChatGPT-4o顯示潛力,但在特異性和影像解讀上仍需改進,以提升耳鼻喉科的診斷準確性。 PubMed DOI