原始文章

這項研究發現,ChatGPT-4o在判斷脊椎X光片是否有裝穩定系統,以及細分類型時,表現比BiomedCLIP更好,準確率也較高。不過,遇到複雜案例時還是有挑戰。BiomedCLIP雖然回答一致,但分類準確度較低。整體來說,ChatGPT-4o在臨床輔助診斷上更有優勢。 PubMed DOI


站上相關主題文章列表

研究比較了基於GPT-4的ChatGPT、基於GPT-4V的ChatGPT和放射科醫師在106個案例的肌肉骨骼放射學診斷準確性。結果顯示,基於GPT-4的ChatGPT準確率為43%,優於基於GPT-4V的ChatGPT的8%。放射科醫師的準確率分別為41%和53%。ChatGPT表現接近住院醫師,但不及認證放射科醫師。放射科醫師需了解ChatGPT的診斷表現,強調提供詳細影像描述以提高準確性。 PubMed DOI

這項研究評估了GPT-4在初級和急診護理中對脊椎問題的分診和診斷效果。研究設計了十五個臨床情境,要求GPT-4提供診斷、影像學建議及轉診需求。結果顯示,GPT-4能準確識別診斷並給出符合標準的臨床建議。雖然它有過度轉診的傾向,但這並不顯著。整體表現與主治醫師和住院醫師相當,顯示其在脊椎問題初步分診中的潛力。不過,GPT-4並非專為醫療用途設計,需注意其限制。隨著進一步訓練,這類AI可能在分診中變得更重要。 PubMed DOI

這項研究調查了四個大型語言模型(LLMs)—Bard、BingAI、ChatGPT-3.5 和 ChatGPT-4—在遵循2023年北美脊椎學會(NASS)頸椎融合指導方針的表現。結果顯示,這些模型的遵循率不高,ChatGPT-4和Bing Chat表現較佳,僅達60%。在特定情況下,所有模型都未能符合NASS建議,顯示出明顯差異。研究強調了對LLMs進行更好訓練的需求,並指出在臨床決策中考慮病人特徵的重要性,顯示出人工智慧在醫療中的潛力與挑戰。 PubMed DOI

這項研究探討了多種大型語言模型(LLMs)在生成退化性頸椎MRI報告的放射學印象的效果。比較了OpenAI的ChatGPT-3.5、GPT-4、Anthropic的Claude 2、Google的Bard和Meta的Llama 2,使用50份合成MRI報告進行評估。結果顯示,Claude 2在大多數情況下表現最佳,穩定性高,而GPT-4則需重新訓練以改善表現。研究指出,LLMs,特別是Claude 2,對自動生成放射學印象有潛力,但仍需進一步研究以優化性能和實際應用效果。 PubMed DOI

這項研究評估了ChatGPT-4.0o在放射影像定位品質的有效性,分析了30張不同關節的放射線影像。模型的任務是找出定位錯誤並提出改進建議。放射技術師根據標準對模型的回應進行1到5的評分。結果顯示,模型僅在20%的案例中正確識別所有錯誤,且最常見得分為3,表示至少識別一個錯誤,30%的影像中提供了正確建議。平均得分為2.9,顯示準確性較低,強調了教育背景和臨床經驗在放射學中的重要性。 PubMed DOI

這項研究評估了大型語言模型(LLMs),如ChatGPT和Claude,在脊椎病理的外科決策及放射影像解讀的有效性,並與經驗豐富的脊椎外科醫生進行比較。結果顯示,雖然LLMs能詳細描述MRI影像,但在準確識別病變及外科決策上表現不佳,準確率僅20%,遠低於外科醫生的100%。研究建議LLMs在輔助影像解讀和決策上有潛力,但需進一步發展以克服現有限制,並強調AI研究人員與臨床專家的合作重要性。 PubMed DOI

本研究評估了兩種人工智慧工具,M4CXR 和 ChatGPT-4o,在解讀胸部 X 光片的診斷能力。研究分析了826張影像,結果顯示M4CXR在準確性和一致性上均優於ChatGPT,診斷準確性分別為60-62%和42-45%。M4CXR在解剖定位的準確性達76-77.5%,而ChatGPT僅36-36.5%。研究強調這些技術的互補潛力,建議結合人工智慧與臨床判斷,以提升病患護理結果。 PubMed DOI

本研究探討生成預訓練變壓器(ChatGPT)在放射影像中分類股骨轉子周圍骨折的準確性。研究結果顯示,ChatGPT能根據修訂的AO/OTA分類系統將骨折分為穩定(A1)和不穩定(A2),其分類一致性(κ = 0.420)與骨科醫生相似,顯示中等可靠性。這表明ChatGPT可有效整合進臨床工作流程,並在數據收集上需求較低,對醫療應用具潛力。 PubMed DOI

這項研究探討了一個基於GPT-4的大型語言模型(LLM)在評估肌肉骨骼MRI掃描請求的有效性,特別針對放射學領域。這個模型結合了來自33項美國放射學會的適當性標準,並在70個虛構案例上測試。結果顯示,優化後的LLM準確率達92.86%,明顯優於基準模型和標準GPT-4,且在處理臨床資訊不足的案例時特別有效。這顯示出其在放射學臨床決策支持中的潛力。 PubMed DOI

研究發現,ChatGPT-4.0在判讀肌肉骨骼腫瘤影像時,主要診斷正確率低於人類專家(44%比87%),但若加上次要診斷,差距縮小(71%比94%)。雖然準確度還不及專家,但因為速度快又隨時可用,未來有機會成為放射科的輔助工具。 PubMed DOI