原始文章

這項研究探討如何在大型語言模型中處理類別不平衡,以預測患者接受全膝關節置換術(TKA)的情況。研究人員使用ARCHERY專案的數據,訓練GatorTron模型,並比較了標準模型、類別加權和多數類別下採樣三種方法。在7,707份報告中,只有11.8%的患者接受TKA,顯示類別不平衡的問題。結果顯示,類別加權在少數類別的識別和校準上表現最佳,對於開發高效的AI模型在創傷與骨科領域非常重要。 PubMed DOI


站上相關主題文章列表

這項研究探討大型語言模型(LLMs),特別是GPT-4和GPT-3.5,如何分析急診部報告以識別與腎結石相關的就診。研究使用標註過的數據集,透過提示優化和微調來提升模型表現。結果顯示,GPT-4的宏觀F1分數為0.833,表現最佳,而GPT-3.5為0.796。微調改善了GPT-3.5的表現,並且加入人口統計和醫療歷史信息有助於決策。GPT-4未顯示種族或性別偏見,但GPT-3.5在種族多樣性建模上有困難。研究強調了LLMs在臨床應用的潛力及偏見問題的重要性。 PubMed DOI

這項研究探討了大型語言模型(LLMs)在急性缺血性中風(AIS)病例中的應用,特別是機械性血栓切除術(MT)的適應性。研究分析了100名AIS患者的數據,LLM根據放射學報告、神經症狀、發病資訊和患者年齡進行判斷。結果顯示,該AI模型的整體準確率達88%,特異性96%,敏感性80%,曲線下面積為0.92,顯示出LLMs在整合醫療數據方面的潛力,並鼓勵進一步探索其在臨床的應用。 PubMed DOI

這項研究評估了兩個人工智慧語言模型,ChatGPT 和 iFlytek Spark,在生成踝部骨折手術後加速康復(ERAS)建議的表現。結果顯示,ChatGPT 在正確回答專家共識問題上表現較佳,達82.9%,但在某些領域仍有不一致。iFlytek Spark 則為62.9%,回應較為一般化。兩者在65.7%的問題上達成一致,ChatGPT 提供的建議更具體。研究強調了精煉人工智慧模型的重要性,以確保其與醫療指導一致,並需醫師監督以確保安全性。未來應提升人工智慧在骨科護理中的可靠性。 PubMed DOI

這項研究探討了大型語言模型(LLM),特別是ChatGPT 3.5,分析電子健康紀錄(EHR)筆記的潛力,判斷全膝關節置換術(TKA)患者在一年後是否達到膝關節骨關節炎結果評分的最小臨床重要差異(MCID)。研究發現,ChatGPT 3.5的敏感性高達97%,但特異性僅33%,整體準確率為65%。相比之下,外科醫生的敏感性為90%,特異性63%,準確率76%。結論指出,LLM在識別改善患者方面表現良好,但仍需改進以提升其臨床應用的準確性。 PubMed DOI

人工智慧(AI)和語言學習模型(LLMs)如ChatGPT和Gemini,正被臨床醫生和病人用於臨床決策。雖然這些工具能迅速提供資訊,但對循證指南的遵循性不佳,引發擔憂。針對骨科領域開發專門的LLMs,利用經過驗證的文獻資料庫,或許能改善輸入數據的質量。不過,這些模型仍可能面臨選擇偏誤及文獻品質不足的問題。此外,使用者的健康素養也可能有限。雖然LLMs是重要進步,仍需持續評估和改進,AI應視為補充臨床判斷的資源,而非取代。 PubMed DOI

本研究探討大型語言模型(LLMs)在肌肉骨骼醫學的應用,並評估相關研究的質量。透過系統文獻回顧,分析了2022至2024年間的114項研究,主要集中在病人問題回答、診斷管理、骨科檢查等五大領域。大部分研究使用ChatGPT 3.5,方法學上存在透明度不足的問題。研究指出,雖然LLMs在醫療上有潛力,但目前的研究仍需改進,並強調建立指導方針以促進有效應用。 PubMed DOI

本研究探討了深度學習模型在預測晚期上皮性卵巢癌患者手術結果的有效性,特別是使用非結構化的手術筆記。評估了RoBERTa和GatorTron兩個模型,結果顯示GatorTron在大多數任務中表現優於RoBERTa,顯示專為醫療設計的模型在理解醫療語言上有明顯優勢。不過,兩者在預測術後併發症和住院時間時仍面臨挑戰,顯示手術文本不足以全面反映術後恢復的複雜性。這些發現對提升患者護理質量的醫療AI系統發展至關重要。 PubMed DOI

這項研究發現,GPT-4o自動產生的膝關節MRI報告,不僅比GPT-4o-mini更準確,還能幾乎完美預測骨關節炎嚴重程度。骨科醫師也認為這些AI報告更好用、審閱更快。整體來說,GPT-4o有機會幫助醫師減少文書工作,提升臨床效率。 PubMed DOI

這項研究開發了一套新模型,把臨床資料轉成文字,再結合數值資訊,利用大型語言模型來預測心肺繞道手術前發生急性腎損傷的風險,準確率高達AUC 0.92。研究也找出哪些術前和術中措施有助預防AKI,能幫助醫師更早預測並預防相關風險。 PubMed DOI

這項研究發現,ChatGPT-4o 和 Gemini Advanced 在設計膝蓋骨關節炎復健計畫時,和物理治療師的整體一致性不錯,但在運動細節上還有待加強。ChatGPT-4o 表現較佳,尤其在進階階段。不過,這些 AI 目前還缺乏臨床判斷和細節指導,臨床應用前仍需專家把關與優化。 PubMed DOI