原始文章

這項研究探討大型語言模型(LLMs),特別是ChatGPT和Gemini,在根據手術記錄生成當前程序術語(CPT)代碼的有效性。分析了10個案例,將AI生成的代碼與專家手動編碼進行比較。結果顯示兩者表現相似,準確性無顯著差異。Gemini的正確回應率稍高(30%對20%),而ChatGPT則有更多部分正確的回應(50%對40%)。研究指出,AI有潛力提升編碼準確性並減少醫療帳單的行政負擔,未來將探討其在其他外科領域的應用。 PubMed DOI


站上相關主題文章列表

研究比較了OpenAI的ChatGPT和Google的Gemini在手部受傷分類和手術治療建議方面的表現。Gemini在手部受傷分類能力表現優異,正確率達70.6%,而ChatGPT則為0.87。ChatGPT在手術建議方面較敏感,但特異性較Gemini低。Gemini也展現更高的回應可複製性。研究顯示大型語言模型在醫學決策上有潛力,Gemini通常優於ChatGPT。 PubMed DOI

研究比較了三個大型語言模型(LLMs)- ChatGPT-3.5、GPT-4和Gemini-在為整形外科患者提供術後護理建議的表現。結果顯示,這些模型提供的資訊都很準確,其中GPT-3.5在評分上表現最好。Gemini的回應更易讀、更易懂。雖然LLMs在術後護理方面有潛力,但仍需進一步研究和改進,才能成為更完善的資源。 PubMed DOI

研究比較了ChatGPT-4和Gemini Pro兩個語言模型在整形外科手術決策支援的表現。ChatGPT-4準確性和相關性較佳,Gemini則回應更快且易讀。兩者皆有應用潛力,但需進一步訓練和優化以確保可靠性。 PubMed DOI

這項研究探討了人工智慧(AI)在神經外科手術文檔的應用,分析了36份手術記錄,並利用ChatGPT 4.0撰寫記錄。研究團隊評估了144份記錄,結果顯示AI生成的記錄在準確性(4.44)和組織性(4.54)上表現良好,但內容得分較低(3.73)。可讀性方面,AI記錄的複雜度較高,顯示其在提升神經外科文檔效率上有潛力,但仍需改善內容質量。 PubMed DOI

這項研究分析了五種大型語言模型(LLMs)在識別顱面外科手術的CPT代碼的有效性,包括Perplexity.AI、Bard、BingAI、ChatGPT 3.5和ChatGPT 4.0。由於CPT編碼複雜且耗時,尤其在專業編碼人員短缺的情況下,研究旨在評估這些AI模型的效率和準確性。結果顯示,雖然整體準確性差異不大,但ChatGPT 4.0在複雜代碼上表現較佳,而Perplexity.AI和Bard在簡單代碼上更可靠。研究建議這些AI可減輕手動編碼負擔,並提升CPT編碼的資源效率,支持將其整合進臨床流程。 PubMed DOI

這項研究評估了三個大型語言模型(LLMs)—ChatGPT 4.0、AtlasGPT 和 Gemini—在識別血管內神經外科手術報告中的程序術語(CPT)代碼的效果。分析了30份手術記錄後,AtlasGPT 表現最佳,正確識別35.3%的 CPT 代碼,ChatGPT 緊隨其後,正確率為35.1%,而 Gemini 僅有8.9%。統計分析顯示這些模型之間的表現差異顯著。研究指出,雖然這些模型能部分識別 CPT 代碼,但進一步訓練可提升準確性,並可能降低醫療成本。 PubMed DOI

隨著像ChatGPT和Google Gemini等AI平台的快速發展,這些工具在醫療資訊,特別是術後指導方面的使用逐漸增加。一項研究比較了這些AI系統在為接受內窺鏡鼻竇手術的病人提供術後指導的有效性。雖然AI生成的內容能被理解,但在可行性和可讀性上仍有不足,顯示病人在尋求術後指導時需謹慎考量這些限制,並強調對AI醫療資訊進行仔細評估的重要性,以確保病人的安全與最佳結果。 PubMed DOI

這項研究評估了三個人工智慧模型—ChatGPT-4o、DeepSeek-V3 和 Gemini 1.5—在手部骨折診斷與治療建議的有效性,並與經驗豐富的外科醫生進行比較。結果顯示,ChatGPT-4o的準確率最高,但精確度較低;DeepSeek-V3表現中等,偶爾漏掉正確方案;而Gemini 1.5則表現不佳。結論指出,雖然AI能增強臨床流程,但在複雜案例中仍無法取代人類專業,且需解決倫理問題才能廣泛應用。 PubMed DOI

這項研究分析了五種大型語言模型(LLMs)在識別手部手術的CPT代碼上的表現,包括Perplexity.AI、Bard、BingAI、ChatGPT 3.5和4.0。研究發現,Perplexity.AI在簡單程序中表現最佳,獲得15個正確結果,而對於複雜程序,則只有Perplexity.AI和Bard各有三個正確結果。這顯示AI模型在手術編碼中有潛力提升效率與準確性,未來可能成為醫療工作流程的標準部分,符合數位轉型的趨勢。 PubMed DOI

這項研究探討大型語言模型(LLMs),特別是ChatGPT和Google Gemini,在顱面手術記錄中識別CPT修飾符的效果。準確的醫療編碼對醫療管理和報銷非常重要,尤其在顱面外科這種複雜領域。研究分析了10份手術報告,結果顯示兩個模型都未能成功識別CPT代碼及修飾符,但ChatGPT稍微優於Google Gemini,部分回應中包含正確的代碼。這項研究顯示LLMs在顱面外科的潛力,未來應提升其能力並評估在其他外科的應用。 PubMed DOI