原始文章

這項研究發現,客製化的ChatGPT模型在從成本效益分析論文擷取資料時,整體準確度跟現有資料庫差不多,有些變項甚至更好。不過,遇到複雜資訊(像效用值)時,表現就比較差。總結來說,AI可以幫忙自動化資料擷取,但複雜內容還是需要專家審核。 PubMed DOI


站上相關主題文章列表

研究評估了大型語言模型在醫療保健領域的應用,尤其是在改善患者護理方面。使用MIMIC-III數據庫的電子健康記錄,測試了這些模型在識別特定疾病患者方面的效能。GPT-4在辨識COPD、CKD、PBC和Cancer Cachexia患者方面表現優異,而ChatGPT和LLaMA3則稍遜。儘管LLMs有潛力,但在臨床應用前仍需解決錯誤、解釋不足和倫理問題。進一步研究將有助於提升模型訓練和設計,以更好地應用於醫療保健。 PubMed DOI

這項研究評估大型語言模型(LLMs)在系統性回顧和統合分析中的摘要篩選效果。研究人員使用Python腳本,與多種LLMs互動,包括ChatGPT 3.5和4.0、Google PaLM 2等,並將其表現與人類專家的納入決策進行比較。結果顯示,ChatGPT v4.0的準確率超過90%,顯示其在摘要篩選上的潛力。雖然LLMs尚無法完全取代人類專家,但能顯著提升篩選效率,未來可能改變相關工作流程。 PubMed DOI

這項研究比較了使用生成預訓練變壓器(GPT)與傳統方法開發的臨床與專業技能評估(CPSA)項目的有效性、考官看法及成本。研究對象為最後一年醫學生,開發了兩組各六個案例,其中一個是用GPT創建的。分析239名學生的表現,結果顯示兩者在難度和區分能力上無顯著差異。考官反饋認為GPT案例具挑戰性和現實性,且使用GPT可節省57%的成本。研究顯示GPT能以較低成本產生相似質量的CPSA項目,未來可探討其在其他臨床領域的應用。 PubMed DOI

這項研究探討大型語言模型(LLMs)在優化醫療工作流程的應用,特別是面對經濟和計算挑戰。研究人員使用真實病患數據,評估了十種不同的LLM,進行超過30萬次實驗。結果顯示,隨著問題和臨床筆記數量增加,模型表現會下降。高容量模型如Llama-3-70b和GPT-4-turbo-128k能有效處理最多50個任務,但超過後表現下降。經濟分析指出,使用串接方式可在50個任務時實現高達17倍的成本降低,顯示LLM在臨床環境中的限制及提升成本效率的潛力。 PubMed DOI

這項研究評估了大型語言模型(LLMs),特別是ChatGPT,在填寫血管質量倡議(VQI)程序數據庫的有效性。研究針對三種手術進行,結果顯示LLMs的準確率相當高,CEA為84.0%、EVAR為92.2%、LEB為84.3%。排除少見指標後,準確率更提升至CEA的95.5%、EVAR的94.8%和LEB的93.2%。兩個模型(gpt-35-turbo和gpt-4)之間性能差異不大,且分析成本低。整體而言,LLMs能有效協助填寫VQI數據庫,建議進一步研究以提升準確性。 PubMed DOI

這項研究評估了大型語言模型(LLMs),特別是GPT-3.5和GPT-4,在從腫瘤科電子健康紀錄中提取患者共病情況的表現。研究分析了250份病歷報告,結果顯示GPT-4在敏感性上表現優於GPT-3.5和醫生,達到96.8%。雖然醫生在精確度上稍勝一籌,但GPT-4的表現更一致,且能推斷出非明確的共病情況。整體而言,這些模型在提取資訊方面顯示出潛力,可能成為數據挖掘的重要工具。 PubMed DOI

這項研究探討了使用先進的大型語言模型,如ChatGPT 3.5和ChatGPT 4,來提升醫療紀錄中ICD-10代碼的分類準確性,特別是針對現有方法識別為假陰性的紀錄。研究在MIMIC IV數據集的802份出院摘要上進行,結果顯示ChatGPT 4的匹配率為86%到89%,明顯優於ChatGPT 3.5的57%到67%。雖然經驗豐富的人類編碼員表現更佳,但ChatGPT 4的準確性已達到人類編碼員的中位數。這顯示將這類模型整合進臨床編碼中,能提升醫療文檔的準確性,特別在複雜案例中。 PubMed DOI

生成式AI(像ChatGPT)能大幅提升健康經濟與療效研究(HEOR)效率,協助自動化文獻回顧、資料擷取和報告撰寫。健康經濟學家應學習相關工具和技術,但要注意資料安全、偏誤和倫理問題。導入AI時,需兼顧創新、科學嚴謹與倫理,並公開方法細節,確保風險可控。 PubMed DOI

研究發現,ChatGPT能準確從非結構化臨床紀錄中擷取癌症病患的關鍵資料,如Gleason分數和年齡(F1=0.99),對安寧照護和疼痛狀態的辨識也不錯(F1=0.86)。但few-shot提示有時反而降低準確度,加入背景資訊也未必有幫助。整體來說,ChatGPT有潛力協助電子病歷資料結構化,促進醫療研究資料共享。 PubMed

大型語言模型(LLMs)能自動化調整 Excel 健康經濟模型和技術報告到新情境,準確率高、成本低。只要幾分鐘、幾美元就能完成,且調整結果幾乎完美。這方法有望加快健康科技評估流程,讓病患更快取得治療。 PubMed DOI