原始文章

這項概念驗證研究顯示,大型語言模型(LLMs)能自動將非結構化的病例報告轉換為臨床評分。我們使用標準化的臨床評分量表,並評估LLM對其輸出的信心,以改善提示策略並確保結果的可重複性。針對藥物引起的帕金森症病例報告,研究結果顯示LLM提取的數據與臨床評分者手動提取的結果相當接近,準確率高達90%。 PubMed DOI


站上相關主題文章列表

這項研究評估了大型語言模型(LLMs)在藥物審查中的表現,特別是劑量錯誤、藥物相互作用及基因組學建議的能力。研究測試了四個LLM,發現ChatGPT在劑量方案上表現良好,但對simvastatin的問題有例外。所有LLM都能識別warfarin的相互作用,但錯過metoprolol和verapamil的相互作用。Claude-Instant在治療監測上提供適當建議,而Gemini在基因組學上表現不錯。研究指出,LLM在藥物審查中有潛力,但整合進醫療系統對病人安全至關重要。 PubMed DOI

這項研究探討了結合知識增強電子檔案審查系統(KEEPER)與大型語言模型(LLMs),自動化觀察性研究中基於行政索賠和電子健康紀錄的案例裁定過程的可行性。傳統上,研究人員面臨數據限制及手動審查的挑戰。KEEPER 提取臨床發現,LLMs 評估患者是否符合案例標準。研究測試了四種 LLM,包括 GPT-4,結果顯示敏感性從 78% 到 98% 不等,特異性範圍為 48% 到 98%。這顯示 LLMs 在自動化表型評估上有潛力,未來可能減少手動審查的需求。 PubMed DOI

這項研究探討如何利用大型語言模型(LLMs)自動化提取生活系統性回顧(LSRs)中的數據,模擬兩位審稿人的流程。分析了來自10個試驗的數據,針對23個變數進行研究。使用的模型包括GPT-4-turbo和Claude-3-Opus。結果顯示,在提示開發集中,模型達到96%的高一致性率,但在測試集中降至87%。經過交叉評析後,51%的不一致回應變得一致,整體準確率提升至0.76。研究表明,LLMs能有效支持數據提取,促進系統性回顧的進行。 PubMed DOI

這項研究評估大型語言模型(LLMs)在107項補充醫學試驗中的數據提取及偏見風險評估的效果。僅用LLM的方法,如Moonshot-v1-128k和Claude-3.5-sonnet,準確率達95%以上;而LLM輔助的方法更佳,準確率可達97%以上。此外,LLM輔助的方法處理時間大幅縮短,分別只需14.7分鐘和5.9分鐘,傳統方法則需86.9分鐘和10.4分鐘。這些結果顯示,LLM結合人類專業知識能有效提升證據綜合的效率與準確性。 PubMed DOI

這項研究探討大型語言模型(LLMs),特別是OpenAI的GPT-4,如何提升自然語言查詢(NLQs)轉換為藥物監測(PV)數據庫中的SQL查詢的準確性。研究分三個階段,變化查詢複雜度,並評估有無商業上下文文件的效果。結果顯示,NLQ轉換為SQL的準確性從8.3%提升至78.3%,在所有複雜度層級中均一致。排除高複雜度查詢時,準確率可達85%。這項研究對非技術用戶在數據密集型領域的信息可及性具有重要意義。 PubMed DOI

帕金森氏症是一種影響全球超過一千萬人的神經退行性疾病,每年新增病例達一百萬。由於症狀多樣,診斷相當複雜,語言障礙可能在運動症狀前就出現,這使得語言分析成為早期檢測的有力工具。最近,大型語言模型(LLMs)的進展讓我們能夠自動識別帕金森氏症,準確率高達78%。研究顯示,這些模型能提取更相關的語言特徵,可能顯著改善診斷方法並幫助理解疾病進展。 PubMed DOI

這項研究探討了人工智慧,特別是大型語言模型(LLMs),在模擬隨機臨床試驗中對癲癇藥物cenobamate的應用。試驗包含240名患者,分為安慰劑組和全劑量藥物組。AI能準確分析臨床筆記,評估藥物的療效與安全性,結果顯示AI分析與人類分析相近,僅在療效識別上有小差異。這顯示AI在未來臨床研究中具備高效且可擴展的潛力,能減少對傳統數據挖掘方法的需求。 PubMed DOI

這項研究用機器學習和大型語言模型分析33位帕金森氏症患者在服藥前後的語音內容,最好的模型準確率高達98%,還能預測神經精神評分。結果顯示,透過語音分析,有機會遠端且全面監測帕金森氏症患者的神經精神狀況。 PubMed DOI

臨床試驗中,方案偏差(PDs)定義不一,難以有效辨識關鍵影響。傳統用NLP分類PDs又慢又複雜。這項研究用Meta Llama2大型語言模型,開發自動化系統,能快速分類Roche系統裡的PDs,自動標記出超過八成可能影響結果的PDs,讓專家能聚焦審查,大幅提升效率,幾分鐘就能得到有用見解。 PubMed DOI

研究團隊開發了一套經微調的大型語言模型,能自動從電子病歷的臨床紀錄中擷取阿茲海默症及相關失智症的7大症狀,準確度(AUROC)高達0.97-0.99,優於傳統方法。這些症狀不僅能預測失智症診斷,還和腦部MRI結果有關,有助提升診斷準確率並推動相關研究。 PubMed DOI