LLM 相關三個月內文章 / 第 60 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

大型語言模型(LLMs)在醫療領域展現出改善診斷和病人照護的潛力,但對抗性攻擊使其脆弱,可能導致嚴重後果。本研究分析了LLMs在三個醫療任務中對兩種對抗性攻擊的易受攻擊性,發現無論是開源還是專有模型,都容易被操控。特定領域任務需更多對抗性數據來微調模型,雖然添加這些數據對整體性能影響不大,但改變了模型權重,顯示出檢測和減輕攻擊的潛力。這強調了在醫療應用中加強LLMs安全措施的必要性。 相關文章 PubMed DOI

從舊有的出版物和專利中提取化學數據面臨不少挑戰,但自動化反應挖掘提供了有效的解決方案,能將這些知識轉換為數位格式,促進材料和反應的發現。這項研究探討了使用多模態大型語言模型(MLLMs)來分析不同數據輸入,並創建了一個包含65篇文章的測試數據集。結果顯示,表現最佳的MLLM在解析反應圖和解決數據模態相互依賴性方面達到96%以上的準確率。我們開發的MERMES工具包整合了這些功能,簡化了知識提取過程,為化學知識的數位化奠定基礎。 相關文章 PubMed DOI

隨著 AI 語言模型如 ChatGPT 的興起,護理教育中的學術誠信受到關注,特別是學生可能會提交 AI 生成的內容。研究中,四名護理學生提交了自己撰寫和 ChatGPT 生成的「致編輯的信」作業。結果顯示,雖然 AI 生成的內容語法正確,但常有過時或虛構的參考文獻,且缺乏深度。護理教育者需了解 AI 的能力與限制,以支持學生學習並維持學術誠信,並發展有效的評估策略,促進原創思考與批判性分析。 相關文章 PubMed DOI

這篇評論探討了線上醫療資源和人工智慧工具在放射腫瘤學中的影響。經過系統性搜尋,從2161篇手稿中納入70篇研究。結果顯示,網路臨床決策工具能有效應用於劑量計算和分期等領域,並且有35篇論文強調其教育效益。此外,35篇文章探討數位和AI工具在治療計畫及診斷中的應用,特別針對乳腺癌和頭頸癌進行研究。整體來看,這些工具在個性化癌症治療上展現出顯著潛力。 相關文章 PubMed DOI

這項研究探討大型語言模型(LLMs),特別是Llama 2和GPT-4,在電子健康紀錄中檢測認知衰退的有效性。研究在麻省總醫院進行,分析輕度認知障礙患者的臨床筆記,並將LLMs與傳統模型比較。結果顯示,GPT-4的表現優於Llama 2,但仍不及傳統模型。集成模型的表現最佳,達到90.2%的精確度。錯誤分析顯示模型間的錯誤特徵不同,建議結合LLMs與傳統模型以提升診斷效果。該研究獲得美國國家老齡化研究所及國家醫學圖書館的資助。 相關文章 PubMed DOI

所提的草藥處方推薦模型PresRecRF,透過整合中醫語意與分子知識,解決臨床智能決策的挑戰。它包含三個主要模組:表徵學習模組(整合分子與中醫知識)、表徵融合模組(全面理解數據)、草藥推薦模組(預測草藥及劑量)。實驗結果顯示,PresRecRF在兩個臨床數據集上表現優於現有模型,證實其有效性與可靠性,適合精準醫療與治療推薦。源代碼已在GitHub公開。 相關文章 PubMed DOI

這項研究探討了不同的不確定性代理如何評估大型語言模型(LLMs),如GPT-3.5、GPT-4、Llama2和Llama3,在醫療診斷和治療選擇中的信心。主要發現顯示,樣本一致性(SC)在辨識正確與錯誤回應上表現最佳,ROC AUC分數介於0.68到0.79之間。雖然SC的校準效果不佳,但使用GPT註釋的SC在辨識能力和校準上表現良好。研究認為SC是評估LLM不確定性最有效的方法,並指出這些模型在表達信心時常過於自信。 相關文章 PubMed DOI

自然語言處理(NLP)是人工智慧的一個重要領域,專注於理解和生成自然語言,尤其在醫療領域的應用越來越普遍。這篇回顧分析了2018至2023年間的27篇相關論文,探討NLP如何改善病患溝通、篩選電子健康紀錄,並自動化臨床試驗的候選者識別。研究顯示,NLP技術能有效處理大型非結構化數據,提升公眾情感分析和風險預測模型的準確性,並幫助醫療提供者縮短與病患的溝通距離,進而提升醫療服務品質。 相關文章 PubMed DOI

感染性心內膜炎(IE)對高風險患者在牙科手術前需進行抗生素預防。研究測試了七個大型語言模型(LLMs)在提供IE抗生素預防資訊的準確性,使用基於2021年美國心臟協會指導方針的28個是非題。結果顯示,模型間準確性差異顯著,使用預先提示時表現普遍較佳,GPT-4o達到80%的最高準確率。雖然沒有模型達到理想的準確性標準,但仍顯示出潛力,顯示需進一步訓練以提升醫療查詢的有效性。 相關文章 PubMed DOI

這項研究探討了大型語言模型(LLMs),特別是ChatGPT-4o和Claude 3-Opus,在超音波影像中分類甲狀腺結節的表現。研究涵蓋112位患者的116個結節,結果顯示ChatGPT-4o的Kappa值為0.116,Claude 3-Opus更低,僅0.034,而初級放射科醫師的Kappa值為0.450,顯示中等協議。ROC曲線方面,ChatGPT-4o的AUC為57.0%,Claude 3-Opus為52.0%,醫師則為72.4%。兩個LLM的不必要活檢率也高,分別為41.4%和43.1%,醫師僅12.1%。這顯示LLMs在醫學影像的診斷準確性仍有限,需謹慎使用。 相關文章 PubMed DOI