Supervised Natural Language Processing Classification of Violent Death Narratives: Development and Assessment of a Compact Large Language Model.
暴力死亡敘述的監督式自然語言處理分類：精簡型大型語言模型的開發與評估 JMIR AI 2025-07-03

這項研究用精簡型語言模型（distilBERT）分析美國暴力死亡通報系統的敘述資料，預測死亡情境和類型。結果顯示，至少要1,500筆訓練資料，模型表現才夠好（F1-score達0.6以上，誤判較少）。前處理像是替換專業術語有幫助，但過度取樣效果有限。模型在不同族群和性別間表現有差異，需注意偏誤和資料處理。相關文章 PubMed DOI 推理

Algorithmic Classification of Psychiatric Disorder-Related Spontaneous Communication Using Large Language Model Embeddings: Algorithm Development and Validation.
利用大型語言模型嵌入進行精神疾病相關自發性溝通的演算法分類：演算法開發與驗證 JMIR AI 2025-07-03

這項研究用大型語言模型分析Reddit上超過3.7萬篇討論七種精神疾病的貼文，能高準確度分辨像ADHD、憂鬱症等不同疾病。ADHD的語言特徵最明顯，邊緣型人格障礙則和其他疾病較難區分。LLM分析效果比其他方法好，未來建議在臨床驗證並考慮共病影響。相關文章 PubMed DOI 推理

The Diagnostic Performance of Large Language Models and Oral Medicine Consultants for Identifying Oral Lesions in Text-Based Clinical Scenarios: Prospective Comparative Study.
大型語言模型與口腔醫學專科醫師在文字型臨床情境中辨識口腔病變的診斷表現：前瞻性比較研究 JMIR AI 2025-07-03

研究發現，ChatGPT在診斷50個口腔病灶案例時，準確度和專業醫師差不多，表現比Microsoft Copilot好。兩種AI都有潛力協助牙醫臨床診斷，尤其是ChatGPT表現最突出。相關文章 PubMed DOI 推理

Harnessing Moderate-Sized Language Models for Reliable Patient Data Deidentification in Emergency Department Records: Algorithm Development, Validation, and Implementation Study.
運用中等規模語言模型於急診部門紀錄中進行可靠的病患資料去識別化：演算法開發、驗證與實作研究 JMIR AI 2025-07-03

這項研究比較了幾款中型開源語言模型在去除法文臨床紀錄個資的表現，重點是能在一般電腦上運作。結果發現，Mistral 7B 微調後表現最好，準確率高達0.97，且幾乎不會改動原文內容。這方法能有效保護病患隱私，讓臨床資料更安全地用於醫療研究和系統優化。相關文章 PubMed DOI 推理

Striking a Balance: Innovation, Equity, and Consistency in AI Health Technologies.
取得平衡：AI健康科技中的創新、公平與一致性 JMIR AI 2025-07-03

AI技術發展迅速，現有法規難以跟上，特別是在生技製藥這種高度管制產業，嚴格規範反而可能阻礙創新。本文回顧現行法規，強調需為AI醫療產品建立專屬法規，並提出混合式監管評估方法，藉由案例說明，盼兼顧創新與安全。相關文章 PubMed DOI 推理

Using AI to Translate and Simplify Spanish Orthopedic Medical Text: Instrument Validation Study.
運用 AI 翻譯與簡化西班牙文骨科醫學文本：工具驗證研究 JMIR AI 2025-07-03

這項研究比較GPT-4和Google Translate在翻譯及簡化骨科衛教資料時的表現。結果顯示，Google Translate翻譯西班牙文較準確，GPT-4則在簡化醫學用語、提升易讀性方面較好。不過，簡化後的內容易讀性仍未達標。建議先用Google Translate翻譯，再用GPT-4簡化，能幫助西班牙語病患更容易理解骨科健康資訊。相關文章 PubMed DOI 推理

Genomic language models (gLMs) decode bacterial genomes for improved gene prediction and translation initiation site identification.
基因體語言模型（gLMs）解碼細菌基因體以提升基因預測與轉譯起始位點鑑定 Brief Bioinform 2025-07-03

GeneLM 是用 transformer 架構（DNABERT）打造的基因體語言模型，能像讀語言一樣學 DNA 序列，提升細菌基因預測準確度。它分兩步驟：先找編碼區，再精準定位起始點。比起傳統和其他深度學習工具，GeneLM 在基因辨識和起始點預測都更厲害，顯示語言模型有機會大幅改變基因體註解方式。相關文章 PubMed DOI 推理

Clinical decision support using pseudo-notes from multiple streams of EHR data.
利用來自多重 EHR 資料流的偽筆記進行臨床決策支援 NPJ Digit Med 2025-07-03

MEME 是一個把表格型電子病歷資料轉成類似文字「pseudo-notes」的深度學習模型，能善用語言模型做臨床預測。它用 self-attention 結合不同資料領域，預測急診病人結果時表現比傳統方法和 GPT-4 prompt 更好，也能輕鬆適應新型 EHR 資料集。相關文章 PubMed DOI 推理

Large language model trained on clinical oncology data predicts cancer progression.
基於臨床腫瘤學資料訓練的大型語言模型可預測癌症進展 NPJ Digit Med 2025-07-03

Woollie 是專為腫瘤學打造的開源大型語言模型，利用 Memorial Sloan Kettering 的真實數據訓練，並用 UCSF 的資料驗證。它在醫療任務和標準測試上都比 ChatGPT 更優秀，能準確預測放射科報告中的癌症進展（AUROC 高達 0.98）。Woollie 也是首個跨機構驗證的腫瘤學 LLM，展現提升癌症照護的潛力。相關文章 PubMed DOI 推理

Retrieval-augmented generation elevates local LLM quality in radiology contrast media consultation.
檢索增強生成（Retrieval-augmented generation）提升放射學顯影劑諮詢中在地大型語言模型（LLM）的品質 NPJ Digit Med 2025-07-03

這項研究發現，透過 RAG 技術，本地部署的 LLM 在放射科顯影劑諮詢上表現更好，不僅消除幻覺現象，答案品質也提升。雖然雲端模型整體還是較優，但本地模型回應更快，且在 LLM 評審中表現勝過 GPT-4o mini。不過，放射科醫師還是偏好 GPT-4o mini。RAG 有助提升本地臨床 LLM 表現，並兼顧病患隱私。相關文章 PubMed DOI 推理

LLM 相關三個月內文章 / 第 27 頁

可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

LLM 相關三個月內文章 / 第 27 頁

可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

可選擇其它分類: 一週新進文章腎臟科一般醫學 SGLT2i GLP1