LLM 相關三個月內文章 / 第 117 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

研究發現,ChatGPT、Copilot 和 Gemini 這三款生成式AI在計算局部麻醉劑安全劑量時,常常給出錯誤或危險的建議,尤其是前兩者更容易出現過高劑量。Gemini則多半選擇不回答。總結來說,這些AI目前不適合臨床使用,醫師還是要依靠專業知識和標準指引,確保病人安全。 相關文章 PubMed DOI 推理

這項研究用精簡型語言模型(distilBERT)分析美國暴力死亡通報系統的敘述資料,預測死亡情境和類型。結果顯示,至少要1,500筆訓練資料,模型表現才夠好(F1-score達0.6以上,誤判較少)。前處理像是替換專業術語有幫助,但過度取樣效果有限。模型在不同族群和性別間表現有差異,需注意偏誤和資料處理。 相關文章 PubMed DOI 推理

這項研究用大型語言模型分析Reddit上超過3.7萬篇討論七種精神疾病的貼文,能高準確度分辨像ADHD、憂鬱症等不同疾病。ADHD的語言特徵最明顯,邊緣型人格障礙則和其他疾病較難區分。LLM分析效果比其他方法好,未來建議在臨床驗證並考慮共病影響。 相關文章 PubMed DOI 推理

研究發現,ChatGPT在診斷50個口腔病灶案例時,準確度和專業醫師差不多,表現比Microsoft Copilot好。兩種AI都有潛力協助牙醫臨床診斷,尤其是ChatGPT表現最突出。 相關文章 PubMed DOI 推理

這項研究比較了幾款中型開源語言模型在去除法文臨床紀錄個資的表現,重點是能在一般電腦上運作。結果發現,Mistral 7B 微調後表現最好,準確率高達0.97,且幾乎不會改動原文內容。這方法能有效保護病患隱私,讓臨床資料更安全地用於醫療研究和系統優化。 相關文章 PubMed DOI 推理

AI技術發展迅速,現有法規難以跟上,特別是在生技製藥這種高度管制產業,嚴格規範反而可能阻礙創新。本文回顧現行法規,強調需為AI醫療產品建立專屬法規,並提出混合式監管評估方法,藉由案例說明,盼兼顧創新與安全。 相關文章 PubMed DOI 推理

這項研究比較GPT-4和Google Translate在翻譯及簡化骨科衛教資料時的表現。結果顯示,Google Translate翻譯西班牙文較準確,GPT-4則在簡化醫學用語、提升易讀性方面較好。不過,簡化後的內容易讀性仍未達標。建議先用Google Translate翻譯,再用GPT-4簡化,能幫助西班牙語病患更容易理解骨科健康資訊。 相關文章 PubMed DOI 推理

GeneLM 是用 transformer 架構(DNABERT)打造的基因體語言模型,能像讀語言一樣學 DNA 序列,提升細菌基因預測準確度。它分兩步驟:先找編碼區,再精準定位起始點。比起傳統和其他深度學習工具,GeneLM 在基因辨識和起始點預測都更厲害,顯示語言模型有機會大幅改變基因體註解方式。 相關文章 PubMed DOI 推理

MEME 是一個把表格型電子病歷資料轉成類似文字「pseudo-notes」的深度學習模型,能善用語言模型做臨床預測。它用 self-attention 結合不同資料領域,預測急診病人結果時表現比傳統方法和 GPT-4 prompt 更好,也能輕鬆適應新型 EHR 資料集。 相關文章 PubMed DOI 推理

Woollie 是專為腫瘤學打造的開源大型語言模型,利用 Memorial Sloan Kettering 的真實數據訓練,並用 UCSF 的資料驗證。它在醫療任務和標準測試上都比 ChatGPT 更優秀,能準確預測放射科報告中的癌症進展(AUROC 高達 0.98)。Woollie 也是首個跨機構驗證的腫瘤學 LLM,展現提升癌症照護的潛力。 相關文章 PubMed DOI 推理