LLM 相關三個月內文章 / 第 148 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這篇論文提出VLMTraj模型,把行人軌跡預測轉換成視覺問答任務,結合視覺-語言大型語言模型來處理。它用自然語言和視覺token描述場景與軌跡,並設計專屬token化方法處理數值資料。VLMTraj在公開測試中表現優於傳統模型,能更好理解社交互動和場景脈絡,提升多模態軌跡預測的準確度。 相關文章 PubMed DOI 推理

這篇論文提出LMT++架構,結合多模態大型語言模型(LLM)當教師,並用自適應加權策略,解決手術視覺問答在持續學習時的領域轉移和資料不平衡問題。作者也建立了新的手術VQA資料集,實驗證明他們的方法比現有做法更有效。 相關文章 PubMed DOI 推理

這項研究比較三款大型語言模型在肺炎治療建議的準確性。結果顯示,OpenAI O1 表現最好,O3 mini 次之,ChatGPT-4o 最差。具備 chain-of-thought 推理的模型(O1、O3 mini)在專家回饋後進步明顯,顯示這種推理機制有助於提升臨床決策的可靠性。 相關文章 PubMed DOI 推理

ChatGPT-3.5 回答糖尿病足潰瘍問題時,內容大致正確且易懂,但偶爾會有錯誤或資訊不全,且用詞有時較艱深。它適合提供一般資訊,但不能取代醫師專業建議,醫師也要了解其優缺點。 相關文章 PubMed DOI 推理

大型模型正逐步改變醫學影像領域,不僅提升診斷準確度,也讓流程更有效率、治療更個人化。本文整理其關鍵技術、訓練方式與應用現況,並指出資料品質、安全性及臨床整合等挑戰。未來建議聚焦於提升模型效率、可解釋性與泛化能力,確保臨床應用可靠。 相關文章 PubMed DOI 推理

這項研究用 Llama 3 把 1,192 條本體論公理翻成自然語言,讓專家更好評估。結果只有約 14% 翻得完全正確,22% 不正確,64% 部分正確。Llama 3 處理簡單公理還行,但遇到複雜內容就比較不行。未來如果再訓練或當輔助工具,還有進步空間。 相關文章 PubMed 推理

研究比較 ChatGPT(3.5、4.0)和澳洲泌尿科住院醫師在專科考試的表現,結果住院醫師的通過率和分數都比 AI 略高,雖然差異沒達到統計顯著。考官大多能分辨 AI 答案。整體來說,ChatGPT 在這類高階醫學考試還是比不上人類醫師。 相關文章 PubMed DOI 推理

scExtract 是一套新工具,運用大型語言模型自動化分析單細胞 RNA 定序資料,能從論文中擷取資訊,提升資料前處理、註解和整合效率。它結合先前知識,批次校正和生物多樣性保留都比現有方法更好,已成功整合 14 個資料集,建立 44 萬個細胞的人類皮膚細胞圖譜。 相關文章 PubMed DOI 推理

CLOVER 是一套專為數位病理學設計的高 CP 值對話式 AI 架構。它只需訓練小模組,主模型不用動,並用 GPT-3.5 加上聰明提示語來產生病理專屬指令,省下不少成本。CLOVER 的混合型視覺問答表現甚至比大模型還好,資料少也能跑得不錯,未來在臨床應用很有機會。 相關文章 PubMed DOI 推理

mRNA除了製造蛋白質,還有很多調控功能,但現有研究方法很難全面發現。這篇文章認為,AI(像大型語言模型和圖神經網路)有機會徹底改變RNA生物學,幫助我們更有效分析mRNA非編碼區和交互作用。作者也提出整合AI工具和資料的計畫,並鼓勵生物學家和資訊科學家合作。 相關文章 PubMed DOI 推理