LLM 相關三個月內文章 / 第 67 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這項研究比較三款大型語言模型在肺炎治療建議的準確性。結果顯示,OpenAI O1 表現最好,O3 mini 次之,ChatGPT-4o 最差。具備 chain-of-thought 推理的模型(O1、O3 mini)在專家回饋後進步明顯,顯示這種推理機制有助於提升臨床決策的可靠性。 相關文章 PubMed DOI 推理

ChatGPT-3.5 回答糖尿病足潰瘍問題時,內容大致正確且易懂,但偶爾會有錯誤或資訊不全,且用詞有時較艱深。它適合提供一般資訊,但不能取代醫師專業建議,醫師也要了解其優缺點。 相關文章 PubMed DOI 推理

大型模型正逐步改變醫學影像領域,不僅提升診斷準確度,也讓流程更有效率、治療更個人化。本文整理其關鍵技術、訓練方式與應用現況,並指出資料品質、安全性及臨床整合等挑戰。未來建議聚焦於提升模型效率、可解釋性與泛化能力,確保臨床應用可靠。 相關文章 PubMed DOI 推理

這項研究用 Llama 3 把 1,192 條本體論公理翻成自然語言,讓專家更好評估。結果只有約 14% 翻得完全正確,22% 不正確,64% 部分正確。Llama 3 處理簡單公理還行,但遇到複雜內容就比較不行。未來如果再訓練或當輔助工具,還有進步空間。 相關文章 PubMed 推理

研究比較 ChatGPT(3.5、4.0)和澳洲泌尿科住院醫師在專科考試的表現,結果住院醫師的通過率和分數都比 AI 略高,雖然差異沒達到統計顯著。考官大多能分辨 AI 答案。整體來說,ChatGPT 在這類高階醫學考試還是比不上人類醫師。 相關文章 PubMed DOI 推理

scExtract 是一套新工具,運用大型語言模型自動化分析單細胞 RNA 定序資料,能從論文中擷取資訊,提升資料前處理、註解和整合效率。它結合先前知識,批次校正和生物多樣性保留都比現有方法更好,已成功整合 14 個資料集,建立 44 萬個細胞的人類皮膚細胞圖譜。 相關文章 PubMed DOI 推理

CLOVER 是一套專為數位病理學設計的高 CP 值對話式 AI 架構。它只需訓練小模組,主模型不用動,並用 GPT-3.5 加上聰明提示語來產生病理專屬指令,省下不少成本。CLOVER 的混合型視覺問答表現甚至比大模型還好,資料少也能跑得不錯,未來在臨床應用很有機會。 相關文章 PubMed DOI 推理

mRNA除了製造蛋白質,還有很多調控功能,但現有研究方法很難全面發現。這篇文章認為,AI(像大型語言模型和圖神經網路)有機會徹底改變RNA生物學,幫助我們更有效分析mRNA非編碼區和交互作用。作者也提出整合AI工具和資料的計畫,並鼓勵生物學家和資訊科學家合作。 相關文章 PubMed DOI 推理

這項研究發現,ChatGPT在泌尿動力學相關問題上,無論是理論還是實務題,答對率都只有一半,且無法正確解讀圖譜或提供可靠文獻。整體來說,ChatGPT只能當作輔助查詢工具,無法取代專業醫師,也無法提升檢查品質。 相關文章 PubMed DOI 推理

MedAESQA 資料集專為提升大型語言模型在醫療問答的表現而設計,內含 40 個真實醫療問題,每題有 30 答案(人類與 AI 產生),並附上相關科學文獻摘要。每個答案都經人工評估正確性與來源相關性,目的是讓 AI 回答更貼近事實、具科學根據。 相關文章 PubMed DOI 推理