LLM 相關三個月內文章 / 第 89 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

ChatGPT 3.5 用來測驗近十年整形外科住院醫師考題(不含圖片),正確率只有約 46%,明顯低於住院醫師平均。它在基本知識和乳房、醫美題目表現較好,但遇到需要複雜推理或手部、下肢相關題目就比較弱。整體來說,ChatGPT 現階段還不適合拿來做臨床決策或考試準備。 相關文章 PubMed 推理

本研究提出用大型語言模型打造模組化 AI 代理人,分工處理訓練規劃、動物福利、SOP 等任務,協助訓練師快速產出個別化、實用的動物訓練計畫。這種彈性架構能有效彌補現有 AI 工具與實際訓練需求間的落差。 相關文章 PubMed DOI 推理

我們提出一種新方法,結合NCBI Gene的基因描述和大型語言模型,將單細胞RNA定序資料轉換成有意義的向量。做法是先找出每個細胞表現量最高的基因,擷取基因註解,再用語言模型轉成向量,並依表現量加權。這樣不只提升解釋性,也讓細胞分群和分析更精準。 相關文章 PubMed 推理

CellTypeAgent 是一款新工具,結合大型語言模型和資料庫驗證,能自動又精確地標註單細胞 RNA 定序資料的細胞類型。它比現有方法更準確、錯誤率更低,已在九個資料集、36 種組織、303 種細胞類型上測試,展現出快速又可靠的標註潛力。 相關文章 PubMed 推理

在基層診所用 AI 自動紀錄系統後,精神症狀的紀錄變得更詳細,但醫師實際針對憂鬱症採取行動(像新診斷、開藥或轉介)的機率反而變低。也就是說,AI 雖然能記錄更多,但不一定會讓醫師多做處置。未來還需要更多研究來評估對病人照護的影響。 相關文章 PubMed DOI 推理

這篇研究提出 ProtFun 深度學習模型,結合蛋白質語言模型嵌入、家族網路資訊(用圖注意力網路)和蛋白質特徵,來預測蛋白質功能。實驗結果顯示 ProtFun 在標準資料集上表現比現有方法更好,程式碼也已經公開。 相關文章 PubMed DOI 推理

作者們開發了一套高通量系統,實驗測試VDJdb資料庫中的多組TCR-pMHC配對,發現實際只有約一半是真的有反應。他們建立了經過驗證的TCRvdb資料庫,並發現AlphaFold3的信心指標有助於分辨真假TCR-pMHC互作。TCRvdb已公開,希望能提升未來TCR專一性預測的準確率。 相關文章 PubMed DOI 推理

最新的商業大型語言模型(像GPT-4o),在神經影像的中繼資料標註上,表現幾乎跟專業人員一樣好(zero-shot下得分0.91–0.97),錯誤率也差不多,很多分歧其實不是錯誤。這代表LLM很適合大規模自動標註。作者也建議大家建立並分享標註基準資料集,方便未來測試。 相關文章 PubMed DOI 推理

這項研究開發了一個網頁工具,把ACS常用的三種風險評分整合在同一介面,並用AI協助設計。結果顯示,這工具評分和現有系統一致,減少重複輸入、提升效率。證明AI輔助、醫師主導的軟體開發在心血管風險評估上可行又準確,但還需要更多臨床驗證。 相關文章 PubMed DOI 推理

研究人員用GPT-4提出乳癌新藥物組合,選用多種原本非治療癌症的FDA核准藥物,兩兩搭配後進行細胞實驗。結果發現,有些AI建議的組合效果比現有治療還好,顯示大型語言模型在新藥開發和科學假說產生上很有潛力。 相關文章 PubMed DOI 推理