LLM 相關三個月內文章 / 第 57 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這篇論文提出 VisionTrack 多模態 AI 系統,能整合影像、臨床資料和醫療報告,提升視網膜疾病診斷的準確度。系統結合 CNN、GNN 和 LLM 技術,在公開資料集上測試表現優異,展現早期偵測和個人化眼科照護的應用潛力。 相關文章 PubMed DOI 推理

這篇論文探討用大型語言模型從非結構化或半結構化文本中自動擷取感測器資料,並強調設計精確提示語讓模型輸出標準 JSON 格式。實驗發現 GPT-4 效果最好,但資料結構明確時,開源模型表現也不差。小型模型處理自由文本較弱,但對表格資料還行;大型模型則更穩定可靠。 相關文章 PubMed DOI 推理

這項研究比較四款主流大型語言模型在產生整形外科醫病對話的表現,結果顯示它們都能產生真實又實用的對話,平均分數都超過4.5分。雖然 Gemini Pro 2.5 和 Claude 3.7 Sonnet 表現稍好,但彼此間沒有明顯差異。這些模型適合用於醫學教育和研究,但還是要注意多元性和偏見的問題。 相關文章 PubMed DOI 推理

AI 在臨床試驗風險評估的應用越來越多,2013 到 2024 年有 142 篇相關研究,運用機器學習、深度學習和因果推論來預測安全性、療效和作業風險。資料來源多元,近期也開始用大型語言模型。雖然部分模型表現很好,但還是有偏誤、驗證不足和資料品質等問題。整體來說,AI 有助於提升臨床試驗的安全性和效率,特別是在風險監控方面很有潛力。 相關文章 PubMed DOI 推理

這篇研究提出AraSum,一款專為阿拉伯語醫療摘要打造的輕量AI模型。AraSum運用知識蒸餾和合成醫療對話資料,不僅在自動評分和人工評估上都勝過大型模型JAIS-30B,還能大幅降低運算資源需求。證明小型高效模型也能有效支援資源較少語言的醫療應用,推動AI更永續與公平發展。 相關文章 PubMed DOI 推理

這項研究比較GPT、Claude和Gemini三款AI在中風照護的表現,發現它們在正確性、同理心等方面都不夠穩定,沒有一款能全面達到臨床標準。不同提示方法各有優缺點,但整體來說,現階段AI還無法完全勝任中風照護需求。 相關文章 PubMed DOI 推理

這項研究發現,ChatGPT 4o在預測肝細胞癌患者手術前微血管侵犯的表現,明顯優於傳統機器學習模型,且能有效區分術後存活率與復發風險,顯示LLM有助於提升術前評估與手術規劃品質。 相關文章 PubMed DOI 推理

作者介紹「Virtual Lab」這個虛擬實驗室,結合AI和人類合作,由大型語言模型組成團隊,在人類帶領下進行跨領域研究。他們用這系統設計出92種針對新冠變異株的nanobody,實驗證實其中幾種效果不錯,甚至有兩種對新變異株的結合力更強,顯示這方法能加速重要科學發現。 相關文章 PubMed DOI 推理

這項研究發現,ChatGPT 和 Gemini 產生的妊娠糖尿病衛教資料,內容易讀、實用,專家評價也很高。雖然 AI 在病人衛教上很有潛力,但還需要更多研究來證實長期效果。 相關文章 PubMed DOI 推理

這篇研究主要解決小型語言模型難以理解文字空間關係的問題。作者用思路鏈技巧和半監督學習,讓小模型學會大型模型的推理能力,並萃取高品質資料。這方法讓小模型在空間推理上表現接近大型模型,對資源有限時提升語意理解很有幫助。 相關文章 PubMed DOI 推理