LLM 相關三個月內文章 / 第 12 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

scClassify2 是新一代細胞註解工具,能辨識細胞狀態的連續性,不只分細胞類型。它用雙層架構,結合序位迴歸和生物知識,表現優異。支援單細胞 RNA 定序和空間轉錄體學,也有提供學術用的網頁伺服器。 相關文章 PubMed DOI 推理

這項研究發現,GPT-4o在南韓機械維修國考中表現優異,計算和非計算題都能應付,但在進階推理、法律題和圖表解讀上較弱。推理和法律題可靠專用模型改善,但圖表還需更強視覺AI。整體來說,GPT-4o有潛力協助維修,但實際應用還有待突破。 相關文章 PubMed DOI 推理

最新研究比較五款主流AI聊天機器人在歐洲放射學文憑考題上的表現,發現Claude 3.5 Sonnet在正確率、自信和一致性都拿下第一,ChatGPT-4o緊追在後。這些AI整體表現甚至超越人類考生,但各自的穩定度和自信還是有差異,提醒大家在臨床或教育等重要場合使用時要特別小心。 相關文章 PubMed DOI 推理

TL;DR: 大型語言模型(像ChatGPT)不只會有明顯的社會偏見,也會出現像人類一樣的隱性偏見,這些偏見常常不容易被發現。研究發現,AI和人類都會對社經地位較低的人有負面看法,而且AI的偏見更嚴重。大家也比較難察覺AI的偏見,卻比較容易發現自己的。要讓AI負責任地使用,這些偏見問題一定要正視。 相關文章 PubMed DOI 推理

這篇論文提出一套專為小型建築設計的代理人式數位分身架構,每個組件由代理人管理,系統會持續自我更新並用知識圖譜編碼。數位分身能執行工作流程、與人協作,並結合知識圖譜與大型語言模型,用檢索增強生成技術回答自然語言問題。論文定義四種操作模式,展示五個代理人的離線應用,使用者可透過網頁介面互動與視覺化模型。 相關文章 PubMed DOI 推理

現有像ChatGPT-4o這類AI模型,在診斷老年性黃斑部病變時,表現還是比不上眼科醫師。不過,研究團隊透過專門設計的訓練課程,開發出RetinaVLM-Specialist,讓它在分期和轉診上表現已經追上資淺醫師,甚至比其他AI更準確。專家也認同這種課程式訓練,能讓AI更貼近臨床需求。 相關文章 PubMed DOI 推理

這篇論文分析300萬則AI應用程式用戶評論,發現約1.75%提到LLM幻覺,最常見是事實性錯誤。作者建立七種幻覺分類,並指出用戶回報這些錯誤時有特定語言和情緒特徵。研究建議,行動App應加強LLM錯誤監控和修正,提升用戶信任與軟體品質。 相關文章 PubMed DOI 推理

在學術寫作用 ChatGPT 這類 AI 時,常會遇到「參考文獻幻覺」問題,也就是 AI 會捏造或給錯引用,這對學術誠信很傷,特別是在重視實證的口腔顎面外科領域。建議加強編輯把關、提升 AI 素養,並用即時引用工具,確保文獻正確,維護學術公信力。 相關文章 PubMed DOI 推理

這項研究發現,微調過的BERT模型在分類病人安全事件報告時,比傳統CNN模型更能準確辨識罕見事件和嚴重程度,且在新資料上也有不錯表現。即使資料量少或分布不均,BERT只用預設參數就能有很好的效果,顯示其在醫療文本分類上相當有潛力。 相關文章 PubMed DOI 推理

這項研究發現,ChatGPT-4o 回答子宮內膜異位症相關問題的表現,和人類專家差不多,品質、正確性和安全性都不輸專家。雖然專家多能分辨 AI 回答,但 AI 仍有潛力協助病人獲取健康資訊。未來還需進一步研究 AI 在臨床應用的風險與接受度。 相關文章 PubMed DOI 推理