LLM 相關三個月內文章 / 第 50 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這項研究比較四款主流AI聊天機器人回答頭頸癌症狀問題的品質與可讀性,發現Microsoft Copilot表現最佳,Open Evidence最差。不同平台差異明顯,顯示AI健康資訊仍需加強驗證與監督,才能確保病人獲得正確、易懂的資訊。這屬於等級4證據。 相關文章 PubMed DOI 推理

這項研究評估 AI 語言模型在新加坡基層診所分類病人申訴的表現,發現 GPT-4o mini 和 Claude 3.5 Sonnet 準確度比 GPT-3.5 turbo 好。常見申訴有等太久、員工態度差和預約問題。結果顯示 LLMs 能提升申訴分析效率,但還需要再優化才能更精準。 相關文章 PubMed DOI 推理

這項研究發現,GPT-4o 在醫學院簡答題批改上,和老師的分數差異大多在±5%以內,準確度很高。AI 對記憶、應用、分析題目特別精準,但理解和評估題型就比較弱。遇到難題時,AI 和老師的評分落差也會變大。建議 AI 批改還是要搭配老師一起使用,尤其是複雜題目。 相關文章 PubMed DOI 推理

將GenAI和LLM導入無線接取網路(RAN),能大幅提升6G網路的自動化與智慧化。不過,要真正發揮效益,還需建立標準化框架、代理架構、工具整合及效能評估等。研究呼籲加強相關標準與驗證,推動AI驅動的網路自動化。 相關文章 PubMed DOI 推理

這篇系統性回顧發現,生成式AI在自閉症診斷和情緒辨識等方面有潛力提升照護品質,但目前研究數量少、樣本有限且缺乏標準化,還有倫理疑慮。未來需加強驗證和透明度,才能安全應用於臨床。 相關文章 PubMed DOI 推理

TL;DR: 這篇研究利用大型語言模型(LLMs)從文獻中自動擷取植物代謝相關資料,像是酵素-產物和化合物-物種配對,還能把表格圖片轉成可用資料。經過不同提示設計和模型測試,結果顯示這方法準確率不錯,漏掉的資料也比以前少。不過,專業知識還是很重要,不能完全靠AI。 相關文章 PubMed DOI 推理

這項研究發現,ChatGPT-4在回答慢性外側踝關節不穩定(CLAI)手術治療問題時,約有65%答案和專家共識相符。雖然它有時能提供正確且有幫助的資訊,但偶爾會出現過度自信或不完整的回答。整體來說,ChatGPT-4的臨床可靠度還不及專家,但在CLAI管理上有輔助潛力。 相關文章 PubMed DOI 推理

BTE RAG 是一種新架構,把大型語言模型和真實生物醫學知識結合,能大幅減少錯誤和幻覺。實驗顯示,在三個生物醫學問答資料集上,BTE RAG 的準確率和答案品質都明顯優於單用 LLM,是做生醫研究和機制探索的可靠工具。 相關文章 PubMed DOI 推理

這項研究發現,只用一個超簡單、只有21個參數的機率模型,不靠RNA二級結構或比對資料,也能從少量(甚至50條)RNA序列中,自然學出A:U、G:C和G:U這些基本鹼基配對規則。這代表RNA序列本身就藏有足夠訊號,單靠簡單模型和標準深度學習方法就能抓出來,未來有機會應用在更多RNA分析工具上。 相關文章 PubMed DOI 推理

這項研究推出OmniCellAgent,一個全新AI代理人,能自動分析大量單細胞RNA-seq和多種組學資料,還能整合生醫知識和文獻,幫助病患、臨床醫師和研究人員等非專家也能進行專業級的生醫研究,找出疾病機制和精準治療方法。 相關文章 PubMed DOI 推理