LLM 相關三個月內文章 / 第 19 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這篇研究發現,奈及利亞在職教師在培訓後,採用ChatGPT的關鍵在於易用性和正向態度,比單純覺得有用還重要。科技焦慮和同儕影響也會影響他們的意願。建議針對教師設計培訓、降低焦慮、強化AI信任,幫助資源有限的學校推動AI應用。 相關文章 PubMed DOI 推理

這項研究提出DeLLiriuM模型,能把住院前24小時的結構化病歷資料轉成文字,讓大型語言模型分析,預測ICU譫妄風險。模型在195家醫院、10萬多名病人驗證,預測準確度(AUROC)達82.5,優於現有方法。這是首個用這種方式處理EHR資料的ICU譫妄預測工具,能更精準反映臨床狀況。 相關文章 PubMed DOI 推理

這項研究把大型語言模型(LLM)和深度學習結合,協助ICU醫師決定是否用高流量鼻導管或無創呼吸器。LLM能強化臨床指引遵循,並給出有解釋的建議。當治療和LLM建議一致時,病人插管和死亡率都較低。大多數建議符合指引,醫師有65%同意。這方法提升可解釋性和一致性,有望改善病人預後。未來會加強禁忌症偵測並做前瞻性驗證。 相關文章 PubMed DOI 推理

GCTHarmony 是一款用大型語言模型和 OpenAI 文字嵌入技術,專門把不同單細胞 RNA 定序研究裡的細胞類型註解標準化,對應到統一的本體論術語,讓不同資料集的註解更一致、更好比對。 相關文章 PubMed DOI 推理

這項研究發現,ChatGPT、Bing 和 Google Gemini 這三個AI搜尋引擎在判斷骨科足踝手術的CPT代碼時,整體正確率只有44%。其中Bing表現最好(62%),ChatGPT最差(23%)。AI和專家醫師的編碼結果落差大,顯示目前AI還不適合單獨用來做骨科手術編碼。 相關文章 PubMed DOI 推理

這項研究用22個神經眼科病例,比較ChatGPT(GPT-3.5和GPT-4)和兩位專科醫師的診斷能力。GPT-3.5正確率59%,GPT-4有82%,醫師則是86%。GPT-4的表現已經接近專科醫師,顯示AI有潛力協助診斷複雜眼腦疾病,尤其在缺乏專科醫師的地區。不過,臨床應用前還需要更多驗證安全性與可靠性。 相關文章 PubMed DOI 推理

scClassify2 是新一代細胞註解工具,能辨識細胞狀態的連續性,不只分細胞類型。它用雙層架構,結合序位迴歸和生物知識,表現優異。支援單細胞 RNA 定序和空間轉錄體學,也有提供學術用的網頁伺服器。 相關文章 PubMed DOI 推理

這項研究發現,GPT-4o在南韓機械維修國考中表現優異,計算和非計算題都能應付,但在進階推理、法律題和圖表解讀上較弱。推理和法律題可靠專用模型改善,但圖表還需更強視覺AI。整體來說,GPT-4o有潛力協助維修,但實際應用還有待突破。 相關文章 PubMed DOI 推理

最新研究比較五款主流AI聊天機器人在歐洲放射學文憑考題上的表現,發現Claude 3.5 Sonnet在正確率、自信和一致性都拿下第一,ChatGPT-4o緊追在後。這些AI整體表現甚至超越人類考生,但各自的穩定度和自信還是有差異,提醒大家在臨床或教育等重要場合使用時要特別小心。 相關文章 PubMed DOI 推理

TL;DR: 大型語言模型(像ChatGPT)不只會有明顯的社會偏見,也會出現像人類一樣的隱性偏見,這些偏見常常不容易被發現。研究發現,AI和人類都會對社經地位較低的人有負面看法,而且AI的偏見更嚴重。大家也比較難察覺AI的偏見,卻比較容易發現自己的。要讓AI負責任地使用,這些偏見問題一定要正視。 相關文章 PubMed DOI 推理