LLM 相關三個月內文章 / 第 63 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

NeuroScale 是新一代深度學習模型,結合演化蛋白質建模和多尺度神經網路(GoogLeNet),能精準預測神經肽(AUC 超過 0.97),不論序列相似度或長度都很穩定,非常適合用來發現神經肽和開發肽類藥物。 相關文章 PubMed DOI 推理

這項研究比較了 Ernie Bot、ChatGPT 和 Gemini 三款 AI 對成人牙齒矯正常見問題的回答表現。結果發現,三者在正確性、清楚度和同理心等六項指標上,大多只拿到中等分數,很少有滿分。雖然 AI 可以輔助解答,但建議還是要有專業醫師把關,未來在正確性和病患照護上還有進步空間。 相關文章 PubMed DOI 推理

Valsci 是一款開源工具,能用支援 OpenAI 的語言模型,自動化大規模科學論述驗證。它結合檢索增強生成、書目計量評分和 chain-of-thought 提示,能有效搜尋並摘要像 Semantic Scholar 這類來源的證據。和一般 LLM 不同,Valsci 以真實文獻為基礎,減少虛構或錯誤引用,提升研究驗證效率與可靠性。 相關文章 PubMed DOI 推理

Claude 3.5 Sonnet 是多模態大型語言模型,這次用來分析160張瞼板腺攝影,評分腺體脫落程度並偵測形態異常。它在腺體流失分級的準確率高達85–97.5%,能正確辨識所有人工標記的異常,還能發現人工漏掉的細微問題,顯示有潛力成為眼科影像判讀和教學的好幫手。 相關文章 PubMed DOI 推理

傳統質性研究難以驗證假說,因為文字資料不好量化。TESA這個新方法,利用大型語言模型把假說變成搜尋詞,抓出語意嵌入,再跟文本比對相似度。這樣就能用分數分布來做假說檢驗,解決過去方法偏誤和效率低的問題。 相關文章 PubMed DOI 推理

研究發現,ChatGPT-4o在診斷眩暈時,可信度評分最高,但診斷正確率只跟資淺醫師差不多,明顯不如資深醫師。而且它的診斷答案較難閱讀。整體來說,ChatGPT-4o有輔助潛力,但診斷能力和可讀性還有待加強。 相關文章 PubMed DOI 推理

研究發現,透過機器學習分析血液樣本,可以找出更多和SuperAger(高齡但認知力像年輕人)有關的生物標記,預測認知表現的準確率達76%。這代表未來只要抽血檢查,就有機會早期辨識認知力強的長者,對健康老化研究很有幫助。 相關文章 PubMed DOI 推理

這篇研究分析五款中國主流大型語言模型,發現它們在性別、地區、年齡和學歷上都有明顯偏見,尤其是ChatGLM最嚴重。Tongyiqianwen有時會因隱私問題拒絕生成內容。論文也討論偏見來源,並提供改進建議,對未來更道德地使用這些模型很有參考價值。 相關文章 PubMed DOI 推理

這項研究用大型語言模型和遷移學習,成功設計出高不對稱因子、窄帶發射且手性可調的人工圓偏振磷光材料。這方法能在資料少時,幫助選擇合成材料並指導實驗。團隊做出的薄膜表現優異,還能依需求調整發光波長。這技術對多色顯示和資訊加密等應用很有潛力。 相關文章 PubMed DOI 推理

這項研究發現,GPT-4o 和 o1-preview 這兩款大型語言模型在放射科專科考試的表現比人類還要好,特別是在難題和鑑別度高的題目上,推理方式也很接近人類。結果顯示,這些先進模型未來有機會協助醫學考題的設計和標準化。 相關文章 PubMed DOI 推理