LLM 相關三個月內文章 / 第 171 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這項研究發現,ChatGPT-4o寫病史的品質跟住院醫師差不多,但速度快很多(只要40秒,醫師要15分鐘)。雖然AI有助提升效率和品質,但資料安全和隱私問題還沒解決,實際應用前還需要更多研究,特別是在複雜病例和不同臨床環境下的表現。 相關文章 PubMed DOI 推理

研究團隊開發出一套機器學習模型,能透過十二指腸切片影像診斷乳糜瀉。這個模型在超過3,000張切片訓練,測試時準確率、敏感度和特異性都超過95%,AUC更高於99%,表現媲美專家病理醫師。未來有望大幅提升臨床診斷乳糜瀉的效率與速度。 相關文章 PubMed DOI 推理

這項研究發現,ChatGPT-4 和 Copilot 在日本護理師國考題目上表現及格,ChatGPT-3.5 則沒過關。三款模型在涉及日本特有法律和社會保障制度的題目上表現最差,顯示需要在地知識時,LLMs 容易出錯。整體來說,較新版本的 LLMs 準確度較高。 相關文章 PubMed DOI 推理

這項研究發現,美國鼻科醫學會的衛教資料平均需要10年級閱讀程度,但用ChatGPT、Gemini和Copilot等AI重寫後,平均只要8.6年級,Gemini甚至只要7.5年級。AI能讓醫療資訊更容易理解,但內容還是要由醫師和病患一起確認。 相關文章 PubMed DOI 推理

NeuroScale 是新一代深度學習模型,結合演化蛋白質建模和多尺度神經網路(GoogLeNet),能精準預測神經肽(AUC 超過 0.97),不論序列相似度或長度都很穩定,非常適合用來發現神經肽和開發肽類藥物。 相關文章 PubMed DOI 推理

這項研究比較了 Ernie Bot、ChatGPT 和 Gemini 三款 AI 對成人牙齒矯正常見問題的回答表現。結果發現,三者在正確性、清楚度和同理心等六項指標上,大多只拿到中等分數,很少有滿分。雖然 AI 可以輔助解答,但建議還是要有專業醫師把關,未來在正確性和病患照護上還有進步空間。 相關文章 PubMed DOI 推理

Valsci 是一款開源工具,能用支援 OpenAI 的語言模型,自動化大規模科學論述驗證。它結合檢索增強生成、書目計量評分和 chain-of-thought 提示,能有效搜尋並摘要像 Semantic Scholar 這類來源的證據。和一般 LLM 不同,Valsci 以真實文獻為基礎,減少虛構或錯誤引用,提升研究驗證效率與可靠性。 相關文章 PubMed DOI 推理

Claude 3.5 Sonnet 是多模態大型語言模型,這次用來分析160張瞼板腺攝影,評分腺體脫落程度並偵測形態異常。它在腺體流失分級的準確率高達85–97.5%,能正確辨識所有人工標記的異常,還能發現人工漏掉的細微問題,顯示有潛力成為眼科影像判讀和教學的好幫手。 相關文章 PubMed DOI 推理

傳統質性研究難以驗證假說,因為文字資料不好量化。TESA這個新方法,利用大型語言模型把假說變成搜尋詞,抓出語意嵌入,再跟文本比對相似度。這樣就能用分數分布來做假說檢驗,解決過去方法偏誤和效率低的問題。 相關文章 PubMed DOI 推理

研究發現,ChatGPT-4o在診斷眩暈時,可信度評分最高,但診斷正確率只跟資淺醫師差不多,明顯不如資深醫師。而且它的診斷答案較難閱讀。整體來說,ChatGPT-4o有輔助潛力,但診斷能力和可讀性還有待加強。 相關文章 PubMed DOI 推理