LLM 相關三個月內文章 / 第 104 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這項研究發現,不同版本的 ChatGPT 在驗光與視覺科學領域的答題表現有差異,越新的模型表現越好,但分數普遍比真人評分者高,尤其是 GPT-3.5。雖然 ChatGPT 有潛力應用於驗光教育,但因為表現不一和倫理疑慮,導入時還是要小心管理。 相關文章 PubMed DOI 推理

這篇研究提出KFLM2方法,把有藥物發現知識的LLM和分子圖資訊結合,來提升分子性質預測的準確度。透過微調LLM並融合SMILES嵌入和分子圖,KFLM2在多數基準資料集上表現更好。結果證明,結合LLM知識和分子結構比單獨用其中一種更準確,強調領域知識和多模態學習對藥物發現很重要。 相關文章 PubMed DOI 推理

這篇論文介紹一款開源 AI 健康日誌 App,讓病人用自然語言記錄健康狀況,並即時獲得 LLM 回饋。系統有三分割介面,支援日誌、AI 對話和健康追蹤,也能模擬醫療專家互動。初步結果顯示有助提升健康素養並保護隱私。作者提出五大設計原則,強調透明、隱私和臨床整合,但實際成效還需更多研究驗證。 相關文章 PubMed DOI 推理

這篇大型驗屍研究用AI分析588例PSP個案,根據五大症狀分出七種早期臨床亞型,並發現一種新且進展最快、tau蛋白病變最嚴重的侵襲性亞型(PSP-PF)。利用決策樹可早期分類亞型,幫助預測病程並提升臨床試驗招募效率。PSP-CBS並非獨立早期亞型。 相關文章 PubMed DOI 推理

這是一則針對 DOI: 10.3389/fmed.2025.1612838 這篇文章的更正通知。 相關文章 PubMed DOI 推理

這篇研究發現,經過資料增強和微調的小型語言模型(如BERT、RoBERTa)在預測題目難度上表現優於以往方法,且多模型結合效果更佳。反而大型語言模型(如GPT-4)因資料和上下文限制,預測效果不如預期。專屬領域模型沒加分,進階提示設計也不如資料增強有效。 相關文章 PubMed DOI 推理

這項研究比較四款AI聊天機器人在診斷顏面頜部疾病的表現,發現ChatGPT正確率最高,特別是在腫瘤診斷上表現最好。雖然各AI間差異沒達統計顯著,但整體來說,AI聊天機器人,尤其是ChatGPT,未來在牙科診斷輔助上很有發展空間,但還需要再優化。 相關文章 PubMed DOI 推理

這篇研究比較了四種免費機器翻譯工具,把重症醫療教材翻成中文、西班牙文和烏克蘭文,並和專業人工翻譯做評比。結果發現,沒有哪個工具在所有語言和評分項目都最優,各語言和工具表現有差異。這提供教育者一個多元評估方法,幫助挑選適合的翻譯工具來推動國際醫學教育。 相關文章 PubMed DOI 推理

這項研究發現,ChatGPT 3.5在設計特定熱量的食譜時,熱量計算蠻準的,尤其是單一道菜的情況下更精確。不過,若是整天的餐點計畫,準確度就比較差一點。雖然結果看起來不錯,但還需要更多研究來確認ChatGPT在營養建議和食譜實用性上的可靠性。 相關文章 PubMed DOI 推理

這篇研究提出的 Neuro-TM Diarizer 深度學習系統,結合降噪、波束成形和神經網路分離技術,在 VoxConverse 和 VoxCeleb 測試下,語者分離錯誤率分別只有 6.89% 和 6.93%,比傳統方法更準確且穩定,特別適合用在語音轉錄、語者驗證等應用。 相關文章 PubMed DOI 推理