LLM 相關三個月內文章 / 第 25 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

一項針對270位風濕病患的調查發現,44%用過像ChatGPT這類聊天機器人,15%拿來問健康問題,主要是一般健康相關。年輕人和政治立場偏自由者用得較多,性別、學歷和收入則沒明顯差異。研究提醒,隨著這類工具在醫療上的應用增加,準確性、安全性和公平性都要特別注意。 相關文章 PubMed DOI 推理

這項研究比較了ChatGPT、Gemini和DeepSeek三種大型語言模型,利用Demirjian’s scores和全口X光片來預測牙齒年齡。雖然三種模型都能產生預測結果,但準確度都比傳統方法差,且有明顯誤差。Gemini表現較佳,但所有模型都還不適合直接用於臨床,需再加強訓練和驗證。 相關文章 PubMed DOI 推理

這個資料集收錄了馬來語在憂鬱、焦慮和壓力相關的情緒表達,並依DASS-42子量表標註。關鍵字由精神科和語言學專家挑選,資料來自2010到2019年的Twitter。內容包含原始和處理過的貼文,適合做情緒辨識、理解、預測研究,也很適合訓練馬來語語言模型。 相關文章 PubMed DOI 推理

這項研究發現,Google 三款大型語言模型在判斷放射科報告是否有肺栓塞時,準確率高達 95.3%–99.6%。提示設計和資料品質會影響表現,few-shot prompting 有助提升召回率,但 chain-of-thought prompting 反而可能降低。Gemini-1.5-Flash-002 對資料變動最有彈性。雲端地區差異影響不大。總結來說,LLMs 在醫療應用上表現不錯,但還是要小心驗證和設計提示。 相關文章 PubMed DOI 推理

這篇研究發現,GPT-4o在沒有臨床資訊下,判讀X光比CT準確,對骨盆和腫瘤影像最難,對出血判讀最好。結果顯示GPT-4o很依賴熟悉的影像,建議加強系統性分析、減少幻覺、標準化評估,並增加多元訓練資料,才能提升放射科AI的表現。 相關文章 PubMed DOI 推理

目前用電子健康紀錄(EHR)網路來研究憂鬱症的文獻還不多,主要集中在美國,常用的平台有 TriNetX 和 All of Us。分析重點多放在年齡、性別、種族等因素。雖然 EHR 網路很有潛力,但在憂鬱症研究上的應用還不夠,未來應加強資料存取與利用。 相關文章 PubMed DOI 推理

Concept2Brain 利用 AI 技術,把圖片或文字的意義轉換成模擬大腦(EEG)反應,讓研究人員能預測或創造各種概念的腦波數據,有助於深入了解大腦如何處理語意和情緒。 相關文章 PubMed DOI 推理

作者提出一套專為環境科學設計的LLM開發流程,包括多代理人提示生成器EnvInstruct、涵蓋五大主題的ChatEnv資料集,以及多元任務基準EnvBench。經此流程微調的EnvGPT模型,在環境任務上表現超越同級甚至更大型模型。所有資源皆已開放,為環境領域LLM發展提供可重現基礎。 相關文章 PubMed DOI 推理

這項研究少見地用免費GPT工具(ChatGPT v4、DeepSeek v3)和特定提示框架,來分析教練和運動員的對話。結果顯示,這些AI能有效萃取有用資料,對教練學習和實務很有幫助,且省時又省錢。但統計可靠性和資料隱私還有疑慮,未來還需更多研究來釐清優缺點。 相關文章 PubMed DOI 推理

AI能快速產出高品質、客製化的選擇題,幫助健康科學教育省時省力,但也要注意題目正確性、公平性,以及技術、倫理和隱私問題。文章提供實用指引,並建議未來多研究AI選擇題對學習成效的影響。 相關文章 PubMed DOI 推理