LLM 相關三個月內文章 / 第 26 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

GPT-4等生成式AI能提升臨床效率,尤其在複雜照護上,但因推理過程不透明,容易引發安全疑慮。這在精神健康照護特別重要,因為該領域有獨特需求。作者提出CRITiCS架構,強調醫師需持續參與並理解AI推理,同時呼籲建立AI負責任使用的共識。 相關文章 PubMed DOI 推理

**重點摘要:** 雖然大型語言模型(LLMs)在教育上有其好處,但過度依賴它們可能會讓人減少直接閱讀,進而削弱深度識讀能力,這在兒童身上尤其明顯。認知科學家和教育工作者必須攜手合作,找出哪些能力可能受到影響,並發展教學策略,以維持閱讀與寫作帶來的獨特認知優勢。 相關文章 PubMed DOI 推理

研究用NLP技術分析35萬份智利職業健康報告,發現男性多為操作員,常因尖銳物刺傷;女性多做清潔,常因跌倒受傷。這顯示職災有明顯性別差異。研究也公開程式碼,方便全球應用,未來將深入探討通勤事故與職業病。 相關文章 PubMed DOI 推理

這項研究用大型語言模型(LLM)自動評分治療逐字稿中的心理構念(如病人參與度),取代傳統人工評分。實驗用 Llama 3.1 8B 分析 1,131 場治療,結果顯示 LLM 評分具高信度與效度,且與治療結果高度相關。這方法不僅減輕參與者負擔、保護隱私,也為心理評估帶來新可能。 相關文章 PubMed DOI 推理

這篇研究發現,Aidoc AI在臨床上偵測頭部CT的顱內出血表現很好,放射科醫師用起來敏感度高、特異性也很棒。ChatGPT-4 Turbo也能準確從報告中抓出ICH,顯示自動化監控AI很有潛力。不過,Aidoc在某些掃描儀(像Philips)或影像雜訊多時,偽陽性會比較多。整體來說,持續監控AI表現很重要,結合大型語言模型能提升效率與可靠度。 相關文章 PubMed DOI 推理

這篇系統性回顧分析了大型語言模型在牙顎顏面放射學的應用,包括診斷、治療建議、考題作答和報告生成。雖然LLMs在這些任務上展現潛力,但準確率落差大(33%到92.5%),表現還不夠穩定,未來還需要更多改進和驗證,才能真正用在臨床實務上。 相關文章 PubMed DOI 推理

這篇系統性回顧指出,AI在發炎性腸道疾病的診斷、預測和治療上很有潛力,應用包括多組學分析、語言模型和穿戴式監測。不過,臨床廣泛使用前,還需更多研究來確保安全、隱私和實際效果。 相關文章 PubMed DOI 推理

這項研究用先進語言模型(像GPT-4、LLAMA3、Mistral)來產生法文藥物錯誤通報的合成資料,解決醫療AI缺乏真實資料的問題。專家和AI都認為這些合成資料很逼真,訓練出來的分類器在真實資料上表現也不錯(F1-score最高0.78),證明合成資料對藥物錯誤分析很有幫助。 相關文章 PubMed DOI 推理

這項研究發現,GPT-4生成的急診到住院交班摘要大致準確且實用,但約有6%案例因資訊遺漏或描述錯誤產生安全疑慮。AI摘要的實用性會受是否有會診影響。多數醫護人員對AI摘要持正面態度,但也發現有藥物、檢驗數據遺漏或病人狀況判斷錯誤。建議在廣泛導入前,需進一步優化AI並蒐集臨床回饋。 相關文章 PubMed DOI 推理

這項研究用 diphones(能捕捉音素間轉換的語音單位)來取代單一音素,作為腦波轉文字語音的中介步驟,有效提升解碼準確率。在 Brain-to-Text 2024 測試中,音素錯誤率降到 15.34%,單字錯誤率 5.77%,表現比過去的方法更好。 相關文章 PubMed DOI 推理