LLM 相關三個月內文章 / 第 33 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

大型語言模型在辨識單一神經迷思時表現比人類好,但遇到實際應用情境時,通常不會主動質疑迷思,因為它們傾向迎合使用者。若明確要求糾正錯誤,效果才明顯提升。總之,除非特別指示,否則 LLMs 目前還不適合單靠來防堵教育現場的神經迷思。 相關文章 PubMed DOI 推理

榮格的原型不只是心理學概念,其實是生物、神經和文化共同編碼的心智模式。Barbieri 的「編碼生物學」認為生命靠編碼規則運作,神經科學也發現原型是大腦穩定的神經模式。現在 AI 也能模擬這些原型,雖然沒意識。這觀點把生物、心理和 AI 串連起來,認為原型是底層編碼的產物。 相關文章 PubMed DOI 推理

這項研究用GPT-3.5產生的合成資料訓練BERT模型,能自動從電子病歷自由文本中抓出難治型憂鬱症的關鍵預後因子。模型在真實臨床資料上辨識20個相關因子,F1分數最高達0.85。這方法有助於用日常紀錄偵測DTD,不需用到敏感資料或花錢請專家標註。 相關文章 PubMed DOI 推理

這篇論文提出 M2ERD 方法,結合大、小型語言模型優點來偵測多模態緊急謠言,並設計新融合網路整合文字和圖片資訊。實驗證明 M2ERD 在多個資料集的準確率和 F1-score 都優於現有方法,程式碼和資料已公開在 GitHub。 相關文章 PubMed DOI 推理

這項研究發現,社群媒體上關於自殺的討論常忽略弱勢族群的議題。研究團隊用AI生成補足這些缺漏主題的資料,讓機器學習模型訓練更全面。結果顯示,加入這些合成資料後,模型偵測自殺意念的準確度提升,有助於打造更包容的線上自殺風險偵測工具。 相關文章 PubMed DOI 推理

這項研究發現,ChatGPT-4.0在ITI植牙認證考試的表現已經跟合格牙醫師差不多,明顯比ChatGPT-3.5好。雖然AI有潛力成為牙科專業的輔助工具,但還需要進一步研究,尤其是針對能看懂影像和影片的AI模型。 相關文章 PubMed DOI 推理

這項研究提出結合特徵摘要、思路鏈推理和混合型RAG架構的新提示工程方法,能提升大型語言模型判讀胸部CT報告、診斷肺部疾病的準確度。用2,965份報告測試,結果比傳統深度學習和其他提示法更準,外部驗證也表現優異。此方法不僅提升可解釋性,也有助臨床更精確診斷。 相關文章 PubMed DOI 推理

AI,像 ChatGPT,現在在醫師助理教育越來越普遍,能幫忙解答問題、整理重點,也支援個人化學習。不只提升行政效率,還能協助臨床決策。不過,使用上還是有倫理上的疑慮。整體來說,AI 對 PA 教育發展很有幫助。 相關文章 PubMed DOI 推理

過去研究多只偵測技術債或臭蟲其中一種,也很少用深度學習。這篇研究提出用LSTM、GRU和Transformer(BERT、GPT-3)等模型來辨識和分類軟體註解裡的技術債和臭蟲,資料來自主流程式庫。結果顯示,Transformer表現最好,GPT-3準確率最高達0.984,能有效提升軟體品質評估,對學界和業界都很有幫助。 相關文章 PubMed DOI 推理

這篇綜述主要討論 RAG 技術如何應用在醫療領域的大型語言模型,並整理現有資料集、技術和評估方式。多數研究用英文或中文資料,且偏好 GPT-3.5/4 這類專有模型。現階段缺乏統一的評估標準,對倫理問題的討論也不夠。未來需要更多研究,確保 RAG 在醫療應用上既安全又有效。 相關文章 PubMed DOI 推理