LLM 相關三個月內文章 / 第 134 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

作者提出用大型語言模型自動從網路上的植物描述擷取形態性狀資料,大幅減少人工整理。方法能高準確度重現現有資料庫超過一半內容,證明大規模自動化建立性狀資料庫已可行,但仍受限於描述資料的完整性。 相關文章 PubMed DOI 推理

作者開發了一套NLP流程,運用機器學習模型自動從大量文字中擷取植物性狀資料。這套基於transformer的方法,無論在分類型或數值型性狀上,表現都比傳統關鍵字或正則表達式好很多。這能有效補足全球性狀資料庫的不足,加速資料數位化。 相關文章 PubMed DOI 推理

這項研究發現,在台灣非英語學術醫院裡,醫師用大型語言模型(LLM)來產生病人訊息回覆草稿,雖然有超過一半的回覆用了LLM,但實際上並沒有明顯省下回覆時間。不同科別的使用情況和修改幅度也不太一樣。整體來說,LLM草稿算是安全可用,但目前還沒看到明顯的效率提升,未來隨著經驗增加,效果可能會更好。 相關文章 PubMed DOI 推理

機器翻譯的性別偏見問題,研究超過十年還是很難解決,單靠技術修正沒辦法徹底改善。作者回顧百篇論文,發現偏見依舊存在,尤其大型語言模型出現後,挑戰更多。未來應該從使用者、多語言和文化多元等角度,貼近真實情境來處理這個問題。 相關文章 PubMed DOI 推理

這篇文章介紹如何用 prompt engineering(提示設計)來提升大型語言模型的表現,包括基礎和進階技巧,像是自我一致性、思路鏈結和生成知識等,也有討論視覺-語言模型的應用。文中強調這些方法對 AI 安全很重要,尤其能防禦對抗攻擊,並提出未來研究方向。 相關文章 PubMed DOI 推理

這項研究用 ChatGPT-4o 分析外科住院醫師從三種評估工具收到的回饋,發現 ChatGPT 的評分和老師高度一致(90% 一致,κ=0.94)。SIMPL-OR 的回饋最具體、矯正性高,常提到病人照護;輪科結束的回饋則較籠統、矯正性低,但更強調專業素養。結果建議應用多元工具給住院醫師回饋,才能兼顧內容和品質。 相關文章 PubMed DOI 推理

這項研究評估RAPID工具,結合大型語言模型和檢索增強生成技術,自動產生醫學報告檢查清單(如CONSORT、CONSORT-AI)。用91篇標註文章測試,RAPID在CONSORT準確率92.11%,CONSORT-AI為83.81%,內容一致性高。RAPID能幫助醫療人員省時,容易應用到其他指引,表現也比現有方法更好。 相關文章 PubMed DOI 推理

這項研究提出CLUES框架,結合大型語言模型和不確定性量化,協助簡化中風住院病歷的人工審查。透過三階段流程,能維持高準確度(F1-score最高0.955),同時減少75%人工工作量。系統會判斷哪些案例需人工審核,確保結果可靠,讓AI更有效融入臨床流程。 相關文章 PubMed DOI 推理

這篇論文指出,現行歐盟醫療器材法規(MDR)對AI醫療大語言模型的風險管理流程,沒辦法完整處理LLM的特殊風險,像是使用者不明確或新型危害。作者建議,應該從實際風險和使用情境出發,再回推預期用途和控制措施,才能更有效保障醫療AI的安全。 相關文章 PubMed DOI 推理

這篇論文提出WCSE-AGC架構,結合AI和共識方法,評估小麥種植適宜性並考慮條銹病影響。透過模擬專家意見和建立信任網絡,即使專家數量少或意見分歧,也能提升疾病評估共識。實測結果證明,這方法在精準農業決策上表現穩定有效。 相關文章 PubMed DOI 推理