LLM 相關三個月內文章 / 第 120 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這項研究開發了一套用於提升核醫療診斷治療的聊天機器人架構,透過情境增強(RAG)讓大型語言模型能查找相關研究資料。測試五款主流LLM後發現,RAG能明顯提升答案品質,尤其CLAUDE 3 OPUS和GPT-4O表現最好。研究也提醒,目前問題範圍有限,未來應擴大題目多樣性並比較人類與AI的評分。 相關文章 PubMed DOI 推理

這篇研究評估ChatGPT-4o存取PubChem資料庫的能力,發現用提示語讓它產生程式碼來查詢最有效。作者公開所有提示語,並建議未來可用大型語言模型來提升生物醫學資料庫的存取效率。 相關文章 PubMed DOI 推理

這項研究發現,ChatGPT-4.0在酵素學考試的表現優於3.5版,但兩者分數都比學生低,尤其在實驗室分析題目上差距更明顯。雖然聊天機器人有助學習,但目前還無法取代人類專業知識。 相關文章 PubMed DOI 推理

四款大型語言模型用來產生多發性骨髓瘤和AL類澱粉沉積症治療的臨床摘要,Claude在正確性和完整性上表現最好,但沒有任何模型能完全正確。所有模型產出的內容都需要專家審查,目前還不適合單獨用於臨床摘要。 相關文章 PubMed DOI 推理

這項研究發現,ChatGPT-4o等AI模型在燒燙傷診斷上表現和有經驗的醫師差不多,報告也更好懂。不過,AI的治療建議常常太籠統,缺乏個人化。AI可以當輔助工具,但還是需要醫師把關,確保治療安全又符合每個病人的需求。 相關文章 PubMed DOI 推理

這項研究發現,ChatGPT-4在回答全髖關節置換術後性生活相關問題時,表現普遍算是「尚可」,尤其適合用來做一般衛教,特別是面對敏感話題。不過,遇到需要更專業或個別化的情境時,ChatGPT的表現就比較有限,因此還是要依賴專業醫師的建議。 相關文章 PubMed DOI 推理

這篇論文回顧了在Industry 5.0和大數據下,工業故障診斷的最新方法,重點在多元資料來源、深度學習技術及大型模型的應用。作者也指出,未來要提升資料品質、強化深度學習的可解釋性,並發展邊緣運算的大型模型。 相關文章 PubMed DOI 推理

ACBreaker 是一套用大型語言模型(LLM)協助找出物聯網裝置網頁介面存取控制漏洞的新方法。它會先把韌體程式碼拆成小區塊,再用 LLM 萃取裝置細節,最後結合模糊測試來找漏洞。實測 11 款裝置,發現 39 個新漏洞,部分還拿到 CVE 編號。 相關文章 PubMed DOI 推理

這項研究解決了社群媒體上IoC分類缺乏高品質標註資料的問題,透過微調GPT-3.5來產生擬真合成資料集。用這些資料訓練模型,準確率最高達82%,證明微調後的LLM能有效生成有用的資安資料,提升IoC分類表現,對資安領域很有幫助。 相關文章 PubMed DOI 推理

這篇論文提出一套結合AI路線優化、知識圖譜決策、LLM對話助理及MR頭戴裝置的最後一哩配送系統,提升物流協作與資訊共享。原型已在義大利阿普利亞測試,證實可行性與效益,但也發現實務應用上的挑戰。 相關文章 PubMed DOI 推理