LLM 相關三個月內文章 / 第 118 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這項研究發現,ChatGPT-4在回答全髖關節置換術後性生活相關問題時,表現普遍算是「尚可」,尤其適合用來做一般衛教,特別是面對敏感話題。不過,遇到需要更專業或個別化的情境時,ChatGPT的表現就比較有限,因此還是要依賴專業醫師的建議。 相關文章 PubMed DOI 推理

這篇論文回顧了在Industry 5.0和大數據下,工業故障診斷的最新方法,重點在多元資料來源、深度學習技術及大型模型的應用。作者也指出,未來要提升資料品質、強化深度學習的可解釋性,並發展邊緣運算的大型模型。 相關文章 PubMed DOI 推理

ACBreaker 是一套用大型語言模型(LLM)協助找出物聯網裝置網頁介面存取控制漏洞的新方法。它會先把韌體程式碼拆成小區塊,再用 LLM 萃取裝置細節,最後結合模糊測試來找漏洞。實測 11 款裝置,發現 39 個新漏洞,部分還拿到 CVE 編號。 相關文章 PubMed DOI 推理

這項研究解決了社群媒體上IoC分類缺乏高品質標註資料的問題,透過微調GPT-3.5來產生擬真合成資料集。用這些資料訓練模型,準確率最高達82%,證明微調後的LLM能有效生成有用的資安資料,提升IoC分類表現,對資安領域很有幫助。 相關文章 PubMed DOI 推理

這篇論文提出一套結合AI路線優化、知識圖譜決策、LLM對話助理及MR頭戴裝置的最後一哩配送系統,提升物流協作與資訊共享。原型已在義大利阿普利亞測試,證實可行性與效益,但也發現實務應用上的挑戰。 相關文章 PubMed DOI 推理

這項研究比較 GPT-4o、Llama-3 (70B) 和 Mixtral (8x7B) 三款大型語言模型,發現 Llama-3 (70B) 和 GPT-4o 拆解餐點成分的表現都比 Mixtral 好,尤其 Llama-3 (70B) 準確率和 F1-score 都最高。結果顯示,像 Llama-3 這類開源模型,對個人化營養和餐點客製化很有幫助。 相關文章 PubMed DOI 推理

這篇綜述分析67篇AI應用於MRI的研究,發現AI能加快掃描和判讀速度、自動分割影像,提升工作效率。常用技術有ResNet、U-Net等卷積神經網路。雖然AI表現不錯,但因外部驗證不足、資料集不一致,臨床應用還有限。未來需更多標準化研究,才能讓AI安全有效地用在臨床MRI。 相關文章 PubMed DOI 推理

這項研究比較多種阿拉伯語預訓練語言模型在心理健康問答分類的表現,發現 MARBERT 等 PLMs 效果明顯優於傳統方法。透過進一步微調或用 GPT-3.5 少量學習,準確率還能提升,顯示 PLMs 有助於提升阿拉伯語心理健康支援的可行性與效果。 相關文章 PubMed DOI 推理

臨床試驗中,方案偏差(PDs)定義不一,難以有效辨識關鍵影響。傳統用NLP分類PDs又慢又複雜。這項研究用Meta Llama2大型語言模型,開發自動化系統,能快速分類Roche系統裡的PDs,自動標記出超過八成可能影響結果的PDs,讓專家能聚焦審查,大幅提升效率,幾分鐘就能得到有用見解。 相關文章 PubMed DOI 推理

這項研究提出一套新框架,能提升大型語言模型(LLM)生成臨床紀錄的準確性與安全性。透過錯誤分類、反覆評估、臨床安全性檢查和CREOLA介面,分析近1.3萬句臨床標註句子後,發現幻覺率1.47%、遺漏率3.45%。經優化後,重大錯誤率甚至比人類醫師還低,顯示這方法有助於提升LLM臨床應用的安全性。 相關文章 PubMed DOI 推理