原始文章

大型語言模型(LLMs)如ChatGPT的發展,催生了能處理複雜任務的代理人,但這些代理人常面臨錯誤傳播和適應性不足的挑戰。為了解決這些問題,我們提出了「任務分解與代理生成」(TDAG)框架,將複雜任務拆解為小子任務,並分配給專門的子代理,以提升適應性。 此外,我們推出了ItineraryBench基準測試,專注於旅行規劃,評估代理人在記憶、規劃和工具使用等方面的能力。實驗結果顯示,TDAG在處理複雜任務時的表現顯著優於現有基準,展現出更強的適應性和情境意識。 PubMed DOI


站上相關主題文章列表

大型語言模型對機器人任務規劃有幫助,但執行任務時有困難。提出多層模型,逐層分解任務以改善處理。視覺語言模型可幫助環境感知,整合任務目標與環境數據,進行精確運動規劃。語義對齊方法可增強任務可執行性。無人載具實驗驗證了此方法對應機器人任務規劃與執行的有效應對。 PubMed DOI

Transformer神經網絡,特別是大型語言模型(LLMs),在材料分析、設計和製造上很有效。它們能處理各種數據,支持工程分析,像MechGPT在材料力學領域表現出理解能力。檢索增強的本體知識圖表等策略可提高生成性能,解決困難。這些方法在材料設計探索中有優勢,並提供見解。非線性取樣和基於代理的建模增強生成能力,改進內容生成和評估。例如,問答、代碼生成和自動生成力場開發。 PubMed DOI

Teriyaki是一個結合象徵性任務規劃和機器學習的框架,利用像GPT-3這樣的大型語言模型。這個方法旨在解決動態人機協作中的問題,透過逐步生成計劃行動提高效率,同時達成規劃和執行。初步結果顯示有希望的成果,包括更高的問題解決率、更短的計劃時間,以及縮短計劃可用性等待時間。 PubMed DOI

這篇論文探討大型語言模型(LLMs)對自然科學和社會科學的影響,特別是透過生成代理模型(GABMs)模擬人類行為。研究涵蓋網絡科學、演化博弈論等領域,顯示LLMs能預測社會行為、增強合作及模擬疾病傳播。雖然LLMs能模仿公平性和合作,但仍面臨提示敏感性和幻覺等挑戰,影響行為一致性。未來研究應聚焦於完善模型、標準化方法,並探討LLMs與人類互動可能帶來的新合作行為,重塑決策過程。 PubMed DOI

這篇論文提出了一個創新的多代理深度學習框架,專注於優化無人機(UAV)在去中心化環境中的軌跡。透過將問題設置為去中心化部分可觀察馬可夫決策過程(Dec-POMDP),該框架克服了現有價值分解演算法的限制,能更好地連結局部觀察與UAV群體的全局狀態。結合QTRAN演算法與大型語言模型(LLM),並利用圖卷積網絡(GCNs)及自注意力機制,模擬結果顯示其收斂速度和任務完成率顯著提升,改進幅度超過10%。這個框架在UAV軌跡優化及邊緣計算場景中,展現了重要的進展。 PubMed DOI

這項研究提出了一種新方法,利用大型語言模型(LLMs)為機器人生成複雜的長期任務計畫。過去的研究多集中於簡單的任務規劃,動作指令通常不超過十個。新方法透過讓LLM主動收集資訊並進行問答,精煉任務計畫,並能識別和解決長期任務中的模糊性,增強計畫細節。研究以烹飪任務為例,實驗結果顯示,這種方法成功提升了任務計畫的資訊量,填補了長期機器人任務研究的空白。 PubMed DOI

LightVA 框架旨在透過整合大型語言模型 (LLM) 代理,簡化視覺分析過程,幫助分析師更有效地規劃和執行任務。其主要組成包括: 1. **任務提案與規劃**:將複雜任務分解為可管理的部分,提升組織與執行效率。 2. **數據建模與視覺化**:執行者負責生成視覺化圖表及數據分析。 3. **動態控制**:控制器協調規劃者與執行者的互動,隨任務變化調整複雜度。 4. **用戶互動**:提供任務流程圖和互動式視覺化面板,增強用戶控制感。 實際場景與專家研究顯示,LightVA 有潛力改善視覺分析工作流程,讓其更智能且友善於用戶。 PubMed DOI

大型語言模型(LLMs)已經在實驗室工作流程中帶來了顯著進展,特別是在化學研究的自主化方面。本報告介紹了ChemAgents,這是一個由多代理系統和Llama-3.1-70B LLM驅動的機器人AI化學家。ChemAgents能在少量人類介入下執行複雜實驗,並協調文獻閱讀、實驗設計、計算執行和機器人操作等四個專門代理。系統在六個實驗任務中展現了其有效性,並成功在新機器人化學實驗室中自主進行光催化反應,顯示出其可擴展性和適應性,為化學研究的自主化鋪平道路。 PubMed DOI

污水處理廠面臨運營挑戰,因為生物、化學和物理過程之間的複雜互動。傳統的建模方法在處理多樣化數據時常遇困難。大型語言模型(LLMs)提供了新解決方案,能整合數據、識別模式並改善決策過程。這篇文章探討如何利用多代理LLMs來提升污水處理廠的過程控制和決策能力,並透過污泥膨脹案例展示其優勢。儘管存在計算成本和AI決策風險,但可透過驗證和人類監督來解決。總之,多代理LLMs是污水處理廠運營中的關鍵創新。 PubMed DOI

這篇論文探討了一種新方法,利用AI生成內容(AIGC)模型自動化生成和審查熱力學模擬程式碼,特別針對LAMMPS軟體。提出的分子動力學代理(MDAgent)框架,透過大型語言模型簡化模擬程式的創建、執行和優化。為了微調模型,開發了針對LAMMPS的熱力學模擬程式碼數據集,專家評估顯示MDAgent顯著提升程式碼生成和審查效率,平均減少42.22%的任務時間,顯示其在材料科學中的應用潛力。 PubMed DOI