原始文章

這篇論文提出了一個創新的多代理深度學習框架,專注於優化無人機(UAV)在去中心化環境中的軌跡。透過將問題設置為去中心化部分可觀察馬可夫決策過程(Dec-POMDP),該框架克服了現有價值分解演算法的限制,能更好地連結局部觀察與UAV群體的全局狀態。結合QTRAN演算法與大型語言模型(LLM),並利用圖卷積網絡(GCNs)及自注意力機制,模擬結果顯示其收斂速度和任務完成率顯著提升,改進幅度超過10%。這個框架在UAV軌跡優化及邊緣計算場景中,展現了重要的進展。 PubMed DOI


站上相關主題文章列表

大型語言模型對機器人任務規劃有幫助,但執行任務時有困難。提出多層模型,逐層分解任務以改善處理。視覺語言模型可幫助環境感知,整合任務目標與環境數據,進行精確運動規劃。語義對齊方法可增強任務可執行性。無人載具實驗驗證了此方法對應機器人任務規劃與執行的有效應對。 PubMed DOI

這篇論文介紹了DRARLCNN,一種結合了CNN和RL的機器學習模型,用於優化5G網路中的資源分配。它在效率和延遲方面優於現有方法,在測試中取得了令人印象深刻的成績。DRARLCNN為動態5G資源分配設定了新的基準,為未來在這個領域的研究鋪平了道路。 PubMed DOI

城市交通擁堵對經濟和環境造成挑戰,自適應交通信號控制(ATSC)成為解決方案之一。近期,深度強化學習(DRL)的進展提升了ATSC的效能。本文介紹了一種新型ATSC方法——序列決策變壓器(SDT),結合注意力機制與序列決策模型,專為城市交通管理設計。SDT模型在馬可夫決策過程框架下運作,顯示出縮短訓練時間、改善決策過程等優勢,並在合成場景中超越傳統方法,顯示出緩解城市擁堵的潛力。 PubMed DOI

這項研究提出了一個創新的框架,將大型語言模型LLAMA_V2整合進開放無線接取網路(O-RAN)系統,專注於高效的網路切片,滿足多樣化服務需求。透過物聯網設備的數據流,利用O-RAN的切片能力進行動態資源分配,並藉助LLAMA_V2的優化技能提升效能。LLAMA_V2能有效捕捉複雜的網路動態,表現優於傳統AI/ML模型。該框架在降低延遲、提高吞吐量和減少封包損失等關鍵指標上表現卓越,成為5G網路應用的寶貴解決方案。 PubMed DOI

大型語言模型(LLMs)如ChatGPT的發展,催生了能處理複雜任務的代理人,但這些代理人常面臨錯誤傳播和適應性不足的挑戰。為了解決這些問題,我們提出了「任務分解與代理生成」(TDAG)框架,將複雜任務拆解為小子任務,並分配給專門的子代理,以提升適應性。 此外,我們推出了ItineraryBench基準測試,專注於旅行規劃,評估代理人在記憶、規劃和工具使用等方面的能力。實驗結果顯示,TDAG在處理複雜任務時的表現顯著優於現有基準,展現出更強的適應性和情境意識。 PubMed DOI

這項研究提出了一種新方法,利用大型語言模型(LLMs)為機器人生成複雜的長期任務計畫。過去的研究多集中於簡單的任務規劃,動作指令通常不超過十個。新方法透過讓LLM主動收集資訊並進行問答,精煉任務計畫,並能識別和解決長期任務中的模糊性,增強計畫細節。研究以烹飪任務為例,實驗結果顯示,這種方法成功提升了任務計畫的資訊量,填補了長期機器人任務研究的空白。 PubMed DOI

這項工作介紹了一個名為 Voice in Head (ViH) 的新框架,利用大型語言模型 (LLMs) 和語意理解來提升機器人的導航與互動能力。系統結合了 GPT 和 Gemini LLMs,並透過強化學習 (RL) 進行持續學習。它還具備由 Azure AI Search 支持的語意搜尋功能,讓使用者能用自然語言互動。為了確保安全性,系統內建人類反饋的強化學習 (RLHF) 元件。ViH 框架成功率高達 94.54%,顯示出在認知機器人技術上的重大進展。 PubMed DOI

這份調查探討大型語言模型(LLMs)與強化學習(RL)的整合,強調它們在多任務學習、樣本效率和高層次任務規劃等方面的潛力。作者將LLMs在RL中的角色分為四個功能:資訊處理者、獎勵設計者、決策者和生成器,並針對每個角色提出方法論和未來研究方向。這份調查旨在澄清研究領域,並提供框架,應用於機器人、自動駕駛和能源系統等領域,並討論LLMs增強RL的潛在應用與挑戰。 PubMed DOI

LightVA 框架旨在透過整合大型語言模型 (LLM) 代理,簡化視覺分析過程,幫助分析師更有效地規劃和執行任務。其主要組成包括: 1. **任務提案與規劃**:將複雜任務分解為可管理的部分,提升組織與執行效率。 2. **數據建模與視覺化**:執行者負責生成視覺化圖表及數據分析。 3. **動態控制**:控制器協調規劃者與執行者的互動,隨任務變化調整複雜度。 4. **用戶互動**:提供任務流程圖和互動式視覺化面板,增強用戶控制感。 實際場景與專家研究顯示,LightVA 有潛力改善視覺分析工作流程,讓其更智能且友善於用戶。 PubMed DOI

污水處理廠面臨運營挑戰,因為生物、化學和物理過程之間的複雜互動。傳統的建模方法在處理多樣化數據時常遇困難。大型語言模型(LLMs)提供了新解決方案,能整合數據、識別模式並改善決策過程。這篇文章探討如何利用多代理LLMs來提升污水處理廠的過程控制和決策能力,並透過污泥膨脹案例展示其優勢。儘管存在計算成本和AI決策風險,但可透過驗證和人類監督來解決。總之,多代理LLMs是污水處理廠運營中的關鍵創新。 PubMed DOI