Enhancing Robot Task Planning and Execution through Multi-Layer Large Language Models.
透過多層大型語言模型增強機器人任務規劃和執行。 Sensors (Basel) 2024-03-15

大型語言模型對機器人任務規劃有幫助，但執行任務時有困難。提出多層模型，逐層分解任務以改善處理。視覺語言模型可幫助環境感知，整合任務目標與環境數據，進行精確運動規劃。語義對齊方法可增強任務可執行性。無人載具實驗驗證了此方法對應機器人任務規劃與執行的有效應對。 PubMed DOI

Dynamic resource allocation in 5G networks using hybrid RL-CNN model for optimized latency and quality of service.
在 5G 網路中使用混合 RL-CNN 模型進行動態資源分配，以優化延遲和服務品質。 Network 2024-04-10

這篇論文介紹了DRARLCNN，一種結合了CNN和RL的機器學習模型，用於優化5G網路中的資源分配。它在效率和延遲方面優於現有方法，在測試中取得了令人印象深刻的成績。DRARLCNN為動態5G資源分配設定了新的基準，為未來在這個領域的研究鋪平了道路。 PubMed DOI

Sequence Decision Transformer for Adaptive Traffic Signal Control.
自適應交通信號控制的序列決策變壓器 Sensors (Basel) 2024-10-16

城市交通擁堵對經濟和環境造成挑戰，自適應交通信號控制（ATSC）成為解決方案之一。近期，深度強化學習（DRL）的進展提升了ATSC的效能。本文介紹了一種新型ATSC方法——序列決策變壓器（SDT），結合注意力機制與序列決策模型，專為城市交通管理設計。SDT模型在馬可夫決策過程框架下運作，顯示出縮短訓練時間、改善決策過程等優勢，並在合成場景中超越傳統方法，顯示出緩解城市擁堵的潛力。 PubMed DOI

Optimizing Open Radio Access Network Systems with LLAMA V2 for Enhanced Mobile Broadband, Ultra-Reliable Low-Latency Communications, and Massive Machine-Type Communications: A Framework for Efficient Network Slicing and Real-Time Resource Allocation.
使用 LLAMA V2 優化開放無線接入網絡系統，以增強行動寬頻、超可靠低延遲通信及大規模機器類型通信：高效網絡切片和即時資源分配的框架。 Sensors (Basel) 2024-11-09

這項研究提出了一個創新的框架，將大型語言模型LLAMA_V2整合進開放無線接取網路（O-RAN）系統，專注於高效的網路切片，滿足多樣化服務需求。透過物聯網設備的數據流，利用O-RAN的切片能力進行動態資源分配，並藉助LLAMA_V2的優化技能提升效能。LLAMA_V2能有效捕捉複雜的網路動態，表現優於傳統AI/ML模型。該框架在降低延遲、提高吞吐量和減少封包損失等關鍵指標上表現卓越，成為5G網路應用的寶貴解決方案。 PubMed DOI

TDAG: A multi-agent framework based on dynamic Task Decomposition and Agent Generation.
TDAG：一個基於動態任務分解和代理生成的多代理框架。 Neural Netw 2025-02-04

大型語言模型（LLMs）如ChatGPT的發展，催生了能處理複雜任務的代理人，但這些代理人常面臨錯誤傳播和適應性不足的挑戰。為了解決這些問題，我們提出了「任務分解與代理生成」（TDAG）框架，將複雜任務拆解為小子任務，並分配給專門的子代理，以提升適應性。此外，我們推出了ItineraryBench基準測試，專注於旅行規劃，評估代理人在記憶、規劃和工具使用等方面的能力。實驗結果顯示，TDAG在處理複雜任務時的表現顯著優於現有基準，展現出更強的適應性和情境意識。 PubMed DOI

Enhancement of long-horizon task planning via active and passive modification in large language models.
透過主動與被動修改增強大型語言模型的長期任務規劃。 Sci Rep 2025-02-27

這項研究提出了一種新方法，利用大型語言模型（LLMs）為機器人生成複雜的長期任務計畫。過去的研究多集中於簡單的任務規劃，動作指令通常不超過十個。新方法透過讓LLM主動收集資訊並進行問答，精煉任務計畫，並能識別和解決長期任務中的模糊性，增強計畫細節。研究以烹飪任務為例，實驗結果顯示，這種方法成功提升了任務計畫的資訊量，填補了長期機器人任務研究的空白。 PubMed DOI

A novel voice in head actor critic reinforcement learning with human feedback framework for enhanced robot navigation.
一種新穎的頭腦聲音演員評論家強化學習框架，結合人類反饋以增強機器人導航。 Sci Rep 2025-02-28

這項工作介紹了一個名為 Voice in Head (ViH) 的新框架，利用大型語言模型 (LLMs) 和語意理解來提升機器人的導航與互動能力。系統結合了 GPT 和 Gemini LLMs，並透過強化學習 (RL) 進行持續學習。它還具備由 Azure AI Search 支持的語意搜尋功能，讓使用者能用自然語言互動。為了確保安全性，系統內建人類反饋的強化學習 (RLHF) 元件。ViH 框架成功率高達 94.54%，顯示出在認知機器人技術上的重大進展。 PubMed DOI

Survey on Large Language Model-Enhanced Reinforcement Learning: Concept, Taxonomy, and Methods.
大型語言模型增強強化學習的調查：概念、分類法與方法。 IEEE Trans Neural Netw Learn Syst 2025-03-03

這份調查探討大型語言模型（LLMs）與強化學習（RL）的整合，強調它們在多任務學習、樣本效率和高層次任務規劃等方面的潛力。作者將LLMs在RL中的角色分為四個功能：資訊處理者、獎勵設計者、決策者和生成器，並針對每個角色提出方法論和未來研究方向。這份調查旨在澄清研究領域，並提供框架，應用於機器人、自動駕駛和能源系統等領域，並討論LLMs增強RL的潛在應用與挑戰。 PubMed DOI

LightVA: Lightweight Visual Analytics with LLM Agent-Based Task Planning and Execution.
LightVA：輕量級視覺分析與 LLM 代理基礎的任務規劃與執行。 IEEE Trans Vis Comput Graph 2025-03-03

LightVA 框架旨在透過整合大型語言模型 (LLM) 代理，簡化視覺分析過程，幫助分析師更有效地規劃和執行任務。其主要組成包括： 1. **任務提案與規劃**：將複雜任務分解為可管理的部分，提升組織與執行效率。 2. **數據建模與視覺化**：執行者負責生成視覺化圖表及數據分析。 3. **動態控制**：控制器協調規劃者與執行者的互動，隨任務變化調整複雜度。 4. **用戶互動**：提供任務流程圖和互動式視覺化面板，增強用戶控制感。實際場景與專家研究顯示，LightVA 有潛力改善視覺分析工作流程，讓其更智能且友善於用戶。 PubMed DOI

Multi-Agent Large Language Model Frameworks: Unlocking New Possibilities for Optimizing Wastewater Treatment Operation.
多代理大型語言模型框架：開啟優化廢水處理操作的新可能性。 Environ Res 2025-03-16

污水處理廠面臨運營挑戰，因為生物、化學和物理過程之間的複雜互動。傳統的建模方法在處理多樣化數據時常遇困難。大型語言模型（LLMs）提供了新解決方案，能整合數據、識別模式並改善決策過程。這篇文章探討如何利用多代理LLMs來提升污水處理廠的過程控制和決策能力，並透過污泥膨脹案例展示其優勢。儘管存在計算成本和AI決策風險，但可透過驗證和人類監督來解決。總之，多代理LLMs是污水處理廠運營中的關鍵創新。 PubMed DOI

原始文章

站上相關主題文章列表