LOGIC: LLM-originated guidance for internal cognitive improvement of small language models in stance detection.
LOGIC: LLM起源的指導,用於小型語言模型在立場檢測中的內部認知改進。
PeerJ Comput Sci 2024-12-09
A novel voice in head actor critic reinforcement learning with human feedback framework for enhanced robot navigation.
一種新穎的頭腦聲音演員評論家強化學習框架,結合人類反饋以增強機器人導航。
Sci Rep 2025-02-28
這項工作介紹了一個名為 Voice in Head (ViH) 的新框架,利用大型語言模型 (LLMs) 和語意理解來提升機器人的導航與互動能力。系統結合了 GPT 和 Gemini LLMs,並透過強化學習 (RL) 進行持續學習。它還具備由 Azure AI Search 支持的語意搜尋功能,讓使用者能用自然語言互動。為了確保安全性,系統內建人類反饋的強化學習 (RLHF) 元件。ViH 框架成功率高達 94.54%,顯示出在認知機器人技術上的重大進展。
PubMedDOI
Survey on Large Language Model-Enhanced Reinforcement Learning: Concept, Taxonomy, and Methods.
大型語言模型增強強化學習的調查:概念、分類法與方法。
IEEE Trans Neural Netw Learn Syst 2025-03-03