Exploring a GPT-based large language model for variable autonomy in a VR-based human-robot teaming simulation.
探索基於GPT的大型語言模型在基於VR的人機協作模擬中的可變自主性。 Front Robot AI 2024-04-18

這篇論文探討了在人機合作環境中運用大型語言模型（LLMs）如GPT進行口語溝通的方法。介紹了一個以GPT為核心的機器人代理在Unity VR環境中的模擬框架。透過12位參與者的使用者研究，探討了GPT-4在多機器人環境中的效用。研究結果顯示，使用者可能對與機器人互動有先入為主的看法，但透過自然語言溝通的探索，可以帶來更有效的互動。同時提供了寶貴的教訓和未來研究的建議。 PubMed DOI

Incremental learning of humanoid robot behavior from natural interaction and large language models.
從自然互動和大型語言模型中增量學習人形機器人行為。 Front Robot AI 2024-10-25

這篇論文提出一個系統，透過自然語言對話提升人機互動，讓機器人能夠從經驗中學習。系統利用大型語言模型（LLMs）協調機器人行為，生成Python程式碼來控制動作和感知，這些程式碼根據人類指令和環境反饋生成。當LLM誤解指令時，會調用另一個專注於改善程式碼的LLM來學習錯誤。改進的互動會儲存於機器人記憶中，未來能更好處理類似請求。該系統已整合進人形機器人ARMAR-6，並透過模擬和實測評估其有效性，顯示機器人能夠逐步學習並應用知識。 PubMed DOI

Enhancing intention prediction and interpretability in service robots with LLM and KG.
利用大型語言模型和知識圖譜提升服務機器人的意圖預測和可解釋性。 Sci Rep 2024-11-06

隨著人工智慧的快速進步，服務機器人在日常生活中越來越普遍，這要求它們能準確識別人類意圖。現有方法在複雜環境中常常無法達標。為了解決這個問題，我們提出了一個基於大型語言模型和知識圖譜的意圖識別框架（LKIRF）。這個框架結合了大型語言模型和知識圖譜，提升了服務機器人的意圖識別能力。實驗結果顯示，LKIRF在各種場景中的預測準確性超越傳統方法，並增強了意圖推理的透明度和可解釋性。 PubMed DOI

Enhancing the Travel Experience for People with Visual Impairments through Multimodal Interaction: NaviGPT, A Real-Time AI-Driven Mobile Navigation System.
透過多模態互動提升視障人士的旅行體驗：NaviGPT，一個即時AI驅動的移動導航系統。 GROUP ACM SIGCHI Int Conf Support Group Work 2025-01-14

NaviGPT是一個創新的導航系統，專為視覺障礙者設計，結合了LiDAR障礙物檢測、震動反饋和大型語言模型（LLMs）。與傳統解決方案需切換多個應用不同，NaviGPT提供即時的環境資訊，簡化使用者體驗，讓導航更有效率和直觀。此外，透過位置和感測器數據，NaviGPT能解決回應延遲問題，確保在各種環境中提供即時支援。 PubMed DOI

Humanoid robot learning of complex behaviors with LLMs.
使用大型語言模型 (LLMs) 的類人機器人複雜行為學習。 Sci Robot 2025-01-22

大型語言模型（LLMs）與人形機器人的結合，能顯著提升機器人透過自然互動學習的能力。首先，LLMs幫助機器人理解人類語言，促進更流暢的互動。其次，機器人能透過對話學習情境行為，並根據反饋調整行動。此外，LLMs提供社交知識，幫助機器人理解情感與社交規範。它們還能作為知識庫，讓機器人動態學習新概念。最後，透過模擬與角色扮演，機器人能在安全環境中練習複雜的社交互動。 PubMed DOI

Enhancement of long-horizon task planning via active and passive modification in large language models.
透過主動與被動修改增強大型語言模型的長期任務規劃。 Sci Rep 2025-02-27

這項研究提出了一種新方法，利用大型語言模型（LLMs）為機器人生成複雜的長期任務計畫。過去的研究多集中於簡單的任務規劃，動作指令通常不超過十個。新方法透過讓LLM主動收集資訊並進行問答，精煉任務計畫，並能識別和解決長期任務中的模糊性，增強計畫細節。研究以烹飪任務為例，實驗結果顯示，這種方法成功提升了任務計畫的資訊量，填補了長期機器人任務研究的空白。 PubMed DOI

Survey on Large Language Model-Enhanced Reinforcement Learning: Concept, Taxonomy, and Methods.
大型語言模型增強強化學習的調查：概念、分類法與方法。 IEEE Trans Neural Netw Learn Syst 2025-03-03

這份調查探討大型語言模型（LLMs）與強化學習（RL）的整合，強調它們在多任務學習、樣本效率和高層次任務規劃等方面的潛力。作者將LLMs在RL中的角色分為四個功能：資訊處理者、獎勵設計者、決策者和生成器，並針對每個角色提出方法論和未來研究方向。這份調查旨在澄清研究領域，並提供框架，應用於機器人、自動駕駛和能源系統等領域，並討論LLMs增強RL的潛在應用與挑戰。 PubMed DOI

Next Generation XR Systems-Large Language Models Meet Augmented and Virtual Reality.
下一代 XR 系統 - 大型語言模型與擴增實境及虛擬實境的結合。 IEEE Comput Graph Appl 2025-03-06

這篇文件探討擴增實境（XR）的快速發展，並強調大型語言模型（LLMs）整合進XR系統的潛力。它提出三個主要支柱：感知與情境意識、知識建模與推理，以及視覺化與互動。這種整合在神經康復、安全訓練和建築設計等領域具有顯著好處，同時也需考量隱私、透明度和包容性等倫理問題。文件鼓勵進一步研究，目的是創造更智能且以使用者為中心的XR系統。 PubMed DOI

NavCoT: Boosting LLM-Based Vision-and-Language Navigation via Learning Disentangled Reasoning.
NavCoT: 透過學習解耦推理提升基於大型語言模型的視覺與語言導航。 IEEE Trans Pattern Anal Mach Intell 2025-03-25

這篇論文介紹了一種新策略，稱為導航思維鏈（NavCoT），旨在提升大型語言模型（LLMs）在視覺與語言導航（VLN）中的表現。由於訓練數據與VLN任務之間的差距，LLMs常面臨挑戰。NavCoT透過領域內訓練，幫助LLM進行自我引導的導航決策，包含三個步驟：想像觀察結果、選擇最匹配的結果、決定行動。實驗顯示，NavCoT在多個VLN基準測試中表現優於傳統方法，並在R2R數據集上實現7%的提升。研究代碼已在GitHub公開。 PubMed DOI

Artificial intelligence orchestration for text-based ultrasonic simulation via self-review by multi-large language model agents.
多大型語言模型代理自我審查的文本基超聲模擬之人工智慧編排。 Sci Rep 2025-04-11

這項研究提出了一種新型的文本基礎超聲模擬控制系統，旨在簡化使用者體驗並縮短配置時間。透過大型語言模型（LLM）和地面人工智慧（AI）技術，系統將SimNDT的功能模組化，讓使用者能用自然語言下指令。報導指出，這項創新能將模擬設置時間縮短約75%。此外，結合自我檢查和多個LLM代理的協作，顯著降低了場景生成的錯誤率，從23.89%降至1.48%。整體而言，這種方法展示了AI在提升模擬系統效率和可靠性方面的潛力，特別適用於快速變化的數位雙胞胎系統。 PubMed DOI

原始文章

站上相關主題文章列表