Using large language models to accelerate communication for eye gaze typing users with ALS.
使用大型語言模型加速ALS患者的眼球注視打字溝通。 Nat Commun 2024-11-02

這篇論文介紹了SpeakFaster，一個創新的輔助與替代溝通（AAC）介面，利用大型語言模型（LLMs）來提升文字輸入效率。使用者可以以簡化方式輸入文字，減少57%的動作需求，這在離線模擬中得到證實。針對19位非AAC參與者的初步研究顯示，打字速度影響不大。對兩位因肌萎縮側索硬化症的用戶進行的測試顯示，文字輸入速度提升29%至60%。這些結果顯示LLM在AAC及其他介面中的應用前景廣闊。 PubMed DOI

Child-Centric Robot Dialogue Systems: Fine-Tuning Large Language Models for Better Utterance Understanding and Interaction.
以兒童為中心的機器人對話系統：微調大型語言模型以改善語句理解和互動。 Sensors (Basel) 2025-01-08

這個對話系統的目的是改善機器人與孩子的互動，透過更好地理解孩子獨特的語言特徵，如不完整句子和發音錯誤。現有的大型語言模型在解讀孩子意圖時不如人類準確，因此系統採用微調方法，利用人類對孩子回應的判斷差異來訓練。這樣一來，系統能更自然地理解孩子的語言，並進行適應性的對話。其有效性透過機器人社交屬性量表和合理性指標進行評估，顯示能理解並回應孩子的話語。 PubMed DOI

Humanoid robot learning of complex behaviors with LLMs.
使用大型語言模型 (LLMs) 的類人機器人複雜行為學習。 Sci Robot 2025-01-22

大型語言模型（LLMs）與人形機器人的結合，能顯著提升機器人透過自然互動學習的能力。首先，LLMs幫助機器人理解人類語言，促進更流暢的互動。其次，機器人能透過對話學習情境行為，並根據反饋調整行動。此外，LLMs提供社交知識，幫助機器人理解情感與社交規範。它們還能作為知識庫，讓機器人動態學習新概念。最後，透過模擬與角色扮演，機器人能在安全環境中練習複雜的社交互動。 PubMed DOI

LLMER: Crafting Interactive Extended Reality Worlds with JSON Data Generated by Large Language Models.
LLMER：利用大型語言模型生成的 JSON 數據創建互動擴展現實世界。 IEEE Trans Vis Comput Graph 2025-03-10

大型語言模型（LLMs）如GPT-4與擴增實境（XR）技術結合，能創造沉浸式環境，並透過自然語言與使用者互動。不過，XR環境的複雜性使得提取上下文數據變得困難，導致成本上升和錯誤產生。為了解決這些問題，我們推出了LLMER框架，利用LLMs生成的JSON數據來構建互動式XR世界。LLMER能有效減少應用崩潰和延遲，初步研究顯示其令牌消耗減少超過80%，任務完成時間減少約60%。使用者反饋也指出了優化的空間。 PubMed DOI

Large Language Model-Driven 3D Hyper-Realistic Interactive Intelligent Digital Human System.
大型語言模型驅動的3D超擬真互動智慧數位人系統 Sensors (Basel) 2025-04-28

這篇論文介紹一套得獎的3D超擬真互動數位人系統，採用模組化客戶端-伺服器架構，結合LLM、語音辨識、自然語言處理和情感TTS技術。透過電腦圖學和AI，打造擬真3D虛擬人，目標是革新數位內容的製作和應用方式，並探討未來發展潛力。 PubMed DOI

LLM-based robot personality simulation and cognitive system.
基於LLM的機器人個性模擬與認知系統 Sci Rep 2025-05-16

這項研究開發出一套結合 ChatGPT-4 的認知型機器人架構，能模擬人類個性、情緒、動機、注意力和記憶。機器人可處理文字和影像，並根據設定的個性回應，還能用文件嵌入技術實現長期記憶。個性模擬參考心理學理論，並用 Big Five 測驗驗證。Mobi 機器人展現出先進的心智理論，能靈活應對社交互動，對話自然又有意圖。 PubMed DOI

Embodied large language models enable robots to complete complex tasks in unpredictable environments.
具身大型語言模型使機器人在不可預測環境中完成複雜任務 Nat Mach Intell 2025-05-20

研究團隊開發的 ELLMER 機器人架構，結合 GPT-4 和檢索增強生成技術，讓機器人能適應變化多端的環境，執行像泡咖啡、擺盤等多步驟任務。透過力覺和視覺回饋，機器人的智慧和適應力大幅提升。 PubMed DOI

The Multi-Agentization of a Dual-Arm Nursing Robot Based on Large Language Models.
基於大型語言模型的雙臂護理機器人多智能體化 Bioengineering (Basel) 2025-05-28

**重點摘要：** 這項研究把護理機器人的每隻手臂都當作獨立的代理人，並結合幾何限制和大型語言模型，讓機器人能更好地協調動作、規劃任務，進而提升護理工作的效率和準確性，讓護理照護變得更有效率也更到位。 PubMed DOI

A Multimodal Large Language Model Framework for Intelligent Perception and Decision-Making in Smart Manufacturing.
智慧製造中用於智能感知與決策的多模態大型語言模型框架 Sensors (Basel) 2025-05-28

這篇論文提出一套多模態系統，能整合影像、感測器數據和生產紀錄，並結合大型語言模型。系統有統一資料格式、動態分詞和強大跨模態對齊能力，採用兩階段訓練。新開發的Transformer模型同時支援影像和文字生成，提升即時決策。實驗證明，這方法在影像-文字檢索和視覺問答等任務表現優異，對智慧製造和異常偵測等應用很有幫助。 PubMed DOI

From text to motion: grounding GPT-4 in a humanoid robot "Alter3".
從文字到動作：將 GPT-4 應用於人形機器人「Alter3」 Front Robot AI 2025-06-11

這篇論文介紹了仿人型機器人Alter3，結合GPT-4後，能把語言指令直接轉換成動作。只要少量範例，機器人就能學新姿勢，還能根據語言回饋調整行為，展現語言理解與機器人控制的重大進展。 PubMed DOI

原始文章

站上相關主題文章列表