LOGIC: LLM-originated guidance for internal cognitive improvement of small language models in stance detection.
LOGIC: LLM起源的指導，用於小型語言模型在立場檢測中的內部認知改進。 PeerJ Comput Sci 2024-12-09

立場檢測是自然語言處理中的關鍵任務，能識別作者對特定議題的觀點，對社會科學研究及應用相當重要。傳統方法多依賴維基百科數據，但因文章質量不一，效果不穩定。為解決此問題，我們利用大型語言模型（LLMs）進行立場檢測，並提出推理蒸餾方法，將LLMs的推理能力轉移至更小型的語言模型（SLMs），提升效率而不影響性能。我們的LOGIC模型在VAST數據集上表現優異，超越了GPT-3.5 Turbo和GPT-4 Turbo等先進模型。 PubMed DOI

Enhancing the Travel Experience for People with Visual Impairments through Multimodal Interaction: NaviGPT, A Real-Time AI-Driven Mobile Navigation System.
透過多模態互動提升視障人士的旅行體驗：NaviGPT，一個即時AI驅動的移動導航系統。 GROUP ACM SIGCHI Int Conf Support Group Work 2025-01-14

NaviGPT是一個創新的導航系統，專為視覺障礙者設計，結合了LiDAR障礙物檢測、震動反饋和大型語言模型（LLMs）。與傳統解決方案需切換多個應用不同，NaviGPT提供即時的環境資訊，簡化使用者體驗，讓導航更有效率和直觀。此外，透過位置和感測器數據，NaviGPT能解決回應延遲問題，確保在各種環境中提供即時支援。 PubMed DOI

DynamicVLN: Incorporating Dynamics into Vision-and-Language Navigation Scenarios.
DynamicVLN: 將動態納入視覺與語言導航場景。 Sensors (Basel) 2025-01-25

動態視覺與語言導航（DynamicVLN）任務旨在改善傳統的視覺與語言導航（VLN），融入了如車輛移動、交通信號、行人活動和天氣變化等動態因素。這項新任務要求代理不僅要遵循指示，還需在面對突發事件時展現推理和適應能力。為此，研究者創建了十個動態導航場景，並利用CARLA模擬器和大型語言模型建立了包含11,261個實例的數據集，提供真實的訓練環境，並引入基準模型以提升導航能力，目標是開發能在複雜環境中運作的強大代理。 PubMed DOI

Enhancement of long-horizon task planning via active and passive modification in large language models.
透過主動與被動修改增強大型語言模型的長期任務規劃。 Sci Rep 2025-02-27

這項研究提出了一種新方法，利用大型語言模型（LLMs）為機器人生成複雜的長期任務計畫。過去的研究多集中於簡單的任務規劃，動作指令通常不超過十個。新方法透過讓LLM主動收集資訊並進行問答，精煉任務計畫，並能識別和解決長期任務中的模糊性，增強計畫細節。研究以烹飪任務為例，實驗結果顯示，這種方法成功提升了任務計畫的資訊量，填補了長期機器人任務研究的空白。 PubMed DOI

A novel voice in head actor critic reinforcement learning with human feedback framework for enhanced robot navigation.
一種新穎的頭腦聲音演員評論家強化學習框架，結合人類反饋以增強機器人導航。 Sci Rep 2025-02-28

這項工作介紹了一個名為 Voice in Head (ViH) 的新框架，利用大型語言模型 (LLMs) 和語意理解來提升機器人的導航與互動能力。系統結合了 GPT 和 Gemini LLMs，並透過強化學習 (RL) 進行持續學習。它還具備由 Azure AI Search 支持的語意搜尋功能，讓使用者能用自然語言互動。為了確保安全性，系統內建人類反饋的強化學習 (RLHF) 元件。ViH 框架成功率高達 94.54%，顯示出在認知機器人技術上的重大進展。 PubMed DOI

Survey on Large Language Model-Enhanced Reinforcement Learning: Concept, Taxonomy, and Methods.
大型語言模型增強強化學習的調查：概念、分類法與方法。 IEEE Trans Neural Netw Learn Syst 2025-03-03

這份調查探討大型語言模型（LLMs）與強化學習（RL）的整合，強調它們在多任務學習、樣本效率和高層次任務規劃等方面的潛力。作者將LLMs在RL中的角色分為四個功能：資訊處理者、獎勵設計者、決策者和生成器，並針對每個角色提出方法論和未來研究方向。這份調查旨在澄清研究領域，並提供框架，應用於機器人、自動駕駛和能源系統等領域，並討論LLMs增強RL的潛在應用與挑戰。 PubMed DOI

Mitigating spatial hallucination in large language models for path planning via prompt engineering.
透過提示工程減輕大型語言模型在路徑規劃中的空間幻覺。 Sci Rep 2025-03-15

S2ERS 技術旨在提升大型語言模型（LLMs）在迷宮環境中的空間推理能力，改善路徑規劃。它採用了三個關鍵策略：首先，透過圖結構提取，幫助 LLMs 理解空間關係，減少錯誤；其次，納入狀態-行動價值函數（Q），指導 LLM 的決策，避免陷入死胡同；最後，透過多步推理，動態插入局部 Q 表，讓 LLM 同時生成多個行動步驟。實驗顯示，S2ERS 顯著減少了空間幻覺問題，成功率和最佳率分別提高約 29% 和 19%。 PubMed DOI

Chain of Thought Strategy for Smaller LLMs for Medical Reasoning.
用於醫學推理之較小型LLM的Chain of Thought策略 Stud Health Technol Inform 2025-05-17

這篇論文發現，用 Chain of Thought（CoT）提示法能讓小型語言模型在醫學問答上表現更好、更透明，特別是在 PubMedQA 資料集上效果明顯。CoT 幫助模型逐步推理，提升準確度和可解釋性。不過，遇到很專業的題目還是有困難。若結合檢索增強生成等技術，小型模型未來有機會追上大型模型。 PubMed DOI

Rethinking VLMs and LLMs for image classification.
重新思考 VLMs 與 LLMs 在影像分類上的應用 Sci Rep 2025-06-04

作者發現，單純的VLMs在影像分類上表現比結合LLMs還好，但LLMs在需要推理或外部知識時有優勢。為此，他們提出一個輕量級的LLM router，能自動分配任務給最適合的模型。這方法用超過250萬組資料訓練，效果不輸GPT-4V等先進系統，且成本更低。 PubMed DOI

Chain-of-Situation Aware Progressive Inference Learning.
情境鏈結感知的漸進式推論學習 IEEE Trans Neural Netw Learn Syst 2025-06-12

這篇論文提出 CoS-PIL，一個輕量級影像情境辨識框架，不用微調大型多模態語言模型，只靠設計好的提示語和逐步推理流程，預測影像中的動詞、名詞和角色。它還用 chain-of-interest predictor 萃取關鍵資訊，提升辨識準確率。實驗結果在 SWiG 基準上表現優於現有方法。程式碼已開源。 PubMed DOI

原始文章

站上相關主題文章列表