原始文章

最近的研究發現,將Transformer模型與條件策略結合,可以有效提升離線強化學習的表現。傳統強化學習是依序接收觀察,而Transformer則同時處理多個觀察,這可能影響特徵提取及決策的準確性。為了解決這些問題,我們利用預訓練模型的少量學習特性,並結合提示學習來改善即時政策調整。透過從離線數據中抽樣特定信息,我們能快速掌握任務特徵。實驗結果顯示,我們的方法在相關任務中表現優於基準,並提升了對新環境的泛化能力及決策的穩定性。 PubMed DOI


站上相關主題文章列表

整合生物醫學知識庫有助於醫學決策,提供統一索引系統和詳盡對齊。現有方法缺乏監督,需依賴基本匹配算法。神經嵌入模型有潛力,但需要標記數據。HiPrompt是一個利用大型語言模型進行少樣本推理的生物醫學知識融合框架,對KG-Hi-BKF數據集的實驗結果顯示有效性。 PubMed DOI

大型語言模型如ChatGPT在放射學領域有潛力,但成效需靠即時工程處理。不同提示策略可客製化模型回應,無需額外訓練。少樣本學習和嵌入式技術對提升聊天機器人輸出和透明度至關重要。在放射學等專業任務中,提示工程對LLMs利用至關重要,隨模型演進,零樣本學習等方法愈見重要。 PubMed DOI

研究發現,使用解凍的LLMs進行軟提示在GatorTron上表現最佳,勝過傳統微調和硬提示模型。當LLMs規模擴大時,凍結的LLMs也具競爭力,展現出良好少樣本學習和泛化能力。凍結模型不僅計算成本更低,還能跨機構應用。 PubMed DOI

LLMs在臨床應用上很強大,但缺乏標記數據。為了掌握臨床知識,需要進行上下文學習。研究評估了零-shot和少-shot臨床信息提取的提示工程技術。結果顯示,定制任務特定提示至關重要,而啟發式和集成提示也很有效。GPT-3.5表現最佳,並且集成方法有助於提升性能。這項研究為臨床自然語言處理的提示工程提供了重要的指導。 PubMed DOI

從生物醫學文獻中提取準確資訊相當複雜,因為這個領域跨學科且術語專業。早期的自然語言處理(NLP)方法常常無法掌握語言的細微差別,導致錯誤答案。隨著變壓器模型的出現,大型語言模型(LLMs)在問答任務中表現改善,但仍面臨挑戰,經常產生「幻覺」信息。我們的研究透過增強檢索架構來提升LLMs在生物醫學問答中的表現,並開發了問答機器人WeiseEule,強調用戶查詢信號的重要性,改善了回應的準確性和相關性。 PubMed DOI

在人機互動中,準確理解人類意圖對機器人執行任務非常重要。傳統方法需大量訓練來調整機器人行為,而本研究提出的ExTraCT框架,則利用自然語言來修改機器人的軌跡,無需為每個新場景重新訓練。ExTraCT將語言理解與軌跡修改分開,並利用大型語言模型進行語義對齊,提升了適應性和準確性。在模擬和實體機器人研究中,ExTraCT的表現優於基準方法,並提供更具可解釋性的結果,適用於多種人機互動應用。 PubMed DOI

這篇論文探討了將日文定語從句翻譯成中文的挑戰,特別是名詞語義角色對翻譯的影響。研究指出目前機器翻譯工具的局限性,並透過範例分析提出了一種經ChatGPT測試的三步驟提示鏈接策略,翻譯品質顯著提升,平均分數提高超過43%。結果強調語言學知識在設計提示時的重要性,對於提升複雜句子的翻譯準確性至關重要。這項研究不僅連結了語言學理論與機器翻譯,還為優化大型語言模型的提示及改善語言教育工具提供了新見解。 PubMed DOI

所提出的知識蒸餾增強行為轉換器(KD-BeT)框架,結合模仿學習和強化學習的優勢,旨在改善自駕車的行為決策。雖然強化學習在複雜環境中的推理能力較弱,但KD-BeT利用變壓器的上下文推理能力來增強決策。首先,透過模仿學習訓練教師模型,再利用知識蒸餾指導學生模型,提升強化學習的效率和性能。模擬結果顯示,KD-BeT在CARLA NoCrash基準測試中表現優異,特別在交通效率和駕駛安全性上超越其他方法,為解決自駕車挑戰提供了新思路。 PubMed DOI

這項研究提出了一種名為「GAPrompt」的新方法,旨在提升大型語言模型(LLMs)在自動化臨床評估中的應用,特別是針對電子健康紀錄(EHRs)中的中風評估。GAPrompt包含五個關鍵組件,包括選擇適合的LLM、建立增強知識庫、改善檢索、增強推理精確性及結合多重生成輸出。研究結果顯示,GAPrompt能有效分析EHRs並提供定量評估,解決傳統中風評估的勞動密集問題,顯示LLMs在醫療及其他領域的潛力。 PubMed DOI

S2ERS 技術旨在提升大型語言模型(LLMs)在迷宮環境中的空間推理能力,改善路徑規劃。它採用了三個關鍵策略:首先,透過圖結構提取,幫助 LLMs 理解空間關係,減少錯誤;其次,納入狀態-行動價值函數(Q),指導 LLM 的決策,避免陷入死胡同;最後,透過多步推理,動態插入局部 Q 表,讓 LLM 同時生成多個行動步驟。實驗顯示,S2ERS 顯著減少了空間幻覺問題,成功率和最佳率分別提高約 29% 和 19%。 PubMed DOI