城市交通擁堵對經濟和環境造成挑戰,自適應交通信號控制(ATSC)成為解決方案之一。近期,深度強化學習(DRL)的進展提升了ATSC的效能。本文介紹了一種新型ATSC方法——序列決策變壓器(SDT),結合注意力機制與序列決策模型,專為城市交通管理設計。SDT模型在馬可夫決策過程框架下運作,顯示出縮短訓練時間、改善決策過程等優勢,並在合成場景中超越傳統方法,顯示出緩解城市擁堵的潛力。 PubMed DOI ♡
這篇論文提出了一個雙流交叉AGFormer-GPT網路,用於交通流預測,整合了交通佔有率和速度提示以提高準確性。該模型結合了適應性圖神經網路和大型語言模型的優勢,有效捕捉空間和時間相關性。實驗結果顯示,在兩個道路網路數據集上,預測準確性提高了1.2%。 PubMed DOI
這篇評論針對地震區域的交通策略,旨在幫助城市規劃者和政策制定者。文章探討了如何加強規劃和管理緊急需求,評估地震對交通系統的影響,以制定準備、減災、應對和恢復的策略。選擇的方法受到交通系統、城市化程度和建成環境等因素影響。此外,文章介紹了一種名為ALARM的新方法,利用大型語言模型(如OPEN-AI DAVINCI-003)進行全面評論,顯示人工智慧與人類在信息分析上的合作潛力。 PubMed DOI
這篇論文提出一種新方法,利用大型語言模型(LLMs)、AI代理和開放地理數據,提升城市騎乘安全。方法包括分析城市風險和現有騎乘設施的數據,並透過數據預處理和提示工程,創建友好的系統,提供騎乘安全見解。過程分為數據準備、代理協調和決策執行三步,確保開源工具有效整合,促進城市規劃者和騎士的可及性。研究顯示結合LLMs和AI代理的潛力,能改善騎乘實踐和城市交通規劃。 PubMed DOI
SafeMod是一個新框架,旨在提升自動駕駛的安全性,透過改善複雜環境中的決策和情境管理。它克服了傳統方法的局限,採用雙向規劃結構,包括前向和後向規劃。前向規劃利用大型語言模型預測周圍行為,生成行動預測,並由基於變壓器的規劃器處理,結合文本和影像數據創建駕駛軌跡。後向規劃則透過強化學習精煉這些軌跡,選擇最佳行動。實驗結果顯示,SafeMod在安全性和決策能力上優於其他系統,顯示其在自動駕駛中的潛力。 PubMed DOI
這篇論文提出了一個創新的多代理深度學習框架,專注於優化無人機(UAV)在去中心化環境中的軌跡。透過將問題設置為去中心化部分可觀察馬可夫決策過程(Dec-POMDP),該框架克服了現有價值分解演算法的限制,能更好地連結局部觀察與UAV群體的全局狀態。結合QTRAN演算法與大型語言模型(LLM),並利用圖卷積網絡(GCNs)及自注意力機制,模擬結果顯示其收斂速度和任務完成率顯著提升,改進幅度超過10%。這個框架在UAV軌跡優化及邊緣計算場景中,展現了重要的進展。 PubMed DOI
所提出的知識蒸餾增強行為轉換器(KD-BeT)框架,結合模仿學習和強化學習的優勢,旨在改善自駕車的行為決策。雖然強化學習在複雜環境中的推理能力較弱,但KD-BeT利用變壓器的上下文推理能力來增強決策。首先,透過模仿學習訓練教師模型,再利用知識蒸餾指導學生模型,提升強化學習的效率和性能。模擬結果顯示,KD-BeT在CARLA NoCrash基準測試中表現優異,特別在交通效率和駕駛安全性上超越其他方法,為解決自駕車挑戰提供了新思路。 PubMed DOI
這項研究首次探討大型語言模型(LLMs)在環境決策中的應用,分析其潛在優勢與限制。研究提出兩個框架:一是LLMs輔助的框架,增強人類專業知識;二是LLMs驅動的框架,自動化優化任務。透過水工程中PFAS控制的案例,顯示這兩個框架在環境決策中的優化效果。結果顯示,LLMs輔助框架在調節流量和改善PFAS攔截上表現良好,而LLMs驅動框架在複雜參數優化上則面臨挑戰。研究強調人工智慧應輔助而非取代人類專業知識,為未來的合作奠定基礎。 PubMed DOI
最近的研究發現,將Transformer模型與條件策略結合,可以有效提升離線強化學習的表現。傳統強化學習是依序接收觀察,而Transformer則同時處理多個觀察,這可能影響特徵提取及決策的準確性。為了解決這些問題,我們利用預訓練模型的少量學習特性,並結合提示學習來改善即時政策調整。透過從離線數據中抽樣特定信息,我們能快速掌握任務特徵。實驗結果顯示,我們的方法在相關任務中表現優於基準,並提升了對新環境的泛化能力及決策的穩定性。 PubMed DOI
大型語言模型(LLMs)如ChatGPT的發展,催生了能處理複雜任務的代理人,但這些代理人常面臨錯誤傳播和適應性不足的挑戰。為了解決這些問題,我們提出了「任務分解與代理生成」(TDAG)框架,將複雜任務拆解為小子任務,並分配給專門的子代理,以提升適應性。 此外,我們推出了ItineraryBench基準測試,專注於旅行規劃,評估代理人在記憶、規劃和工具使用等方面的能力。實驗結果顯示,TDAG在處理複雜任務時的表現顯著優於現有基準,展現出更強的適應性和情境意識。 PubMed DOI
這篇文章介紹了一種新型的Transformer架構,旨在優化自然語言理解模型在延遲、功耗和準確性之間的平衡。透過自適應調整推理計算成本,模型能根據所需的延遲進行加速。在微調階段,使用一種新指標「注意力上下文貢獻」來識別並移除不重要的詞向量。實驗顯示,移除上層的詞向量能顯著提升推理速度,且對整體性能影響輕微。這種方法使Llama3模型的首次標記時間提升了2.9倍,性能僅輕微下降,顯示出其有效性。 PubMed DOI