原始文章

這篇論文提出 SeeUnsafe 架構,運用多模態大型語言模型自動化交通監視器事故偵測,不需人工後處理,還能互動式分析影片。系統可彈性調整分析任務,並有新指標 IMS 評估回應品質。實驗證明,SeeUnsafe 在事故分類和證據定位上表現優異。 PubMed DOI


站上相關主題文章列表

這篇論文提出一種新方法,利用大型語言模型(LLMs)、AI代理和開放地理數據,提升城市騎乘安全。方法包括分析城市風險和現有騎乘設施的數據,並透過數據預處理和提示工程,創建友好的系統,提供騎乘安全見解。過程分為數據準備、代理協調和決策執行三步,確保開源工具有效整合,促進城市規劃者和騎士的可及性。研究顯示結合LLMs和AI代理的潛力,能改善騎乘實踐和城市交通規劃。 PubMed DOI

SafeMod是一個新框架,旨在提升自動駕駛的安全性,透過改善複雜環境中的決策和情境管理。它克服了傳統方法的局限,採用雙向規劃結構,包括前向和後向規劃。前向規劃利用大型語言模型預測周圍行為,生成行動預測,並由基於變壓器的規劃器處理,結合文本和影像數據創建駕駛軌跡。後向規劃則透過強化學習精煉這些軌跡,選擇最佳行動。實驗結果顯示,SafeMod在安全性和決策能力上優於其他系統,顯示其在自動駕駛中的潛力。 PubMed DOI

這篇論文探討了多模態大型語言模型(MLLMs)的最新進展,特別是像GPT-4V這類結合語言處理與多模態任務的模型。作者強調了MLLMs的獨特能力,例如從圖像生成敘事及進行複雜推理,顯示出朝向人工通用智慧的潛力。論文提供了MLLMs的全面概述,包括架構、訓練策略和評估方法,並探討了增強其適應性的方法。此外,還討論了多模態幻覺等問題及未來研究方向,以提升MLLM的能力。 PubMed DOI

這項研究探討如何利用先進的大型語言模型(LLMs)來提升煤礦安全評估。傳統方法在面對複雜數據時效率不佳,而這個系統能快速處理來自感測器的數據,並透過實體互動增強環境意識。結合煤礦安全知識庫,系統能進行邏輯推理、檢測異常及預測風險,並具備記憶功能以持續學習。研究中還設計了實驗框架,展示該系統在煤礦安全評估中的高效性,提供了一個創新的解決方案。 PubMed DOI

隨著城市成為人類活動的核心,城市感知的重要性日益提升。大型語言模型(LLMs)透過其語言框架,為城市感知帶來新機會。本文探討LLMs在理解城市機制上的潛力,重點在於改善人類與LLMs的知識轉移、提升對城市運作的認識,以及透過LLM代理實現自動化決策。雖然LLMs能提供更深入的城市動態理解,但也面臨多模態數據整合、時空推理、文化適應性和隱私等挑戰。未來的城市感知需善用LLMs的智慧,並克服這些挑戰,以促進智能和可持續的城市發展。 PubMed DOI

這項研究探討交通事故報告中的低報問題,這會影響交通安全措施的發展。傳統修正方法慢且易出錯,特別是處理大數據時。作者提出一個框架,利用大型語言模型(LLMs)分析事故敘述,識別低報因素,如酒精參與。研究團隊用麻薩諸塞州的500份事故報告進行案例研究,結果顯示高準確率,召回率達1.0,精確率0.93,成功識別低報情況。這方法提升了交通安全分析的效率,未來可改善事故記錄質量,支持更有效的安全對策。 PubMed DOI

這項研究開發了LFBERT-ReasonSoT自動化系統,結合LDA主題模型和微調BERT,能更準確分析交通事故報告的肇因和嚴重程度。結果顯示,這套系統比傳統方法更有效率,能從複雜事故文本中萃取有用資訊,提升事故資料自動化處理的能力。 PubMed DOI

這篇論文提出用視覺大型語言模型(VLMs)自動從影像生成道路場景圖,能細緻捕捉交通場景的語意和物件關係。作者還設計了可擴充的場景屬性和圖形相似度量法,並建立了1000筆標註資料集。實驗證明,這方法能用文字、圖片或影片靈活檢索語意相似的交通場景,對自駕車應用很有幫助。 PubMed DOI

這項研究提出一套可解釋的系統(CPTR-LLM),用大型語言模型來預測自駕車的碰撞風險,並判斷駕駛人何時該接手。經過大量數據和兩階段訓練,模型預測準確率高達0.88,也能有效減少不必要或危險的接管。結果顯示,大型語言模型有助提升自駕車的道路安全。 PubMed DOI

這篇論文提出一套多模態系統,能整合影像、感測器數據和生產紀錄,並結合大型語言模型。系統有統一資料格式、動態分詞和強大跨模態對齊能力,採用兩階段訓練。新開發的Transformer模型同時支援影像和文字生成,提升即時決策。實驗證明,這方法在影像-文字檢索和視覺問答等任務表現優異,對智慧製造和異常偵測等應用很有幫助。 PubMed DOI