An Embodied Intelligence System for Coal Mine Safety Assessment Based on Multi-Level Large Language Models.
基於多層大型語言模型的煤礦安全評估具身智能系統。 Sensors (Basel) 2025-01-25

這項研究探討如何利用先進的大型語言模型（LLMs）來提升煤礦安全評估。傳統方法在面對複雜數據時效率不佳，而這個系統能快速處理來自感測器的數據，並透過實體互動增強環境意識。結合煤礦安全知識庫，系統能進行邏輯推理、檢測異常及預測風險，並具備記憶功能以持續學習。研究中還設計了實驗框架，展示該系統在煤礦安全評估中的高效性，提供了一個創新的解決方案。 PubMed DOI

Urban sensing in the era of large language models.
大型語言模型時代的城市感知。 Innovation (Camb) 2025-01-28

隨著城市成為人類活動的核心，城市感知的重要性日益提升。大型語言模型（LLMs）透過其語言框架，為城市感知帶來新機會。本文探討LLMs在理解城市機制上的潛力，重點在於改善人類與LLMs的知識轉移、提升對城市運作的認識，以及透過LLM代理實現自動化決策。雖然LLMs能提供更深入的城市動態理解，但也面臨多模態數據整合、時空推理、文化適應性和隱私等挑戰。未來的城市感知需善用LLMs的智慧，並克服這些挑戰，以促進智能和可持續的城市發展。 PubMed DOI

A large language model framework to uncover underreporting in traffic crashes.
一個大型語言模型框架以揭示交通事故的低報告情況。 J Safety Res 2025-02-22

這項研究探討交通事故報告中的低報問題，這會影響交通安全措施的發展。傳統修正方法慢且易出錯，特別是處理大數據時。作者提出一個框架，利用大型語言模型（LLMs）分析事故敘述，識別低報因素，如酒精參與。研究團隊用麻薩諸塞州的500份事故報告進行案例研究，結果顯示高準確率，召回率達1.0，精確率0.93，成功識別低報情況。這方法提升了交通安全分析的效率，未來可改善事故記錄質量，支持更有效的安全對策。 PubMed DOI

Inspiration in human reasoning logic: Automating the inference and analysis of traffic accident information via macro-micro integration.
人類推理邏輯的啟發：透過巨觀-微觀整合自動化推論與分析交通事故資訊 Traffic Inj Prev 2025-04-22

這項研究開發了LFBERT-ReasonSoT自動化系統，結合LDA主題模型和微調BERT，能更準確分析交通事故報告的肇因和嚴重程度。結果顯示，這套系統比傳統方法更有效率，能從複雜事故文本中萃取有用資訊，提升事故資料自動化處理的能力。 PubMed DOI

Query by Example: Semantic Traffic Scene Retrieval Using LLM-Based Scene Graph Representation.
以範例查詢：使用基於大型語言模型（LLM）的場景圖表示進行語意交通場景檢索 Sensors (Basel) 2025-04-26

這篇論文提出用視覺大型語言模型（VLMs）自動從影像生成道路場景圖，能細緻捕捉交通場景的語意和物件關係。作者還設計了可擴充的場景屬性和圖形相似度量法，並建立了1000筆標註資料集。實驗證明，這方法能用文字、圖片或影片靈活檢索語意相似的交通場景，對自駕車應用很有幫助。 PubMed DOI

Collision risk prediction and takeover requirements assessment based on radar-video integrated sensors data: A system framework based on LLM.
基於雷達-影像整合感測器數據的碰撞風險預測與接管需求評估：一個基於LLM的系統架構 Accid Anal Prev 2025-05-06

這項研究提出一套可解釋的系統（CPTR-LLM），用大型語言模型來預測自駕車的碰撞風險，並判斷駕駛人何時該接手。經過大量數據和兩階段訓練，模型預測準確率高達0.88，也能有效減少不必要或危險的接管。結果顯示，大型語言模型有助提升自駕車的道路安全。 PubMed DOI

A Multimodal Large Language Model Framework for Intelligent Perception and Decision-Making in Smart Manufacturing.
智慧製造中用於智能感知與決策的多模態大型語言模型框架 Sensors (Basel) 2025-05-28

這篇論文提出一套多模態系統，能整合影像、感測器數據和生產紀錄，並結合大型語言模型。系統有統一資料格式、動態分詞和強大跨模態對齊能力，採用兩階段訓練。新開發的Transformer模型同時支援影像和文字生成，提升即時決策。實驗證明，這方法在影像-文字檢索和視覺問答等任務表現優異，對智慧製造和異常偵測等應用很有幫助。 PubMed DOI

Automatically Identifying Event Reports of Workplace Violence and Communication Failures using Large Language Models.
使用大型語言模型自動識別職場暴力事件報告與溝通失誤 AMIA Jt Summits Transl Sci Proc 2025-06-12

**重點整理：** 大型語言模型可以準確分類安全事件通報（例如：職場暴力、溝通失誤），協助醫療機構快速掌握安全趨勢，並透過自動化分析來提升職場安全。 PubMed

Argus: Leveraging Multiview Images for Improved 3-D Scene Understanding With Large Language Models.
Argus：結合多視角影像與大型語言模型以提升3D場景理解 IEEE Trans Neural Netw Learn Syst 2025-06-25

這篇論文提出Argus，一種結合2D多視角影像、相機位置和3D點雲的新3D多模態架構。Argus融合2D細節和3D特徵，彌補單靠點雲資訊不足的問題，讓大型語言模型在3D場景理解上更精準。實驗證明，Argus在多項3D任務表現都比現有方法更優秀。 PubMed DOI

Multitasking vision language models for vehicle plate recognition with VehiclePaliGemma.
使用 VehiclePaliGemma 的多工視覺語言模型於車牌辨識 Sci Rep 2025-07-18

這篇論文提出一個新模型VehiclePaliGemma，專門針對困難情境下的車牌辨識（像是雜訊、模糊、字太近等），在馬來西亞車牌資料集上測試，準確率達87.6%，每秒可處理7張影像。這個模型還能同時辨識多台車的車型、顏色和方向，表現比現有方法更好。 PubMed DOI

原始文章

站上相關主題文章列表