Urban sensing in the era of large language models.
大型語言模型時代的城市感知。 Innovation (Camb) 2025-01-28

隨著城市成為人類活動的核心，城市感知的重要性日益提升。大型語言模型（LLMs）透過其語言框架，為城市感知帶來新機會。本文探討LLMs在理解城市機制上的潛力，重點在於改善人類與LLMs的知識轉移、提升對城市運作的認識，以及透過LLM代理實現自動化決策。雖然LLMs能提供更深入的城市動態理解，但也面臨多模態數據整合、時空推理、文化適應性和隱私等挑戰。未來的城市感知需善用LLMs的智慧，並克服這些挑戰，以促進智能和可持續的城市發展。 PubMed DOI

Large language models: Tools for new environmental decision-making.
大型語言模型：新環境決策的工具。 J Environ Manage 2025-02-02

這項研究首次探討大型語言模型（LLMs）在環境決策中的應用，分析其潛在優勢與限制。研究提出兩個框架：一是LLMs輔助的框架，增強人類專業知識；二是LLMs驅動的框架，自動化優化任務。透過水工程中PFAS控制的案例，顯示這兩個框架在環境決策中的優化效果。結果顯示，LLMs輔助框架在調節流量和改善PFAS攔截上表現良好，而LLMs驅動框架在複雜參數優化上則面臨挑戰。研究強調人工智慧應輔助而非取代人類專業知識，為未來的合作奠定基礎。 PubMed DOI

Enhancing structured data generation with GPT-4o evaluating prompt efficiency across prompt styles.
利用 GPT-4 增強結構化數據生成，評估不同提示風格的提示效率。 Front Artif Intell 2025-04-10

這篇論文探討了不同提示風格（JSON、YAML 和混合 CSV/前綴）對大型語言模型（如 GPT-4o）生成結構化數據的影響，強調提示風格在準確性、效率和成本效益上的重要性。研究評估了這些風格在個人故事、收據和醫療記錄等應用中的表現，並根據準確性、標記成本和處理時間進行比較。主要發現包括： - **JSON**：高準確性但標記成本較高。 - **YAML**：在可讀性和效率間取得平衡。 - **混合 CSV/前綴**：在簡單數據結構中表現優異。論文提供了選擇合適提示風格的建議，幫助優化 AI 應用的數據生成。 PubMed DOI

Industrial applications of large language models.
大型語言模型的產業應用 Sci Rep 2025-04-21

大型語言模型（LLMs）能理解和產生自然語言，正改變醫療、教育、金融等產業，提升效率和準確度。不過，LLMs也有倫理、偏見和高運算成本等問題。本文分析其發展、應用和限制，並探討未來趨勢。 PubMed DOI

An Evaluation of Large Language Models for Supplementing a Food Extrusion Dataset.
用於補充食品擠壓數據集之大型語言模型的評估 Foods 2025-04-26

目前食品擠壓研究缺乏標準化資料集，影響進展。作者建立人工整理的資料集，並測試大型語言模型（LLMs）自動擷取文獻資料的能力。結果發現，LLMs 雖然偶有錯誤或遺漏，但能大幅減少人工整理時間，是輔助建立資料集、加速研究的有力工具。 PubMed DOI

The emergence of large language models as tools in literature reviews: a large language model-assisted systematic review.
大型語言模型作為文獻回顧工具的興起：大型語言模型輔助的系統性回顧 J Am Med Inform Assoc 2025-05-07

這篇研究回顧了LLM在自動化科學文獻回顧的應用，分析了172篇論文。多數專案用ChatGPT或GPT系列，特別在文獻搜尋和資料擷取上表現比BERT好。不過，實際上很少有論文註明用LLM協助。雖然LLM處理數值資料還有些限制，但未來很可能會大幅改變文獻回顧的流程。 PubMed DOI

Using Large Language Models for sentiment analysis of health-related social media data: empirical evaluation and practical tips.
運用大型語言模型進行健康相關社群媒體資料的情感分析：實證評估與實用建議 AMIA Annu Symp Proc 2025-05-26

這篇論文比較了 GPT-3.5-Turbo、FLAN-T5 和 BERT 等大型語言模型在健康社群媒體情感分析的表現。結果顯示，LLMs 比傳統工具（像 VADER）表現更好，但準確度還有進步空間。透過調整提示語和微調，尤其是 BERT，效果會更好。研究也建議未來要在標註資料少的情況下，持續優化這些模型。 PubMed

Large Language Models Can Extract Metadata for Annotation of Human Neuroimaging Publications.
大型語言模型可用於提取人類神經影像學文獻的註釋中繼資料 bioRxiv 2025-06-04

最新的商業大型語言模型（像GPT-4o），在神經影像的中繼資料標註上，表現幾乎跟專業人員一樣好（zero-shot下得分0.91–0.97），錯誤率也差不多，很多分歧其實不是錯誤。這代表LLM很適合大規模自動標註。作者也建議大家建立並分享標註基準資料集，方便未來測試。 PubMed DOI

Automating and Evaluating Large Language Models for Accurate Text Summarization Under Zero-Shot Conditions.
在零樣本條件下自動化與評估大型語言模型以提升文本摘要的準確性 AMIA Jt Summits Transl Sci Proc 2025-06-12

這篇研究發現，大型語言模型在沒經過特別訓練下，結合檢索增強生成（RAG）和提示工程，能有效自動摘要專業資訊，表現不錯。不過，還是會遇到像網頁爬蟲限制和偶爾誤解任務等問題，未來還需要進一步優化。 PubMed

A novel fine-tuning and evaluation methodology for large language models on IoT raw data summaries (LLM-RawDMeth): A joint perspective in diabetes care.
物聯網原始數據摘要大型語言模型之新穎微調與評估方法（LLM-RawDMeth）：糖尿病照護的整合觀點 Comput Methods Programs Biomed 2025-06-14

這項研究用專家指導的模糊邏輯和提示工程，微調GPT模型，讓它能準確又簡潔地摘要連續血糖監測數據。微調後的GPT-4o準確率高達96%，顯示AI有助於糖尿病管理，能把複雜數據轉成實用資訊，減輕醫護人員負擔。 PubMed DOI

原始文章

站上相關主題文章列表