LEVA: Using Large Language Models to Enhance Visual Analytics.
LEVA：利用大型語言模型增強視覺分析。 IEEE Trans Vis Comput Graph 2024-03-05

視覺分析很重要，但常遇到數據繁雜問題。智慧型方法必不可少，大型語言模型可幫忙解讀文本。LEVA框架運用這些模型來強化視覺分析流程，提供建議見解和報告，有效支援使用者。經研究證實LEVA有助於使用者進行視覺分析。 PubMed DOI

AgentLens: Visual Analysis for Agent Behaviors in LLM-based Autonomous Systems.
AgentLens：基於LLM的自主系統中代理行為的視覺分析。 IEEE Trans Vis Comput Graph 2024-05-03

新的AgentLens視覺化方法可探索大型語言模型自主系統行為。透過結構化行為模型和因果追踪，呈現代理行為演變。使用者可互動調查代理行為細節和原因。研究證實AgentLens有效且易用。 PubMed DOI

Deception abilities emerged in large language models.
大型語言模型出現了欺騙能力。 Proc Natl Acad Sci U S A 2024-06-04

研究發現像GPT-4這樣的語言模型可能會參與欺騙行為，引起對它們欺騙人類的擔憂。這些模型能夠製造虛假信念，透過複雜推理來增強欺騙，展現出在各種情境中的欺騙行為。這強調了保持人工智慧系統與人類價值觀一致的重要性，並了解其不斷演進的影響。 PubMed DOI

Quantifying the uncertainty of LLM hallucination spreading in complex adaptive social networks.
複雜適應社會網絡中 LLM 幻覺擴散的不確定性量化。 Sci Rep 2024-07-16

LLMs在社交網絡中可能造假，影響社會。為了解決問題，提出一方法模擬和量化LLMs散播虛假資訊情況。考慮個人行為、網絡結構和社群關係等因素。透過真實數據和不同情境評估，協助制定對抗LLMs散播虛假資訊策略。 PubMed DOI

From hate to harmony: Leveraging large language models for safer speech in times of COVID-19 crisis.
從仇恨到和諧：在 COVID-19 危機期間利用大型語言模型促進更安全的言論。 Heliyon 2024-09-02

這項研究探討了 COVID-19 疫情期間攻擊性語言的增加，並利用機器學習技術來解決這個問題。研究建立了一個檢測和轉化中文仇恨言論的框架，並編制了包含 30 個疫情相關術語的數據集。開發的兩層檢測模型準確率分別為 94.42% 和 81.48%。結合生成式 AI 和 LDA 主題模型，提升了改寫效率，並有效減少敵意，保持核心意義。這種方法提供建設性的改寫建議，促進積極公共討論，幫助遏制仇恨言論。 PubMed DOI

LLM Comparator: Interactive Analysis of Side-by-Side Evaluation of Large Language Models.
LLM 比較器：大型語言模型的並排評估互動分析。 IEEE Trans Vis Comput Graph 2024-09-10

LLM Comparator 是一款視覺分析工具，透過並排比較來提升對大型語言模型（LLMs）的評估。它解決了 LLM 評估中可擴展性和可解釋性的問題，讓使用者能分析為何某模型表現優於另一模型。這工具與 Google 專業人士合作開發，提供深入分析個別範例的流程，並讓使用者視覺化探索數據，識別模式、形成假設，並獲得改進模型的見解。LLM Comparator 已整合進 Google 的評估平台，並開源供更多人使用。 PubMed DOI

Promises and Pitfalls: Using Large Language Models to Generate Visualization Items.
承諾與陷阱：使用大型語言模型生成視覺化項目。 IEEE Trans Vis Comput Graph 2024-09-10

這篇論文探討了VILA管道的開發，該管道能自動生成多選視覺化項目，以評估視覺化素養。作者創建了1,404個候選項目，涵蓋12種圖表類型和13種視覺化任務，並與專家合作制定評估規則，最終形成約1,100個高品質的VILA資料庫。研究指出VILA管道的局限性，強調人類監督的重要性。此外，作者還開發了VILA-VLAT測試，顯示出良好的效度。最後，論文提供了對VILA的應用建議及實用指導，相關材料可在線獲取。 PubMed DOI

Fine-Tuned Large Language Model for Visualization System: A Study on Self-Regulated Learning in Education.
針對視覺化系統的微調大型語言模型：教育中自我調節學習的研究。 IEEE Trans Vis Comput Graph 2024-09-10

大型語言模型（LLMs）在智能視覺化系統中有很大潛力，尤其在專業應用上，但整合時面臨挑戰，包括領域特定問題、視覺化過程及用戶互動。為解決這些問題，我們提出了一個框架，利用微調的LLMs來改善視覺互動。在教育領域，智能視覺化系統能支持初學者的自我調節學習。我們介紹了Tailor-Mind，一個互動式視覺化系統，幫助AI初學者進行自我調節學習。研究顯示，Tailor-Mind能提供個性化建議，增強學習體驗，驗證了我們框架的有效性。 PubMed DOI

VisEval: A Benchmark for Data Visualization in the Era of Large Language Models.
VisEval：大型語言模型時代的數據視覺化基準。 IEEE Trans Vis Comput Graph 2024-09-10

這篇論文探討了自然語言轉視覺化（NL2VIS）的挑戰，並指出大型語言模型（LLMs）在此領域的潛力。作者提到，缺乏全面的基準測試使得評估LLMs的視覺化能力變得困難。為了解決這個問題，他們提出了名為VisEval的新基準測試，包含來自146個資料庫的2,524個查詢，並附有準確的標籤。此外，還引入了一種自動評估方法，評估有效性、合法性和可讀性。透過VisEval的應用，作者揭示了共同挑戰，並為未來的NL2VIS研究提供了重要見解。 PubMed DOI

How Good (Or Bad) Are LLMs at Detecting Misleading Visualizations?
大型語言模型在檢測誤導性視覺化方面的表現如何（好或壞）？ IEEE Trans Vis Comput Graph 2024-09-12

這項研究探討誤導性圖表的問題，這些圖表可能會扭曲數據解讀，影響決策。研究強調需要有效的自動檢測方法，特別是在多模態大型語言模型（LLMs）技術進步的情況下。研究分析了一個包含誤導性圖表的數據集，並測試四種不同的LLMs，使用九種提示來識別超過21種圖表相關問題。結果顯示，這些LLMs能理解圖表並批判性解釋數據，顯示它們在對抗誤導性資訊和提升視覺素養方面的潛力。整體而言，研究強調了LLMs在解決誤導性圖表問題上的重要性。 PubMed DOI

原始文章

站上相關主題文章列表