原始文章

創造引人入勝的數據影片需要高超的技能與努力。近期研究著眼於利用自然語言互動,自動生成影片組件,但過去的研究未能有效結合敘事內容與設計指令,導致產出缺乏客製化。為了解決這個問題,我們提出了一種新方法,將用戶的創作意圖整合成「註解敘述」格式,讓用戶能直接在文本中嵌入設計指令。我們開發的原型系統Data Playwright,能根據用戶上傳的內容生成動態數據影片,並讓用戶輕鬆預覽與調整影片。用戶研究顯示,參與者能有效使用此系統創作影片。 PubMed DOI


站上相關主題文章列表

隨著籃球越來越受歡迎,許多球迷在快速且複雜的比賽中感到難以跟上。為了解決這個問題,我們推出了Sportify,一個視覺問答系統,幫助球迷理解籃球戰術。Sportify提供三種動作視覺化—傳球、切入和掩護,並利用大型語言模型來解釋球員的行動。我們測試了Sportify的效果,結果顯示它顯著提升了球迷的戰術理解,並豐富了觀賽體驗,特別是第三人稱敘述提供了詳細解釋,而第一人稱則增強了參與感。 PubMed DOI

這項研究強調參照手勢在數據視覺化討論中的溝通重要性。傳統的逐字稿和錄影常忽略這些手勢,影響會議表現。為了解決這個問題,作者提出一個新框架,能捕捉游標手勢數據與音頻,並轉換成互動文件。透過大型語言模型,框架能識別口語與手勢的聯繫,提供豐富的上下文註解。用戶研究顯示,參與者更喜歡這種自動化的互動文檔,並初步建立游標手勢分類法,為協作數據分析的應用改進鋪路。 PubMed DOI

大型語言模型(LLMs)如ChatGPT進入教育領域,將透過創新的對話方式改變學習體驗。為了幫助學生更好利用ChatGPT,教師需了解學生的互動方式,但缺乏相關數據使得這一點變得困難。 為了解決這個問題,我們在碩士資料視覺化課程中收集了48名學生的對話數據,並創建了編碼方案來分析互動模式。我們開發的StuGPTViz視覺分析系統能追蹤學生提問時間及ChatGPT回應質量,為教育者提供有價值的見解。研究顯示,StuGPTViz能增強教師對ChatGPT教學價值的理解,並開啟AI驅動的個性化學習解決方案的研究機會。 PubMed DOI

這篇文章探討如何將大型語言模型(LLMs)融入科學工作流程,將原始文本轉化為有條理的敘事,並運用語義網技術。文章強調敘事在傳遞複雜科學資訊中的重要性,以及生成文本的可靠性。研究定義了「敘事事件」,並比較了不同小型LLM在特定需求下的表現,重點在於保持原始敘事的完整性。初步評估顯示,LLaMA 2在生成與源文本緊密對齊的敘事事件方面最為有效,並且透過提示工程技術進一步提升了輸出質量。 PubMed DOI

這段文字探討金融敘事視覺化中自動化圖形疊加的挑戰,強調理解圖形疊加與敘事結構的關聯性。為了解決這個問題,作者調查了1,752個分層圖表及其敘事,找出常見的疊加及其正確用法。他們推出了FinFlier,一個利用大型語言模型的兩階段系統,能自動創建圖形疊加。系統包含文本數據綁定模組和圖形疊加模組,根據敘事順序生成有效的疊加。作者展示了FinFlier的能力,並提供性能評估,證明其有效性及生成圖表的質量。 PubMed DOI

大型語言模型(LLMs)因為能用簡單的提示處理各種自然語言任務而受到廣泛歡迎,讓非專家也能輕鬆使用。不過,撰寫有效的提示卻不容易,因為需要特定知識。為了幫助用戶改善提示,我們開發了PROMPTAID,這是一個互動式的視覺分析系統,能讓用戶創建、精煉和測試提示。PROMPTAID透過協調視覺化,促進關鍵字擾動、意義重述和選擇最佳範例,並經過專家意見和用戶研究驗證,讓用戶能輕鬆迭代提示,生成多樣選項,並有效分析提示表現。 PubMed DOI

大型語言模型(LLMs)如GPT-4與擴增實境(XR)技術結合,能創造沉浸式環境,並透過自然語言與使用者互動。不過,XR環境的複雜性使得提取上下文數據變得困難,導致成本上升和錯誤產生。為了解決這些問題,我們推出了LLMER框架,利用LLMs生成的JSON數據來構建互動式XR世界。LLMER能有效減少應用崩潰和延遲,初步研究顯示其令牌消耗減少超過80%,任務完成時間減少約60%。使用者反饋也指出了優化的空間。 PubMed DOI

這篇論文提出 InsightLens 系統,專為解決用大型語言模型分析資料時,洞見難以管理和追蹤的問題。InsightLens 能自動記錄、整理並視覺化對話中的資料洞見,讓分析師更方便管理和查找。研究結果顯示,這系統能減少手動整理的麻煩,降低認知負擔,提升分析效率。 PubMed DOI

這篇論文介紹「Visualizationary」系統,結合 ChatGPT 與視覺化設計指引,能針對使用者的圖表給予個人化、具體的改進建議,且不需寫程式。13 位參與者的研究顯示,透過 LLM 以自然語言指導,能有效提升不同經驗者的視覺化設計能力。補充資料可在 https://osf.io/v7hu8 查詢。 PubMed DOI

VOICE 是一套結合大型語言模型和互動視覺化的科學溝通工具,能用語音指令即時操作 3D 模型並獲得解說。它採雙層代理架構、微調和提示工程,並以分子視覺化為例,經用戶研究證實能有效滿足需求。更多資訊可見 https://osf.io/g7fbr。 PubMed DOI