An Empirical Evaluation of the GPT-4 Multimodal Language Model on Visualization Literacy Tasks.
對GPT-4多模態語言模型在視覺素養任務上的實證評估。
IEEE Trans Vis Comput Graph 2024-09-10
Fine-Tuned Large Language Model for Visualization System: A Study on Self-Regulated Learning in Education.
針對視覺化系統的微調大型語言模型:教育中自我調節學習的研究。
IEEE Trans Vis Comput Graph 2024-09-10
Sportify: Question Answering with Embedded Visualizations and Personified Narratives for Sports Video.
Sportify:結合嵌入式視覺化和擬人化敘事的運動視頻問答系統。
IEEE Trans Vis Comput Graph 2024-09-10
KNOWNET: Guided Health Information Seeking from LLMs via Knowledge Graph Integration.
KNOWNET: 透過知識圖譜整合引導的健康資訊搜尋。
IEEE Trans Vis Comput Graph 2024-09-10
LLM Comparator: Interactive Analysis of Side-by-Side Evaluation of Large Language Models.
LLM 比較器:大型語言模型的並排評估互動分析。
IEEE Trans Vis Comput Graph 2024-09-10
LLM Comparator 是一款視覺分析工具,透過並排比較來提升對大型語言模型(LLMs)的評估。它解決了 LLM 評估中可擴展性和可解釋性的問題,讓使用者能分析為何某模型表現優於另一模型。這工具與 Google 專業人士合作開發,提供深入分析個別範例的流程,並讓使用者視覺化探索數據,識別模式、形成假設,並獲得改進模型的見解。LLM Comparator 已整合進 Google 的評估平台,並開源供更多人使用。
相關文章PubMedDOI
Prompt Engineering Paradigms for Medical Applications: Scoping Review.
醫療應用的提示工程範式:範疇回顧。
J Med Internet Res 2024-09-10