微信里点“发现”,扫一下
二维码便可将本文分享至朋友圈
演讲摘要:在机器学习中,训练数据的质量决定了数据分析效果的上限,而模型和算法的改进只是不断逼近这个上限。因此,有效的训练数据质量分析和提升对人工智能相关应用至关重要。本报告将介绍我们提出的基于可视分析的数据质量可解释理论框架。该框架将机器学习方法和可视分析技术紧密集成在一起,帮助数据专家更好地理解训练数据中的错误和不一致,提高数据的可用性和代表性。最后,结合具体的应用实例,如标注数据修正和数据集偏差消除等,介绍我们基于该框架研制开发的可视分析方法与技术。
讲者简介:刘世霞,清华大学教授,软件学院副院长,国家级人才计划入选者,IEEEFellow。主要研究方向是大数据可视分析与可解释人工智能。获IEEE可视化技术成就奖(2022);人选福布斯中国科技女性50(2022)和可视化名人堂(2020)。担任CCFA类会议IEEEVIS(VAST)2016和2017的论文主席,IEEEVIS2020-2023指导委员会委员;担任IEEE Transactions on Visualization and Computer Graphics副主编、曾任编委;担任CCFA类期刊ArtificialIntelligence编委;担任EEE Transactions on Big Data 和ACM Transactions on Interactive IntelligentSystems的编委