数据治理及安全论坛将深入探讨数据治理与数据安全领域的前沿技术与发展应用。作为人工智能的关键引擎之一,数据为智能决策与应用提供核心驱动力,数据的高效治理与安全利用是人工智能高质量发展的基础。此次论坛邀请了业内专家分享数据治理、数据要素市场、数据隐私安全等方向的最新研究成果,共同探讨未来技术的发展方向,助力数据治理与安全技术在人工智能领域的革新与应用。
论坛主持人:刘金飞
主持人简介:刘金飞,浙江大学计算机科学与技术学院/网络空间安全学院百人计划研究员,博士生导师。2017年博士毕业于美国埃默里大学,荣获埃默里大学计算机系毕业生最高荣誉“Chris Schoettle杰出研究奖”,毕业后在佐治亚理工学院和埃默里大学任博士后研究员。2020年加入浙江大学计算机科学与技术学院/网络空间安全学院。刘金飞博士主要从事数据要素市场,数据安全与合规等方向的研究工作,带领浙江大学DIVER(Data prIVacy, sEcurity, and maRket)研究小组。发表了50余篇同行评议的会议与期刊论文,其中CCF-A类论文30余篇,是所有数据库领域旗舰会议(e.g., VLDB, SIGMOD, ICDE)的程序委员会委员,并参与所有数据库领域旗舰期刊(e.g., VLDBJ, TKDE, TODS)的审稿工作。参与国标《数据交易安全服务》制定,主持国家自然科学基金和国家重点研发计划课题。
报告1:高置信的数据验证技术
报告人简介:吴黎兵,武汉大学国家网络安全学院二级教授/博士生导师,CCF理事/杰出会员,主要研究方向为物联网、网络安全、数据安全等。近年来主持国家自然科学基金、国家重点研发计划课题、湖北省创新群体、湖北省科技支撑计划、湖北省重点研发计划等项目研究工作,曾参加国家863计划引导项目、可信软件重大研究计划等研究工作。在IEEE TMC, TIFS, TDSC, TII, TITS, ACM TOIS, TOIT, INFOCOM, CVPR等期刊和会议发表论文。获SCI期刊IEEE System Journal 2019年度Best Paper Award。获得ICoC2016中国互联网学术会议Best Paper Award。
报告摘要:开放环境下大数据具有存储海量动态、计算复杂多变、检索逻辑繁杂的特点,导致密文数据存储完整性、计算正确性、检索完备性验证困难。报告简要介绍在密文数据动态完整性验证方面的研究进展。
报告2:保护隐私的安全多方学习:理论与框架
报告人简介:韩伟力,复旦大学教授,中国计算机学会上海分部主席,国家重点研发项目首席科学家。研究方向:数据安全;系统安全;智慧司法;金融科技。于2003进入复旦大学软件学院,从事教学和科研工作。2008年9月到2009年9月,前往普渡大学计算机系访学。在IEEE S&P、ACM CCS、USENIX Security、WWW和IEEE TDSC、TIFS、ACM TWeb等顶尖会议期刊录用发表多篇高质量学术论文。主持国家重点研发、国家自然科学基金重点在内的多项国家和省部级科研项目。获国家教学成果二等奖,上海市教学成果一等奖(第一完成人)、中国计算机学会自然科学二等奖(第一完成人)、复旦大学教学成果一等奖,复旦大学教学贡献奖等,入选国家示范性软件学院20周年“优秀专职教师”、2018华人AI学术影响力Top100。
报告摘要:随着大数据应用的不断涌现,数据资源作为一种战略资源,显得越来越稀缺。如何获取足量的高质量数据,以支撑各种分析模型,成为当前创新型人工智能企业所面临的首要难题。国内外不断严格的法律规范则为这一难题进一步增加了难度。系统安全研究人员为此提出了各种方案和技术路线,包括安全多方学习、联邦学习等,在保护数据的前提下,实现数据的充分共享,以支撑各类大数据应用。将分享复旦大学数据安全与治理实验室在保护隐私的安全多方学习方面的一些前沿进展,包括他们在ACM CCS 2022/2024和IEEE S&P 2023方面发表的安全多方学习创新框架,以及开源隐私计算平台Garnet。
报告3:数据要素安全典型问题及策略
报告人简介:刘哲理,南开大学计算机学院副院长、网络空间安全学院副院长,教育部数据与智能系统安全重点实验室主任,中国中文信息学会大数据安全与隐私保护专业委员会秘书长,中国新一代战略研究院智能网络安全研究中心主任,天津市中青年科技领军人才,教授,博士生导师。自2011年至今,发表USENIX Security、EUROCRYPT、VLDB、ASE、ISSTA、IEEE INFOCOM、IEEE TDSC、IEEE TKDE、IEEE TIFS、IEEE TC等顶级期刊论文和会议40余篇,有9篇论文进入ESI高被引。主要研究方向为密文数据库、密文集合运算、差分隐私、人工智能安全等。目前主持国家自然科学基金重点项目、国家重点研发计划、国防科技创新重点项目、工信部工业互联网创新工程等纵向课题10余项,与华为、腾讯等多家知名信息安全企业建立了合作关系,是华为高斯数据库Security小组核心成员。担任《网络与信息安全学报》、Springer期刊《Cybersecurity》、SCI一区期刊INS等编委。
报告摘要:首先,介绍国家有关数据安全的法律法规和数据安全的有关定义,以及有关数据安全、隐私保护、密文计算、隐私计算等学术概念。进而,围绕数据发布与流通、数据共享与使用两类场景,介绍典型问题和解决策略,包括:(1)在数据脱敏和发布方面,介绍基于匿名化、差分隐私等隐私计算技术的解决方案;(2)在数据溯源方面,介绍基于保留格式加密的数据库水印设计,及其在泄密定责中的应用;(3)在数据共享与使用方面,介绍基于密文交集运算、安全多方计算等数据安全技术的解决方案,重点阐述低通信量密文交集运算、通用安全多方计算协议优化等相关的工作。
报告4:基于大模型的数据清洗融合初探
报告人简介:范举,中国人民大学数据工程与知识工程教育部重点实验室教授,博士生导师,中国计算机学会数据库专委会、大数据专委会执行委员。目前的研究方向包括:数据治理技术与系统、智能数据库系统等。相关研究成果在SIGMOD、VLDB、ICDE、TKDE等CCF-A类期刊和会议上发表论文50余篇。作为负责人先后主持国家自然科学基金优秀青年基金项目、重点项目课题、面上项目、青年项目,以及多项产学研合作项目。现有获得ACM SIGMOD Research Highlight Award、ACM China Rising Award等奖励。
报告摘要:数据清洗融合旨在整合多源异质数据,提升整体数据质量,最终形成统一且高质量的数据视图,包括实体对齐、冲突消解、错误修复等一系列任务。数据清洗融合费时费力已成为大数据由价值到赋能转化的主要瓶颈。现有工作侧重解决面向领域的数据清洗融合问题,缺乏对跨领域通用的数据清洗融合的研究。大模型利用庞大的参数规模和复杂的模型结构,从大规模的数据集中学习了广泛的通用知识,为构建通用的数据清洗融合系统带来了新的机会。本报告将探讨基于大模型构建通用数据清洗融合系统的关键挑战,介绍报告人的一些初步进展,并对未来的研究方向进行展望。
版权所有:中国计算机学会技术支持邮箱:conf_support@ccf.org.cn