在智能科技时代,科学数据开放共享有力推动科技创新。采用先进存力建设科学数据基础设施,实现高质量科学数据的汇聚,推进面向全球的科学数据开放共享,日益受到全球重视。本论坛邀请长期从事先进存力和科学数据开放共享工作的专家,围绕数据统一存储和管理,数据汇聚协议,多模态检索,知识图谱构建,数据流通可信确权和跨域协同隐私保护等关键技术,展开讨论交流,促进建设科学数据基础设施和人工智能推动科研范式快速变革。
曾令仿
之江实验室
之江实验室研究员,博士生导师。入选“浙江省‘万人计划’科技创新领军人才”。2006年博士毕业于华中科技大学并留校任教直至2020年5月加入之江。曾为华中科技大学武汉光电国家研究中心、计算机学院副教授(2009年2月-2020年4月),新加坡国立大学博士后研究员(2007年6月–2008年8月,2010年11月–2013年7月),德国美因茨大学数据中心Visiting Professor(2016年5月–2018年5月)。CCF第十三届理事会理事 ,CCF第十三届会员代表,CCF杰出会员(2021),CFF杰出演讲者(2019),CCF CNCC2018、CNCC2019、CNCC2020、CNCC2021技术论坛主席或共同主席。CCF杭州分部执行委员,CCF开源发展委员会执行委员,CCF高性能计算专业委员会执行委员,CCF信息存储专业委员会执行委员。IEEE Transactions on Parallel and Distributed Systems评审委员会成员,Journal of High-PerformanceStorage编委。
黄永峰
清华大学
黄永峰,清华大学电子工程系教授。博士,博士生导师,首届全国网络安全“十佳”优秀教师。IEEE Senior Member;ACM SIGWEB中国分会副主席;中国高科会人工智能+教育专委会副主任委员;中文信息学会开源情报技术专委会副主任等。多年来一直从事互联网及其信息安全理论与技术的研究和教学工作。先后主持了国家自然基金委的重点和面上项目,科技部973、863、重点研发专项等科研项目50余项。担任了多家国际著名期刊的编委以及重要国际会议主席;已在Science(E-letters)、Nature 子刊.、IEEE/ACM Tran.、中国科学等国内外著名期刊和重要国际会议发表学术论文200多篇;出版专著6部、译著2部,教材2部。申请发明专利30余项(已授权16项,技术转让2项)。获得省部级科技成果奖一等奖3项,二等奖3项;优秀教材一等奖1项、清华大学教学成果奖2项。
报告题目:面向行业分散数据安全共享和学习的集成架构
报告摘要:数据资产的价值利用是国家现在和未来的重要发展战略。然而,行业数据由于各方面原因造成了数据存储和管理的分散性,从而极大地影响了行业数据资产使用价值和利用效益。目前,行业数据资产的价值利用模式包括2个层次,分别是通过数据共享平台实现多源异构数据的互联互通,即原始数据不出域;以及是通过分布式机器学习架构学习数据特征实现模型共享,即数据可用不可见。本报告围绕行业数据资产的2种利用模式,介绍了一套面向面向行业分散数据的安全共享和学习集成架构。该架构采用云计算与区块链的融合机制,集成了基于数据寻址编码的数据互联技术,基于知识图谱的数据语义融合技术,以及基于属性基加密的跨域访问控制技术,以及联邦学习的隐私增强技术等,实现行业分散数据的可信共享和安全学习。同时该报告还介绍该架构的应用案例。
杜一
中国科学院
杜一,中国科学院计算机网络信息中心研究员,博导。国家优秀青年科学基金项目负责人,重点研发青年科学家项目负责人,北京市科技新星,中国科学院青促会会员。目前为大数据技术与应用发展部副主任,主要从事科技大数据知识图谱与数据挖掘方面的研究。承担国家重点研发计划、科技委创新特区等项目十余项,发表学术论文70篇,授权发明专利23项。主持的大数据项目,为多个国家部委及中国科学院学部局等院机构提供服务,保障了多项国家重要任务。
报告题目:开放科学数据驱动科研创新
报告摘要:科学数据开放共享成为推动科研创新的主要动力之一。本报告以国家基础学科公共科学数据中心、信息科学分中心及中国科学院科学数据总中心的实际建设经验为基础,从平台、工具、方法、案例等方面,阐述科学数据的开放共享对于科研创新的促进。
付印金
中山大学
付印金,中山大学副教授、研究生导师、鹏城孔雀计划特聘岗位专家。主要研究方向为分布式存储、云计算与大数据保护。主持过国家重点研发子课题、国家自然科学基金、江苏省自然科学基金、华为胡杨林基金等课题多项,参与过国家重点研发、国家自然科学基金重点、国防科技基础加强和军队预研等课题。先后在ACM/IEEE Trans.、FAST、Middleware、MSST、DATE等国内外主流期刊和会议上发表学术论文50余篇,授权国家发明专利10余项,出版教材3部。担任中国计算机学会(CCF)高级会员、CCF信息存储技术专委会常务委员、CCF系统软件专委会执行委员、《计算机工程》编委。
报告题目:智能分层重删数据存储技术研究
报告摘要:针对大规模分层存储系统现有的存储性能瓶颈,提出一种智能化重删感知的分层存储架构与管理方法,通过高效的数据缩减技术与智能数据分层调度方法,不仅提升各层存储空间利用效率,还能大幅优化分层存储系统性能。
徐泉清
北京大学
徐泉清,北京大学计算机系博士、正高级工程师、蚂蚁技术研究院数据库实验室研究员,目前从事OceanBase分布式数据库前沿技术研究工作,浙江省省级海外高层次人才、杭州市全球引才“521”计划高层次人才,研究领域包括分布式数据管理、区块链数据管理、云数据管理等。徐博士是国际工程与技术学会会士(IET Fellow)、CCF杰出会员和数据库专委会执行委员、国际计算机协会(ACM)高级会员和国际电气与电子工程师协会(IEEE)高级会员。
报告题目:OceanBase数据库中多模态数据存储、管理及检索
报告摘要:OceanBase是一款国产自主研发的高性能分布式关系型数据库系统,支持多模态数据的存储、管理和检索,能够处理结构化数据、半结构化数据和非结构化数据。通过内置的JSON数据类型和全文搜索功能,OceanBase能够有效地存储和查询半结构化数据,如文档、社交媒体内容和Web数据,实现复杂的数据管理需求。全文索引功能则支持对大量文本数据进行快速检索,适用于搜索引擎和内容检索系统。对于多模态数据的处理,OceanBase提供了丰富的SQL支持和高效的数据访问机制,能够满足多种数据应用场景下的需求。
李焱
深圳国家基因库高级工程师
李焱,深圳国家基因库高级工程师主要的方向是高密度JBOD,SAN存储设备和Lustre文件系统适配和运维
报告题目:存储测试中的盲点和反思
报告摘要:记录了基因库在适配块存储/文件系统中遇到的若干问题和期间在存储上一些奇遇,分享了使用开源工具链对这些问题的排查和解决,以及对一些未解决问题的思考。
版权所有:中国计算机学会技术支持邮箱:conf_support@ccf.org.cn