微信里点“发现”,扫一下
二维码便可将本文分享至朋友圈
演讲摘要:大模型已成为理解和处理自然语言的变革性力量,极大推动了通用人工智能的发展。不同于自然语言,“科学语言”是科学家定义的一种包含特定语义符号和语法的专门语言系统。大模型逐渐突破传统语言界限,覆盖了多个学科中的科学语言,催生了科学大模型的发展,成为科学智能(AI for Science)的关键方向。在本次讲习班中,我将以生物学和化学为例,探讨和总结科学大模型在文本、小分子化合物、大分子蛋白质和基因序列及其多模态应用中的表现,涉及到模型架构、能力、数据集和评估等方面。最后,我将讨论科学大模型面临的技术挑战,并简析未来研究方向。
讲者简介:张强博士,浙江大学百人计划研究员,曾在英国伦敦大学学院(University College London)计算机系攻读博士学位并担任博士后,师从国际著名的信息检索与数据挖掘领域的 Emine Yilmaz 教授。他的研究主要涉及到机器学习、自然语言处理、知识图谱和 AI for Science 等方向,在 Nature Machine Intelligence、Nature Communications、NeurIPS、ICML、ICLR、AAAI、ACL等人工智能顶级学术会议和期刊发表四十余篇文章。他主持或参与国家自然科学基金、科技部科技创新 2030-“新一代人工智能”重大项目、浙江省重点研发计划项目、CCF- 腾讯犀牛鸟基金、CAAI- 华为MindSpore 基金等近 10 项。