【高等讲堂】多模态视觉结构学习

发布时间：2024-05-15 15:50:46

主讲人简介：

李玺，博士，浙江大学求是特聘教授，国家杰青，国家青年特聘专家，主要从事人工智能领域研究，提出了多因子合模型学习新理论，探索了知识引导的模型结构设计与搜索新方法，开拓了复杂异构图像结构语义理解的新技术。担任国际权威期刊的编委和顶级会议的Area Chair。

讲座简介：

互联网和物联网时代催生了海量多模态大数据，从这些海量数据中有效提取知识迫切需要各种人工智能的技术和手段。因此，如何进行人工智能驱动的多态计算已经成为当今知识经济时代亟待解决的核心技术问题。本报告主要围绕数据驱动的人工智能学习方法，进行大规模图像/视频数据的视觉特征学习，从目标视觉感知特性、视觉特征表达、深度学习器构建机制、高层语义理解等多维度视角进行了深入剖析，并引入了大规模多模态特征学习所涉及的主要研究问题和技术方法。然后系统地回顾了多模态特征表达和学习领域的不同发展阶段，介绍了近年来我们利用特征学习进行视觉语义分析和理解所做的一系列代表性的研究工作及其实际应用。报告的最后将和大家一起探讨一下涉及多模态特征学习所面临的一些开放性问题和难题。

责任编辑：徐楠

我要评论已有条评论

发表评论

全部评论