【创新前沿】信息学院相继在Physics Reports和计算机顶会CVPR上发表成果

稿件来源:信息学院 作者:信息学院 摄影:信息学院编辑:浏览:10

近期,信息科学与工程学院在国际物理和交叉科学的顶级期刊Physics Reports(影响因子30.5)和国际计算机视觉顶级会议CVPR 2023(中国计算机学会推荐国际学术会议A类,CCF-A类)上,分别以“Signal propagation in complexnetworks”“VL-SAT: Visual-Linguistic Semantics AssistedTraining for 3D Semantic Scene Graph Prediction in Point Cloud” (会议highlight亮点论文,占所有录用论文的10%,占所有投稿论文的2.5%,arxiv预印本链接为https://arxiv.org/abs/2303.14408)、“EMT-NAS: Transferring architectural knowledge between tasks from different datasets”为题‍发表了三篇关于复杂系统和人工智能的最新成果。

复杂系统中的信号传播是理解集体行为出现的关键因素,近年来受到了学界的广泛关注。为了实现对复杂系统中信号传播特性与机制的更深层次理解,团队进行了全面的回顾与总结。在综述中,首先归纳了现有表征节点之间相互作用性质的不同模型,包括流行病模型、Kuramoto模型、扩散模型、级联失效模型和描述神经元动力学的模型。其次,综述涵盖了不同类型的复杂网络及其拓扑结构,包括时序网络、多层网络和神经网络,同时回顾了利用信号传播特性的网络时间序列分析技术,如网络相关性分析、网络重建、节点定位和链路预测等方法,然后,总结了复杂系统中信号传播机制在流行病学、社会动力学、神经科学和机器人学方面的应用。最终,对与复杂系统中信号传播相关的未来研究方向进行了讨论,希望能促进工程、社会和自然科学领域的创新应用。

图片说明:群体行为中的内隐式信息传播

针对如何利用可视化语言语义来辅助三维结构理解的难题,在论文“VL-SAT: Visual-Linguistic Semantics Assisted Training for 3DSemantic Scene Graph Prediction in Point Cloud”中创新地提出了视觉语言语义辅助训练方案VL-SAT,该方案可以显著增强3DSSG预测模型对长尾和模糊语义关系的区分。其主要思路是通过训练一个强大的多模态oracle模型来协助3D模型的构建。这个多模态模型基于视觉、语言和三维几何信息学习可靠的结构表示和特征,可以在训练阶段不均匀地传递给3D模型。

图片说明:视觉语言语义辅助训练方案VL-SAT框架图

针对在多个相关任务上联合训练深度学习神经网络架构权重参数可能导致性能下降,即所谓的负迁移难题,在论文“EMT-NAS: Transferring architectural knowledge between tasks fromdifferent datasets”中创新地提出了进化多任务-神经架构搜索方法EMT-NAS。EMT-NAS算法的核心在于通过在不同任务之间分享神经网络架构的知识,从而达到优化多个任务的效果。与传统的多任务学习不同,EMT-NAS为每个任务设计了个性化的网络架构和权重,从而有效地缓解了负转移的发生,此外,还提出了一种基于适应度重评估的方法,以缓解因参数共享和小批量梯度下降训练方法导致的性能波动,避免在搜索过程中失去有希望的神经网络架构。这项研究成果不仅缓解多任务学习中的负迁移,而且通过利用不同数据集中的任务相似性能有效地提高多任务学习算法的搜索效率和最终模型的分类精度。

图片说明:进化多任务-神经架构搜索方法EMT-NAS流程图

上述发表于Physics Reports的成果作者包括信息学院唐漾教授,发表于国际计算机视觉顶级会议CVPR 2023的成果作者包括欧洲科学院院士、IEEE Fellow金耀初教授,国家高层次人才杜文莉教授和国家高层次人才唐漾教授。相关成果得到了国家自然科学基金基础科学中心项目、国家重点研发计划项目、国家自然科学基金重点项目、国家高层次人才计划和上海市前沿科学研究基地等项目和基地支持,展现了信息学院在人工智能前沿领域和多学科交叉领域的最新成果。‍

发布时间:2023-04-11