电子科大张量建模与计算团队在AAAI 2021发表论文
近日,电子科技大学张量建模与计算团队与日本理化学研究所张量学习团队一篇合作论文被人工智能领域顶级会议AAAI 2021(CCF A类推荐会议)接收,论文题为《Fully-Connected Tensor Network Decomposition and Its Application to Higher-Order Tensor Completion》。电子科技大学博士生郑玉棒为论文第一作者,电子科技大学黄廷祝教授和赵熙乐教授为通讯作者,合作作者为日本理化学研究所张量学习团队负责人Qibin Zhao博士和西南财经大学蒋太翔副教授。
该研究提出了一种全连接张量网络(fully-connected tensor network, FCTN)分解。其优势在于:(1)建立了任意两个因子间的运算,使其可以充分地刻画张量任意两个模式(modes)间的相关性;(2)具有转置不变性,即对于不同的张量mode排列,分解本质上是相同的。进一步地,论文将FCTN分解应用到张量填充任务中,设计了基于临近交替极小化(proximal alternating minimization, PAM)的求解算法,证明了算法的收敛性。
信息技术的飞速发展使得数据形式逐渐趋向高维化,如视频数据、高光谱图像以及交通流量数据,通常可用张量表示。然而,高维数据往往存在像素缺失现象,如成像条件不佳导致高光谱图像部分像素被云覆盖以及感知器故障导致交通数据在连续时间内元素缺失 (如图1所示),这种退化现象严重影响了其后续应用。张量填充旨在从部分的观测数据中反推出完整的真实数据,属于经典的反问题,通常需要利用正则化方法引入高维数据的先验知识 (内在性质) 限制解空间并稳定求解过程。在众多先验知识中,高维数据的全局相关性 (低秩性) 尤为重要。
图1:被云覆盖的高光谱图像和具有元素缺失的交通数据
张量分解旨在将一个高阶张量分解为一系列低维因子,对张量的全局相关性具有强大的捕捉能力。
在过去的十年中,Tucker和CANDECOMP/PARAFAC(CP)分解取得了巨大的成功。但是Tucker分解只能描述张量一个mode与其他所有modes之间的相关性,而不是任意两个modes之间的相关性,且需要较高的存储成本;CP分解无法灵活刻画张量不同modes之间的不同相关性。最近几年,张量链(tensor train, TT)和张量环(tensor ring,TR)分解显示出了处理高阶,特别是超过三阶张量的强大能力 。更具体地说,TT分解将一个N阶张量分解为N-2个三阶张量和两个矩阵。并且,从第一个TT因子(矩阵)开始,每个因子都需要与下一个因子进行运算,直到最后一个因子(矩阵)。TR分解用三阶张量代替了TT因子中的两个矩阵,并在它们之间建立了额外的运算。但是TT和TR分解有两个明显的局限性:(1)这两种分解方法只建立了相邻两个因子之间的运算,而不是任意两个因子之间的联系,导致其相关性度量能力有限;(2)它们只在张量的modes作反向排列(TT和TR)或循环移动(TR)时具有不变性,这意味着TT和TR分解对张量mode的排列高度敏感。那么如何解决这些问题?
图2:Tucker、CP、TT和TR分解
该论文提出了一种新的张量分解,即全连接张量网络(FCTN)分解,它将一个N阶张量分解成一系列低维的N阶因子,并在任意两个因子之间建立了一个运算,其数学表达形式为:
FCTN秩定义为由 组成的向量。
图3:FCTN分解
图3展示了FCTN分解的图表示。可以看到,在二阶情况下,FCTN分解实际上是矩阵分解,而FCTN秩实际上是矩阵秩。此外,对于高阶张量,任意两个FCTN因子间都有一个大小相等的mode用于进行运算,这使得FCTN分解能够充分表征张量任意两个modes之间的相关性。
众所周知,矩阵分解具有转置不变性,即。而对于高阶张量,论文证明了FCTN分解同样具有广义转置不变性,即
也就是说对于不同的张量mode排列,FCTN分解本质上是相同的。这意味着在使用FCTN分解时,不需要考虑张量mode排列顺序。而对于TT和TR分解,不同的mode排列对应的分解是不同的,使用时通常需要寻找最优mode排列。
为了验证FCTN分解的优越性,论文将其应用于张量填充任务,建立了如下基于FCTN分解的张量填充模型
同时,论文设计了一种基于临近交替极小化的求解算法,并证明了其理论收敛性。
研究人员通过仿真数据实验,通过对比相应填充方法的性能,验证论文提出的FCTN分解相对于TT和TR分解的优越性。所有方法均由PAM求解以消除算法的影响。
此外,对于每个数据,论文测试两种张量mode排列,即原始排序和一种广义置换。重建张量与真实张量之间的相对误差(RSE)被用来评价不同方法的性能,图4为不同缺失率(missing ratio, MR)下不同方法的重建结果。
图4:不同缺失率下不同方法的重建结果
从图4可以观察到,首先,FCTN-TC方法对不同的张量mode排列具有鲁棒性,而TT-TC和TR-TC方法的性能对其比较敏感;其次,在不同的数据、缺失率和mode排列情况下,FCTN-TC方法在三种方法中总是获得最低的RSE值,也就是最优的重建效果。
在真实数据实验中,论文选取了基于不同张量分解的张量填充模型作为对比方法,即HaLRTC、TMac、t-SVD、TMacTT和TRLRF。PSNR和RSE被用来评价不同方法的性能。
表1报道了四个彩色视频在不同缺失率下所有比较方法的PSNR值和运行时间。可以看到,在所有测试数据上,所提出的FCTN-TC方法与其他方法相比性能更佳。
表1:四个彩色视频在不同缺失率下所有比较方法的PSNR值和运行时间
在交通数据中,传感器故障通常会导致一段时间的数据全部丢失。因此,论文考虑列缺失问题。
图5展示了某一天的重构结果以及整个数据的RSE值。可以看出,论文提出的FCTN-TC方法在所有对比方法中取得了最好的结果。
图5:40%缺失率下不同方法在某一天的重建结果以及整个数据的RSE值
这项工作有三方面的贡献:提出了一种全连接张量网络分解,它突破了TT和TR分解的局限性;将全连接张量网络分解应用于张量填充问题,并设计了一种基于PAM的求解算法;从理论上论证了算法的收敛性。
相关链接:
论文链接:https://www.aaai.org/AAAI21Papers/AAAI-4990.ZhengY.pdf
https://yubangzheng.github.io/
代码链接:https://yubangzheng.github.io/
未经允许不得转载:大学门户 » 电子科大张量建模与计算团队在AAAI 2021发表论文
- 上一篇:校领导调研航空工业成都飞机设计研究所
- 下一篇:信通学院为留校学生举办迎新春系列活动
相关推荐
- 我校承办的第七届中国城市治理与学科发展研讨会举行
- 春季学期“互联网+”复合型精英人才双学位培养计划工作研讨会召开
- 学校聘任第九届学位与研究生教育督导专家组
- 物理学院2020-2021学年青年教师教学竞赛举办
- 电子科技大学&华南理工大学:90后,到!
- 刘帆:太棒了,努力追梦的成电少年!
- 【抗击新冠肺炎】黄晓波:带病援鄂,奋力战“疫”!
- 校工会推进健康关护社区专属服务落地
- 格拉斯哥学院第五届“栋梁工程·瓦特班”开班
- 成电师生热议全国脱贫攻坚总结表彰大会
- 学校召开2020年度文科科研工作会
- 15岁上成电!他的“秘籍”是……
- 校园舞蹈大赛 赋予青春以激情与律动
- “后疫情时代的思考:园艺与生命”研讨会在我校举行
- 经管学院青年教师在UTD 24国际顶级期刊发表学术论文
- 刘明侦教授团队在《先进科学》上发表研究成果
- 我校艺术团在四川省大学生艺术专场展演中获三项一等奖
- 科技部党组书记、部长王志刚一行来校调研
- 马克思主义学院举行青年教师教学竞赛
- 计算机学院开展2020年“寒冬就业双促行”活动
新闻公告
- 计算机学院研究生党支部组织学习“开学第一课” 03-17
- 学校召开会议部署落实疫情防控工作 03-16
- 王芝同学,你真棒! 03-15
- 张云勇校友:青春之花如何更美? 03-15
- 经管学院启动新学期环校健身跑暨颁奖仪式 03-15
- “廖妈”,太强了! 03-14
高考招生
- 电子科技大学2018全日制普通本科招生章程 08-05
- 电子科技大学2016全日制普通本科招生章程 08-05
- 电子科技大学2017全日制普通本科招生章程 08-05
- 电子科技大学2014年全日制普通本科招生章程 08-05
- 电子科技大学2015年全日制普通本科招生章程 08-05
- 格拉斯哥学院2015招生简章 08-05
- 电子科技大学2013年全日制普通本科招生章程 08-05
- 电子科技大学2011年全日制普通本科招生章程 08-05
- 电子科技大学2012年全日制普通本科招生章程 08-05
- 电子科技大学2008年招生章程 08-05