针对传统模型预测控制(MPC)难以满足高采样率快速系统实时性要求的问题,提出增量支配MPC方法.首先,引入二进制变量定义相邻控制量之间的支配关系,构建支配关系矩阵,并利用该矩阵使待求解的控制量受限,降低在线求解自由度;然后,为使控制器专注于当前控制量的计算,利用状态量的平均误差和平均求解时间构建损失函数,并基于二进制平衡优化(BiEO)算法对支配关系矩阵中的受限部分进行优化,建立增量支配MPC;最后,利用Matlab进行实验验证.结果表明:本方法在不影响控制平稳性的基础上,控制精度有小幅提升,实时性有大幅提升;当控制域为50和70时,求解时间可分别降低43.06%和31.99%,优于现有方法.
针对足式机器人学习过程中探索能力不足、样本利用率低及行走模式不稳定等问题,将动态势能融入基于势能的奖励塑造中,提出一种基于动态势能奖励塑造的奖励函数设计方法.该奖励函数在训练过程中通过动态调整机器人当前动作控制获得的奖励值,从而提高学习过程的探索能力.在搭建的足式机器人虚拟训练环境中,使用近端策略优化算法(PPO)结合基于动态势能奖励塑造的奖励计算实现了双足机器人定速行走控制.测试结果表明:所提出的方法能有效提高训练速度,机器人的运动姿态也更加自然与稳定.
针对基因调控网络结构可能随时间变化的问题,通过引入平均驻留时间切换机制,建立了切换型基因调控网络模型,并研究了切换系统的动态输出反馈控制问题;同时,为节约通信资源,引入了事件触发机制.在系统状态不完全可测的情况下,利用多李雅普诺夫函数法和线性矩阵不等式技术将动态输出反馈控制器设计问题转化为求解一组线性矩阵不等式,建立了闭环系统稳定的充分条件,控制器参数由线性矩阵不等式的解导出.根据线性矩阵不等式得到的条件,设计了事件触发条件.最后,通过一个数值算例验证了所提方法的正确性和有效性.
针对滚动轴承在故障数据有限且在不同工况下采集的信号存在不同的分布特性,导致现有故障诊断方法在表现出较低的故障诊断准确率低、鲁棒性差,提出一种基于多传感器融合(MSF)和改进的InceptionNet网络(I-InceptionNet)的故障诊断方法.该方法首先利用多相抗混叠滤波器对采集的多种信号进行重采样,转换为红绿蓝(RGB)图像作为模型的输入,保留信号的多维信息;然后,采用注意力特征融合(AFF)方法改进InceptionNet网络的连接层,融合多传感器图像特征,提高模型的分类性能;最后,对融合后的图像进行故障状态分类.实验结果表明:所提方法在变工况条件下的故障诊断性能显著优于单一信号源及其他对比方法,特别是在数据量有限的情况下,平均诊断准确率达到98.5%,具有优越的诊断精度和鲁棒性.
针对无线传感网络在遭受恶意攻击时的目标跟踪问题,提出一种基于信任的分布式容积卡尔曼融合滤波算法,以提升目标跟踪的精确性和鲁棒性.该算法包括测量更新、K-means降维两簇聚类融合和时间更新三个关键步骤.首先,各节点利用局部测量对目标状态估计进行更新,获得当前时刻的局部后验估计;其次,各节点基于局部交互的所有后验估计与融合先验局部估计之间的相异性特征,执行K-means降维两簇聚类,相异性较小的节点估计被划分为可信节点估计,而相异性较大的则视为不可信节点估计;随后,不可信节点估计被剔除,可信节点估计通过自适应权重融合以提高可靠性;最后,各节点利用当前时刻的局部融合估计,预测目标下一时刻的状态估计(即先验估计).仿真结果表明:本算法当应对虚假数据注入攻击、拒绝服务攻击、随机攻击、重放攻击和混合攻击等恶意网络攻击时,均表现出优越的鲁棒性.
针对重叠三元组的联合抽取问题,提出一个基于混合关联度的级联关系三重抽取模型.本模型首先引入位置关系来构造关联度编码器,联合双向转换器表示编码器(BERT)形成双编码器结构,将输入文本转化为带有上下文语义和词-句关联信息的词向量;然后,将词嵌入向量输入实体标记解码器,采用级联二进制标注表对所有可能出现的头实体的开始和结束位置进行标注,得到候选头实体集合;最后,将融合了混合关联度的候选头实体集作为关系-对象标记解码器的输入,进行对象和实体对关系的识别.在百度和纽约时报两个数据集上的实验结果表明:与已有模型相比,本研究模型在各评估指标上均有所提升,验证了所提出方法的有效性.
为解决多阶任务并行的相似轨迹查询(MPST)当执行基于轨迹相似度的车辆轨迹查询时产生大量无用数据和冗余数据进而导致系统性能下降的问题,提出一种基于环域计算的无用数据删除和冗余数据合并方法.该方法采用环域结构对点伴随车对进行属性判别——偶然伴随属性或有效伴随属性,并通过对偶然伴随车对(即无用数据)的删除和有效伴随车对(即冗余数据)的合并来减少中间结果的大小,进而减少系统的I/O开销,缩短响应时间.为了验证本方法的有效性,实现了数据删除与合并的相似轨迹查询(EMSR)原型.实验结果表明:与MPST相比,EMSR生成的中间结果集为MPST的5.7%~11.2%,系统响应时间为MPST的30.2%~57.7%.
针对现有基于深度学习的能量信息泄漏评估方法易导致泄漏被隐藏,且神经网络的训练效率偏低的问题,提出一种基于奇异值分解(SVD)和多层感知器(MLP)的多分类能量信息泄漏评估方法.首先基于SVD对原始能耗数据进行投影,并筛选出部分特征以减小数据处理量;然后根据所对应明文的不同将投影后的数据分为多组,并用“多分类”MLP对其进行泄漏评估.分别基于仿真能耗、ASCAD能耗和Chipwhisperer能耗进行验证,结果表明:相比现有深度学习评估方法,该方法检测出泄漏所需能量迹样本量分别减小了18.5%,17.1%和13.6%,评估耗时分别减少了7.1%,18.8%和21.1%.
为了解决人脸关键点检测中的大姿态问题,并获得精度和计算量的平衡,提出一种基于姿态约束特征增强的三阶段轻量级网络.第一阶段采用轻量级骨干网络;第二阶段提出了基于空间通道感知模块的特征金字塔,帮助模型感知面部几何关系;第三阶段使用特征加强网络进行特征增强并保持高分辨率表示,有利于提高热图回归的精度.检测头结合坐标回归与热图回归,同时预测热图分数和坐标偏移,帮助提高模型精度.提出融合数据平衡姿态因子和偏航因子的损失函数进行姿态约束.针对数据平衡姿态因子,首先通过普氏分析法和主成分分析法将样本投影到一维得到姿态系数,然后利用区间占比率和姿态系数即可得到;针对偏航因子,设计了偏航程度计算公式进行计算.实验结果表明:本研究算法达到了精度与计算量的平衡,并有效提升了大姿态下的检测精度.
针对现有连续手语识别方法依赖连接时间分类损失(CTC)实现序列对齐,难以解决因演示习惯和上下文切换导致的类内差异与类间相似问题,提出一种基于手语单词约束的识别网络,包含单词存在约束和单词计数约束:前者通过前K个高概率时间点的平均池化和存在性标签编码,显式强调与抑制目标单词;后者结合时间注意力和全局平均池化,增强时间信息捕获能力.在PHOENIX-2014,PHOENIX-2014T和CSL三个数据测试集上的测试结果表明:所提方法的词错误率分别为21.1%,21.6%和1.5%,验证了其有效性和泛化能力.
基于跳跃连接滑窗自注意力机制,提出一种低时间复杂度的互联网应用传输降质人脸图像增强方法.该方法通过集成窗口自注意力机制与滑动窗口自注意力机制有效提取图像全局特征,同时引入跳跃连接省去部分相似度较高的复杂自注意力计算.以微信软件传输降质为例,基于现有CelebAMask数据集制作了可共享的互联网传输降质人脸图像数据集,在该数据集上进行了多参数的消融实验及多方法的对比实验,验证了所提出方法的有效性.实验结果表明:相比目前其他的人脸图像增强方法,本方法在保持重构图像主观视觉效果和客观指标数值未出现明显下降的同时大幅降低了时间复杂度.
针对目前的先进立体匹配模型通过堆叠深度模块不断提高域内训练精度,导致计算成本提高且难以兼顾跨域数据的模型退化问题,对立体匹配的特征提取、代价计算与聚合、视差细化等子流程进行模型重构,并借助传统模型弥补深度网络缺陷,提出一种兼顾跨域数据泛化能力和快速推理能力的低复杂度立体匹配模型——MobileGStereo.在特征提取阶段,深度网络旨在提取像素之间的差异特征而非复杂的语义特征,同时特征图的表征分布应注重本身而非整个批次,因此采用基于层归一化的MobileNet作为特征提取骨干.在代价计算与聚合阶段,提出一种跳跃代价体以降低高分辨率特征在代价聚合阶段的计算复杂度;为聚合不同尺度特征计算的代价体,通过拟合传统聚合方法提出基于3D深度可分离卷积的跨尺度聚合方法;最后以轻量沙漏型结构对跨尺度聚合后的代价进行多维信息融合并用于回归初始视差.采用基于ConvGRU的循环结构,借助特征信息循环细化初始视差.在基准数据集上进行验证,实验结果表明:所提方法推理1 226×370分辨率立体图片仅耗时75 ms,在显著提高模型推理速度的同时能够在跨域数据泛化能力测试中取得与最先进算法相当的量化性能.
面对深度伪造技术在人脸伪造领域的应用对信息安全构成的严重威胁,首先,全面回顾并总结了深度伪造人脸生成技术的最新进展和主要特点.该技术欺骗性强、伪造成本低且检测难度高,使公众和现有检测手段难以有效分辨与检测;其次,根据伪造类型差异,将深度伪造人脸生成技术分为人脸完全生成、属性编辑、身份替换和面部重演四类,并针对各类型技术展开详细阐述与分析,明确其技术原理与应用场景;再次,系统总结归纳了深度伪造人脸检测技术涉及的真实人脸与深度伪造人脸数据集,同时以特征选择为切入点将现有深度伪造人脸检测方法进行分类和分析比较,包括基于生物特征、身份信息、图像空间特征、图像频域特征、时序特征和混合特征的检测方法等;最后,分别探讨了深度伪造人脸生成与检测技术领域面临的挑战及未来研究方向.
为进一步促进鸟瞰图(BEV)感知算法研究及性能改善,论述了BEV感知的优势和最新工作,介绍了BEV感知的相关数据集和性能评估指标;总结了近年来的BEV感知处理方法,从BEV感知的传感器输入数据出发,将BEV感知分类为BEV相机、BEV激光雷达和BEV融合三种,并对三类算法和解决方案展开了深入阐述.其中,BEV相机根据几何变换方法分为显式变换和隐式变换,显式变换又可分为“2D-3D”和“3D-2D”方法,隐式变换可分为基于Transformer和基于多层感知器(MLP)的神经网络模型方法;BEV激光雷达根据点云特征提取的方法可分为基于体素的方法和基于支柱(Pillar)的方法;根据来自多个传感器输入数据形式,BEV融合分为相机-激光雷达融合、时序-空间信息融合和深度-高度信息融合.此外,还指出了该领域未来研究的六大方向,旨在为从事BEV感知算法及相关技术的研究人员提供有益的见解,并期望激发更多学者对BEV感知领域的研究与应用投入更多的关注与探索.
针对已有足迹图像估计人体多种生物特征方法存在多任务联合训练任务冲突问题,提出一种基于足迹高频特征的多任务人体生物特征估计网络——HiFM-Net.首先,针对足迹图像类间差异小、类内差异大特点设计基于多尺度拉普拉斯卷积核的高频特征分支,提取足迹的轮廓和重压区等高频特征;其次,为解决多任务冲突问题,设计基于软共享结构和注意力机制的多任务交互分支提取任务特定特征,挖掘、利用任务间的关联性;然后,融合模块将足迹共享特征和足迹高频特征分别与任务特定特征正交融合,提高每个任务特征对细节的表征能力;最后,在光学赤足足迹数据集上进行实验.实验结果表明:多任务综合评价指标提升6.48%,身高和体重任务相比单任务C3准确率分别提升6.25%和8.26%,显示本研究方法能有效改善足迹多任务冲突并提升单任务性能.
针对现有乳腺肿块检测算法中存在不规则肿块漏检率高且容易误诊的问题,提出一种基于多分支结构和多层级注意力的肿块检测网络模型.为了解决小肿块特征表达能力差的问题,设计了一种非对称块和空洞卷积构成的多路分支结构,在降低参数量的同时充分提取融合多层次特征;提出一种基于多层级特征图的注意力机制,通过注意力模块在相邻层之间融合深层注意力信息和浅层特征图信息,以获取重要特征及其位置.为解决肿块正负样本失衡的问题,在样本选择过程中引入自适应样本划分算法,根据锚框和肿块的交并比值集合的分布特征,自适应计算划分阈值,确保正样本比例和训练的有效性.在CBIS-DDSM数据集上进行实验,结果表明:该网络模型的平均精度均值达到86.10%,漏检率低至10.19%,实际检测结果优于其他主流算法.
为提高云外包隐私保护K-means算法的聚类效率和计算来自多方用户的密文数据,提出一种可以高效计算多方密文的云外包隐私保护K-means聚类方案.首先,基于稀疏约束的非负矩阵分解算法实现了高维数据的低维表示,从而有效提高了K-means聚类算法在高维数据下的聚类效果;然后,采用基于共用密钥的多密钥全同态加密技术解决了多方密文在云服务器进行K-means聚类时存在同态运算复杂的问题,在此过程中通过构建四个安全的基础协议使隐私信息得到了保护;最后,使用三角不等式定理实现K-means聚类算法的剪枝优化,减少了聚类中存在的冗余距离计算,提高了聚类效率.实验结果表明:所提方案当处理高维数据时有着较高的聚类效率,且准确率接近于明文数据下的聚类.
针对多变量时间序列预测中冗余时间序列变量会引入噪声而使序列预测精度降低的问题,提出一种基于频域注意力机制重要变量筛选的多变量时间序列预测模型.首先,该模型通过时间序列分解将多变量时间序列分解为季节项和趋势项.对季节项设计了一种频域注意力机制,在频域上计算多变量时间序列变量之间的相关函数并通过激活函数得到各个变量的权重,以权重反映各个变量的重要性,从而降低冗余变量对模型预测性能的影响.然后,设计了一种时间序列的多尺度特征提取方法,将季节项在时间方向以相同比例多次分割,通过多层感知机对分割后季节项的时间段和趋势项分别进行特征提取,获取季节项的多尺度特征,从而增强模型对时间序列的特征提取能力.最后,将季节项的多尺度特征和趋势项的特征在时间方向融合并通过全连接层映射,得到多变量时间序列的预测输出.在6个公开的多变量时间序列数据集上对时间序列预测的实验结果表明:本研究所提出的模型的平均预测精度相比Autoformer,FEDformer,Crossformer,DLinear,iTransformer和TimesNet模型均有显著的提升.
基于多元演绎的良好特性,通过对参与演绎的文字进行正负属性分类,提出一种基于子句正负文字的多元演绎方法.通过主文字的属性得到子句的演绎顺序,具有较好的文字消元作用,从而优化多元演绎路径;基于该方法提出一种多元演绎算法,通过矛盾体分离式评估和回溯机制使文字可灵活参与设定条件的演绎,从而提升多元演绎的效率.将该多元演绎算法运用到国际先进的一阶逻辑自动定理证明器Eprover2.6中,以2022年和2023年国际竞赛例为测试对象,在300 s的标准测试时间内,加入了该算法的Eprover2.6相比原始的Eprover2.6分别多证明了18个和17个定理;当证明定理数量相同时,平均证明时间分别缩短了6.485 s和5.092 s;能证明Eprover2.6未证明的19个和18个定理,分别占未证明定理总数的15.70%和14.63%;以TPTP(定理证明器的数千个问题)问题库中rating为1的问题为测试对象,能证明10个其他有证明器都无法证明的定理.实验结果表明:所提出的基于子句正负文字的多元演绎方法和算法能有效提升一阶逻辑自动定理证明的能力和效率.
为了提高神经网络模型从全局到局部的特征提取能力,增强雾图复原过程中的泛化性能,提出一种结合宽型提取和径向增强的二阶段图像去雾算法.算法通过两个阶段对有雾降质图像进行清晰化复原,在特征提取阶段,结合Transformer的全局关注能力与可变形卷积的局部感知能力,提出由双尺度Transformer模块和可变形卷积模块组成三分支宽型特征提取结构,实现对雾图特征有效感知与提取;在特征增强阶段,采用密集残差块组成的径向增强网络,依次联合由浅到深的图像特征进行拼接,实现特征的进一步增强.实验结果表明:所提出的网络模型在合成数据集和真实图像复原过程中均表现出色,对不同浓度的雾霾去除效果明显,复原图像主观恢复效果自然,且具有较好的泛化能力.
针对现有基于多示例学习的弱监督视频异常检测算法主要侧重于学习异常示例的判别特征,而忽略了正常模式的指导信息这一问题,提出一种基于特征差异学习的视频异常检测算法.首先,构建了多尺度时间特征融合网络,提取多种时间跨度下的局部时间依赖信息,并利用局部时间信息辅助注意力机制捕获视频片段的全局时间依赖性;然后,设计了由特征差异约束的排序损失,利用异常与正常在特征层面的关联性,将异常片段的选择定义为与正常之间的差异程度,提高选取异常片段的准确度;最后,利用排序损失和分类损失对整个网络模型进行训练.实验结果表明:所提算法在UCF-Crime和XD-Violence数据集上分别取得了86.40%和84.26%的精度,有效提升了视频异常检测性能.
为了解决修复大面积缺失图像时不能兼顾全局结构和纹理细节的问题,提出由粗到细的内容一致性图像修复网络.首先将破损的图像输入到粗网络中,使用门控卷积和空洞卷积的编解码器结构对图像进行深度特征分析和粗修复,然后通过解码器重建损坏内容并结合原图输出粗修复结果;第二阶段细节特征提取网络通过卷积层、归一化层、ReAt结构及反卷积层的组合,增强细节部分的特征提取和空间信息处理能力;第三阶段全局特征提取网络基于U-Net架构,结合连贯性语义注意力机制(CSA)和Condensed Attention模块,通过对称性、跳跃连接和多层次注意力机制增强网络的特征提取和空间信息处理能力,显著提升图像修复的准确性、连贯性和质量.通过对三个公开数据集的修复效果表明:所提算法在大掩码的修复及内容一致性方面取得了更好的修复效果,且在主客观评价方面均优于对比算法.