融合多项式特征扩展与CNN-Transformer模型的锂电池SOH估计

清洁减排综合网 储能融合多项式特征扩展与CNN-Transformer模型的锂电池SOH估计已关闭评论2阅读模式

据储能界了解到,

本文亮点:(1) 使用增量容量分析法绘制IC曲线,提出 IC 曲线的面积作为特征输入,提高了估计 SOH 的准确性。(2) 提出一种CNN与 Transformer 结合的神经网络,大大提高了神经网络模型在处理序列问题时对局部特征的提取能力。(3) 将特征多项式作为输入,提升了SOH与特征之间的非线性映射关系,大大提高了估算 SOH 的鲁棒性。

摘 要 为了提高锂离子电池健康状态(state of health,SOH)估计的精确度,本研究结合卷积神经网络(convolutional neural networks,CNN)强大的局部特征提取能力和Transformer的序列处理能力,提出了基于多项式特征扩展的CNN-Transformer融合模型。该方法提取了与电池容量高度相关的增量容量(incremental capacity,IC)曲线峰值、IC曲线对应电压、面积及充电时间作为健康因子,然后将其进行多项式扩展,增加融合模型对输入特征的非线性处理能力。引入主成分分析法(principal component analysis,PCA)对特征空间进行降维,有利于捕获数据有效信息,减少模型训练时间。采用美国国家宇航局(National Aeronautics and Space Administration,NASA)数据集和马里兰大学数据集,通过加入多项式特征前后的CNN-Transformer模型对比、加入多项式特征的CNN-Transformer模型和单一模型算法对比,验证了加入多项式特征的CNN-Transformer融合算法的有效性和精确度,结果表明提出模型的SOH估计精度相较于未加入多项式特征的CNN-Transformer模型,对于B0005、B0006、B0007、B0018数据集分别提高了38.71%、50.28%、4.71%、17.58%。

关键词 锂离子电池;电池健康状态预测;主成分分析法;CNN-Transformer;增量容量分析;多项式特征

锂离子电池具有循环寿命长、能量密度高等优点,近年来锂离子电池广泛用于汽车动力电池等领域,促进了电动汽车产业的快速发展。然而,在使用过程中锂离子电池会出现容量衰减现象,导致电池性能的退化,还会影响电池荷电状态(state of charge,SOC)估计的准确度。因此,锂离子电池健康状态(state of health,SOH)的准确有效估计至关重要。

目前SOH估计方法主要有模型驱动法和数据驱动法。其中模型驱动法分为基于等效电路模型和电化学模型的方法。基于等效电路模型的SOH估计方法需要建立等效电路,一般使用二阶等效电路模型,利用卡尔曼滤波器或者粒子滤波器估计SOH。基于电化学模型的SOH估计方法通常基于电池的化学原理、物理参数以及实验数据,通过数学表达式描述电池的充放电过程、内阻变化、容量衰减等关键特征进而进行容量估计。数据驱动法因不需要建立电池内部机理模型而备受关注,通常是通过支持向量机(support vector machine,SVM)、长短期记忆递归神经网络(long short-term memory,LSTM)、门控递归神经网络(gated recurrent neural networks,GRU)、极限学习机等神经网络模型来建立输入特征与SOH之间的映射关系。Sun等结合不同的特征提取方法,提取电压脉冲响应曲线的有效特征和代表性特征,然后,引入SVM估计SOH。Xiao等提出了一种基于等电压间隔下不同放电时间的健康因素,并使用遗传算法优化的反向传播神经网络来快速准确地估计电池容量。随着神经网络模型的发展越来越迅速,研究人员也在尝试使用不同的网络结构。Wen等提出一种新的LSTM方法,称为auto-LSTM的SOH估计方法,该方法可以自动调整特征选择、LSTM结构及训练算法中的超参数。Jia等提出一种双向门控循环单元(bi-directional gated recirculating unit,BiGRU)和Transformer与注意力机制相结合的混合预测模型,该模型能够有效解决长时间序列预测的挑战。上述研究人员在预测电池寿命或电池健康度领域有长足的进步,但是还缺乏关联度更高的特征进行训练和缺乏更加适合预测电池的网络结构。

特征提取是建立数据驱动模型重要的组成部分,常用的特征为温度、电压、电流,其中研究最广泛的特征提取方法是增量容量(incremental capacity,IC)分析法。利用IC曲线分析恒流充电阶段电池退化机理来挖掘更多能表征电池健康度的特征,它可以将内部电化学反应平衡引起的电压平台转化为IC曲线上各种特征,并且IC峰值的出现与锂离子插层/脱嵌过程中活性材料的相变现象密切相关。Gismero等和Wang等研究显示,在电池的整个生命周期中,IC峰值的特征(例如高度和位置)存在明显且有规律的变化,使得利用IC特性进行SOH估计应用更加广泛。Chen等利用IC曲线提出了一种基于粒子群优化算法(particle swarm optimization,PSO)和极限学习机(extreme learning machine,ELM)的锂离子电池健康状态估计模型。Sun等提出Bi-LSTM网络模型,用IC曲线的峰值作为输入来预测SOH。She等用增量容量分析实现从实验室测试到实际应用的过渡。Tian等实现了将锂离子电池充电过程的温差曲线与IC曲线相结合,利用支持向量回归与SOH建立关系。Park等提出了采用ICA方法分析锂离子电池在室温和高温条件下的不同老化机理。此外,通过皮尔逊相关性分析,来分析电池容量与ICA峰值的相关性,以使用线性回归模型估计温度鲁棒性健康状态(SOH)。上述基于IC曲线的数据驱动SOH估计算法虽然取得了不错的估计效果,但仍然存在一些问题:采用平滑滤波的方法会去掉原始数据的特征信息,没有一套通用的滤波方法适合不同电池数据、不同SOH的IC曲线。在特征提取中,传统的数据驱动模型缺乏处理SOH与强关联特征之间非线性关系的能力。传统的数据驱动模型大都只关注SOH与特征之间的关系,忽略了特征与特征之间的关联。

本工作采用了基于多项式特征扩展的CNN-Transformer模型用于SOH估计,解决了上述问题,主要贡献如下:

(1)使用增量容量分析法绘制IC曲线,将IC曲线的面积作为特征输入,提高了估计SOH的准确性。

(2)提出一种CNN与Transformer结合的神经网络,大大提高了神经网络模型在处理序列问题时对局部特征的提取能力。

(3)将特征多项式作为输入,提升了SOH与特征之间的非线性映射关系,大幅提高了估算SOH的鲁棒性。

1 基本原理

1.1 卷积神经网络

其结构图如图1所示。

图1 卷积神经网络

1.2 Transformer

Transformer模型主要由位置编码、编码器-解码器以及残差连接和层归一化模块构成。位置编码在Transformer模型中起着至关重要的作用。由于Transformer模型主要依赖于自注意力机制来处理输入序列,它本身并不具备处理序列中元素位置信息的能力,因此,位置编码被引入,以在输入序列中引入位置信息。位置编码通常是一个与输入序列维度相同的矩阵,它使用了三角函数的正弦和余弦函数来编码位置信息,其数学模型为:

2 实验数据处理

2.1 数据集介绍

本实验采取的第一个数据集是美国国家宇航局测试中心为研究电池老化问题所作的4组电池充放电实验,编号为B0005、B0006、B0007、B0018。实验分为3种模式:恒流恒压充电、恒流放电和阻抗测量模式。在提取锂离子电池健康度特征时,可以分为充电特征与放电特征。由于锂离子电池放电过程中具有各种不同的放电工况,因此在放电过程中提取健康度特征十分困难。但是充电过程是相对稳定的,因此可以收集到更多有代表性的特征,从而能够更加准确地估计SOH。锂离子电池充电阶段可分为恒流充电与恒压充电。恒流充电阶段时电池在1.5 A的条件下连续充电,充电电压达到4.2 V时转换为恒压充电,当电流小于C/100时停止充电。第二个数据集是来自马里兰大学高级生命周期工程中心(CALCE)收集的开源电池寿命数据集CS35,该数据集对应的电池为LiCoO2石墨电池,电池的额定容量为1.1 Ah。实验分为3个阶段:恒流充电、恒压充电和恒流放电。恒流充电时充电电流为0.5C,直到电压达到4.2 V。恒压充电时电压保持在4.2 V,直到充电电流降至0.05 A以下。恒流放电时以1C的电流放电直至电压小于2.7 V。

2.2 增量容量分析法

增量容量分析法是一种分析锂离子充放电过程中容量与电压的关系的方法。在锂离子电池充电过程中,电压上升会出现一个平稳期,在此期间电压上升速度缓慢,这是因为锂离子电池内部的化学反应已经达到了一个相平衡状态。其增量容量对电压的导数被称作IC值,如式(8)所示。

IC曲线被广泛用于分析电池容量损失。在充电过程中,达到相平衡状态的电压以及存储容量与电池健康度有很大关系,尤其是在3.8~4 V之间,IC曲线存在峰值。不同的充电循环次数时3.8~4 V的对应IC曲线如图2所示,可以看出随着充电次数增加,其充电IC曲线的峰值在减小,峰值所对应电压在右移,这些特征均可作为神经网络的输入。因此,本论文提出将3.8~4 V的IC曲线的面积作为特征输入到神经网络模型中进行训练。使用IC曲线的面积估计电池健康度具有更好的稳定性,可以融合IC曲线多个阶段的特征信息。

图2 不同充电循环的IC曲线

2.3 皮尔逊相关性分析

皮尔逊系数是用来衡量两个连续变量之间线性关系的指标,在多个学科具有广泛应用。在本论文中,皮尔逊相关性分析用来判断特征与标签的相关度,进而判断提取的特征是否可以被当作神经网络模型的输入。

其公式(9)如下:

2.4 多项式特征

多项式特征是一种特征工程技术,主要用于增强模型的能力,以便更好地学习和理解数据中的非线性关系。在神经网络训练前,将输入的特征转换为其图片次幂时,实际上是在创建这些特征的多项式组合。例如,假设有一个特征图片,不仅使用图片,还使用图片,图片…图片,如式(10)所示。其中,n是预定的最高次幂。这样做的目的是捕捉特征与输出之间的非线性关系。通过明确引入非线性特征组合,可以帮助神经网络更容易地学习这些关系,特别是在网络较浅或训练数据不足以揭示复杂关系时。

为准确估计锂离子电池的健康状况,本研究采用了多项式特征转换方法来增强模型对电池性能衰退非线性特征的学习能力。电池的健康状况通常受多种因素的影响,包括充放电循环次数、温度变化以及电池的充放电速率等,这些因素之间存在复杂的非线性关系。通过将电池操作参数的原始测量值转换为它们的多项式形式,就能够构造一个更加丰富的特征集,以揭示这些参数之间的潜在非线性交互作用。该多项式扩展方法的应用显著提升了深度学习模型对电池性能随时间衰减方式的细致学习能力,进而增强了电池状况估计的准确性和可靠性。通过预处理输入数据以包含重要的非线性特征,可以减少网络需要学习的复杂性,从而可能减少训练时间。

2.5 主成分分析

本研究关注于提高锂离子电池健康状况估计的准确性和效率。考虑到电池性能数据在多维特征空间中的复杂性,本文采取了主成分分析(principal component analysis,PCA)的数据预处理策略,以优化深度学习模型输入。

为了应对高维特征带来的挑战,本文引入了PCA技术对特征空间进行降维。电池性能数据的高维性不仅增加了模型训练的计算负担,而且可能导致过拟合,特别是在样本量有限的情况下。通过 PCA技术能够从原始特征中提取出最重要的成分,捕获了数据中的主要变异信息,同时去除了噪声和冗余信息。在实际应用中,通过选择数据绝大部分变异性的前几个主成分,显著降低了特征的维度,从而简化了模型结构并降低了过拟合的风险。PCA降维处理的步骤如下:

2.6 电池SOH估计框架及模型评价标准

本论文提出了一种基于多项式特征扩展的CNN-Transformer模型进行电池SOH估计,其框架如图3所示。该模型的工作流程如下:

图3 系统流程图

(1)利用增量容量分析法从恒流充电3.8~4 V的数据中,获取IC曲线的5个特征。使用皮尔逊系数法从这5个特征获得4个强关联特征,然后利用多项式扩展的方法,将原来的特征扩展为特征、特征的二次方和特征的三次方,作为新的特征。

(2)用归一化和主成分分析使得原来的12个特征变成5个特征,以获得多项式扩展特征之后的主成分,减少模型计算量。

(3)CNN:接收5个输入特征,将其组织成一个25的矩阵。然后使用22的卷积核对输入矩阵进行卷积操作,步长为2。这一步骤旨在提取输入特征的局部相关性,从而生成卷积特征图。

(4)Transformer架构:将经过卷积和位置编码处理后的特征输入到Transformer模型中。

(5)输出层:最终通过Transformer的输出层,生成对输入序列进行预测的结果。

本文采用了3种常用的评价指标来全面评估模型的性能,分别是平均绝对误差(mean absolute error,MAE)、均方根误差(root mean square error,RMSE)和平均绝对百分比误差(mean absolute percentage error,MAPE)。这些指标分别从不同的角度反映了模型预测结果的准确性,其公式分别为:

3 结果与分析

在本次实验中,采用美国国家宇航局数据集(B0005、B0006、B0007、B0018)和马里兰大学数据集(CS2_35),验证增量基于多项式特征扩展的CNN-Transformer模型在锂离子电池SOH估计中的精度与鲁棒性。本次实验参数:迭代次数为40000次,学习率统一调整为0.005。将NASA数据集70%用于训练,30%用于测试,在统计评估模型性能指标时只统计后30%数据。本文设计了两组实验。第一组验证进行多项式特征扩展时增加不同高次项对皮尔逊相关性及模型精度的影响。第二组实验进行算法对比,对比了3种算法的结果验证提出的算法的有效性,并且最后在马里兰大学CS2_35数据集上验证算法的泛化能力。

图4展示了NASA数据集恒流充电时间的高次项与容量之间的皮尔逊相关系数,结果表明,在B0005、B0006、B0007三个数据集上,三次项与一次项的相关性绝对值分别提升了0.09、0.06和0.07,而二次项与一次项的相关性绝对值也分别提高了0.06、0.04和0.05。这说明将特征拓展为三次项时,特征与标签值相关系数提升最多。

图4 恒流充电时间的高次项与容量之间的皮尔逊相关系数:(a) B0005;(b) B0006;(c) B0007;(d) B0018

图5给出了加入多项式特征前后的CNN-Transformer模型的SOH估计结果对比。与未加入多项式特征的模型相比,加入多项式特征的模型在预测时浮动更小,显示出更好的稳定性和鲁棒性。这一改进不仅有助于提升锂离子电池健康状态的预测精度,还为实际应用中的稳定性提供了有力保障。

图5 加入特征多项式的CNN-Transformer和不加特征多项式的CNN-Transformer对比:(a) B0005;(b) B0006;(c) B0007;(d) B0018

表1给出了这两种算法在SOH估计中的具体误差结果对比。从表中可以看出,加入多项式特征后的CNN-Transformer模型(Poly-CNN-Transformer)在所有数据集上均展现出最低的MAE、MAPE和RMSE值,系统的预测精度得到了显著提升。具体而言,B0005、B0006、B0007、B0018数据集的精度分别提高了38.71%、50.28%、4.71%、17.58%。这一改进不仅体现在数值上,更体现在预测的稳定性和鲁棒性上。表明模型中CNN用于提取局部特征,而Transformer则处理序列数据的全局关系的结合显著提高了模型对输入序列的理解和处理能力并显示出其在预测精度上的优势。

表1 加入与不加入特征多项式SOH误差对比结果图

图6给出了加入多项式特征扩展后的融合模型、单一Transformer模型和LSTM模型的比较,从图中可以看出,CNN-Transformer模型在所有数据集上均表现出更小的预测浮动和更好的稳定性。表2展示了不同模型在SOH估计中的误差结果。可以看出,加入多项式特征后,CNN-Transformer模型相较于Transformer模型和LSTM模型,平均精度分别提高了32.47%和21.07%。表明模型中CNN用于提取局部特征,以及Transformer用于处理序列数据的全局关系的结合显著提高了模型对输入序列的理解和处理能力并显示出其在预测精度上的优势。

图6 CNN-Transformer和Transformer、LSTM网络结构实验结果对比:(a) B0005;(b) B0006;(c) B0007;(d) B0018

表2 不同算法SOH误差对比结果图

为了全面评估本研究所提出的算法对于不同数据集以及不同起始点的泛化能力,本文采用了马里兰大学数据集的80%作为训练数据,剩余的20%作为预测数据进行了深入的实验验证。实验结果如图7所示,从图中可以清晰地观察到,提出的Poly-CNN-Transformer模型在面对多样化的数据集时,依然展现出强大的适应性和稳定性。

图7 马里兰大学数据集实验结果:(a) 多项式特征实验;(b) 不同网络模型实验

马里兰大学CS2_35数据集实验SOH误差对比结果如表3所示,通过对比分析,相较于Poly-Transformer模型、Poly-LSTM模型和CNN-Transformer模型,提出的Poly-CNN-Transformer模型MAE分别降低了29.9%、13.73%和3.77%。这一结果不仅凸显了本研究所提出模型的优越性,更进一步证实了Poly-CNN-Transformer模型在处理不同数据集和不同起始点时的卓越泛化能力。

表3 马里兰大学CS2_35数据集实验SOH误差对比结果

表4展示了CNN-Transformer、Transformer和LSTM网络的参数量与在4060Ti的GPU上迭代一次所需时间。Transformer模型的迭代时间近似是LSTM的2倍,这是由于Transformer模型的计算复杂度更高,导致运行时间增加。在每个迭代步骤中,Transformer模型,需要执行多头自注意力机制和前馈神经网络,这些操作相对于LSTM的循环神经网络结构来说,计算量更大。然而,由于估计电池健康度模型属于参数量较少的模型,迭代一次时间仅为微秒级别,可以适当放宽迭代时间以提高精度。

表4 模型参数与训练时间

4 结 论

本文通过融合CNN出色的局部特征抽取能力和Transformer强大的序列处理能力,构建了基于多项式特征扩展的CNN-Transformer混合模型。在训练过程中,CNN应用了数据增强技术,有助于提高模型对数据的鲁棒性和泛化能力,从而降低预测的不确定性。同时,Transformer通过自注意力机制实现全局关注,能够同时考虑输入序列中所有位置的信息,有助于建立全局依赖关系。论文深入分析了充电过程中的多项关键特征,涵盖IC曲线峰值、峰值对应电压、IC曲线面积、充电至4 V所需时间以及充电过程的最高温度等,并借助皮尔逊相关性分析,量化了这些特征与真实容量之间的关联性,作为提出融合模型的输入特征。此外,归一化和PCA降维处理进一步提升了模型的训练效率和泛化能力。

利用NASA数据集和马里兰大学数据集验证了提出模型的精确度、鲁棒性和泛化能力,通过多项式特征扩展,有效提升了SOH估计的精确度,提出模型的SOH估计精度相较于未加入多项式特征的CNN-Transformer模型,在B0005、B0006、B0007、B0018数据集分别提高了38.71%、50.28%、4.71%、17.58%。通过CNN与Trans former的有机融合,显著增强了模型在处理序列数据时对局部特征的捕捉能力,加入多项式特征后,CNN-Transformer模型在NASA数据集上相较于Transformer模型和LSTM模型,平均精度分别提高了32.47%和21.07%。

相关文章
消息来源于网络,如有不实请及时告知我们。如有侵权,联系删除。
weinxin
我的QQ
QQ扫一扫
清洁减排综合网
  • 来源:清洁减排综合网
  • 转载请务必保留本文链接:https://qphe.cn/index.php/2024/10/19/10140.html