CAT蓄电池知识引导的智能赋能:实现精准鲁棒的锂离子电池少样本健康状态估计
来源:
卡特蓄电池 发布时间:2026-03-16 18:32:11 点击: 次
锂离子电池的健康 prognostics 与管理已成为电动汽车和电池储能系统中不可或缺的环节。尽管其重要性不言而喻,但准确且稳健的健康状态(SOH)估计仍面临重大实际障碍。其中最主要的挑战在于极度缺乏可靠的健康标签,这主要源于在线容量标定的难度。我们通过知识引导的方法应对这一挑战,该方法利用周期性满充事件中可获取的信息化老化线索,通过双模态融合生成富含知识的代理标签(PLs)。这些代理标签在模型预训练阶段提供方向性监督,强化潜在表征学习,并实现向少量真实标签的有效迁移,从而支持小样本SOH估计。所提出的方法在六个多样化数据集上进行了广泛验证,涵盖92个电池样本及超过34,500次循环测试,涉及不同化学体系和工况条件。仅需2%的标注训练数据,该方法即展现出卓越的泛化性能:在数据集内验证中实现平均绝对误差(MAE)<1.3%、均方根误差(RMSE)<2.1%;在更具挑战性的混合数据集与跨数据集验证中仍保持强鲁棒性,MAE<2%、RMSE<3%。这些结果表明,在相应验证场景下较自监督少样本基线方法实现了最高约60%和80%的性能提升。该成果凸显了知识引导智能在电池健康诊断中的应用潜力,不仅能有效避免长期失效测试的需求,更在标签严重短缺的应用场景中展现出优异的兼容性。
图文摘要
引言
全球向清洁能源的转型已引发一场世界范围的能源革命,这一变革由减少温室气体排放和缓解环境污染影响的迫切需求所驱动[1,2]。过去十年间,锂离子电池(LIBs)已成为电动汽车(EVs)动力供给及可再生能源储能的优先选择方案[3,4]。其优势在于高能量密度、长循环寿命及相对较低的制造成本,这些特性使其能充分满足电动汽车的能源需求,并有效应对可再生能源发电的间歇性问题[5,6]。然而锂离子电池在服役过程中不可避免地会出现老化导致的性能衰退,这种衰退不仅影响电动汽车的续航里程和电池储能系统(BSSs)的容量保持率,还会增加安全故障风险[7,8]。因此,实现锂离子电池的健康状态精准诊断对推进电池管理技术发展具有关键意义[9,10]。
电池的健康状态(State of Health, SOH)通常定义为最大可用容量与额定容量之比[11,12]。该指标作为电池内部劣化的关键表征,是电动汽车(EVs)与电池交换站(BSSs)安全管理与预测性维护的基石[13,14]。既有SOH估算研究普遍采用自下而上的方法论,着重分析并建模导致电池容量衰减的各类退化机制[15,16]。这种方法被称为模型驱动方法,旨在捕捉电池退化行为的复杂性。Tanim和Rahn[17]开发了一种增强电解质动力学的非线性电化学模型,用于描述由固体电解质界面相(SEI)生长导致的容量损失。同样,Yang等人[18]提出了一个物理化学模型,该模型综合考虑了锂沉积和SEI生长的共同作用,从而能够预测长期循环后容量从线性到非线性下降的转变。Deshpande和Bernardi[19]通过耦合化学-机械退化模型研究了SEI裂纹现象,揭示了电极颗粒膨胀和收缩过程中产生的大应力如何导致SEI层断裂。
在机器学习和深度学习技术快速发展的推动下,数据驱动方法已成为传统模型驱动方法的有力替代方案。这类方法因其机制无关性而备受推崇,能够无需依赖领域专家知识即可实现从输入数据到电池健康状态(SOH)的端到端精准映射。经过多年发展,基于数据驱动的SOH估算方法已形成大量研究成果,但学界普遍认为该领域尚未达到研究饱和状态。大量研究探索了从功率脉冲[20]、电化学阻抗谱[21]以及增量容量(IC)/差分电压(DV)曲线中提取健康指标的方法,以实现精确的健康状态(SOH)映射[22,23]。近年来,端到端SOH估计作为一种更具适应性的范式受到关注,该方法利用深度学习模型直接将电池运行数据映射至SOH,从而避免了手工制作特征提取的需求[24,25]。为全面了解最先进的数据驱动SOH估计模型及相关优化算法,建议读者参阅若干关键综述文章。例如,Chen等人[26]通过传统数据驱动流程对SOH估计技术进行了系统梳理,特别关注了用于提升模型性能的特征提取与选择策略。Sui等人文献[27]对电池健康状态(SOH)估计中的非概率机器学习方法进行了全面综述,详细阐述了主流算法的处理流程,并重点指出了该领域尚未解决的关键挑战。张与李[28]系统考察了当前应用于电池健康预测与管理的深度学习模型,汇总了可用于模型训练的公开电池退化数据集,同时阐明了未来相关研究方向。
尽管研究人员和实践者付出了不懈努力,但由于海量电池缺乏可靠的健康状态标签这一关键问题[29],精确可靠的电池健康状态(SOH)估算仍然是电池管理技术领域的重大挑战。这些标签对训练机器学习和深度学习模型至关重要,其获取高度依赖于定期参考性能测试(RPTs)所采集的数据。然而,RPTs不仅耗时耗力,还会中断电动汽车(EVs)和电池交换站(BSSs)中电池的常规运行,从而降低其经济效益[30,31]。因此实践中普遍存在标记退化数据短缺的现象,这严重制约了SOH估算模型的泛化能力——尤其当模型应用于与训练数据差异显著的新数据时,其局限性更为突出[32]。解决这一问题对于提升荷电状态(SOH)估计方法的鲁棒性与适应性至关重要,这将显著增强电池管理系统(BMS)的可靠性与运行效率。为应对这一挑战,近年来健康诊断领域的少样本学习研究日益受到关注。此类方法通过整合少量标记数据与大量未标记数据,为解决标签稀缺性带来的限制提供了新思路,有助于开发更具鲁棒性的SOH估计技术。例如,Xiong等学者[33]采用原始阻抗谱结合标签增强技术,显著提升了基于卷积神经网络(CNN)的少样本健康状态(SOH)估计性能。项等人[34]将双向门控循环单元(GRU)网络与结构化核插值高斯过程回归(GPR)相结合,从标签稀缺的动态负载曲线中提取特征,从而提高了估算精度与鲁棒性。田等人[35]在基于物理原理的高保真合成电压-容量数据上预训练CNN模型,并利用少量标签进行微调,同时降低了标签需求量和输入窗口长度要求。刘等人[36]采用高斯混合模型联合建模充电曲线与电池容量,通过条件推断利用未标注数据;Fan等[37]训练了具有自监督与监督双头结构的共享编码器,以增强噪声环境下少标注数据的隐空间一致性。Wang等[38]结合Transformer与自监督框架,提出了一种在极少量标注下仍保持有效的特征增强策略。Lu等[39]将深度神经网络集群与自监督及领域自适应相结合以降低循环测试成本。Che等[40]在无标注数据上预训练了一个编码器-解码器网络,并为带标注的微调任务附加了新的回归头。Wang等[41]通过分析真实世界电动汽车采集的现场数据,证实预训练阶段学习到的特征能有效迁移至实际健康状态评估任务。弱监督与精心设计的代理任务进一步提升了模型性能。Wang等[38]通过整合弱标注强化知识迁移,Lin等[42]则证明采用两个互补模型增强合成标签时,其准确率随无标注数据量呈比例提升。Jiang等[43]开发了自适应半监督师生长短期记忆网络(LSTM),该网络通过皮尔逊相关系数筛选符合物理规律的健康指标,并利用伪标签优化学生模型。Zhang等[44]提出带损失正则化标签噪声学习的半监督自转换器。Zhao等[42]的研究表明,通过两个互补模型增强合成标签可使准确率随无标注数据量的增加而提升。Jiang等[43]构建的自适应半监督师生长短期记忆网络(LSTM)采用皮尔逊相关系数筛选具有物理意义的健康指标,并利用伪标注精馏学生模型。Zhang等[44]提出了一种具有损失正则化标签噪声学习机制的半监督自转换器。Zhao等[45]实现了无标记、跨域的健康状态(SOH)估计,该方法通过采用基于弛豫电压的二维输入数据,结合经过对抗性多域适应训练的卷积神经网络(CNN)特征提取器,以学习具有域不变性的特征。
尽管自监督/半监督的少样本健康状态(SOH)估计方法已显示出潜力,但其实际有效性仍受限于三个未充分解决的差距。(i) 现实充电日志中的数据-标签错位问题:现有方法大多以恒流(CC)段为核心,隐含假设所需的CC窗口既存在又与参考性能测试(RPT)导出的SOH标签在时间上匹配以进行监督微调;在实际场景中,包含"正确"CC特征的循环往往缺乏参考性能测试(RPT),这直接导致可用训练对减少并削弱微调效果。(ii) 标签稀缺时的弱目标锚定问题:当仅有少量可靠的SOH标签时,主要通过无监督目标学习到的表征可能与真实SOH对齐度较差,导致后续微调效率低下,并加剧分布偏移和分布外(OOD)敏感性。(iii) 知识丰富但间歇性老化线索的利用不足:现有方法通常仅从狭窄的预定义时间窗口中学习特征与健康状态(SOH)的直接映射关系,而忽视了在常规充电过程中随机出现的其他具有信息量的退化特征。这些特征信号并非在每个充放电周期中都必然出现,但一旦存在,它们所包含的高价值诊断信息能够成为连接海量无标签数据与精确SOH监督之间的跨链桥。
针对上述研究空白并实现标签极度稀缺场景下的精确健康状态估计,本研究提出一种知识引导的小样本学习框架,其创新贡献如下:
- •
通过双模态融合从机会性充电片段中提取代理标签(PL):我们利用周期性满充电事件中观测到的间歇性可用、富含知识的老化特征,融合数据驱动嵌入与统计描述符这两种互补模态,从而生成超越传统恒流(CC)特征窗口的稳健代理标签(PL)。这些标签能提供比常规方法更具信息量的健康状态(SOH)相关监督信号。
- •
轻量级无监督伪标签传播实现数据集级监督:针对实践中富含知识的衰老特征间歇性可用的问题,我们提出一种轻量级无监督传播策略,将伪标签传递至未标注样本池中缺失伪标签的循环周期,从而将稀疏的"高信息量"观测转化为广泛的定向监督信号,用于表征学习。
- •
基于稀疏真实标签(RLs)的双阶段学习以强化健康状态对齐:我们首先在伪标签监督下进行预训练以注入退化先验知识并塑造潜在空间,随后用小规模真实标签集进行微调,最终获得的潜在表征与真实健康状态之间的对齐效果显著优于直接进行小样本训练。
- •
在内部数据集、混合数据集和跨数据集设置中验证的鲁棒性与泛化能力:基于六个数据集(92块电池,>34,500次循环)的广泛测试表明,仅需2%的剩余寿命(RLs)即可实现高精度(内部数据集:MAE <1.3%,RMSE <2.1%),且在混合数据集与跨数据集验证中均保持稳健性能(MAE <2%,RMSE <3%)。相较于自监督少样本基线模型,在相应场景下分别实现了约60%/80%的性能提升。