CAT蓄电池一种用于快速检测锂离子电池高自放电异常的数据驱动框架
来源:
卡特蓄电池 发布时间:2026-03-19 21:11:35 点击: 次
摘要
由于锂离子电池制造工艺的复杂性,内部偶尔会产生微短路,导致自放电率升高(HSD)。这些缺陷可能扳机热失控甚至自燃。目前检测HSD电池的主流方法是对自放电性能进行长期静态测试,该过程极其耗时。针对这一局限,本文提出一种基于T统计量与支持向量机(TSM-SVM)的快速筛选方法,用于有效识别具有HSD异常的电池。该方法利用锂离子电池化成与老化阶段采集的数据,包括电压、容量等参数,提取关键特征以表征电池性能。针对异常筛查场景,提出基于T统计量的特征选择策略。通过信息熵与皮尔逊相关系数筛选冗余特征,并采用T统计量评估各特征对内部微短路的敏感性。针对训练集中存在的类别不平衡问题,应用SMOTE算法对负样本进行扩增。所提出的TSM-SVM模型采用五折交叉验证进行评估,在全部五次验证中始终保持约96%的准确率,且对HSD电池的检测召回率达到100%。
图文摘要
引言
随着全球能源短缺和环境污染问题日益严峻,以电力替代传统化石燃料作为动力源的电动汽车正日益被视为一种可持续的交通解决方案[1]。锂离子电池因其高能量密度与功率密度、长循环寿命、低自放电率[2]以及环境友好性[3],被广泛应用于电动汽车领域。然而,锂离子电池的制造过程包含多个中间工序,其间极易产生各类缺陷[4]。最常见的问题包括金属杂质污染、极片或隔膜上的毛刺或损伤[5][6],这些缺陷可能导致电池发生内部短路(ISC)[7][8]。此外,还可能存在电池隔膜气泡形成和极片边缘皱褶等问题。这些问题将不可避免地导致高自放电(HSD)现象,即缺陷电池的自放电率显著高于正常电池[9]。HSD现象会降低电池的使用效率和寿命,增加热失控风险,甚至引发电池自燃。因此,HSD是生产过程中判定不合格电池的关键指标之一。锂离子电池制造商在交付前会检测电池的自放电性能是否符合合格标准,以防止HSD电池流入市场。
尽管国际上对电池自放电率尚未制定直接的标准规范,但针对电池荷电保持能力这一可直观反映自放电率的指标存在明确要求。如IEC 62660-1所限制级规定:当电池在初始荷电状态(SOC)为50%、温度45°C条件下静置存储28天后,其静置后的SOC应至少维持初始SOC值的80%。我国相关标准GB/T 31486-2024同样包含类似规定:电池在25℃静置储存30天后,搁置后的荷电状态(SOC)不得低于初始SOC值的90%。制造商通常对电池自放电率提出更严苛的要求,其相关测试方法则根据各自具体情况有所不同。当前检测高自放电(HSD)电池的主流方法为静态老化测试,这与前述标准中的描述相类似。该方法将单体电芯置于恒温恒湿环境中的静态托盘或支架上,进行约28天的静置。即便借助高温加速、分段筛选等辅助手段,测试仍需耗时1-2周。但在实际量产中,HSD电池的比例通常仅为万分之几,却要求所有电池均需接受静态老化测试。这导致严重的资源浪费,且难以匹配大规模模组与电池包制造的生产节拍。在此背景下,通过数据驱动模型预测并表征异常电压衰减行为(即高自放电特征),已成为该领域的研究重点。
目前预测电池自放电的两种主要方法为等效电路模型(ECMs)和数据驱动模型[10]。大多数传统的自放电率预测方法依赖于ECMs或基于充放电电流曲线构建的经验拟合模型[11][12]。然而,要精确建模锂离子电池中复杂的电化学降解机制,需要大量实验数据集和计算密集型流程。此外,自放电行为的高度非线性特征限制了传统线性模型准确捕捉该现象的有效性。某些方法仍依赖于部分静态老化模型,这会产生与高通量工业需求不相容的持续时间约束。
近年来,数据驱动的机器学习模型或深度学习模型也被应用于锂电池性能预测领域。数据驱动的机器学习与深度学习技术为异常自放电检测提供了新思路。通过整合电压时间序列曲线、微分容量特性(dV/dQ vs. SOC)以及基于ML/DL的预测结果等多源异构数据,这些模型能够捕捉传统方法难以表征的复杂非线性关联。He等[13]提出了一种改进的支持向量回归(SVR)方法,该方法通过初步相关性分析构建复合特征输入以预测自放电电压衰减。Zhang等[14]开发了基于LSTM的深度学习模型用于电池故障诊断。Deng等[15]提出了一种多分类支持向量机(MC-SVM)策略,用于电动汽车锂离子电池故障诊断,即使采用小样本训练数据集也能实现高诊断精度与速度。Qiu等[16]开发了基于多级香农熵的方法,用于锂电池储能系统的故障诊断与不一致性评估。该方法有助于早期检测内部短路故障,并可定量评估低温条件下电池组的不一致性。Gan等[17]采用基于XGBoost的故障诊断策略实现了锂电池过放电故障的诊断。通过将电压阈值分析与XGBoost预测模型相结合,该模型能准确识别电动汽车历史过放电故障并检测实时过放电状态。Lei等学者提出了一种基于支持向量机的智能故障诊断方法,该方法通过网格搜索优化实现。通过调整核函数参数与惩罚因子,该技术可快速精准识别电池故障状态[18]。
然而,由于内部微短路通常对电池充放电性能影响极小——且此类性能指标本身呈正态分布——聚类算法往往难以全面识别所有HSD电池。与此同时,深度学习算法因泛化能力有限和可解释性差,在工业部署中面临挑战。传统分类算法在异常检测场景中同样存在两大关键难题:首要挑战在于HSD样本中正负类的严重失衡,这种类别不平衡会导致训练过程中模型产生偏差,并阻碍对少数类样本的有效识别[19][20]。第二个挑战是如何在高维特征空间中进行有效特征选择,以分离出受内部微短路影响最显著的特征。针对类别不平衡问题,合成少数类过采样技术(SMOTE)已成为事实标准方法,其通过智能重采样增强少数类表征能力[21][22]。在第二个挑战中,特征选择方法通常可分为三种类型:包装法(wrapper)、过滤法(filter)和嵌入法(embedded)。其中,过滤法因其较低的计算复杂度,特别适用于大规模工业数据集。常见的基于过滤法的方法包括方差阈值法(variance thresholding)、信息增益(information gain)以及Fisher得分(Fisher score)。值得注意的是,Fisher得分是一种被广泛使用的方法,它独立计算均值(μ) 和标准差 (σ) 对于每个类别。该方法在偏斜类别分布下的稳健性使其特别有用,因为它避免了对类间关系的依赖。该指标定义如下:F=|μ+j−μ−j|(σ+j)2+(σ−j)2其中μ+j和σ+j分别为均值和方差。j阳性样本的特征,以及μ−j以及σ−j分别为负样本第j个特征的均值和方差[23]。类别区分度得分高的特征在正常电池与HSD电池间表现出强判别力。因此,最大化该指标的特征选择可生成异常检测的最优特征子集。灰色关联分析(GRA)是基于灰色系统理论的多性向因素分析方法,通过比较数据序列的几何相似性来确定各因素间的关联程度。利用GRA计算各特征与K值的关联度,选择关联度最高的特征作为最优特征。这些方法虽能筛选合适特征子集,但在异常筛查场景中仍可进行更具针对性的筛选。
本研究的主要贡献如下:
(1) 提出了一种数据驱动的高自放电(HSD)电池检测方法,解决了实际生产中因耗费大量时间测试所有电池产品以识别占比极低的HSD电池而导致的资源浪费问题。
(2) 提出了一种针对锂离子电池制造流程中容量分选工序的数据采集、分析与预测方法。该方法无需额外工序即可实现与真实工业生产条件的完全兼容。
(3) 建立了一种针对电池容量分选过程中参数的系统化分析方法,解决了当前生产数据利用率不足的问题。
(4) 提出了一种融合T统计量的改进型基于滤波器的特征选择策略。该策略优先筛选正负样本间均值差异最大的特征,并剔除冗余特征,有效解决了本场景下特征维度高、特征质量评估难度大的问题。
(5)提出一种基于SMOTE的数据集优化方法,通过参数配置控制生成虚拟样本的均值变异,解决了实际生产中HSD细胞占比极低导致模型训练困难的问题。