可靠性设计,是可靠性正向设计指在产品设计过程中,为满足产品可靠性要求,将产品性能指标和可靠性指标进行综合分析与设计的过程,目的是通过可靠性分析与可靠性评估,从产品结构、材料、工艺、使用条件等方面不断优化可靠性设计方案,消除潜在故障模式,使设计的产品满足预期性能要求和可靠性要求。
将产品可靠性要求转换为产品可靠性设计要求,核心是将装备可靠性指标分配给各单元和元器件,将元器件可靠性指标分解为元器件内部各物理结构的失效控制要求,使之成为在设计层面支撑可靠性分析与评估的具有可操作性的设计指标,让产品设计师有针对性、有目标地开展可靠性定性和定量设计。
一旦产品完成了可靠性设计,也就确定了所设计产品的固有可靠性,后续制造产品所进行的工作,如:制造加工、装配、封装等,由于受工艺参数的离散性限至,也只能使产品的可靠性尽可能地接近固有可靠性,而不能期望其超越固有可靠性。
常用的可靠性设计原则和方法有元器件选择和控制、热设计、简化设计、降额设计、冗余和容错设计、环境防护设计、健壮设计和认为因素设计等。可靠性设计是实现产品固有可靠性要求的最关键环节,是在可靠性分析的基础上通过指定和贯彻可靠性设计准则来实现的。
1)可靠性设计指标
产品可靠性设计的首要任务是确定可靠性设计指标,即将产品可靠性要求转换为产品可靠性设计要求,可以通过可靠性指标分配或可靠性指标分解,获得产品的可靠性设计指标要求。
系统装备级的可靠性设计指标,由产品可靠性指标分配获得,即通过指标分配将整个系统的可靠性要求转换为每个分系统、每个单元、每个元器件的可靠性要求。例如,航空电子设备的可靠性设计要求有三项:表征连续或间断工作××小时的工作寿命,表征工作寿命至少应当有××小时的总工作寿命,表征可靠性的平均失效间隔时间(MTBF)。其中,MTBF指标的分配,以f(R1,R1,…,Rn)≥R为原则,对系统可靠性进行分配,获得n个分系统的可靠性设计指标要求;再对分系统的可靠性进行分配,获得单元、元器件的可靠度设计指标要求,并可通过计数法进行初步可靠性预计,优化调整各单元、各元器件的可靠性指标。
电子元器件的可靠性设计指标,由产品可靠性指标分解获得,即通过指标分解将元器件的可靠性要求转换为内部各物理结构的退化机理和失效模式的控制要求。例如,半导体晶体管的“耗损寿命”指标,可分解为微电子芯片TDDB、Al_EM退化机理与Au-Al丝键合界面退化机理等多个退化机理的失效时间控制指标,产品最终耗损寿命取决于多机理竞争失效时间;再如,混合集成电路(HIC)的热性能控制指标“所用元器件工作温度不应超出规定的温度上限”,可具体分解为内装硅器件极限温度不超过175℃、长期工作温度按Ⅰ/Ⅱ/Ⅲ级降额温度,阻容元件极限温度不超过125℃、长期工作温度按Ⅰ/Ⅱ/Ⅲ级降额温度,感性元件极限温度不超过200℃、长期工作温度按Ⅰ/Ⅱ/Ⅲ级降额温度。
通常,电子元器件产品的可靠性要求,用失效率λ和寿命t以及环境适应性来表征,将其可靠性设计指标要求分解并转换为元器件可靠性设计指标。可参照四个方面的设计考虑进行可靠性指标分解:
● 元器件的主要性能参数在规定条件下随时间的稳定程度(参数退化模型分析);
● 元器件所能适应的环境应力范围(温度、机械、潮湿、盐雾、辐照、低气压等环境);
● 元器件寿命、失效率或质量等级(耗损寿命、随机失效率、质量保证等级);
● 必须消除或控制的主要失效模式(过应力失效、退化性失效)。
2)可靠性设计基本内容
产品可靠性设计的基本内容包括四个方面[74]:性能可靠性设计、结构可靠性设计、工艺可靠性设计和可靠性评价试验设计。涵盖了产品结构、材料、工艺的可靠性设计,以及考核产品可靠性满足质量要求的筛选与评价试验设计。
性能可靠性设计:针对产品性能参数在规定环境应力范围随时间变化的稳定性要求,所开展的可靠性设计内容。可以通过降低复杂度、功耗,考虑性能容错、裕度、散热、冗余等措施,实施性能可靠性设计。
结构可靠性设计:针对产品各部分连接、组装及整体结构的环境适应性和可靠性要求,所开展的结构和材料优选设计。可以通过仿真模拟和电、热、机械等物理性能测试验证手段,实施结构可靠性设计。
工艺可靠性设计:针对产品在制造过程中工艺参数的波动性和产品性能参数的离散性控制要求,所开展的工艺质量稳定性设计。可以通过健壮设计分析,量化控制关键工艺点的控制参数和范围,实施工艺可靠性设计,有效减少工艺参数偏差对产品性能参数稳定性的影响。
可靠性评价试验设计:针对产品设计鉴定的可靠性评价要求,设计评价试验方案,包括对试验应力、失效判据、样品数量、试验时间及测量周期的设计等。结合产品性能、结构、工艺的特点和可靠性要求,实施可靠性评价试验设计。
3)装备可靠性设计与分析
产品可靠性设计强调的是设计过程中的可靠性分析和可靠性评估,通过全面的可靠性分析和可靠性评估,确定所设计的产品是否满足可靠性设计指标要求,发现薄弱环节并优化设计。标准GJB 450A—2004《装备可靠性工作通用要求》,工作项目300系列,针对装备产品给出了可靠性设计与分析的13个工作项目:
● 建立可靠性模型:用于定量分配、预计和评价产品的可靠性;
● 可靠性分配:将产品的可靠性定量要求分配到规定的产品层次;
● 可靠性预计:预计产品的基本可靠性和任务可靠性,评价设计方案是否满足可靠性要求;
● 失效模式、影响及危害性分析(FMECA):找出潜在的薄弱元器件和零部件;
● 故障树分析(FTA):寻找导致装备发生某种故障事件的所有可能的潜在原因事件;
● 潜在分析:针对电路的潜在通路分析(SCA),针对液/气管路的潜在通路分析;
● 电路容差分析(CTA):分析电路组成部分在规定温度范围内的参数偏差对电路性能容错的影响;
● 制定可靠性设计准则:根据产品的可靠性要求,制定专用的可靠性设计准则并实施;
● 元器件、零部件和原材料选择与控制:根据产品特点,制定选择与控制要求;
● 确定可靠性关键产品:基于FMECA、FTA方法,确定和控制对装备可靠性产生影响的关键元器件等;
● 确定功能测试、包装、储存、装卸、运输和维修对产品可靠性的影响:通过测试与分析,评估功能测试对产品可靠性的影响及影响程度、储存时间及储存条件变化等给产品可靠性带来的影响;
● 有限元分析(FEA):当产品设计基本确定时,采用FEA方法进行机械强度、热特性分析,发现问题;
● 耐久性分析:通过评价产品载荷应力、失效机理,对关键或“短板寿命”零部件进行耗损寿命分析,确定耗损故障根本原因并采取纠正措施。
4)电子元器件可靠性设计与分析
为使设计的元器件满足规定的可靠性指标要求,需要根据电子元器件性能和结构特点,从以下六个方面考虑可靠性设计与分析工作。
(1)耐环境设计与分析。电子元器件在整机装备的工作过程中,可能遇到温度、机械、潮湿、电磁场、盐雾、辐照、低气压等不同类型的环境应力或多种环境应力耦合的作用。不同的环境应力导致不同的失效问题,如:高温、温变应力及其应力耦合,导致焊点或焊接界面IMC生长、焊料蠕变疲劳退化,而机械冲击可能导致金属气密封装盖板塌陷。设计时应预先了解所设计元器件在整机中可能遇到的环境应力类型,分析元器件在整机条件下对环境应力的响应水平,并建立应力响应模型(热阻模型、谐响应模型等),分析其对元器件性能、可靠性的影响程度,按最坏情况采取设计对策,使元器件耐环境应力强度(破坏阈值)大于最坏情况下的应力响应水平。
(2)稳定性设计与分析。分析同类元器件产品性能参数在规定条件下随时间变化的规律,针对元器件性能参数产生蠕变、漂移、突变、瞬时变化或间歇变化的根本原因,采取相应的设计措施,使元器件性能参数稳定在规定的范围内。
(3)热设计与分析。分析温度变化对所设计元器件可靠性的影响,以及元器件工作时导致温升的热量来源,包括环境温度变化、自身功耗热量和内部多热源热耦合导致的温升,针对导致元器件温升的根本原因,通过降低功耗、热补偿等措施,选用合适的、耐热的且热稳定性好的封装材料,利用热传导、热对流和热辐射技术增强散热能力,使额定工作状态下的元件热点温度、器件结温不超过允许的温度上限。
(4)长寿命设计与分析。分析影响元器件耗损寿命的退化机理,如:半导体器件的TDDB、EM等,液体钽电解电容器的电解液蒸发,金属封装外壳腐蚀,焊点疲劳等,要采取延缓退化、延长耗损失效时间的设计措施,使元器件退化机理的失效时间大于规定的耗损寿命要求。
(5)失效模式分析与控制。收集同类元器件的失效模式,分析其失效机理,根据失效频次排出失效模式主次顺序。可以应用元器件FEMA及FTA方法,分析主要失效模式的失效机理,确定失效机理过程的长期作用应力或短时间随机过应力及其来源,从产品设计、工艺设计、试验设计三个层面分析发现可能导致失效的原因,提出针对性的纠正措施并验证,使主要失效模式得到有效控制。
(6)裕度设计与分析。对元器件的工作电应力容限与安全工作区进行设计分析,使元器件的电流、电压、功耗所限定的安全工作区边界大于实际工作区,并根据元器件质量水平、工作状态和可靠性要求,对额定功率的设计留有适当的裕度。结合耐环境设计与分析获得的应力响应模型,根据元器件的热性能、机械性能等物理性能要求,使元器件的最大额定结温、热点温度大于实际工作结温、热点温度,使元器件的机械强度大于实际应力载荷。根据可靠性要求和环境适应性要求,计算合适的温度裕度和机械裕度。
Safeguard与深圳为民研究院保持常年的合作关系,通过技术咨询与培训为企业提供可靠性建设服务。