第1章 绪论基础
1.1 为什么需要"系统安全性"?
早期的飞机设计依赖"试飞-坠机-改进"的经验循环,安全性靠事后吸取教训。但现代民机有以下特征:
- 系统极度复杂:一架 C919 拥有约 100 个系统,数千万行机载软件代码,单靠经验已无法预测所有失效组合;
- 失效后果极严重:一次空难可造成数百人死亡,公众与监管对安全的容忍度趋近于零;
- 必须事前证明:飞机要拿到型号合格证(TC),必须在首飞之前用分析手段证明其足够安全,而不能"飞起来再说"。
因此发展出了一整套"用工程化方法、在设计阶段就预测并消除危险"的学科——这就是"民机系统安全性设计与评估"。
1.2 必须掌握的基本概念
这些术语在后续每一章都会反复出现,含义务必准确:
| 术语 | 含义解释 |
|---|---|
| 故障 Fault | 部件处于"不正常"状态,但不一定立刻表现出来。例如电阻漂移、传感器零点偏移。它是失效的原因。 |
| 失效 Failure | 系统/部件丧失了规定的功能。例如"液压泵不再产生压力"。它是故障的表现。 |
| 失效状态 Failure Condition | 把一个或多个失效放回"飞机正在飞行"这个真实场景中所产生的后果。例如"巡航中双发停车"。它强调的是对飞机和乘员的影响,而不是单个部件坏了。 |
| 危险 Hazard | 潜在的伤害源。可以来自系统内部(设计错误),也可以来自外部(鸟撞、雷击)。 |
| 风险 Risk | "事情发生的可能性 × 一旦发生有多严重"。安全性工程的目标就是把风险控制在可接受水平。 |
| 安全性 Safety | 免于不可接受风险的状态。注意:绝对安全不存在,安全是一个"足够低的风险"概念。 |
1.3 失效状态的五个等级——全书的基准刻度
适航规章用一把"尺子"衡量后果严重程度,把所有失效状态划分到五个等级,并对每一等级规定了允许出现的最大概率。这是安全性设计中的"金科玉律":越严重的后果,发生概率必须越低。
| 等级 | 对飞机/乘员的影响 | 定性目标 | 定量目标(每飞行小时) |
|---|---|---|---|
| 灾难的 Catastrophic | 阻止飞机继续安全飞行和着陆,通常意味着机毁人亡 | 极不可能 | \(< 10^{-9}\) |
| 危险的 Hazardous | 显著降低飞机或机组的能力,少数乘员严重受伤或死亡 | 极微小可能 | \(< 10^{-7}\) |
| 较大的 Major | 显著降低安全裕度或工作能力,乘员不适 | 微小可能 | \(< 10^{-5}\) |
| 较小的 Minor | 稍微增加机组工作负担,不显著影响安全 | 可能 | \(< 10^{-3}\) |
| 无安全影响 NSE | 对飞行安全无影响 | — | 无要求 |
1.4 学科的发展脉络
系统安全性学科经历了三个阶段的演进:
- 经验阶段(1950 年代以前):靠飞行事故反推改进,没有系统化方法;
- 可靠性阶段(1960~1980 年代):引入故障率、MTBF 等指标,但只关注单个部件好不好,不关注"一坏会怎样";
- 系统安全性阶段(1980 年代至今):以 ARP4754/ARP4761 为代表,从飞机功能出发自顶向下分析、自底向上验证,把安全性变成可证明、可追溯的工程过程。
当前趋势:基于模型的安全性分析(MBSA)、与网络安全的融合、面向新构型(如电动飞机、eVTOL)的方法扩展。
第2章 规章、咨询通告与工业标准了解
2.1 我国适航法规的四级体系
从顶到底依次约束力递减、具体性递增:
- ① 法律
- 《中华人民共和国民用航空法》——最高层,规定民航活动总框架
- ② 行政法规
- 《民用航空器适航管理条例》——国务院发布,建立适航审定制度
- ③ 规章 CCAR
- 由民航局发布,例如
CCAR-25《运输类飞机适航标准》——具有强制力 - ④ 咨询通告 AC
- 提供"可接受的符合性方法"(AMC),不强制但实际上是"标准答案"
2.2 母条款 25.1309——一切的源头
整本教材的核心法律依据就是 CCAR/FAR 25.1309。它对系统安全性提出了两条根本要求:
2. 任何降低飞机能力或机组应对能力的失效状态,发生的可能性必须是"不可能的"。
并且必须用分析方法证明上述要求得到了满足,必要时辅以试验。
这看似简短,却给整个行业指明了方向——不是"飞得多了证明安全",而是"在设计图纸上就要算出来安全"。后续所有 FHA、PSSA、SSA、FTA 等技术,本质上都是在回答一个问题:"我怎么向局方证明我满足了 25.1309?"
2.3 配套的工业标准——告诉你"具体怎么做"
规章只说"要安全",不说"具体步骤"。具体步骤由 SAE 和 RTCA 这样的国际标准化组织制定:
| 标准编号 | 名称 | 解决什么问题 |
|---|---|---|
| SAE ARP4754A | 民用飞机和系统研制指南 | 规定整机/系统级研制流程,怎样确认和验证需求,怎样做研制保证 |
| SAE ARP4761 | 安全性评估过程指南 | 规定 FHA、PSSA、SSA、CCA 等所有安全性技术的具体方法——本书的主要参考 |
| RTCA DO-178C | 机载软件适航 | 软件的研制保证 |
| RTCA DO-254 | 机载电子硬件适航 | 复杂电子硬件的研制保证 |
第3章 飞机系统安全性设计与评估体系核心
3.1 安全性工作的总体规划
安全性工作不是某个阶段单独完成的"附加任务",而是与飞机研制同步开展、持续迭代的活动。其总体规划遵循以下原则:
- 早介入:从概念阶段就开始,而不是等到样机出来再补;
- 全覆盖:从飞机级 → 系统级 → 子系统级 → 部件级,逐层落实;
- 双向闭环:自顶向下分配需求(设计驱动),自底向上验证符合(证据回传)。
3.2 评估过程的"V 字模型"
这是全书最重要的一张图,请务必记住:
飞机级功能危险性评估
系统级功能危险性评估
初步系统安全性评估
系统安全性评估
用一句话理解每一步:
- FHA:"如果这个功能坏了会怎样?"——识别危险、分类后果
- PSSA:"我设想的架构能不能满足这些后果对应的概率目标?"——分配需求
- SSA:"最终设计真的达到那些目标了吗?"——验证符合
3.3 安全性需求的四个动作:目标 → 分配 → 确认 → 验证
这是安全性工程中最容易混淆的四个词,请仔细区分:
| 动作 | 含义 | 示例 |
|---|---|---|
| 目标 | 飞机层面要达到什么概率/严重度水平 | "双发停车"必须 \(< 10^{-9}\)/FH |
| 分配 | 把整机目标自顶向下分解到系统、子系统、部件 | 每台发动机自身的失效概率应 \(< 10^{-5}\)/FH |
| 确认 Validation | 检查这个需求"定得对不对"——是否完整、是否正确 | 有没有漏掉某种使用场景?分类有没有偏低? |
| 验证 Verification | 检查这个需求"做到了没有"——设计是否满足 | 用 FTA/试验证明实际概率确实 \(< 10^{-5}\) |
3.4 研制保证等级 DAL——给"严谨程度"打分
除了概率指标,对于复杂的硬件和软件,还需要用"研制过程的严谨程度"来防止设计错误。这个严谨程度就是 DAL(Development Assurance Level),按对应失效状态严重度分为五级:
| DAL 等级 | 对应失效状态 | 研制要求强度 |
|---|---|---|
| A | Catastrophic | 最严格——评审、测试、覆盖率全部最高 |
| B | Hazardous | 非常严格 |
| C | Major | 严格 |
| D | Minor | 一般 |
| E | NSE | 无特殊要求 |
为什么需要 DAL?因为概率分析只能覆盖"随机硬件失效",而软件 bug、设计错误这种"系统性错误"是没有概率的——只能靠过程严谨度来防止。
第4章 功能危险性评估 FHA核心
4.1 FHA 要做什么
FHA 的核心任务有四步:
- 识别功能:把飞机/系统的所有功能列清楚;
- 识别失效状态:每个功能可能怎样"坏"——完全丢失、误动作、部分丢失、延迟……
- 分析影响:每种失效状态在不同飞行阶段下对飞机和乘员意味着什么;
- 分类定级:依据后果严重度,定为 Catastrophic / Hazardous / Major / Minor / NSE。
关键点在于:FHA 是"功能驱动"而非"设备驱动"。在 FHA 阶段,工程师还不知道这个功能将由哪台计算机、哪根管路实现——他们只问"功能本身丢了行不行"。
4.2 FHA 的两个层次:AFHA 与 SFHA
FHA 不是只做一遍,而是分两个层级:
| 类型 | 对象 | 开展时机 | 典型功能 |
|---|---|---|---|
| AFHA 飞机级 | 飞机功能 | 概念设计阶段 | "提供升力"、"控制飞行轨迹"、"为乘员提供可生存环境" |
| SFHA 系统级 | 各系统的功能 | 系统功能定义后 | "提供刹车力"、"显示空速"、"维持座舱压力" |
AFHA 的结果会"分解"到各系统,成为各个 SFHA 的输入。两者构成一个"飞机 → 系统"的两层漏斗。
4.3 失效状态的四种典型类型
对每个功能,至少要考虑这四种失效模式,否则容易遗漏:
- 功能丧失(Loss):功能完全没了,例如刹车完全失效
- 误动作(Malfunction):功能输出了错误的值,例如显示错误的空速
- 非指令动作(Inadvertent):没让它动它动了,例如自动收起落架
- 延迟动作:动作发生但太晚,例如刹车响应慢于预期
4.4 FHA 报告应包含什么
- 分析对象与边界
- 功能清单
- 每个功能的失效状态及其在各飞行阶段的影响
- 失效状态的分类等级及对应概率目标
- 分类的依据、假设和保守度
- 派生的安全性需求(对下游设计的输入)
失效状态:在着陆阶段无法将起落架放下并锁定
影响:飞机无法以正常构型着陆,可能机腹擦地,导致人员伤亡
分类:Catastrophic
概率目标:\(< 10^{-9}\)/FH
派生需求:起落架系统应具备主放与应急放的独立通道
第5章 初步系统安全性评估 PSSA核心
5.1 PSSA 的作用与目的
PSSA 在飞机研制的初步设计阶段开展,主要做三件事:
- 校核架构可行性:验证候选架构能不能满足 FHA 的目标,如果不能就反过来改架构(增加冗余、增加监控等);
- 导出下层安全性需求:把整机/系统级的概率目标,分配到具体的子系统、部件、接口;
- 分配 DAL 等级:给每个软硬件项目确定研制保证等级。
PSSA 的精髓在于"迭代"——它不是一锤子买卖,而是和系统架构设计来回拉锯,直到方案能"算得过去"。
5.2 PSSA 的输入与输出
| 输入 | 输出 |
|---|---|
|
① FHA 的失效状态及其分类 ② 候选系统架构 ③ 部件初步可靠性数据 ④ 上一级 PSSA 分配下来的需求 |
① 初步故障树(FTA) ② 子系统/部件层级的安全性需求 ③ 软硬件 DAL 分配 ④ 独立性、隔离、冗余要求 ⑤ 派生需求(设计约束) |
5.3 PSSA 的典型分析过程
5.4 工程示例:机轮刹车系统的概率分配
FHA 给出"全部刹车功能丧失"的目标:
假设设计采用两个独立通道,且二者共因可忽略,则在 PSSA 阶段可建立简化故障树(顶事件 = 通道1失效 AND 通道2失效),按"与门"概率乘法分配:
这个 \(3.16 \times 10^{-5}\) 就成为每个通道的可靠性指标——下游设计师必须把单通道的失效概率做到这个水平之内。如果发现做不到,就必须改架构,比如改成三通道。
第6章 系统安全性评估 SSA核心
6.1 SSA 的本质:从"目标"到"证据"
SSA 与 PSSA 在方法上相似(都用 FTA、FMEA 等工具),但性质完全不同:
| 对比项 | PSSA(初步) | SSA(最终) |
|---|---|---|
| 开展时机 | 设计早期,架构未冻结 | 设计完成、试验完成后 |
| 用什么数据 | 估计值、目标值、相似机型经验 | 真实试验数据、成熟可靠性数据 |
| 目的 | 导出需求、迭代架构 | 证明需求得到满足 |
| 方向 | 自顶向下分配 | 自底向上汇总验证 |
| 面向谁 | 内部设计师 | 适航局方审定 |
6.2 SSA 过程的主要工作
- 更新故障树:用最终设计数据重新计算每个顶事件的概率;
- 汇总 FMEA / FMES:把所有部件的故障模式分析结果整合,证明没有遗漏的"单点故障";
- 开展共因分析(CCA):包括特定风险分析、共模分析、区域安全分析,证明"独立通道真的独立";
- 编制符合性矩阵:把每条安全性需求都对应到具体的证据上;
- 形成 SSA 报告:作为飞机型号合格审定的核心文件之一。
6.3 SSA 的输出
- 最终故障树及定量概率分析结果
- FMEA / FMES 汇总表
- 共因分析报告(CCA = PRA + ZSA + CMA)
- 对所有 FHA 失效状态的"需求 → 证据"映射表
- 剩余风险说明与可接受性论证
第7章 安全性概率计算分析工具核心
7.1 故障树分析 FTA——最常用的工具
FTA 是一种自顶向下、演绎式的分析方法。从一个不希望发生的"顶事件"出发(例如"双发停车"),用逻辑门一层层向下展开,找到所有可能导致它的基本事件组合。
核心元素
- 顶事件:要避免的失效状态,通常来自 FHA
- 基本事件:不再展开的最底层故障,通常是部件的随机故障
- 与门 AND:所有输入事件同时发生,输出才发生(用于建模冗余)
- 或门 OR:任一输入事件发生,输出就发生(用于建模单点链路)
概率计算公式
独立基本事件经过与门,输出概率为各事件概率乘积:
独立事件经过或门,当各 \(P_i\) 较小时(通常 \(< 0.1\)),可近似为求和:
关键概念:最小割集
割集是能让顶事件发生的基本事件组合;最小割集是其中"再去掉任何一个就不成立"的最简组合。最小割集的"阶数"(包含的事件数)非常重要:
- 1 阶割集:单点故障——这是设计禁忌,必须消除;
- 2 阶割集:需要两个事件同时发生才能导致顶事件——通常是冗余设计的产物;
- 更高阶:安全性更好,但也意味着更高的成本和复杂度。
7.2 相关图分析(Dependence Diagram)
相关图本质上是 FTA 的"对偶"表示——它用"成功路径"而非"失效路径"来表达系统结构,类似可靠性框图。它和 FTA 在数学上等价,但在某些情况下(例如系统天然以"通路"形式描述时)更直观。
7.3 马尔可夫分析——处理时序与修复
FTA 有一个隐含假设:所有事件相互独立、不考虑时间。但有些问题它处理不了:
- 系统有"状态切换",比如主用→备用→失效
- 故障可以被修复,故障率与修复率交织
- 事件之间存在时序依赖——A 必须先于 B
这时就需要马尔可夫模型。它把系统建模为一组"状态",状态之间用"转移率"连接。任意时刻 \(t\) 的状态概率向量 \(\mathbf{P}(t)\) 满足微分方程:
其中 \(\mathbf{Q}\) 是转移率矩阵,对角元素为离开该状态的总速率(取负),非对角元素为状态间的转移率(如故障率 \(\lambda\) 或修复率 \(\mu\))。
第8章 故障模式及影响分析 FMEA / FMES核心
8.1 FMEA 与 FMES 是什么关系
| 缩写 | 全称 | 作用 |
|---|---|---|
| FMEA | Failure Mode and Effects Analysis | 对每个部件的每个故障模式逐一分析其影响 |
| FMES | Failure Mode and Effects Summary | 把 FMEA 中"影响相同"的故障模式合并,作为 FTA 的基本事件输入 |
简言之:FMEA 是细账,FMES 是把细账按"对系统影响"汇总后的总账。
8.2 FMEA 的基本原则
- 单一故障假设:每次只假设一个部件的一个故障模式发生(多重故障由 FTA 处理);
- 穷尽故障模式:每个部件可能的全部故障模式都要考虑,例如电阻的"开路、短路、漂移"三种;
- 逐级影响:故障影响要分"本级、上一级、最终"三个层次描述。
8.3 FMEA 的分析步骤
- 确定分析层级:分析做到部件级还是 LRU 级
- 列出部件清单并编码(建立追溯关系)
- 识别故障模式:每个部件可能怎么坏
- 分析故障原因:磨损、老化、过载、设计缺陷……
- 逐级评估影响:本级影响 → 上一级影响 → 飞机级最终影响
- 识别检测手段:是否有 BIT、监控、机组指示
- 提出补偿措施:冗余、降级模式、机组程序
- 记录失效率数据来源:MIL-HDBK-217、FMD-2016、217Plus 等
8.4 FMEA 表格的典型字段
| 字段 | 说明 |
|---|---|
| 部件编号 / 名称 | 追溯标识 |
| 功能 | 该部件承担什么功能 |
| 故障模式 | 怎么坏的 |
| 故障原因 | 为什么坏 |
| 本级影响 | 对本部件的影响 |
| 上一级影响 | 对子系统/系统的影响 |
| 最终影响 | 对飞机/乘员的影响 |
| 检测手段 | 能否被检测到 |
| 补偿措施 | 冗余、应急程序等 |
| 故障率 | 来源数据 |
| 严重度 | 对应 FHA 等级 |
第9章 特定风险分析 PRA了解
9.1 什么是特定风险
特定风险是指独立于飞机系统失效而存在的外部事件,但它一旦发生,会对飞机多个部位/系统产生共同影响。常见特定风险包括:
- 发动机非包容性转子失效(UERF, Uncontained Engine Rotor Failure)
- 机轮及轮胎失效(爆胎碎片击伤周围结构与系统)
- 鸟撞
- 雷击
- HIRF(高强度辐射场)
- 冰雹、积冰
- 火灾、液体泄漏
9.2 以发动机非包容性转子失效为例
发动机转子(风扇、压气机、涡轮)以极高转速旋转,一旦叶片或轮盘破裂飞出,能击穿机身、油箱、液压管路、控制电缆。分析步骤大致为:
- 定义碎片大小与扩散角(局方有规定的"1/3 圆盘碎片"和"小碎片"模型);
- 从每台发动机出发,画出碎片可能击中的"散布锥"区域;
- 识别落入散布锥的所有关键设备/线路;
- 分析这些设备同时被击中后,飞机能否继续安全飞行;
- 必要时调整设备布置或加装防护板。
9.3 鸟撞与轮胎爆破分析
类似地,鸟撞分析关注挡风玻璃、机翼前缘、发动机进气道等部位是否能承受规定能量的鸟体撞击;轮胎爆破分析关注高速滑跑/起飞时爆破碎片对机轮舱周围结构的影响。这些分析都属于"外部事件 → 多系统共影响"的研究。
第10章 区域安全性分析 ZSA了解
10.1 ZSA 的核心思想
ZSA 把飞机按物理区域划分(例如机鼻舱、电子设备舱、机翼前缘、发动机吊舱、起落架舱等),对每个区域内安装的所有设备、线路、管路进行"邻居关系"检查。
10.2 主要检查内容
- 隔离与保护:液压管路与电缆、燃油管路与点火源是否充分分离;
- 泄漏路径:液压油/燃油如果泄漏,会不会流到电气接线盒或高温部件上;
- 磨损与振动:管路、线束在振动环境中是否会与结构件相互磨损;
- 火灾扩散:一处起火能否被防火墙阻隔;
- 维修可达性:是否易导致维护错误(例如装反、漏装)。
10.3 ZSA 的输入与输出
输入:飞机三维数模、安装图、各系统设备清单、相邻设备间隙数据。
输出:每个区域的检查清单与不符合项,以及对应的设计改进建议。
第11章 共模分析 CMA了解
11.1 共模故障是什么
共模故障(Common Mode Failure, CMF)指由共同原因引起的、使多个理应独立的部件同时失效的事件。它直接破坏冗余的有效性——FTA 中 \(P_{\text{AND}} = P_1 \times P_2\) 的乘法假设建立在独立性之上,而共模会让这个假设崩塌。
11.2 共模故障的常见来源
- 共同设计错误:相同的软件或硬件设计 bug;
- 共同制造缺陷:来自同一批次的部件存在相同瑕疵;
- 共同环境影响:高温、振动、EMI、湿气同时作用于多个部件;
- 共同维护错误:同一名维护人员对所有冗余通道犯了同样错误;
- 共同电源/信号源:冗余通道共用上游电源或时钟。
11.3 共模分析要做什么
- 识别系统中所有"声明独立"的通道;
- 对每对独立通道,列出它们之间所有可能的共同点(设计、硬件、软件、安装、环境、维护、电源…);
- 判断这些共同点是否会导致同时失效;
- 对存在共模风险的部分提出隔离/差异化措施(如硬件不同型号、软件不同算法、物理隔离、不同维护人员)。
共模分析与特定风险分析(PRA)、区域安全性分析(ZSA)合称共因分析(CCA, Common Cause Analysis),是 SSA 的必备组成部分。
第12章 与系统安全性相关的其他内容概览
12.1 候选审定维修要求 CMR
CMR(Candidate Certification Maintenance Requirements)是指:通过安全性分析识别出的、必须强制执行的维修任务。如果不做这些任务,飞机的安全性就无法维持。
典型场景:某个故障是"潜在故障"(即不做维护就无法被发现),如果不定期检查,它会和另一个故障组合形成灾难性后果。这种检查任务就必须固化为 CMR,写入飞机维护方案。
12.2 主最低设备清单 MMEL
MMEL(Master Minimum Equipment List)规定:飞机上哪些设备失效后,仍允许飞机放行起飞,以及在什么条件下放行。它是航空公司日常运行不可或缺的依据。
MMEL 的制定来自安全性评估的结果:只有那些"在该设备失效情况下仍能保持可接受安全水平"的项目,才能进入 MMEL。
12.3 电气线路互联系统 EWIS
EWIS(Electrical Wiring Interconnection System)把飞机上所有电气线路、连接器、绑扎件视为一个独立系统,对它单独开展安全性分析。原因是历史上多起空难(如 TWA800、瑞士航空 111)都源于线束老化、磨损、绝缘失效引发的火灾,而传统分析中线束往往被忽视。
EWIS 分析关注:线束老化、磨损、污染、过热、电弧故障的概率与影响,以及防火与隔离要求。
第13章 安全性工作管理与规划概览
13.1 安全性工作管理的要素
- 组织:成立独立的安全性工作组,与设计、试验、制造、客服各部门接口;
- 计划:制定《安全性工作计划 SPP》,明确范围、方法、节点、资源;
- 评审:在每个研制阶段(PDR/CDR/TRR/TC)开展安全性评审;
- 变更控制:任何设计变更都要回溯评估其对安全性分析的影响;
- 风险管理:识别、跟踪、闭环所有"安全性相关问题项 SCI"。
13.2 安全性文件体系
典型的安全性文件包括:
- 安全性工作计划(SPP)
- FHA 报告(AFHA + SFHA)
- PSSA 报告
- SSA 报告
- CCA 报告(PRA + ZSA + CMA)
- FMEA / FMES 表
- CMR 清单
- MMEL 提案
- 符合性矩阵(Compliance Matrix)
13.3 安全性活动与型号研制节点的对应
| 研制阶段 | 关键安全性活动 |
|---|---|
| 概念阶段 | 启动 AFHA |
| 初步设计 (PDR) | 完成 AFHA、启动 SFHA、开展 PSSA 初稿 |
| 详细设计 (CDR) | SFHA 完成、PSSA 完成、启动 SSA |
| 试验试飞 | SSA 数据更新、CCA 完成、CMR/MMEL 提案 |
| 型号合格审定 (TC) | SSA 终版、符合性矩阵交付局方 |
| 持续适航 | 跟踪在役故障、闭环改进 |
📖 全书脉络与学习建议
本书虽然章节众多,但本质上围绕一条主线和一组工具展开:
主线(必须掌握)
识别危险
分配需求
验证符合
支撑工具(必须熟练)
- FTA:自顶向下,找原因
- FMEA:自底向上,看后果
- Markov:处理时序与修复
- CCA(PRA/ZSA/CMA):处理共因与外部威胁
建议学习顺序
- 第 1~3 章打基础:术语、规章、整体框架——必须先吃透;
- 第 4~6 章抓主线:FHA → PSSA → SSA 是"灵魂三部曲";
- 第 7、8 章练工具:FTA 和 FMEA 必须能动手算;
- 第 9~12 章补专题:CCA 三件套和 EWIS、CMR、MMEL;
- 第 13 章学管理:理解技术之外的工程组织与文件体系。