研发测试质量规范(草稿)

博客园 - 小海海宁宁

研发测试质量规范(草稿)

小海海宁宁 · 2026-03-09 · via 博客园 - 小海海宁宁

目的

明确版本提测流程及产研质量要求，旨在通过规范化的准入标准、可度量的质量指标、清晰的责任界定，保证提测版本质量，提升研发测试协作效率，降低版本上线风险，形成可追溯、可改进的质量闭环。

范围

本规范适用于ICC产品线所有涉及软件研发、测试活动的项目与版本。所有产研团队成员均需遵守。不满足则有权拒绝提测。

提测准入标准

本章定义了版本进入正式测试阶段前必须满足的强制性要求，是提测的“准入门槛”。

需求与设计完整

需求覆盖100%：提测版本需100%覆盖迭代/版本计划中已评审通过的需求，无遗漏功能点
设计评审：详细设计已通过技术评审，所有评审遗留问题均已闭环

代码质量门禁

代码审查

所有代码需通过团队内至少一名成员的审查，消除明显逻辑缺陷

代码静态扫描

通过Sonar、SCA等工具扫描，结果满足以下红线标准（不得突破）：
1. bug数量：红线标准≤ 30个推荐标准= 0个
2. 阻断违规数量：红线标准= 0个推荐标准= 0个
3. 严重违规数量：红线标准≤ 5个推荐标准≤ 1 个
4. 阻断性漏洞：红线标准= 0个推荐标准= 0个
5. 严重漏洞：红线标准≤ 5 个推荐标准= 0个
6. 重要漏洞：红线标准≤ 10 个推荐标准= 0个
注： sonar扫描：通过静态代码分析，系统性检测代码中的技术债务、可靠性问题、安全漏洞及可维护性风险，提供整体质量画像。 scan扫描：识别项目所使用第三方依赖库中的已知安全漏洞、许可证合规风险，并管理开源组件清单。

2.2.3 单元测试覆盖率达标
1. 单元测试通过率 100%
2. 全量代码行覆盖率 ≥ 50%
3. 全量代码分支覆盖率 ≥ 40%
4. 增量代码行覆盖率 ≥ 80%
5. 增量代码分支覆盖率 ≥ 70%
2.3 集成和冒烟测试通过
1. 联调完成：
1. 完成跨模块/系统的端到端集成联调
2. 保证提测需求功能点正确实现
2. 冒烟测试通过：
1. 在联调环境执行主流程冒烟测试并通过，确保主流程可正确执行
2. 提供冒烟测试用例执行通过结果，录屏并发送报告
2.4 交付物就绪
技术文档已在知识库更新并同步相关方。配置、脚本等均已就绪。
技术文档包括不限于：
1. 需求文档
2. 设计文档
3. 接口文档
4. 新增配置说明和配置流水线提交
5. 数据库变更说明及脚本
6. 部署说明
注：1）上述质量要求原则上均需满足，特殊情况需向部门提交申请（含原因及改进计划），申请通过后需按计划逐步推进。
2）上述要求为全面的质量目标。当前阶段，提测的强制准入检查项以第6.2.3节中定义的清单为准。其他要求（如静态扫描、单元测试覆盖率）团队将逐步通过工具链集成，纳入自动化准入检查。

研发质量度量与责任

本章定义了研发团队在提测后需持续关注和改进的质量指标，并明确其责任边界。指标数据应尽可能从DevOps平台自动获取。

研发质量度量标准

衡量维度	衡量指标	目标值	考核频率	备注与数据来源
单元测试质量	新增代码分支覆盖率	详见2.2.3单元测试覆盖率达标	每次代码提交/迭代	仅考核当期新增代码
单元测试质量	新增代码行覆盖率	详见2.2.3单元测试覆盖率达标	每次代码提交/迭代	仅考核当期新增代码
功能质量	新需求测试用例通过率	≥ 80%	每轮测试	需求提测后第一轮测试通过率
	新需求门槛测试用例通过率	100%	每轮测试	新需求门槛用例
	千行代码缺陷密度	≤ 5个/K	按迭代	新增每K代码量对应的缺陷数
	严重缺陷占比	≤ 10%	按迭代	(致命+严重)/总缺陷数
	缺陷回归不通过率	≤ 5%	按迭代	原场景测试不通过的缺陷/总缺陷数
	上线P1/P2事件数	0	按版本/月度	公司层级问题
交付效率	提测打回次数	0	每次提测	打回标准见2节
	需求提测准时率	≥ 90%	按迭代	按计划准时提测的需求数/总需求数
	缺陷平均修复时间(致命&严重)	≤ 1天	按迭代	24小时内修复（工作日）
	缺陷平均修复时间(一般&轻微)	≤ 2天	按迭代	48小时内修复（工作日）
CI/CD质量	CI/CD流水线通过率	≥ 95%	每次构建	历史基本功能用例，当前流水线未搭建起来，暂不考核

详细指标定义与评分标准

单元测试质量

指标定义说明

单元测试质量维度旨在衡量代码的自动化测试覆盖程度，确保核心逻辑得到有效验证。

指标名称	新增代码分支覆盖率	新增代码行覆盖率
目标值	详见2.2.3单元测试覆盖率达标	详见2.2.3单元测试覆盖率达标
考核范围	仅考核当期新增代码	仅考核当期新增代码
统计口径	新增代码中覆盖的分支数 ÷ 新增代码总分支数 × 100%	新增代码中覆盖的代码行数 ÷ 新增代码总行数 × 100%
	数据来源	SonarQube / JaCoCo / 覆盖率报告	SonarQube / JaCoCo / 覆盖率报告
采集频率	每次代码合并后自动采集	每次代码合并后自动采集
责任主体	开发工程师	开发工程师

好中差评分标准

评分等级	新增代码分支覆盖率	新增代码行覆盖率	含义说明
好 (A)	≥ 85%	≥ 90%	测试覆盖充分，核心逻辑有完整验证
中 (B)	70% - 84%	75% - 89%	基本覆盖，存在少量未覆盖逻辑
差 (C)	< 70%	< 75%	覆盖不足，存在质量风险

说明：对于特殊场景（如UI层、复杂异常处理等）可根据实际情况申请调整目标值，需经技术负责人审批。

功能质量 - 新需求测试用例通过率

新需求测试用例通过率

指标名称	新需求测试用例通过率	新需求门槛测试用例通过率
目标值	≥ 80%	100%
统计口径	首轮测试通过的用例数 ÷ 该需求总用例数 × 100%	首轮测试通过的门槛用例数 ÷ 该需求门槛用例总数 × 100%
门槛用例定义	- 核心业务流程 - P0级功能 - 冒烟测试用例	- 核心业务流程 - P0级功能 - 冒烟测试用例
数据来源	测试用例管理系统	测试用例管理系统
采集频率	需求提测后首轮测试完成时	需求提测后首轮测试完成时
责任主体	开发工程师	开发工程师

好中差评分标准：

评分等级	新需求测试用例通过率	新需求门槛测试用例通过率	含义说明
好 (A)	≥ 90%	100%	提测质量高，仅少量非核心问题
中 (B)	80% - 89%	100%	提测质量合格，存在一定问题
差 (C)	< 80%	< 100%	提测质量差，影响测试进行

功能质量 - 千行代码缺陷密度

千行代码缺陷密度

指标名称	千行代码缺陷密度
目标值	≤ 5个/K
统计口径	(迭代内发现的缺陷总数 × 1000) ÷ 迭代内新增/修改代码行数
缺陷统计范围	- 提测后发现的缺陷 - 回归测试发现的缺陷 - 代码评审发现的缺陷
排除规则	- 重复缺陷 - 无效缺陷（"不是缺陷"、"无法重现"） - 线上缺陷（另有指标统计）
数据来源	缺陷管理系统 + 代码仓库
采集频率	迭代结束后
责任主体	开发工程师

好中差评分标准：

评分等级	千行代码缺陷密度	含义说明
好 (A)	≤ 2.5个/K	代码质量优秀，缺陷密度很低
中 (B)	2.6 - 5.0个/K	代码质量可控，处于正常范围
差 (C)	> 5.0个/K	缺陷密度过高，需要质量改进

功能质量 - 严重缺陷占比

严重缺陷占比

指标名称	严重缺陷占比
目标值	≤ 10%
统计口径	(致命缺陷数 + 严重缺陷数) ÷ 总缺陷数 × 100%
缺陷等级定义	详见4.1缺陷严重等级定义
数据来源	缺陷管理系统
采集频率	按迭代/版本
责任主体	开发工程师

好中差评分标准：

评分等级	严重缺陷占比	含义说明
好 (A)	≤ 5%	严重缺陷控制很好，无明显质量问题
中 (B)	6% - 10%	严重缺陷在可控范围内
差 (C)	> 10%	严重缺陷过多，需分析原因并改进

功能质量 - 缺陷回归不通过率

缺陷回归不通过率

指标名称	缺陷回归不通过率
目标值	≤ 5%
统计口径	回归测试不通过的缺陷数 ÷ 当期回归测试的缺陷总数 × 100%
判定标准	缺陷标记为"已修复"，但在验证时发现未修复、修复不完整或引入新问题
数据来源	缺陷管理系统（工作流记录）
采集频率	按迭代
责任主体	开发工程师

好中差评分标准：

评分等级	缺陷回归不通过率	含义说明
好 (A)	≤ 2%	修复质量高，一次通过率高
中 (B)	3% - 5%	修复质量正常，偶有反复
差 (C)	> 5%	修复质量差，浪费验证时间

功能质量 - 上线P1/P2事件数

上线P1/P2事件数

指标名称	上线P1/P2事件数
目标值	0
统计口径	统计周期内，生产环境发生的P1/P2级事件总数
事件等级定义	- P1：核心功能完全不可用、大面积故障、数据严重错误 - P2：部分功能受影响、性能明显下降、少量用户受影响
数据来源	事件管理系统 / 运维监控平台
采集频率	按版本/月度
责任主体	全流程（开发、测试、产品、运维）

好中差评分标准：

评分等级	上线P1/P2事件数	含义说明
好 (A)	0	无生产事故，发布质量优秀
中 (B)	0	无事故（此指标仅有好和差）
差 (C)	≥ 1	发生生产事故，需进行事故复盘

交付效率 - 提测打回次数

提测打回次数

指标名称	提测打回次数
目标值	0
打回标准	详见2 提测打回标准
统计口径	统计周期内，被测试团队打回的需求/任务次数
数据来源	测试管理系统 / 提测记录
采集频率	每次提测
责任主体	开发工程师

好中差评分标准：

评分等级	提测打回次数	含义说明
好 (A)	0	提测质量合格，一次通过
中 (B)	1	偶有打回，需加强自测
差 (C)	≥ 2	提测质量不稳定，需规范自测流程

交付效率 - 需求提测准时率

需求提测准时率

指标名称	需求提测准时率
目标值	≥ 90%
统计口径	按时提测的需求数 ÷ 计划提测的需求总数 × 100%
准时定义	在迭代计划中约定的提测时间点当天完成提测（包括23:59前）
延期处理	延期提测需说明原因，影响后续测试排期
数据来源	项目管理工具的提测记录
采集频率	迭代结束时
责任主体	开发工程师/项目经理

好中差评分标准：

评分等级	需求提测准时率	含义说明
好 (A)	100%	所有需求准时提测，计划性强
中 (B)	90% - 99%	大部分准时，个别延期可控
差 (C)	< 90%	延期较多，影响迭代节奏

交付效率 - 缺陷平均修复时间

缺陷平均修复时间

指标名称	缺陷平均修复时间(致命&严重)	缺陷平均修复时间(一般&轻微)
目标值	≤ 1天	≤ 2天
统计口径	Σ(致命&严重缺陷修复时长) ÷ 致命&严重缺陷总数	Σ(一般&轻微缺陷修复时长) ÷ 一般&轻微缺陷总数
修复时长计算	从缺陷"创建时间"到"修复完成时间"的工作日天数	从缺陷"创建时间"到"修复完成时间"的工作日天数
暂停计时	阻塞等待时间不计入（如等待外部依赖）	阻塞等待时间不计入
数据来源	缺陷管理系统的工作流日志	缺陷管理系统的工作流日志
采集频率	按迭代/月度	按迭代/月度
责任主体	开发工程师	开发工程师

好中差评分标准：

评分等级	致命&严重缺陷修复时间	一般&轻微缺陷修复时间	含义说明
好 (A)	≤ 0.5天	≤ 1天	响应迅速，修复高效
中 (B)	0.6 - 1天	1.1 - 2天	符合预期，按时完成
差 (C)	> 1天	> 2天	响应慢，影响开发进度

2.4 CI/CD质量

2.4.1 CI/CD流水线通过率

指标名称	CI/CD流水线通过率
目标值	≥ 95%
统计口径	(流水线成功执行次数 ÷ 流水线总触发次数) × 100%
测试范围	- 代码编译 - 单元测试 - 静态代码扫描 - 构建打包 - 历史基本功能用例（待接入）
当前状态	流水线未完全搭建，暂不考核
数据来源	Jenkins / GitLab CI / 流水线平台
采集频率	每次构建
责任主体	开发工程师/运维工程师

好中差评分标准（待流水线搭建完成后启用）：

评分等级	CI/CD流水线通过率	含义说明
好 (A)	≥ 98%	流水线稳定，极少失败
中 (B)	95% - 97%	偶有失败，整体可控
差 (C)	< 95%	频繁失败，影响交付效率

研发责任界定

需求实现与沟通责任

对产品需求的理解负有主动确认义务。因未充分沟通导致理解偏差引发的缺陷，由研发承担主要责任。

技术交付物责任

负责提供准确、完整的接口文档、设计文档。因文档错误或缺失导致的集成问题，由研发承担。

变更通知责任

任何代码、接口、配置的变更，必须通过正式渠道及时通知所有受影响方（含测试）。因未通知导致测试漏测，由研发承担全部责任。

提测质量责任

确保提测版本满足第2章所有准入标准。出现以下情况，测试有权打回，责任归属研发：

新需求基本功能阻塞，无法正常测试。
影响全链路基本功能（如无法正常拨打/进线）。
提测需求的首轮测试用例通过率 < 60%。

测试质量度量和责任

本章定义了测试团队独立的质量活动、度量指标与责任边界。

缺陷严重等级定义（用于度量与定责）

P0-致命：所有环境/租户呼叫流程受阻：联络作业中断，无法正常拨打/进线，无法登录、切换状态等。
P1-严重：单环境/单租户(KA)/3+小租户呼叫流程受阻：联络作业中断，无法正常拨打/进线，无法登录、切换状态等，持续时间30min以内。
P2-一般：业务效率降低，但不阻塞业务呼叫主流程：例如送号容量瓶颈、预测外呼任务无法自动runcall等，持续时间30min以内。
P3-轻微：非联络核心业务受影响：例如数据回流、录音回流、早期媒体检测、实时转文本等出现延时，但无丢失风险，持续时间1H以内。

测试质量度量指标

衡量维度	衡量指标	目标值	备注
测试过程	测试完成时间执行进度偏差率	≤ 10%	测试完成时间相对计划延迟不能超过10%
	缺陷平均验证周期(P0致命/P1严重)	≤ 1天	24小时内验证（工作日）
	缺陷平均验证周期(P2一般/P3轻微)	≤ 2天	48小时内验证（工作日）
	门槛用例提供延迟次数	0	未按时提供给开发
测试效果	缺陷逃逸率（上线发现问题）	≤ 1%	核心指标：上线后发现缺陷数/总缺陷数
	上线P1/P2事件数	0
	测试执行覆盖率	100%	新增用例100%执行
	子系统拦截率	≥ 80%	测试发现本模块问题/归属该模块所有问题
测试资产与效率	新增自动化有效性及忠诚度	100%	1.用例与自动化一一对应； 2.步骤与手工用例一致
	集成功能回归测试周期	≤ 4人/天	完成一轮回归测试的工作量
	CI/CD自动化测试通过率	≥ 95%	除去产品问题，反映脚本健壮度

详细指标定义与评分标准

测试过程 - 测试完成时间执行进度偏差率

测试完成时间执行进度偏差率

指标名称	测试完成时间执行进度偏差率
目标值	≤ 10%
统计口径	\|实际测试完成时间 - 计划测试完成时间\| ÷ 计划测试周期 × 100%
计算公式示例	计划3天完成，实际3.2天完成 → 偏差率 = 0.2 ÷ 3 × 100% = 6.67%
统计规则	- 仅计算可测试的时间（排除阻塞、等待时间） - 计划变更需重新基线 - 以测试报告提交时间为完成时间
排除情况	- 需求变更导致的测试范围扩大 - 环境不可用等客观阻塞因素 - 开发延期提测导致的计划压缩
数据来源	测试计划文档 / 项目管理工具 / 测试报告
采集频率	每个测试任务结束后
责任主体	测试工程师

好中差评分标准：

评分等级	偏差率范围	含义说明
好 (A)	≤ 5%	计划准确，执行偏差极小
中 (B)	5% - 10%	偏差在可接受范围内
差 (C)	> 10%	计划或执行存在较大问题，需复盘

测试过程 - 缺陷平均验证周期

缺陷平均验证周期

指标名称	缺陷平均验证周期(P0/P1)	缺陷平均验证周期(P2/P3)
指标代码	TEST-VERIFY-P0P1	TEST-VERIFY-P2P3
目标值	≤ 1天	≤ 2天
统计口径	Σ(缺陷验证时长) ÷ 对应优先级缺陷总数	Σ(缺陷验证时长) ÷ 对应优先级缺陷总数
验证时长定义	从缺陷标记为"已解决"到测试验证通过/关闭的时间（工作日）	从缺陷标记为"已解决"到测试验证通过/关闭的时间（工作日）
暂停计时	- 等待开发提供验证环境的等待时间不计 - 等待产品确认的阻塞时间不计	- 等待开发提供验证环境的等待时间不计 - 等待产品确认的阻塞时间不计
数据来源	缺陷管理系统的工作流日志	缺陷管理系统的工作流日志
采集频率	按迭代/月度	按迭代/月度
责任主体	测试工程师	测试工程师

好中差评分标准：

评分等级	P0/P1缺陷验证周期	P2/P3缺陷验证周期	含义说明
好 (A)	≤ 0.5天 (4小时)	≤ 1天	验证及时，响应迅速
中 (B)	0.6 - 1天	1.1 - 2天	符合预期，按时验证
差 (C)	> 1天	> 2天	验证滞后，可能影响迭代节奏

特别说明：

P0缺陷应优先验证，原则上修复后应在4小时内完成验证
同一缺陷反复验证的情况，累计计时但需标记原因

测试过程 - 门槛用例提供延迟次数

门槛用例提供延迟次数

指标名称	门槛用例提供延迟次数
目标值	0
门槛用例定义	- 冒烟测试用例（核心业务流程） - P0级功能验证用例 - 提测准入的基本功能用例
提供时间要求	需求进入开发前，或至少提测前2个工作日提供给开发
延迟判定	开发提测时，门槛用例仍未提供即计为1次延迟
统计口径	统计周期内，门槛用例提供时间晚于要求的次数
数据来源	测试用例管理系统 / 需求文档 / 沟通记录
采集频率	每次需求
责任主体	测试工程师

好中差评分标准：

评分等级	延迟次数	含义说明
好 (A)	0	用例准备及时，开发可提前了解测试要点
中 (B)	0	（此指标仅有好和差之分）
差 (C)	≥ 1	用例提供延迟，影响开发自测或提测质量

测试效果 - 缺陷逃逸率（上线发现问题）

缺陷逃逸率（上线发现问题）

指标名称	缺陷逃逸率
目标值	≤ 1%
统计口径	(生产环境发现的缺陷数 ÷ 总缺陷数) × 100%
总缺陷数定义	线上缺陷数 + 测试阶段发现的缺陷数
线上缺陷统计	- 用户反馈并确认的缺陷 - 监控系统发现的程序错误 - 线上事件中确认为代码缺陷的部分
排除规则	- 需求变更/新需求（非缺陷） - 环境配置问题 - 数据问题（非代码导致）
数据来源	缺陷管理系统 + 事件管理系统
采集频率	按版本/月度
责任主体	测试团队

好中差评分标准：

评分等级	缺陷逃逸率	含义说明
好 (A)	≤ 0.5%	测试覆盖充分，漏测极少
中 (B)	0.6% - 1.0%	漏测在可控范围内
差 (C)	> 1.0%	漏测较多，需分析测试盲区

测试效果 - 上线P1/P2事件数

上线P1/P2事件数

指标名称	上线P1/P2事件数
目标值	0
统计口径	统计周期内，生产环境发生的P1/P2级事件总数
事件等级定义	- P1：核心功能完全不可用、大面积故障、数据严重错误 - P2：部分功能受影响、性能明显下降、少量用户受影响
与测试相关的责任界定	- 因测试未覆盖导致 → 测试负主要责任 - 因需求理解偏差导致 → 测试/产品共同责任 - 因环境差异导致 → 测试/运维共同责任
数据来源	事件管理系统 / 运维监控平台
采集频率	按版本/月度
责任主体	测试团队（作为质量门禁的最后一道防线）

好中差评分标准：

评分等级	上线P1/P2事件数	含义说明
好 (A)	0	无生产事故，测试拦截有效
中 (B)	0	无事故（此指标仅有好和差）
差 (C)	≥ 1	发生生产事故，需进行事故复盘

测试效果 - 测试执行覆盖率

测试执行覆盖率

指标名称	测试执行覆盖率
目标值	100%
统计口径	(实际执行的用例数 ÷ 计划执行的用例总数) × 100%
计划执行用例范围	- 本次测试范围涉及的所有新增用例 - 本次测试范围涉及的回归用例 - 计划中明确需要执行的用例
未执行处理	未执行的用例必须在测试报告中说明原因
可接受的未执行原因	- 需求变更导致用例失效 - 环境问题且短期内无法解决 - 优先级调整（需审批）
数据来源	测试用例管理系统 / 测试执行记录
采集频率	每轮测试结束后
责任主体	测试工程师

好中差评分标准：

评分等级	测试执行覆盖率	含义说明
好 (A)	100%	所有计划用例均执行，测试完整
中 (B)	95% - 99%	个别用例未执行，有合理说明
差 (C)	< 95%	大量用例未执行，测试不完整

测试效果 - 子系统拦截率

子系统拦截率

指标名称	子系统拦截率
目标值	≥ 80%
统计口径	(测试发现的归属本模块的缺陷数 ÷ 归属该模块的所有缺陷数) × 100%
分母定义	测试发现的归属本模块缺陷数 + 集成测试发现的归属本模块缺陷数 + 线上发现的归属本模块缺陷数
分子定义	测试阶段发现的、缺陷归属为本模块的问题（包括功能测试、自动化测试等）
统计意义	衡量测试在自身负责模块的缺陷发现能力，数值越高说明本模块测试越充分
数据来源	缺陷管理系统（按模块归属）
采集频率	按迭代/月度
责任主体	测试工程师

好中差评分标准：

评分等级	子系统拦截率	含义说明
好 (A)	≥ 90%	测试充分，绝大部分问题在本模块发现
中 (B)	80% - 89%	拦截能力良好，偶有漏测到集成阶段
差 (C)	< 80%	拦截能力不足，问题外溢到后续阶段

测试资产与效率 - 新增自动化有效性及忠诚度

新增自动化有效性及忠诚度

指标名称	新增自动化有效性及忠诚度
目标值	100%
定义说明	这是一个复合指标，包含两个核心要求： 1. 一一对应：每条自动化用例对应一条手工用例，无冗余/缺失 2. 步骤一致：自动化用例的验证步骤与手工用例完全一致，保证测试逻辑不变
统计口径	(符合要求的自动化用例数 ÷ 新增自动化用例总数) × 100%
符合要求判定标准	- 可在自动化平台查询到对应的手工用例ID - 自动化脚本覆盖了手工用例的所有验证点 - 无额外的不相关验证逻辑 - 用例命名和描述能清晰对应
不符合情况示例	- 一条自动化覆盖多条手工用例（无法准确定位失败原因） - 自动化脚本验证逻辑与手工用例不一致 - 没有对应的手工用例记录 - 手工用例已失效但自动化仍在运行
数据来源	自动化测试平台 + 手工用例库
采集频率	每次自动化代码提交/每周统计
责任主体	自动化测试工程师

好中差评分标准：

评分等级	自动化有效性	含义说明
好 (A)	100%	自动化用例管理规范，与手工用例完美对应
中 (B)	95% - 99%	存在少量对应问题，需优化改进
差 (C)	< 95%	自动化用例管理混乱，难以维护和定位问题

测试资产与效率 - 集成功能回归测试周期

集成功能回归测试周期

指标名称	集成功能回归测试周期
目标值	≤ 4人/天
统计口径	回归测试投入的总人天数
计算公式	参与测试人数 × 测试天数
示例	2人测试2天 → 4人/天；4人测试1天 → 4人/天
统计范围	- 环境准备时间 - 用例执行时间 - 结果记录与分析时间 - 缺陷复现与初步定位时间
排除范围	- 缺陷修复时间（属开发） - 等待时间（环境不可用等） - 测试报告编写时间
数据来源	测试工时记录 / 项目管理工具
采集频率	每次版本回归测试后
责任主体	测试团队

好中差评分标准：

评分等级	回归测试周期	含义说明
好 (A)	≤ 2人/天	回归效率高，可能受益于自动化程度高
中 (B)	2.1 - 4人/天	回归效率符合预期
差 (C)	> 4人/天	回归耗时过长，影响发布效率

测试资产与效率 - CI/CD自动化测试通过率

CI/CD自动化测试通过率

指标名称	CI/CD自动化测试通过率
目标值	≥ 95%
统计口径	(自动化测试成功执行并通过的次数 ÷ 自动化测试总执行次数) × 100%
统计范围	- CI/CD流水线中集成的所有自动化测试 - 单元测试、接口测试、UI自动化测试等
失败原因分类	1.产品问题：代码缺陷导致用例失败 2. 脚本问题：自动化脚本自身不稳定或断言错误 3. 环境问题：测试环境不可用、数据问题 4. 框架问题：测试框架或依赖问题
目标值说明	目标值≥95%是指"脚本问题+环境问题"导致的失败率控制在5%以内，反映脚本健壮度
数据来源	Jenkins / 流水线平台 / 自动化测试报告
采集频率	每次构建/每日统计
责任主体	自动化测试工程师

好中差评分标准：

评分等级	自动化测试通过率（脚本健壮度）	含义说明
好 (A)	≥ 98%	脚本非常稳定，极少因脚本问题失败
中 (B)	95% - 97%	脚本稳定，偶有不稳定因素
差 (C)	< 95%	脚本不稳定，频繁误报，需优化维护

注：此指标不考核产品问题导致的失败，仅考核"非产品问题"的比例。

更精确的计算方式：脚本健壮度 = 1 - (非产品问题导致的失败次数 ÷ 总执行次数) × 100%其中：非产品问题 = 脚本问题 + 环境问题 + 框架问题

测试侧责任界定

测试设计责任

对产品需求的理解负有确认义务。在研发已明确通知变更的前提下，因测试分析遗漏导致的用例缺失，由测试承担全部责任。

测试执行责任

对已覆盖的测试用例，因执行遗漏或验证不充分导致缺陷逃逸至上线的，由测试承担主要责任。

质量评估与门禁责任

有权根据第2章拒绝接收不达标版本，并对版本质量给出客观评估。

测试资产维护责任

负责业务层自动化测试脚本的编写、维护与忠诚度（与手工用例一致）。

模块间协作责任界定标准

本章定义跨系统、跨模块协作中出现问题时的定责原则与流程，是第3、4章责任条款在技术协作层面的延伸和具体化。

核心定责原则

接口契约原则

接口提供方负责接口定义、实现和文档的准确性
接口调用方负责按文档规范调用，处理异常响应
双方共同维护接口契约的稳定性

数据流向原则

数据生产者负责数据质量和格式
数据消费者负责数据校验和异常处理
跨模块数据流转问题，按数据流向追溯责任

变更影响原则

发起变更方负责评估影响范围和通知相关方
被影响方负责及时响应和适配
未通知或通知不充分导致的交互问题，由变更发起方承担。

具体定责标准（常见场景）

问题类型	定责标准	主要责任方
接口定义问题	接口文档与实际实现不一致	接口提供方
数据格式问题	返回数据格式不符合约定	接口提供方
调用方式问题	调用参数错误、超时设置不当	接口调用方
数据校验问题	未对输入数据进行校验导致异常	接口提供方
异常处理问题	未处理接口异常导致系统崩溃	接口调用方
性能问题	接口响应超时或吞吐量不足	接口提供方
兼容性问题	接口升级未向下兼容	接口提供方
依赖服务问题	依赖的第三方服务不可用导致功能异常	依赖服务提供方

定责操作流程

问题发现阶段
1. 建立问题上报机制，明确问题描述、复现步骤、影响范围
2. 记录问题发生时间、环境、相关日志
初步定位阶段
1. 通过日志分析、链路追踪确定问题模块
2. 确认是单模块问题还是跨模块交互问题
责任判定阶段
1. 根据接口契约、数据流向、变更记录判定责任方
2. 涉及多方责任时，明确主责方和次责方
问题修复阶段
1. 责任方制定修复方案并实施
2. 相关方配合验证修复效果
复盘改进阶段
1. 定期复盘定责案例，优化定责标准
2. 完善接口文档、监控告警、变更流程

配套机制

接口管理机制
1. 建立接口文档中心，统一管理接口定义
2. 实施接口版本管理，明确兼容性要求
变更通知机制
1. 建立变更通知平台，确保变更信息及时同步
2. 明确变更影响评估和通知范围
监控告警机制
1. 建立跨模块调用监控，实时发现交互问题
2. 设置合理的告警阈值和响应机制
质量度量机制
1. 统计模块间交互问题数量、定责准确率
2. 将定责结果纳入团队和个人绩效评估

通过这套定责标准，可以有效减少模块间推诿扯皮，提升研发协作效率，确保系统稳定性和可维护性。

提测流程规范

邮件提测流程（旧）

本节记录了ICC产品线过往使用的邮件提测流程。自DevOps平台提测流程（见6.2节）正式生效后，邮件提测方式已不再作为标准提测渠道。本节内容主要供历史追溯和参考，所有新版本提测请统一遵循6.2节的DevOps平台流程。

6.1.1 规范背景与目标

背景：在DevOps平台全面推广前，团队通过邮件方式进行版本提测通知。

目标：

建立统一的邮件提测通知格式。
明确邮件提测的干系人和信息要素。
确保提测信息能够有效传达和追溯。

6.1.2 核心原则

信息完整原则：提测邮件必须包含版本、范围、人员、文档等所有关键信息。
分级提测原则：按研发阶段分为“子系统提测”和“产品/项目提测”两级。
文档化管理原则：提测详细内容通过飞书文档管理，邮件正文仅提供摘要和链接。

按研发阶段划分，版本提测包括：子系统提测、产品提测、项目提测。

6.1.3 提测准入标准（前置条件）

在发送提测邮件通知相关干系人前，必须满足以下所有条件：

子系统提测：
- 子系统版本负责人对子系统版本研发工作进度及质量进行管理，
- 子系统内所有需求已完成开发、自测和联调。
- 已完成迭代测试，主流程可用。
产品/项目提测：
- 产品/项目版本负责人对产品/项目版本整体研发工作进度及质量进行管理
- 版本内所有相关子系统均已完成子系统提测（SIT完成）。
- 版本整体已完成集成联调，核心业务流程可完整跑通。
通用条件：
- 所有涉及的需求均已通过技术评审。
- 必要的技术文档（接口、设计、配置等）已准备就绪。
- 自测或联调结果已通过录屏等方式记录。

6.1.4 提测邮件填写标准

发件人与收件人：
- 发件人：版本产品协调人、开发协调人、测试协调人、项目经理
- 主送人：需求相关产品、需求相关研发、需求相关测试、模块负责人
- 抄送人：部门负责人、产品负责人、研发负责人、测试负责人、项目管理团队
邮件主题：
- 格式：【版本提测】ICC_模块名称_版本号（第X/X次）
- 示例：【版本提测】ICC_AMedia_R2.1.0.0（第1/2次）
- 注意：模块名称需与版本计划表中的子系统名称保持一致，不要自创、简写或者写应用名称。
邮件内容：
- 邮件正文需包含提测的基本摘要信息。
- 必须附上提测文档的飞书链接，所有详细信息均在该文档中维护。提测文档需存放在指定目录：\产品管理\产品力建设专项\产品版本管理\<版本号>\测试文档。
- 提测文档模板（必填项）参考：【模板】提测模板

6.1.5 提测操作流程

准备：版本负责人（开发协调人或产品协调人）按模板创建并填写提测文档。
确认：确认所有前置条件均已满足。
发送：撰写邮件，附上提测文档链接，发送给所有干系人。

6.1.6 规范状态与迁移说明

当前状态：预废弃，仅供历史参考。
迁移说明：自DevOps平台提测流程（规范V1.4）生效之日起，所有版本提测均需通过DevOps平台进行。邮件仅可作为辅助通知手段，但不能替代正式的DevOps平台提测单。团队将逐步淘汰邮件提测方式，实现提测流程的完全线上化和自动化。

Devops平台提测流程（推荐）

本节明确了通过DevOps平台进行提测的核心原则、质量标准和执行要求，是团队必须遵守的基准，旨在统一提测流程，实现系统化、线上化管理，保障交付质量。

规范背景与目标

背景：为统一产研团队在敏捷迭代模式下的提测方式，杜绝邮件、口头等不统一形式，推荐统一通过DevOps平台测试管理进行提测。

目标：

统一采用DevOps平台线上提测流程，实现系统化、线上化管理。
统一团队提测流程执行标准，明确前置条件与提测单填写要求。
作为重要研发活动，通过标准化流程保障交付测试质量。
通过前置条件校验，保障代码质量、自测质量与资料完整性。

核心原则

质量内建原则：质量保障活动应前置到开发阶段，提测版本必须达到既定质量门槛。
标准统一原则：团队应采用统一的提测渠道（DevOps平台）与准入标准。
一个迭代一单原则：每个迭代每次提测必须创建一个提测单，支持分步提测。
协同提测原则：涉及多研发的需求，由需求研发负责人统一组织验收与提测。

提测准入标准（前置条件）

提测前必须全部满足以下条件，测试人员有权对不达标提测单执行打回：

代码开发完毕：根据评审通过的需求及技术方案完成编码。
功能自测通过：完成接口联通、前后端联调、主流程/特殊流程逻辑验证等自测。
开发规范自查完毕：根据团队《开发规范》完成代码与配置自查，确保符合规范。
研发资料单完整：检查本需求相关的研发资料单已填写完整、准确，尤其是变更部分无遗漏、错误。
Showcase完成：已组织并完成需求实现效果演示，相关方(产研测)对演示结果无异议。
代码Review完毕：已完成小组或团队内部的代码评审，并已按评审意见完成修改。
配置变更已登记：本需求涉及的生产环境配置变更，已在《版本配置变更汇总单》中登记复核。

注：本清单是当前通过DevOps平台提测的强制检查项。团队更全面的质量目标（如代码扫描、单元测试覆盖率等）请参见本规范第2节提测质量要求。

提测单填写标准

模板

1、提测版本：icc-au-admin:test_R2.3.8.0
2、RD建议回归覆盖范围： *
2.1 xxx功能模块；
2.2 xxx功能模块；
2.3 ....
3、研发资料单：https://weikezhijia.feishu.cn/docx/PU5LdiPFRoxhp2x7VDDcL9X4ntb

标题：须与项目管理工具（如多维表）中的需求名称完全一致。
详细描述：必须包含“提测版本”、“RD建议回归范围”、“研发资料单链接”三个核心部分。
关键字段：
- 提测应用/分支：必须关联本需求涉及的所有应用与正确分支（如 icc-au-admin:test_Rx.x.x.x）。
- 变更说明（DB/中间件/配置）：有变更必须附链接，无变更必须明确声明“无”。
- 负责人：必须正确填写开发负责人（所有研发）、受理人（主测）、测试执行人（所有测试）、关注人（研发/测试/版本负责人）。
- 环境与迭代：必须正确选择提测环境（如test1）和关联的迭代。

提测操作流程

提测规范生效和执行

生效时间：自本规范生效之后起正式执行。
执行要求：团队全体成员（前端、后端、测试）必须严格按照本规范在DevOps平台进行提测操作。

提测监控

每个需求的测试跟进人对该需求的提测情况进行监督，在版本群里提醒未提测的相关需求研发负责人完成提测。
团队负责人在每个版本的提测日监督提醒版本负责人检查提测情况，对紧急或未在标准提测日的需求进行监督，在版本群里提醒未提测的相关需求研发负责人完成提测。

回顾周期

本规范按季度进行定期回顾。

回顾周期	回顾日期	备注
第1次回顾评估日期		规范生效后一个季度
第2次回顾评估日期
第3次回顾评估日期
....

此内容由惯性聚合(RSS阅读器)自动聚合整理，仅供阅读参考。原文来自 — 版权归原作者所有。

推荐订阅源

博客园 - 小海海宁宁

目的

范围

提测准入标准

需求与设计完整

代码质量门禁

代码审查

代码静态扫描

研发质量度量与责任

研发质量度量标准

详细指标定义与评分标准

单元测试质量

指标定义说明

好中差评分标准

功能质量 - 新需求测试用例通过率

新需求测试用例通过率

好中差评分标准：

功能质量 - 千行代码缺陷密度

千行代码缺陷密度

好中差评分标准：

功能质量 - 严重缺陷占比

严重缺陷占比

好中差评分标准：

功能质量 - 缺陷回归不通过率

缺陷回归不通过率

好中差评分标准：

功能质量 - 上线P1/P2事件数

上线P1/P2事件数

好中差评分标准：

交付效率 - 提测打回次数

提测打回次数

好中差评分标准：

交付效率 - 需求提测准时率

需求提测准时率

好中差评分标准：

交付效率 - 缺陷平均修复时间

缺陷平均修复时间

好中差评分标准：

2.4 CI/CD质量

2.4.1 CI/CD流水线通过率

好中差评分标准（待流水线搭建完成后启用）：

研发责任界定

需求实现与沟通责任

技术交付物责任

变更通知责任

提测质量责任

测试质量度量和责任

缺陷严重等级定义（用于度量与定责）

测试质量度量指标

详细指标定义与评分标准

测试过程 - 测试完成时间执行进度偏差率

测试完成时间执行进度偏差率

好中差评分标准：

测试过程 - 缺陷平均验证周期

缺陷平均验证周期

好中差评分标准：

测试过程 - 门槛用例提供延迟次数

门槛用例提供延迟次数

好中差评分标准：

测试效果 - 缺陷逃逸率（上线发现问题）

缺陷逃逸率（上线发现问题）

好中差评分标准：

测试效果 - 上线P1/P2事件数

上线P1/P2事件数

好中差评分标准：

测试效果 - 测试执行覆盖率

测试执行覆盖率

好中差评分标准：

测试效果 - 子系统拦截率

子系统拦截率

好中差评分标准：

测试资产与效率 - 新增自动化有效性及忠诚度

新增自动化有效性及忠诚度

好中差评分标准：

测试资产与效率 - 集成功能回归测试周期

集成功能回归测试周期

好中差评分标准：

测试资产与效率 - CI/CD自动化测试通过率

CI/CD自动化测试通过率