第五章 数据质量评价方法
本章节内容参考 ILCD 系列指南、EF 合规数据集导则、ecoinvent 数据库技术文档和 GaBi 数据库技术文档研制。
数据质量评级(DQR)
概述
【必须】总体数据质量考虑技术代表性、地理代表性、时间代表性和精确度。
【必须】数据集的 DQR 应根据方程 F.1 计算:
其中,
【必须】对于次级数据集,数据质量评级参照以下流程:
- 选择最相关的子过程和(前景)基本流,这些过程和流应至少占次级数据集总环境影响的 80%(单一分值),并按贡献大小从高到低排序;
- 计算每个最相关过程和每个最相关(前景)基本流的 DQR 标准,即
、 、 和 。每个标准的值应根据以下情况分配:- 每个最相关(前景)基本流应包括数值和流名称(例如,40 克二氧化碳)。对于每个最相关(前景)直接基本流,评估 4 个 DQR 标准,即
, , , 。例如,评估流数值测量的时间、流使用的技术以及流的地理区域。 - 每个最相关的过程是活动数据和使用的次级数据集的组合。对于每个最相关的过程,4 个 DQR 标准的计算如下:(i)
和 应在活动数据层面评估,分别命名为 和 ,而(ii) 、 和 应在使用的次级数据集层面评估,分别命名为 、 和 。由于 需要被评估两次,活动数据和次级数据集的 TiR 的数学平均值代表最相关过程的 。
- 每个最相关(前景)基本流应包括数值和流名称(例如,40 克二氧化碳)。对于每个最相关(前景)直接基本流,评估 4 个 DQR 标准,即
- 计算每个最相关过程和基本流对所有最相关过程和基本流的总环境影响的贡献百分比(使用 16 个影响类别进行加权)。例如,新创建的数据集仅包含两个最相关的过程,总共贡献了数据集总环境影响的 80%:
- 过程 1 占数据集总环境影响的 30%,该过程对 80% 总环境影响的贡献是 37.5%(后者是要使用的权重)。
- 过程 2 占数据集总环境影响的 50%,该过程对 80% 总环境影响的贡献是 62.5%(后者是要使用的权重)。
- 分别计算次级数据集的
, , , 作为每个最相关子过程和最相关基本流各标准的加权平均值。权重是步骤 3 中计算的每个最相关过程和直接基本流的相对贡献百分比(%)。 - 使用公式 F.1 计算次级数据集的 DQR,其中
, , , 是步骤 4 计算的加权平均值。
表 8 数据质量标准的质量评级
质量评级 | |||||
---|---|---|---|---|---|
1 | 经过测量/计算和验证。 | 数据的收集日期相对于数据集的“参考年”,最多在2年内。 | 数据集的"参考年"在次级数据集的有效期内。 | 技术方面的建模与标题和元数据中的描述完全一致,没有任何需要改进的地方。 | 数据集所包含的过程完全代表元数据中"位置"所述的地理区域。 |
2 | 经过测量/计算/文献记载,审查员已检查其合理性。 | 数据的收集日期相对于数据集的“参考年”,最多在4年内。 | 数据集的“参考年”最多比次级数据集的有效期晚2年。 | 技术方面与标题和元数据中的描述非常相似,仅需要有限的改进。例如:使用通用技术数据而不是建模所有单个工厂。 | 数据集中包含的过程完全符合元数据中“位置”所表示的地理区域。 |
3 | 已测量/已计算/有文献记载,但审查员未检查其合理性。OR基于计算的有保留估计,审查员已检查其合理性。 | 数据的收集日期相对于数据集的“参考年”,最多在6年内。 | 数据集的“参考年”最多比次级数据集的有效期晚3年。 | 技术方面与标题和元数据中的描述相似,但有改进空间。一些相关过程没有使用具体数据建模,而是使用了代理数据。 | 数据集中包含的过程足够符合元数据中“位置”所表示的地理区域。例如,所代表的国家不同,但电网组合配置几乎一致。 |
4 | 基于计算的合格估计,审查员未检查其合理性。 | 数据的收集日期相对于数据集的“参考年”,最多在8年内。 | 数据集的“参考年”最多比次级数据集的有效期晚4年。 | 技术方面与标题和元数据中的描述不同,需要重大改进。 | 数据集中包含的过程仅部分符合元数据中“位置”所表示的地理区域。例如,所代表的国家不同且电网组合配置有显著差异。 |
5 | 粗略估计,存在已知缺陷。 | 数据的收集日期相对于数据集的“参考年”超过8年。 | 数据集的“参考年”比次级数据集的有效期晚超过4年。 | 技术方面与标题和元数据中的描述完全不同,需要大幅改进。 | 数据集中包含的过程不符合元数据中“位置”所表示的地理区域。 |
【必须】数据集 DQR 的报告:数据集应将每个 DQR 标准(分别是
指标详述
技术代表性
LCI 结果的技术代表性在不同用途下有所区别。对于用途 A,B 和 C,需要区分归因建模和归果建模。对于单元过程,仅在系统模型的质量控制时需要考虑其技术代表性。
【必须】良好的技术代表性:整体清单数据应具有所需的良好技术代表性,满足研究的目标要求(注意技术、地理和时间相关的代表性是紧密相关的)。特别关注目标过程和系统功能单位和/或基准流和/或技术规格的所有定量和定性等方面,尤其是可能导致 LCI 数据相关差异的方面。
【必须】过程的特定方式或模式:如果过程的技术与平均、典型或综合操作不同,根据研究目标,特别是预期的应用场景来确定数据是否需要代表操作技术的特定方式或模式(例如,运输的特定负载因子,或过程的特定启动、关闭等周期步骤)。
【必须】同技术的归因和归果建模:需要注意的是,归因和结果建模常常需要完全不同的过程(在某种程度上也包括系统)作为背景系统。但为了简化分析,可以采用一些通用的简化措施,除了用途 B 中面临“重大”变化的过程:
- 归因建模:
- 前景系统:应该使用针对前景系统特定技术的主要数据,以及将前景系统与背景系统连接的产品和废物的规格数据。应优先使用实际供应商/下游参与者的次级数据,而非其他(第三方)次级数据。然而在前景系统的某些部分,在特定情况下如果第三方提供的技术特定、通用或平均数据比供应商/下游参与者提供的技术特定初级或次级数据质量更高(即更准确、精确、完整),则应使用这些数据。
- 背景系统:应使用平均技术作为市场消费组合数据。
- 归果建模:
- 前景系统:与上述的归因建模相同。此处应该使用包括供应商/下游参与者在合同规定或计划的供应链中特定技术的次级数据。
- 背景系统:应根据适用的用途 A,B,C1 和 C2,使用短期或长期边际技术组合。长期边际技术组合仅适用于用途 B 下因分析决策而导致“重大”变化的过程,并且选择性地适用于假设情景。边际过程的技术组合应根据市场条件和潜在边际过程的成本竞争力等因素确定。
- 使用不完全代表性的数据: 对于归因和归果建模,只有在以下条件下才能使用不完全具有技术代表性的数据:
-
对于 LCI 和 LCIA 数据集/非比较性 LCI/LCA 研究:只有当与使用完全具有代表性的数据相比,使用不完全具有技术代表性的数据不会显著地改变 LCIA 的整体结果时,才有理由使用技术上不完全具有代表性的数据;否则,应在数据集/报告中记录说明所使用的数据代表性较低。对于竞争产品提供的数据,较低的代表性不应导致该产品计算的 LCIA 结果的整体环境影响增加。对于自有产品或没有竞争情况的产品(例如,通用数据来自咨询或研究项目,用于一般背景),较低的代表性不应导致该产品计算的 LCIA 结果的环境影响减少。
-
对于比较性 LCA 研究:尽可能不影响研究的结论或建议。否则,在得出结论和提出建议时应明确考虑较低的技术代表性。特别是,使用代表性较低的数据不应在相关程度上不利于竞争产品。
注意这只能在 LCA 工作的后续迭代步骤中实施。
-
【必须】对于用途 A,B 和 C1 的生命周期模型,应适用以下规定:如果特定所需功能(例如产品)在分析市场中不能显著增加,并且由于固有限制(例如许多国家的水力发电),则应尽可能使用该产品提供的特定功能的市场消费组合数据(例如上述示例中的电力),而不是特定供应商/产品的数据。为避免与解决多功能性的规定相矛盾,此规定不适用于所需的共功能。
地理代表性
针对 LCI 结果的地理代表性,有区别的适用于用途 A,B 和 C,区分归因建模和归果建模。对于单元过程,仅在系统模型质量控制时需要考虑其地理代表性。
对于 LCI 结果,应注意所有后续将采用的清单数据的声明地理范围,确保其能够支持准确且恰当的影响评估。如果应用了非通用的影响评估(例如,按国家、地区甚至场所区分的特征因子),应仔细检查。注意:这些规定仅在 LCI 阶段应用。
【必须】良好的地理代表性:整体清单数据应具有同研究目标一致地理代表性,尤其关注由于地理范围不同的 LCI 数据中导致相关差异的数据项。
【必须】不同地理范围的归因和归果建模:注意归因和归果建模可能需要背景系统中具有不同地理范围的过程/产品。为了简化分析,可以采用一些通用的简化措施,用途 B 中面临“重大”变化的过程除外:
- 归因建模:
- 前景系统:应该使用前景系统的现场或生产商/提供者的特定数据,以及连接前景与背景系统的产品供应商的特定数据。然而在前景系统的某些部分,在特定情况下如果地理组合的通用数据比现有的特定数据更准确、精确和完整,也可以使用地理组合的通用数据(特别是在供应商操作的过程中)。
- 背景系统:应使用背景系统的平均市场消费组合数据。
- 归果建模:
- 前景系统:对于直接控制的前景系统过程,应使用现场或生产者/提供者的特定数据,前景系统中具有合约和供应链关系、以及连接前景与背景系统的产品和废物,应使用供应商的现场特定数据。然而在前景系统的某些部分,如果地理混合的通用数据比现有的特定数据更准确、精确和完整,也可以使用地理组合的通用数据(特别是在供应商操作的过程中)。
- 背景系统:应根据适用的用途 A、B、C1 和 C2,使用短期或长期的边际地理组合数据。应根据市场条件和潜在边际过程的成本竞争力等因素来确定边际过程的地理组合数据。
- 使用不完全具有代表性的数据: 对于归因和归果建模,只有在以下条件下才能使用不完全具有地理代表性的数据:
- 对于 LCI 和 LCIA 数据集/非比较性 LCI/LCA 研究:只有当与使用完全具有地理代表性的数据相比,使用不完全具有地理代表性的数据不会显著地改变 LCIA 的整体结果时,才有理由使用地理上不完全具有代表性的数据;否则,应在数据集/报告中记录说明所使用的数据代表性较低。
- 对于比较性 LCA 研究:尽可能不影响研究的结论或建议。否则,在得出结论和提出建议时应明确考虑较低的地理代表性。特别是,使用代表性较低的数据不应在相关程度上不利于任何竞争的产品。
时间代表性
完全适用于 LCI 结果,对于单元过程,仅在系统模型的质量控制时需要考虑其时间代表性。
【必须】良好的时间代表性:整体清单数据应具有同研究目标一致的良好时间代表性,特别是在反映不同时间的 LCI 数据存在差异的情况下更应注意。
注意过程或系统代表的年份应指实际代表的年份,而不是数据集计算的年份或使用的次级数据源发布的年份。
【必须】具体的季节或昼夜情况:如果数据与年平均数据不同,根据研究目标和预期应用检查数据是否需要代表特定的季节或昼夜情况。
【必须】与时间相关的未来代表性:对于研究时间起前后超过 5 年的过程(例如长寿命产品的使用阶段和生命周期末期阶段,或回顾性分析),应尽可能使用完全具有时间代表性的未来/历史数据。如果无法做到:
- 最佳可用技术和最新数据: 对于归因和归果建模,如果能够证明最佳可用技术(BAT)数据在所需时间内足够具有代表性,则 BAT 组合数据应作为第二优先选项,最新数据是第三优先选项。
- 使用不完全具代表性的数据: 只有在以下条件下才能使用不完全具有时间代表性的数据:
- 对于 LCI 和 LCIA 数据集/非比较性 LCI/LCA 研究:只有当与使用完全具有时间代表性的数据相比,使用不完全具有时间代表性的数据不会显著地改变 LCIA 的整体结果时,才有理由使用时间上不完全具有代表性的数据;否则,应在数据集/报告中记录说明所使用的数据代表性较低。
- 对于比较性 LCA 研究:尽可能不影响研究的结论或建议。否则,在得出结论和提出建议时应明确考虑较低的时间代表性。特别是,使用代表性较低的数据不应在相关程度上不利于任何竞争对手的产品。
不确定性
简介
不确定性表达了一个普遍问题,即观察值永远无法完全复现,但当进行了足够多的观察时,可以描述其分布的某些特征,如平均值和标准偏差。概率分布是给出某一观察值取得特定值概率的数学和/或图形函数。
有许多不同的概念用于描述不确定性。在适用的情况下,本导则使用 ISO 3534 中定义的统计术语。不确定性是用来涵盖所有由随机变异或偏差引起的群体内数据分布的一般术语。
变异(variation)是用于描述不确定性随机成分的一般术语。通常用统计术语描述,如方差、分布、标准偏差等(见下文定义)。该术语是观察值的随机性,允许进行统计处理,因为这描述了观察值的概率分布。
偏差(bias)是由于观察中的系统误差(相对于随机误差)导致分布中引入的偏差,例如,当观察是在一个非均质群体的特定子集上进行的。群体是所考虑的所有项目的总数,通常只观察其中的一个样本。算术平均值或平均值是观察值之和除以观察次数。观察误差是观察值与平均值的偏差,即观察值减去平均值。样本方差是变异的描述,定义为误差平方和除以观察次数减 1。标准偏差是方差的正平方根。中位数是使分布中 50% 的值小于它,50% 的值大于它的值,也称为 50% 分位数。众数或最可能值是分布中概率最大的值。双侧置信区间是分布的中心部分,位于两个值之间,使得该区间包括总群体的所需百分比。例如,95% 置信区间包括 95% 的群体,即在两个极端排除 2.5% 的群体。
在某些情况下,不考虑不确定性的计算所使用的值不是分布的平均值,例如三角分布的众数。这种效应在对数正态分布中尤其明显,其使用中位数进行静态计算。在这些情况下,必须决定使用可用数据来导出分布的最具代表性值,即使这不是分布的数学平均值。由于对数正态分布的平均值总是高于中位数值,在包含大量对数正态分布的蒙特卡洛 LCA 计算中,平均值会偏高于静态计算结果。
不确定性类型
分布的选择对产品系统的整体不确定性影响有限,因为大量独立变量的集合,每个变量的分布总是接近正态分布的结果,即"中心极限定理"。现实生活中的许多现象都是由大量独立的随机效应引起的,中心极限定理解释了为什么现实生活中的数据近似于正态分布。
表 9 不确定性类型及其相关信息
不确定性类型 | 统计参数 | 使用的值(公式) |
---|---|---|
对数正态分布 | 中位数 | μg |
正态分布 | 平均值 | μ |
三角分布 | 众数 | A |
均匀分布 | 平均值 | (B+A)/2 |
BetaPERT分布 | 众数 | (a+4m+b)/6 |
伽马分布 | 平均值 | KΘ+M |
二项分布 | 平均值 | NP |
未定义(范围) | - | (最小值+最大值)/2 |
正态分布是一种对称分布(相对于偏态分布),这意味着算术平均值、中位数和众数都出现在同一位置。正态分布的一个有趣特征是,68% 的数据位于平均值两侧的一个标准偏差内,95% 的数据位于平均值两侧的两个标准偏差内,99.7% 的数据位于平均值两侧的三个标准偏差内。因此,比较置信区间和标准偏差很容易。
【建议】对数正态分布是指观察值的自然对数是正态分布的概率分布。由于以下几个原因,对数正态分布是用于建模数据库中不确定性的主要分布:
- 对数正态分布在现实生活中的群体中经常观察到,其原因之一是许多现实生活中的效应是乘法性的,而不是加法性的,并且类似于加法效应的中心极限定理,可以证明乘法效应会导致对数正态分布。
- 现实生活中群体的大多数参数总是正值,这一限制会导致偏态分布,具有向较高值延伸的较长尾巴。
- 底层正态分布的标准偏差与尺度无关。这意味着对于一个对数正态分布的随机值向量 X,乘以常数 a 不会改变标准偏差,也不会改变底层正态分布的标准偏差。
出于向后兼容的原因,还提供了“未定义”范围分布,字段包括最小值、最大值和标准偏差 95,许多分布可以转换为彼此表示。
允许输入不确定性信息,不仅包括输入/输出量,还包括输入/输出属性、参数和传递系数,从而得以报告原始数据的不确定性,特别是在输入/输出量通过涉及这些属性、参数或系数的数学关系计算时。随后可以根据其组成部分的不确定性来计算输入/输出的不确定性。
【建议】对输入/输出量化两种不确定性:
- 由于测量不确定性、活动特定的变化、时间变化等原因,描述输入/输出值的变化和随机误差时会表现出基本的不确定性。当无法获得某项活动的详细信息时,输入/输出只能以不具体的方式或在活动的高聚合水平上进行报告。如果所应用的平均数据未能充分说明重要的输入/输出,就会导致输入/输出值的不确定性。
- 由于使用估计值、缺乏验证、样本不完整或从时间、空间和/或技术上不同的条件上进行推断所产生的不确定性,例如,如果内蒙古某活动的电力消耗近似使用了海南电力消耗组合的数据集,这些不确定性方面将反映在近似的内蒙古数据集的额外不确定中,通过数据质量指标来进行估算。
基本不确定性的默认值
【建议】如果样本数据可用,可以直接计算样本的概率分布和标准偏差。如果样本量较小,可以从范围(最大和最小观察值之间的差异)计算出近似标准偏差。对于正态分布,当样本量分别为 10、30 和 100 时,范围大约是标准偏差的 3 倍、4 倍和 5 倍。生命周期数据通常来自少量观察,因此当观察次数未知时,使用 3 倍因子是合理的。
当只有一个信息来源且只提供一个值而没有关于该值的任何不确定性信息时,通常无法从可用信息中得出特定值的不确定性。因此开发了一种简化的标准程序来量化这些(相当多)案例的不确定性。
在应用简化标准程序时,始终假设为对数正态分布。假设不同类型的输入/输出在其不确定性上有所不同。例如,C
表 10 当没有足够的样本数据时,应用于中间流和基本流的默认不确定性
(对数变换数据的方差,即基础正态分布);c:燃烧排放;p:过程排放;a:农业排放
类别 | 输入 / 输出组 | c | p | a |
---|---|---|---|---|
消耗 | 热能、电力、半成品、工料、废水处理服务 | 0.0006 | 0.0006 | 0.0006 |
运输服务(tkm) | 0.12 | 0.12 | 0.12 | |
基础设施 | 0.3 | 0.3 | 0.3 | |
资源 | 初级能源载体、金属、盐类 | 0.0006 | 0.0006 | 0.0006 |
土地利用,占用 | 0.04 | 0.04 | 0.002 | |
土地利用,转换 | 0.12 | 0.12 | 0.008 | |
排放到水中的污染物: | BOD, COD, DOC, TOC, | |||
无机化合物 (NH4, PO4, NO3, Cl, Na等) | 0.04 | |||
个别碳氢化合物,PAH | 0.3 | |||
重金属 | 0.65 | 0.09 | ||
农药 | 0.04 | |||
NO3, PO4 | 0.04 | |||
排放到土壤中的污染物: | 石油,总碳氢化合物 | 0.04 | ||
重金属 | 0.04 | 0.04 | ||
农药 | 0.033 | |||
排放到大气的污染物: | CO2 | 0.0006 | 0.0006 | |
SO2 | 0.0006 | |||
NMVOC总量 | 0.04 | |||
NOx, N2O | 0.04 | 0.03 | ||
CH4, NH3 | 0.04 | 0.008 | ||
个别碳氢化合物 | 0.04 | 0.12 | ||
PM>10 | 0.04 | 0.04 | ||
PM10 | 0.12 | 0.12 | ||
PM2.5 | 0.3 | 0.3 | ||
多环芳烃(PAH) | 0.3 | |||
CO, 重金属 | 0.65 | |||
无机排放物,其他 | 0.04 | |||
放射性核素(例如氡-222) | 0.3 |
数据质量指标带来的其他不确定性
【建议】除了基本的不确定性(无论是测量的还是估算的)之外,还会根据数据质量指标向对数正态分布中添加额外的不确定性,这些额外的不确定性基于谱系矩阵方法。
将正态分布添加到由基本不确定性得出的基础正态分布中将增加总体不确定性。正态不确定性分布归因于五个特征的各自得分,每个分布的均值为零,方差基于专家判断。
表 11 数据质量指标评级带来的不确定性
指标评级 | 1 | 2 | 3 | 4 | 5 |
---|---|---|---|---|---|
可靠性 | 0.000 | 0.0006 | 0.002 | 0.008 | 0.04 |
完整度 | 0.000 | 0.0001 | 0.0006 | 0.002 | 0.008 |
时间相关性 | 0.000 | 0.0002 | 0.002 | 0.008 | 0.04 |
地理位置相关性 | 0.000 | 2.5e-5 | 0.0001 | 0.0006 | 0.002 |
其它技术相关性 | 0.000 | 0.0006 | 0.008 | 0.04 | 0.12 |
由于假设每个正态分布是独立的,即它们的协方差为零,因此总分布的方差可以表示为:
σ²₁: 基本不确定性的方差(测量或估计的方差)
σ²₂: 可靠性分布的不确定性因子(方差)
σ²₃: 完整性分布的不确定性因子(方差)
σ²₄: 时间相关性分布的不确定性因子(方差)
σ²₅: 地理相关性分布的不确定性因子(方差)
σ²₆: 其他技术相关性分布的不确定性因子(方差)
局限性
不确定性的评估方法没有考虑到以下也会导致总体不确定性的因素:
- 模型不确定性:用于描述单元过程的模型可能不合适(例如,使用了线性模型而不是非线性模型)。
- 人为失误导致的错误:信息来源中包含的人为错误或数据提供者在建模过程中犯的错误,而后续的验证和审查并未发现这些错误。
蒙特卡洛模拟和结果
【建议】不确定性估计针对单元过程层面的每个数据点给出。通过蒙特卡洛模拟计算累积 LCI 结果的 95% 置信区间,计算的 2.5% 和 97.5% 值显示在 LCI 结果的每个单独的基础输入/输出中。
平均概率均值(即通过蒙特卡洛模拟确定的累积结果)与确定性累积结果不同,出现这种差异是因为确定性的累积结果并不总是使用底层不确定性分布的均值计算的。对于对数正态分布,使用几何均值(即中位数)进行确定性计算;对于三角分布,使用众数计算确定性结果。确定性结果通常比基于粗略估计的分布参数的概率均值更可靠。在对数正态分布情况下,几何均值始终小于算术均值;对于三角分布,众数与均值之间没有先验关系。
目前,在影响评估结果中没有显示不确定性值。当前的影响评估方法通常不提供不确定性信息。损害因子的不确定性对整体影响评估结果的作用被认为至少与 LCI 结果的不确定性一样重要。在不考虑 LCIA 不确定性的情况下,如果在 LCIA 结果层面显示不确定性值会产生误导。
完整性
化学计量学
【建议】如果数据可用性较差,可使用化学计量平衡来确定原材料需求。如果没有具体信息,可假定 95% 的产量。这些建模选择在数据集中进行记录。
物质平衡
【建议】对于每个活动,质量和能量守恒定律都适用。考虑到清单变化,每个活动的进出质量和能量都应是相同的。只有涉及核反应的活动,这些平衡才会相互作用。对于每个元素也是如此。因此,除了涉及核反应的活动外,所有活动都适用单独的质量和元素平衡。
对于每项资源投入、每个产品和废物的中间交换以及排放,都可以获得(报告或计算)的干质量和水质量,包括水资源的使用,以及进入涉及燃烧、光合作用和生物代谢活动的空气中的氮和氧,以及根据反应方程式计算的从这些活动中产生的水蒸气、氧气和氮的空气排放量。例如,燃烧的氧气需求量是根据燃烧废气中的氧化物(特别是
除了干物质平衡外,当提供了这些元素在活动的所有相关输入和输出中的具体含量信息时,还可以对选定的化学元素进行质量平衡。目前,这仅针对化石和非化石碳系统性地执行。
质量平衡已作为验证功能实现,总和及其差异(例如,“输入 > 输出 X [单位](输出的 0.01%)”)在验证结果中显示为警告。目前对偏差没有最低要求。
特定条件下才会发生的输入/输出不包括在质量平衡中。
能量平衡
【建议】能量含量不是流的必需属性,无法提供所有活动或产品系统的完整能量平衡,但可以根据化石燃料和核燃料的资源投入来计算总的化石和核燃料投入以及累计能量需求(化石和核能)。
货币平衡
【建议】尽管没有“货币守恒定律”,但每个活动都适用货币平衡,以会计等式表达,是复式记账系统的基础。因此,考虑到储蓄的变化,所有收入都必须被花费。
利用每项中间输入和输出的价格信息,可以为每个活动建立货币平衡。平衡要素是活动产出(收入)价值与该活动中间产品投入(包括投资)价值之间的差额,该差额以货币单位计量,可计算为货币平衡中未指定的残差。当有更多信息时,可将其分为以下几个部分:
- 劳动成本(工资和其他报酬),可能进一步细分为收入组或工人的教育水平。
- 净税(税收减去补贴)。
- 净营业盈余(企业收入或利润)。
- 租金(支付给资源所有者)。
“初级生产要素的支出”也被称为增加值。在财务中,租金包含在净营业盈余中,尽管投资的增加值已在提供投资品的行业中计算过一次,增加值一词用于支付给包括投资在内的初级生产要素。在财务中,一项活动的增加值与其对国内生产总值(GDP)的贡献相同。
为确保将其纳入货币平衡,初级生产要素和/或其组成部分的支出都具有“价格”属性,即使这些输入/输出量已经以货币单位衡量。当以与输入/输出金额相同的单位表示时,价格属性的金额为 1。劳动成本有一个附加属性“工作时间”,该属性与每小时成本相关。
一项活动不一定要支付其所有投入,有些投入可能是“免费”提供给该活动的,例如作为公共服务,如道路基础设施或医院服务。这种情况下,物理关系(因果关系)与直接经济关系不匹配。但是,“免费”提供的服务或产品通常意味着其他人已经支付了该服务或产品的成本,因此这是一种经济外部性。为了避免重复计算,这类外部性不作为外部性报告,而是直接(内部化)作为活动的中间投入。当将经济外部性内部化时,最初为该产品或服务支付费用的活动将免除这部分成本,而这部分成本则增加到之前免费获得该投入的活动的总中间成本中。通过调整活动的净税来保持活动的经济平衡,这相当于模拟补贴。
注意,当某种产品或服务已由专项税涵盖并在活动净税下报告时,内部化也是相关的,因为该税与任何物理输入无关。实际上,所有专项税或补贴,即专门用于特定活动的税或补贴,都应通过这种方式内部化,以正确模拟物理因果关系。
然而,是否将“免费”产品或服务作为活动的投入包括在内有时取决于对构成物理因果关系的判断。例如,即使道路基础设施不是由车辆运营商直接支付,也应将其作为道路运输的一项投入,而不是作为独立的最终消费项目,但道路运输数据集是否以及在多大程度上应包括额外医疗保健投入(按比例补偿道路事故受害者)或补偿其他用户在同一基础设施上排队所损失的时间,可能就不那么明显了。有关此类建模决策的详细信息,数据库用户须参考相关的个别数据集。通常,所有有充分记录的物理因果关系,无论是否有直接的经济关系,数据库都应尽量涵盖。
基本流
【建议】应尽量保证基本流的完整性。
水
【建议】水作为一种资源输入,从环境进入人类活动中,与其他资源一样,其来源或位置会有所区分(例如区分为地下水、地表水、海水和雨水)。水资源的质量可以通过其属性进一步指定,相关属性可能包括化学需氧量(COD)、生物需氧量(BOD)、总悬浮固体(TSS)、总溶解固体(TDS)和粪大肠菌群。水资源和从其他流域转移的水以体积报告,而“水质量”属性用于量化水资源投入的质量,以便在水平衡中使用。水平衡还包括从矿物中提取的结合水、野生收获的生物材料中的结合水,以及中间输入中的水,这些都在输入/输出的“水质量”属性中进行量化。
水的输入可以与中间输出、转移到其他流域的水以及输出到不同环境区域(空气、土壤、地下水、海洋和地表水)的等量输出进行平衡。注意,排放到环境中的任何水污染/污染物不会指定为水属性,而仅指定为单独交换(例如,COD、BOD、粪大肠菌群和温度等),以避免在影响评估中重复计算。
如果淡水交换的确切来源和/或目的地未知,则将其作为来自环境子区域“未指定水”的输入和/或输出进行记录。
土地利用和土地转化
【建议】土地利用和土地转化在生命周期清单分析和生命周期影响评估方法中越来越受到关注,尤其对于农业和林业产品这更为重要。
土地利用类别和描述参考《全球土地利用 LCIA 手册》的草案版本,该手册是联合国环境规划署 UNEP/SETAC 生命周期倡议框架内的一部分。
注意,土地利用类别并非旨在捕捉特定排放,如森林砍伐后的二氧化碳排放。因此,此类排放被单独纳入最近转化土地上种植的特定作物的数据集中。
应覆盖直接和间接(上游)土地利用效应。事实上,直接和间接土地利用之间的区别只有在从一个特定单元过程的角度来看时才有意义,因为所有输入/输出都直接针对其发生的具体活动,而对于所有下游活动则是间接的。
土地利用通过以下数据进行清单记录:
- 当前土地利用的土地占用(被占用的土地阻止转化为更自然的状态)。
- 土地转化(从先前的土地用途到当前的土地用途,例如,将以前的自然区域转化为工业用地;通过积极重新耕种将采石场转化为自然区域)。
对于土地占用,生产一定数量的产品和服务所需的面积和时间都很重要。因此,土地占用以面积*时间_(m²_年)记录。明确界定且相对较短时间的土地用途临时变化也记录为土地占用(例如,地下天然气管道的建设,将农业用地暂时转化为挖掘场地)。对于这些建设活动以及不再使用后的积极恢复活动,适用土地利用类别“土地占用,施工现场”。
土地转化包括两个条目:
- 土地转化,从土地利用类别 X
- 土地转化,到土地利用类别 Y
土地转化记录了转化前后的状态。
某些需要特定用途土地的活动,可以通过一般土地租赁市场获得土地使用权,该市场包括不同的土地类别:已使用的土地、新转化的土地,以及通过提高现有土地使用效率来替代土地的方式。生产力不同的土地(潜在净初级生产力,NPP,以 kg 碳/m²× 年计)可以作为同一土地权属市场的投入。因此土地使用权通常以 kg 碳表示。土地权属市场与其他市场活动应用相同的默认建模规则(例如,除非可以证明当地市场边界合理,否则假设存在全球市场等)。
土地权属市场可能适用于更具体的土地用途。例如,“耕地权属市场”可能为年作物生产和采石场提供土地(因为采石场通常位于适合农业的土地上)。在“耕地权属市场”的上游输入中,通常会记录更笼统的“转化,至耕地,未指定用途”和“占用耕地,未指定用途”,而更具体地从“耕地,未指定用途”到“年作物”或“矿物开采场地”的转化,以及更具体的“占用,年作物”和“占用,矿物开采场地”则直接记录在这些土地用途的活动中。因此,通过这些更具体的土地利用类别记录的转化和占用,可以在影响评估中表示相对于上游记录的笼统转化和占用影响的额外转化影响或差异。
虽然土地权属(以及可能更具体的转化和占用)通常作为基础设施生产活动的投入,但农业和林业用地需求在不包括建筑物的情况下,则会被记录为运营活动的输入。建筑物、温室等所需的土地权属被记录为基础设施数据集的投入。
对于特定活动,开始活动前的土地利用类型可能是已知的,但很难详细评估所有被活动转化的土地利用类型。如果在活动操作阶段之前不知道土地利用类型,则不记录其具体转化,相关土地权属市场只提供平均转化。
活动结束时的土地转化可能与某些活动有关(如道路建设、发电厂建设、矿山恢复、废弃并受自然演替影响的土地等)。然而,通常不考虑结束时的转化,即当假设后续活动从当前活动状态开始时,或者可以假设土地利用在活动结束时不太可能发生变化(如工厂、交通基础设施或农业用地的使用寿命结束时不会从“工业区”转化为“未知”)。
噪音
【建议】考虑将噪音增加至基本流中。
事故和意外事件
【建议】事故是指意外的、异常的、无意的和不可预测的事件,因此不包括在内。例如,核电站的严重事故(如切尔诺贝利事故),尽管可能会产生非常重大的影响,但由于发生频率极低,因此不考虑在内。
另一方面,可以概率性计算并且发生频率高,以至于年度平均值不会受到每个单独事件显著影响的事件,则会在活动数据集中考虑。例如由于运输管道破裂而导致的石油泄漏。此类泄漏事件经常发生,并且会定期报告。
具有额外安全措施的企业可能发生事故的频率较低,这就可能需要为这些企业建立单独的数据集。
垃圾
【建议】虽然垃圾本质上是对环境的排放,但由于其不会经过进一步处理,直接记录垃圾会增加许多对影响评估价值不大的基础输入/输出。因此,垃圾在自然界中被视为人类处理活动的一部分,类似于地表填埋和/或水体沉积。
经济外部性
【建议】经济外部性指由未经营或控制所报告活动的各方支付的成本或获得的收益,这些成本或收益不属于产品价格的一部分。
一个活动的外部成本通常是另一个活动提供的外部收益,反之亦然。因此,此类外部性直接作为活动的中间输入(内部化),而不单独报告为经济外部性。
社会外部性
【建议】社会外部性,即可能影响人类福祉但不具有生物物理或经济性质(即不通过使用自然资源、排放或经济成本和收益转移来涵盖)的社会压力变化,可以作为基础输入/输出添加。
社会外部性的例子包括职业健康问题(工作日损失)、超负荷工作(每周工作超过 48 小时)、工作场所压力、非组织化劳动和伤害(不限于与工作相关的伤害)。
正面的社会外部性例子包括:提供养老金和社会保障(而这些福利不是由公共当局提供的)、通过提供针对贫困人群的产品来减轻贫困、招聘长期失业的工人以及对被解雇工人的支持。
与经济外部性不同,社会外部性不是由其他活动支付或提供的。例如,失去的工作日没有补偿,而是直接损失了。这意味着同一个问题有时可能是经济外部性,有时可能是社会外部性。例如,免费提供的教育可以是经济外部性,因为它是由某人支付并由特定活动提供的,而失去的教育机会(例如童工)可以是一种社会外部性。
本导则规定社会外部性的数据不包括在内,但鼓励数据提供者系统地增加新的社会外部性指标。
敏感性
【必须】敏感性的规定适用于研究方面所有类型的交付成果,但对于单元过程、部分终止系统、LCI 结果和 LCIA 结果数据集类型的交付成果,仅在开发 LCI 数据或系统模型的迭代过程中用于改进数据质量(结果也可以包括在 LCI 研究报告中)。
- 检查结果的敏感性:检查总体结果的准确性和精确性在多大程度上满足预期应用的要求。目标是将其提高到所需水平,具体如下:
- 重大问题的敏感性:针对识别出的重大问题,识别出其中最敏感的部分,并分析这些部分对总体结果的敏感性,以及它们的随机和系统不确定性估计。这些结果决定了总体结果的准确性和精确性,以及从 LCI/LCA 研究中得出的结论的强度,并且应该与数据集一起报告。注意,计算出的不确定性值可能未包含由模型假设、数据缺失和缺乏准确性引起的系统不确定性。
- LCI 项目的敏感性:评估 LCIA 结果(或加权 LCIA 结果)对关键流、过程参数设置、流属性和其他数据项(如可回收性、商品寿命、服务步骤持续时间等)的敏感性。评估敏感的清单项目如何影响数据的代表性和精确性。
- LCIA 因子的敏感性:考虑到影响评估中的不确定性(例如,人类毒性、生态毒性等具有高不确定性,而全球变暖、酸化等具有较低不确定性),评估 LCIA 结果(或加权 LCIA 结果)的敏感性。
- 建模选择和假设的敏感性:评估 LCIA 结果(或加权 LCIA 结果)对不同建模选择和方法假设的敏感性,例如功能单位的定量和定性方面、替代过程、分配标准等。
- 尽可能提高敏感性数据、参数、影响因子、假设等的鲁棒性:如果某些重大问题的数据质量不足,应重新审视清单分析和/或影响评估阶段,以改进相关数据(对于数据问题)、影响因子(对于 LCIA 问题),或对敏感假设或选择进行评估和讨论(对于方法问题)。考虑到数据的完整性,改进 LCI 数据精度时应从目标和范围开始微调或修订,即进行完整的迭代。
- 报告最终结果以及可能需要修订范围或目标:如果关键问题的确定性无法达到要求,或者无法满足 LCI/LCA 研究应用所需的准确度和精确度,则应决定是否需要修订或重新定义范围甚至目标。
- 重大问题的敏感性:针对识别出的重大问题,识别出其中最敏感的部分,并分析这些部分对总体结果的敏感性,以及它们的随机和系统不确定性估计。这些结果决定了总体结果的准确性和精确性,以及从 LCI/LCA 研究中得出的结论的强度,并且应该与数据集一起报告。注意,计算出的不确定性值可能未包含由模型假设、数据缺失和缺乏准确性引起的系统不确定性。
一致性
【必须】一致性的规定适用于研究方面所有类型的交付成果,但对于单元过程类型的交付成果,仅在研制数据或系统模型的迭代过程中用于改进数据质量(结果也可以包括在研究报告中),对于部分终止系统、LCI 结果和 LCIA 结果数据集,一致性的规定还用于确保建模过程中方法的一致性。对于 LCA 研究,这些规定还用于确保比较系统建模中方法的一致性。
- 数据质量的一致性检验:检查数据质量(包括准确性、完整性和精确性)以及系统中不同过程所选数据来源是否与研究目标和范围一致,这对于比较研究尤为重要。
- 方法选择的一致性检验:检查所有方法选择(例如,LCI 建模原则、分配标准或系统扩展/替代方法、系统边界等)是否与研究的目标和范围(包括预期应用和目标受众)一致。应通过检查是否满足与适用用途 A、B 或 C1/C2 相关的方法规定来判断。注意,方法一致性适用于单元过程层面(即从原始数据开发单元过程的方法一致性)和系统层面(即建模系统的一致性)。当整合不同来源的数据时,这一方面尤为重要。
- 影响评估的一致性检验:检查影响评估的步骤(包括归一化和加权)是否一致地应用并符合目标和范围。
- 评估不一致性的相关性:评估已识别的不一致性(如上所述)对结果的相关性/重要性,并对此进行记录。对于 LCA 研究,从结果中得出结论或建议时应考虑这些因素。
通过确保上述方面的一致性,可以提高研究结果的可靠性和有效性,这在涉及比较研究和使用不同数据的情况下尤为重要。
数据审查
审查类型
审查者/团队与数据开发者/提供者之间的关系包括以下几种情况:
独立的外部审查者/团队: 审查者及其所在单位(如果有的话)不得参与所审查案例的定义或开发工作。审查者或团队必须是外部的,且至少 1 年内不得与负责执行、委托、资助或以其他方式影响所审查研究的组织有任何相关关系。所谓“相关关系”包括除审查协议本身及同一框架内的其他审查外的财务关系,以及可能导致利益冲突的法律或类似关系,如补贴、合资、开发、销售或任何其他形式的战略合作伙伴关系。
独立的内部审查者/团队: 审查者不得参与所审查研究或其定量相关部分(例如收集背景数据)的工作,但审查者可以是负责执行或委托 LCA 工作的组织的内部成员,或者是与之相关第三方组织的成员。
非独立的内部审查者/团队: 审查者可以参与所审查研究或其定量相关部分(例如收集背景数据)的工作,并且是执行或委托 LCA 工作的组织成员。这种类型的审查者在 ISO 标准中有所定义,但在本报告考虑的方案中不适用。
根据审查者类型和审查团队的组成,可以区分为 2 种不同的审查类型。
【要求】按下表中要求组织数据审查
表 12 设定的审查类型(“审查者”指符合上述最低要求的单个审查者或团队)
审查者的类型和数量 | 类型 1 | 至少3名独立审查者,至少1名外部审查者 |
---|---|---|
类型 2 | 2名独立审查者,至少1名外部审查者 |
审查资格
【必须】对于数据集的合规审查,最低资格要求遵循下表。
表 13 审查者最低资格要求。审查者的技能可以通过团队来满足(例如,一名审查者满足 LCA 经验的最低要求,另一名审查者满足特定领域的最低要求).
方面 | 指标 | 最低要求 |
---|---|---|
验证和审计实践 | 经验年数1 | > 2 |
审查次数2 | > 2 | |
LCA方法论和实践 | 经验年数3 | > 2 |
参与LCI工作次数4 | > 4 | |
技术或其他活动的知识 | 按所覆盖的领域5 | |
NACE主要领域 | 在公共和/或私营组织中的经验年数 | > 2 |
1 具备环境领域审计和审查经验,不仅限于基于生命周期的经验; 2 担任审查者,LCA(符合 ISO、ILCD 或 EF)或 EPDs 或 LCI 数据集,其他基于生命周期的要求; 3 如果主要专注于 LCA,则从硕士阶段开始计算; 4 LCI 数据集的开发/建模(有文档记录); 5 特定宏观领域(NACE)在任何层次的经验(工作、监测、管理、研发等)。
审查报告
【必须】审查团队必须按详细的审查报告模板填写表格。每个数据集只允许有一个审查报告,以及一个与之关联的 DQR,由审查团队同意并签署。报告应附在数据集的“完整审查报告”字段(在验证表中)下。
在表格中,所有审查合规性方面应回答“是”或必须满足这些要求才能声称数据集合规。如果这些项目回答“否”,则必须改进数据集以解决不合规的问题。
如果数据集的核心内容(即 LCI、DQRs、LCIA 结果等)进行了更新,则需要对数据集的新内容进行部分审查以符合要求。
表 14 审查报告模板,带注释。斜体表示如何填写不同字段的意见和建议。
审查报告 | |||
---|---|---|---|
基本信息 | |||
数据集名称 | 数据集名称,例如:电网组合 1 kV-60 kV;交流;电力消费组合;1 kV-60 kV | ||
数据集UUID和版本号 | 数据集的唯一标识符 (UUID)(文件名是一个36位字母数字代码,结构如下 xxxxxxxx-xxxxxx-xxxxxxx-xxxxxxxxxxx | ||
数据集位置(例如:永久URI、URL、联系点或数据集名称和版本等) | 永久URI、URL、联系人,或数据集名称和版本等。 | ||
审查委托人 | 数据集所有者或数据集/数据库开发者或供应商 | ||
审查员(团队所有成员)姓名及其隶属单位,联系方式 | |||
适用的审查类型,及与EF要求的审查一致性 | 1类或2类审查(见表 14) | ||
审查方法及范围 | 说明审查所采用的方法:例如,在审查大量数据集时,说明是通过检查每个数据点来审查每个数据集,还是审查基本的一般模型+抽查所有数据集的某些参数,或+抽查 x%数据集的所有参数等。 | ||
审查完成日期 | (日/月/年) | ||
审查依据/合规系统名称 | PEF/OEF | ||
参考数据包(版本)的兼容性 | 声明所使用的参考数据包版本 | ||
总体合规性评估 | |||
内容 | 是 | 否 | 备注 |
与特定要求的一致性 | 数据集符合参考文件的所有要求。文件完整、清楚地说明了如何在数据集中应用这些要求(如农业建模、运输、电力等) | ||
分配规则的明确性和一致性 | 明确解释并记录前景系统中采用的分配方式(分配类型(质量分配、经济分配......);分配因素......)。 | ||
循环足迹公式(正确实施) | _检查是否使用了适当的参数值,检查替换点。检查 E*v假设。报告用于模拟不同参数排放曲线的数据集 UUID。_描述CFF实施情况和所用参数的文件清楚地说明了上述检查。 | ||
LCIA结果一致性 | 将数据集内的LCIA结果与Look@LCI计算出的结果进行比较,差异>1%不符合标准。 | ||
命名法 | |||
应用命名法的正确性和一致性(使用特定的参考包;其他流、过程等的正确命名法) | |||
文件记录 | |||
文件记录的适当性,参见文件“填报表-中文版”和附加的“欧盟环境足迹(EF)合规数据集构建指南解读”文件 | 文件是否在内容方面符合标准?是否能对数据集进行公平评估?哪些信息详细?哪些缺乏(如果有)?元数据是否足够详细,是否符合要求? | ||
文件格式的适当性/正确性 | 是否遵循格式?文件是否经过验证工具的验证?不符合要求的方面(如有)是否已经解决? | ||
通过验证器的验证 | 如果“否”,请指明哪些方面不符合要求 | ||
数据质量标准和评级 | 审查员对DQR声明负责。每个数据集只有一个DQR,用两位数(X.X)表示。可由审核员或数据集开发人员计算。审核员应证明数值的正确性。 | ||
截断法(Cut-off) | 核实模型中应用的截断规则是否符合PEFCR指南的要求。 |
审查方案
- 审查准备阶段
- 审查计划和沟通
- 定义审查目标和范围: 明确审查将覆盖 LCA 工作的各个方面,如数据集、方法论或整个 LCA 研究。
- 选择审查类型: 根据 LCA 工作的复杂性和预期用途,选择合适的审查类型(如独立外部审查或独立小组审查)。
- 选择审查员: 根据所需的专业知识和独立性标准选择合适的审查员,如果一名审查员无法满足所有要求,可能需要一个审查团队。
- 审查员准备
- 确认审查员资格: 确认审查员符合所有必要的资格要求,包括独立性、技术和方法论方面的专业知识。
- 准备审查材料: 审查员需要获得所有相关的 LCA 文件和数据,包括 LCA 报告、数据集和方法论文件。
- 审查计划和沟通
- 审查执行阶段
- 数据和方法论审查
- 数据完整性检查: 确保所有输入数据、假设和方法都经过充分记录,并符合国际标准。
- 一致性检查: 评估 LCA 研究是否遵循相关的国际标准(如 ISO 14040/44)和 ILCD 手册的要求。
- 关键假设和结果的验证: 验证 LCA 研究关键假设和计算结果的准确性。
- 利益相关者参与
- 利益相关者沟通: 根据需要组织和管理利益相关者会议,讨论 LCA 研究的方法和结果。
- 收集反馈: 从技术和非技术受众处收集反馈,并进行必要的调整。
- 数据和方法论审查
- 审查报告阶段
- 编写审查报告
- 详细记录发现: 编写详细的审查报告,包括审查发现、数据和方法的评估、关键问题的讨论和改进建议。
- 审查和批准: 审查报告需要由审查团队的所有成员审阅和批准。
- 报告提交和后续行动
- 提交审查报告: 将最终审查报告提交给申请人和其他相关利益相关者。
- 实施建议措施: 申请人应根据审查报告中的建议采取行动,以改进 LCA 研究或数据集的质量。
- 编写审查报告
- 后续审查和持续改进
- 后续审查: 根据需要进行后续审查,以确保所有推荐的改进措施都已实施。
- 持续改进: 鼓励 LCA 从业者根据最新的科学发展和行业标准,持续更新和改进他们的 LCA 方法和数据。
现场审查
由数据集所有者或数据集/数据库开发者或供应商批准的审查员进行现场审查,需要访问工厂并审查账簿,以确定活动在数据集中得到正确和完整的表示,审查按照 ISO 19011 标准进行。
数据验证
【必须】数据的验证涵盖以下内容:
- 符合格式要求
- 符合本文档中描述的规则
- 数据的合理性
验证过程分为几个步骤:
- 确保数据符合格式要求: 验证数据是否符合标准格式。一些符合数据集特定规则的验证也可以在数据输入时直接进行。
- 特定规则的验证: 其他验证检查需要根据数据集的生产版本,因为这些检查需要对已经存在于数据库中的数据进行验证,例如,“全球数据集必须在非全球数据集上传之前存在”,以及“特定活动、时间段和宏观经济情景的数据集的生产量不得超过相应全球数据集的生产量”。这些验证检查也适用于数据集的删除,例如“父数据集不能被删除”。
- 合理性检查:
- 合理性检查通常不会导致数据集被拒绝(即数据集仍然可以提交到数据库进行审查),但如果存在异常值,则需要在相邻的评论字段中解释异常值。没有充分理由的不合理条目将被审查员退回。
- 合理性检查通常将数据条目与类似数据集中的类似条目进行比较。通过这种方式检查数据的完整性(例如是否有缺失的输入输出或字段,而所有类似数据集都有条目);检查条目是否在预期范围内(例如相对于参考产品的数量或指定输入输出的不同数量和/或属性之间的关系)。质量和货币平衡的结果也会在验证结果中报告。
- 合理性检查与现有数据库、数据库中的特定类似数据集以及关于典型和重要错误及各数据集内各数据值之间关系的知识有关。这些知识随着时间的推移不断积累,得益于从过去错误中学习、利用软件进行探索性数据分析、与专家知识互动以及基于集群分析的持续学习周期。因此,合理性检查将作为持续维护和更新的一部分,随着时间的推移而不断改进。