关键词:偶然事故;事故发生率;样本;异常数据;影响函数;跳跃度函数
然而,电力系统实际运行情况的复杂性及系统中元件位置分布的广泛性,使得对电力系统中事故数据的收集很难全面、系统地进行。到目前为止,对系统中所发生的重大事故[1,2],只有以少量样本形式存在的现场数据或对同类设备事故的以往数据积累而得。对于这种事故数据为少量样本的情况,显然不能用经典的统计分析方法来对系统运行中的事故发生率进行估算。可是,如果为了避免建立事故发生率分布函数的复杂性而采用常规可靠性分析中的简化分析方法,不加证明地使用事故发生率为常数假设或说明事故发生率与实际运行条件无关,就对事故发生概率进行估算,却又不能对系统运行情况的变化所引起的系统事故发生率的变化作出及时的、合理的反映,从而使人们对电力系统安全分析的可靠性产生疑问。
本文提出采用跳跃度函数的方法,对系统中所出现的引起事故发生率发生变化的异常数据进行分析和计算,在进行理论证明的基础上给出跳跃度函数的计算公式,并以线路故障率为例,说明本文中的方法对电力系统偶然事故选择所产生的影响。
2事故样本中的异常数据
在电力系统中实施统计方法来对事故发生率T(此处T表示包含不同类型的事故发生率的集合)进行计算时,对系统中发生的事故X(r),…,X(s)所作出的统计,认为是以截尾样本或截尾数据的形式出现的,而T的值是通过事故样本X(r),…,X(s)的值来确定。在此,希望由事故样本所得出的事故发生率能够同系统中的真实情况基本吻合。
要从理论上解决针对电力系统中事故发生率的统计问题,首先要假定符合电力系统事故发生率实际情况的统计模型。即,针对事故发生率的分布,通过构造一定的分布族的方法对其进行分析。当X(r),…,X(s)中混入少量异常值时,作为统计量的T要能够把这些异常值所产生的影响及时地反映出来。但在实际电力系统中情况却较复杂,因为:一方面,没有足够的根据去确定引起事故发生的统计模型,即使有相当的根据去确定其模型,往往也只能说是近似地成立而不是一丝不差地成立,例如,在对某地区的单相短路引发事故原因的统计过程中,可能只注意到了由于线路遭受雷击而引起的单相短路,而对于因线路维护不当,沿路树枝长高所引发的单相短路事故并未加以注意;另一方面,对于所有可能发生的某类(如系统中的单相短路)事故所形成的次序统计量中,只观察到了X(r),…,X(s)的值,其余的没有观察或者由于条件的限制不能观察,例如,在对某地区的变压器故障进行统计中,仅对本地区变压器的故障原因进行了记录,而对于造成其他乃至相邻地区同种型号变压器发生故障的原因,由于受到系统间信息不能及时交换的限制而不能进行考虑。即使以上2种情况都能得到满足,可在观察已得到的事故记录X(r),…,X(s)的过程中,也可能会由于观察条件的改变、以前未被注意的现象突然重新出现及系统运行状态的改变等因素,将造成X(r),…,X(s)中包含了1个或几个对系统运行产生严重影响的结果。而这种对正常的统计结果产生严重影响的数据,一般是以离开数据群体的孤立值形式出现的,常称为样本中的异常值(outlier)[3]。所得到的样本X(r),…,X(s)认为是受到了来自异常数据的污染。如果对这些异常值不加以区分,那么,在实际应用中就会不可避免地产生错误的结论或判断。
如果仅简单地通过常用的经验分布函数如指数分布、正态分布、Weibull分布等,就很难在确定X(r),…,X(s)的异常值的基础上,合理地对T进行估算。
当X(r),…,X(s)中混入少量异常值时,T所受的影响可通过对影响函数IF(InfluenceFunction)及相应的过失敏感误差性(grosserrorsensitivity)[4]的确定来反映。通过对样本均值函数的分析[4]得知,样本均值满足对样本中异常值进行鉴别的需要。
3异常数据出现的确定
在对系统中事故的发生进行统计时,得到的事故记录是以样本观测点X1,…,Xn的形式出现的。根据样本均值对异常数据的出现所反映出的敏感性,可用前后2个样本观测点之间样本均值的变化来衡量观测点中是否出现异常数据。故可定义反映系统事故发生率变化的跳跃度函数(BouncingFunction)τ如下:
称τ(k)为平均事故发生率点估计λ在k点的跳跃度,简称k点的跳跃度。
在确定事故样本中的异常值时,通常会由于样本观测值的波动而存在着屏蔽效应(MaskingEffect)[4,5]。这使得对样本中异常值个数的确定变得十分困难和复杂。而电力系统偶然事故分析的特点要求运行人员能考虑那些可能引起系统故障率变化的异常值。
结合异常数据的存在使平均故障率的点估计产生跳跃的特点,可采用一个简单的方法来对样本的观测值是否从属于异常数据进行划分:选取值最大,即找到满。这种想法是符合常情的[6],因为平均故障率点估计的最大跳跃点最有可能是异常数据的起始点,也就是使系统故障率“非正常”升高的起始点。
4异常数据的处理
根据电力系统中偶然事故选择的需要,在对事故统计样本进行检验后,发现X(r),…,X(s)中混入少量异常值时,作为统计量的事故发生率l应能及时地对这些异常值的出现作出反映。这样,在对系统进行安全分析时,就会体现出由事故样本所表现出来的系统事故发生率的真实剧烈变化的情况。
在电力系统中,最常见的情况是用大量统计结果的平均值来作为对某一个参数的估计值。比如,对于系统中的线路故障率,通常使用的方法就是取线路的总故障次数同总运行时间相除之商,而对引起线路故障的原因不加区分。可实际情况是,在不同的运行条件下,线路上的故障率并不相同。以处在户外的输电线路为例:当进入雷雨季节的时候,常常会由于线路上落雷次数的增多,线路故障率明显增大。因此,在对线路故障进行统计所得的结果中[1][2][3]下一页