摘要 尾矿库存在的电离辐射使得各传感器的可靠度估计困难和数据融合结果精度较低。建立一个广义的数据融合模型,提出F-Bayes(F-统计量-Bayes理论)融合方法,通过采用模糊聚类分析对标准化处理后的数据分类,然后用F-统计量确定最佳分类阈值以获得传感数据融合集,改进传统方法中依据经验或请专家确定置信矩阵阈值的办法,最终融合结果偏差值降低到0.000 2。
关键词 数据融合;F-统计量;Bayes估计;聚类分析;放射性尾矿库
中图分类号:TP302.1 文献标识码:B 文章编号:1671-489X(2011)33-0120-03
Multi-sensor Data Fusion on Radioactive Tailing Dam based on F-Bayes Method//Liu Yong, Liu Zhiqin, Wang Yaobin
Abstract To solve the problem that ionizing radiation making it difficult in estimating sensors’ reliability and Low-resolution data fusion in radioactive tailing dam, the author has built a generalized data fusion model and proposed F-Bayes (F-statistic-Bayes theory) method, used fuzzy cluster analysis classifying the data that is standardized processing, F-statistic to determine the optimal threshold value for sensor fusion set , and has improved the traditional method based on experience or experts to determine the threshold value of confidence matrix, the measurement deviation has reduced to 0.000 2.
Key words data-fusion; F-statistic; Bayes estimation; cluster analysis, radioactive tailing-dam
Author’s address School of Computer Science and Technology, Southwest University of Science and Technology, Mianyang, Sichuan, China 621010
尾矿库内存在的多种放射性矿渣含有铀、钍等10多种放射性物质,在这种环境下,存在多种电离干扰,因此会直接影响通信数据的可靠性。所以在实际测量中应采用合理的数据融合技术来滤除大部分干扰数据,以能保证数据精度和可靠性。
目前的多传感器数据融合方法高层处理工作中主要采用的数学融合理论有Bayes理论、极大似然估计等方法,这些方法对数据融合的精度影响相对较小[1]。但在低层处理中,人们对原始数据的提取方法则各异,如凭借经验的人工估计法,或建立一定的相融矩阵,采取人工方法确定阈值,这些方法会直接影响后期融合结果。
本文主要对某尾矿库监测系统中的χ、γ监测射线进行数据融合,对传统依据经验或请专家确定置信矩阵阈值的办法做出改进[2],提出使用模糊聚类分析中的F-统计量来对多传感数据置信距离矩阵进行聚类分析,以确定最佳估计阈值。
1 理论分析
设有多个传感器测量同一参数,第i个传感器和第j个传感器测得的数据分别为Xi和Xj,Xi和Xj都服从Gauss分布,以它们的pdf曲线作为传感器的特性函数,记成pi(x),pj(x)。xi,xj分别为Xi,Xj的一次观测值。为反映xi和xj之间的偏差大小,引进置信距离测度[3],①。
dij的值称为第i个传感器与第j个传感器读数的置信距离测度,dij的值越小,说明i、j两传感器的观测值越相近,否则偏差就越大,因此也称dij为两个传感器的融合度。其值可借助误差函②直接求得,即③。
如果有n个传感器测量同一参数,那么置信距离测度dij(i,j=1,2,…,n)构成多传感数据的置信距离矩阵:
查阅相关资料,对于矩阵④,一般融合方法是给出一个融合上限λij,⑤。若rij=0,则认为第i个传感器与第j个传感器相融性差,或称它们相互不支持;若rij=1,则认为第i个传感器与第j个传感器相融性好;若rij=rji=1,则称第i个传感器与第j个传感器相互支持。
不难看出,这样做存在一定的问题:λij的选取过于绝对化和经验化,因为λ取值不同便可得到不同分类,不利于对实际情况做出客观判别。在实际问题中,许多时候需要确定最优分类数据,以全面了解样本分布情况。针对此问题,在系统融合过程中提出采用F-统计量来确定λ的最佳阈值。
2 数据融合模型设计
根据实际情况,设计如下多传感器融合功能模型[4]。该模型融合功能分两步完成:第一步是完成低层处理,即完成准则算法,识别分类等工作;第二步是高层处理,对应于决策级融合,输出的是抽象结果。数据模型图如图1所示。
2.1 预处理
根据融合模型,第一步是预处理原始数据,抽出某监测区域具有代表性的8个辐射检测仪参数,即n=8,初始数据如表1所示。
由公式②③计算出置信距离矩阵,得到D:
D=
如用F-统计量来确定最佳分类阈值,需要得到F-统计量的等价矩阵,因此还需将矩阵D进行一系列变换。项目中选用算术平均值最小法建立相似矩阵,但相似矩阵一般只满足自反性和对称性,所以需要得到F-统计量的等价矩阵才能进行聚类分析。采用平方法求出R的传递闭包:
R4=
2.2 聚类
至此已得到F-统计量的等价矩阵,接下来对R4进行聚类,目的是将相互支持的传感器数据分为一类,然后再融合。令λ由1降至0,主要分类如下:
0.848<λ<0.900:(1,2,3)(4)(5,6)(7)(8)
0.831<λ<0.848:(1,2,3,4,7)(5)(6)(8)
0.675<λ<0.831:(1,2,3,4,7)(5,6)(8)
0.640<λ<0.675:(1,2,3,4,5,6,7)(8)
2.3 λ参数估计
根据动态聚类结果,分别计算各λ值所对应的F-统计量值及F值,以得到λ最佳估计值(表2)。通过比较:r=3时,F>F0.05,故最优分类为3类,取λ=0.831,得最佳融合数据组类数为n=5,融合集为{x1,x2,x3,x4,x7}。采用矩估计法得,。
2.4 融合
分别采用以下几种方法来对融合集进行融合比较:采用F-Bayes理论,求得最优融合数据为41.999 843 99;算术平均值法为41.984;极大似然法为41.989 843 75;总概率最大值为41.978 345。
由表3可看出,F-Bayes组合估计方法的融合值偏差最小,其结果为0.000 2,因此可以认为F-Bayes估计值是最接近真实值。通过多次验证,F-Bayes融合方法对测量结果的改善效果更为显著。
3 结论
数据融合是无线传感器网络的一个关键技术,本文提出的F-Bayes方法(F-统计量-Bayes)提高了本项目数据精度。实践证明,这种融合框架可以按照无线传感器网络中多传感器采集的数据进行动态调整,显示了较强的适用性,提高了信息的准确性和全面性。
参考文献
[1]Macii D, Boni A, Cecco M D, ET AL. Multisensor Data Fusion[J].IEEE Instrumentation & Measurement Magazine, 2008,11(3):24-33.
[2]陈增福.多传感器数据融合的数学方法[J].数学的实践与认识,1995,25(2):13-16.
[3]盛骤,谢式千,潘承毅.概率论与数理统计[M].北京:高等教育出版社,2008.
[4]叶宁,王汝传.无线传感器网络数据融合模型研究[J].计算机科学,2006,33(6):58-60.