数字矿床模型专家系统推理系统

如题所述

一、不确定性推理的概率基础

1.4个定义

定义1:试验中每一个可能出现的结果称为试验的一个样本点,由全体样本点构成的集合称为样本空间。

定义2:样本空间的某个子集称为随机事件。

定义3:在同一组条件下进行大量重复试验时,如果事件A出现的频率总是在某一常数P附近摆动,则称该常数P为随机事件A的统计概率,通常记为P(A)。

定义4:设A与B是两个事件,P(B)>0,则称

中国矿产资源评价新技术与评价新模型

为在事件B已发生的条件下事件A的条件概率。

2.2个定理

定理1:设事件A1,A2,…,An满足:

1)任意两个事件都互不相容;

2)P(Ai)>0(i=1,2,…,n);

3)

则对任何事件B有下式成立:

中国矿产资源评价新技术与评价新模型

该公式称为全概率公式。

定理2:设事件A1,A2,…,An满足:

1)任意两个事件都互不相容;

2)P(Ai)>0(i=1,2,…,n);

3)

则对任何事件B有下式成立:

中国矿产资源评价新技术与评价新模型

该定理称为Bayes定理,上式称为Bayes公式。

二、主观Bayes方法

主观Bayes方法是由R.O.Duda等人于1976年提出的一种不确定性推理模型,并成功地应用在他自己开发的PROSPECTOR专家系统中。

1.知识不确定性的表示

(1)知识表示方式

主观Bayes方法中,知识用产生式表示,其形式为

if E then(LS,LN)H

其中E是前件结点,H是结论结点,(LS,LN)表示该知识的知识强度,LS和LN分别定义为:

中国矿产资源评价新技术与评价新模型

LS和LN的取值范围均为[0,+∞]。

(2)修改的Bayes公式

设几率函数为:

中国矿产资源评价新技术与评价新模型

O(H∣E)=LS×O(H)

O(H∣E)=LN×O(H)

上述两个式子称为修改的Bayes公式。

(3)充分性度量LS的性质

当LS>1时,O(H∣E)>O(H),说明E支持H。LS越大,O(H∣E)就比O(H)大得越多,E对H的支持越充分。当LS→+∞时,O(H∣E)→+∞,即P(H∣E)→1,表示E存在将导致H为真。

当LS=1时,O(H∣E)=O(H),说明E对H没有影响。

当LS<1时,O(H∣E)<O(H),说明E的存在使H为假。

由上述分析可知,LS反映的使E的出现对H为真的影响程度,因此,称LS为知识的充分性度量。

(4)必要性度量LN的性质

当LN>1时,O(H∣

)>O(H),说明

支持H,即由于E的不出现,增大了H为真的概率。LN越大,O(H∣

)就比O(H)大得越多,

对H为真得支持就越强。当LN→+∞时,O(H∣

)→+∞,即P(H∣

)→1,表示E存在将导致H为真。

当LN=1时,O(H∣

)=O(H),说明

对H没有影响。

当LN<1时,O(H∣

)<O(H),说明

不支持H,即由于

的存在,将使H为真的可能性下降,或者说由于E不存在,将反对H为真。当LN→0时,O(H∣

)→0,即LN越小,E不出现就越反对H为真,这说明H越需要E的出现。

当LN=0时,O(H∣

)=0,说明

的存在将导致H为假,或者说E不存在将导致H为假。

由上述分析可以看出,LN反映的是当E不存在时对H为真的影响,因此,称LN为知识的必要性度量。

(5)LS与LN的关系

由于E和E不会同时支持或排斥H,因此只有下述3种情况存在:

1)LS>1且LN<1;

2)LS<1且LN>1;

3)LS=LN=1。

事实上,如果LS>1,即

中国矿产资源评价新技术与评价新模型

同理可以证明“LS<1且LN>1”和“LS=LN=1”。

(6)LS与LN的获取

在实际系统中,LS和LN的值均是由领域专家根据经验给出,而不是由LS和LN公式计算出来的。给值的基本原则是:当证据E越是支持H为真时,则LS的值应该越大;当证据E对H越是重要时,则LN的值应该越小。

数字矿床模型专家系统中,LS和LN的值由10位矿床地质专家给出,然后通过一定的数学模型输出,具有一定的可靠性和权威性。

2.证据不确定性的表示

(1)证据的动态强度

主观Bayes方法中,证据E的不确定性是用其概率或几率来表示的。在当前观察S下,证据E的先验概率P(E)更改为后验概率P(E∣S),相当于给出证据E的动态强度。

(2)初始证据的可信度

由于概率或几率的确定比较困难,对于在观察S下的初始证据E,引入可信度C(E∣S)的概念。C(E∣S)的取值范围是-5到5之间的11个整数,C(E∣S)与P(E∣S)之间保持大小次序一致的对应关系(图6-11):

C(E∣S)=-5,表示在观察S下证据E肯定不存在,即P(E∣S)=0;

C(E∣S)=0,表示观察S与E无关,即P(E∣S)=P(E);

C(E∣S)=5,表示在观察S下证据E肯定存在,即P(E∣S)=1;

C(E∣S)为其它值时,与P(E∣S)的对应关系通过上述3个点进行分段线性插值得到。

C(E∣S)与P(E∣S)之间对应关系的解析表达式为

中国矿产资源评价新技术与评价新模型

这样,只要给出C(E∣S),系统就会将其转化为P(E∣S),转化的公式是:

图6-11 C(E∣S)与P(E∣S)对应关系图

中国矿产资源评价新技术与评价新模型

3.组合证据不确定性的表示

无论组合证据有多么复杂,其基本组合形式只有合取与析取两种。设在观察S下有单一证据E1,E2,…,En,且分别有概率P(E1∣S),P(E2∣S),…,P(En∣S),若组合证据E=E1and E2and…and En,则

P(E∣S)=min{P(E1∣S),P(E2∣S),…,P(En∣S)}.

若组合证据E=E1or E2or…or En,则

P(E∣S)=max{P(E1∣S),P(E2∣S),…,P(En∣S)}.

4.不确定性的更新

由Bayes公式知道:

中国矿产资源评价新技术与评价新模型

当P(E∣S)=1时,P(

∣S)=0,可得

中国矿产资源评价新技术与评价新模型

当P(E∣S)=0时,P(

∣S)=1,可得

中国矿产资源评价新技术与评价新模型

当P(E∣S)=P(E)时,表示E与S无关,可得

中国矿产资源评价新技术与评价新模型

由上述分析得到了P(E∣S)上的3个特殊值:0、P(E)和1,并分别取得了对应值P(H∣

),P(H)和P(H∣E),这样就构成了3个特殊点。

当P(E∣S)为其它值时,P(H∣S)的值可以通过上述3个特殊点的分段线性插值函数求得。该插值函数P(H∣S)如图6-12所示。

图6-12 P(H∣S)与P(E∣S)对应关系图

函数解析式为

中国矿产资源评价新技术与评价新模型

该公式称为EH公式。

EH公式处理用概率描述得非精确性,当证据的非精确性是用可信度C(E∣S)给出时,需要适当修改EH公式,得到

中国矿产资源评价新技术与评价新模型

该公式称为CP公式。

有了EH和CP公式,系统就可以根据这两个公式对可信度和概率进行不同处理。当用初始证据进行推理时,可根据用户给出的可信度C(E∣S),通过运用CP公式求出P(H∣S);当用前面推出的中间结论作为新的证据进行推理时,可根据该中间结论的概率,通过运用EH公式就可以求出P(H∣S)。

5.结论不确定性的合成

假设有n条知识都支持同一结论,并且这些知识的前提条件分别是n个相互独立的证据E1,E2,…,En,而每个证据所对应的观察分别是S1,S2,…Sn。在这些观察下,求H的后验概率的方法是:首先对每条知识分别求出H的后验几率O(H∣Si),然后利用这些后验几率并按下述公式求出所有观察下H的后验几率:

中国矿产资源评价新技术与评价新模型

6.主观Bayes方法的特点

主观Bayes方法的主要优点是理论模型精确,灵敏度高,不仅考虑了证据间的关系,而且考虑了证据存在与否对假设的影响。

主观Bayes方法的主要缺点是所需要的主观概率太多,专家不易给出。

三、主观Bayes方法在数字矿床模型专家系统推理系统中的更新法

主观Bayes方法在规则优选上理论不够充分。下面示例中可以看出一些需要更新的地方。

例 设有规则

r1:if E1then(2,0.0001)H1

r2:if E1.and.E2then(100,0.0001)H1

r3:if H1then(200,0.01)H2

已知:O(H1)=0.1,O(H2)=0.01,C(E1∣S1)=2,C(E2∣S2)=1

求:O(H2∣S1,S2).

解:由已知得到推理网络图(图6-13)。

图6-13 推理网络图

第一步,计算O(H1∣S1)

中国矿产资源评价新技术与评价新模型

∵ C(E1∣S1)=2>0

∴ 使用CP公式的后半部分计算P(H1∣S1)。

中国矿产资源评价新技术与评价新模型

中国矿产资源评价新技术与评价新模型

第二步,计算O(H1∣(S1.and.S2))

由于r2的前件是E1,E2的合取,且已知C(E1∣S1)=2,C(E2∣S2)=1

∵ 0<C(E2∣S2)<C(E1∣S1)

∴ P(E2∣S2)<P(E1∣S1)

当前件为多个证据的合取时,按照取最小的原则,这里可只考虑E2的影响。即把计算O(H1∣(S1.and.S2))的问题转化为计算O(H1∣S2)的问题。

中国矿产资源评价新技术与评价新模型

∵ C(E2∣S2)=1>0

∴ 使用CP公式的后半部分计算P(H1∣S2)

中国矿产资源评价新技术与评价新模型

第三步,计算O(H1∣S1,S2)

中国矿产资源评价新技术与评价新模型

第四步,计算O(H2∣S1,S2)

对r3,H1就相当于E。现已知O(H1)和O(H1∣S1,S2),为了确定应该选用EH公式的哪一部分,需要判断P(H1)与P(H1∣S1,S2)的大小关系。

∵ O(H1∣S1,S2)=0.471,O(H1)=0.1

即O(H1∣S1,S2)>O(H1);

∴ P(H1∣S1,S2)>P(H1)

∴ 应该选用EH公式的后半部分,即

中国矿产资源评价新技术与评价新模型

为使用该公式,需要先把O(H2)和O(H1∣S1,S2)转化成概率,并求出P(H2∣H1)。

中国矿产资源评价新技术与评价新模型

H2原先的几率是0.01,通过运用知识r1,r2,r3及初始证据的可信度进行推理,最后推出的H2的后验几率为0.214,相当于几率增加了20多倍。

这个解答在推理H1过程中没有对两个观察S1和S2是否可能产生重复推理进行分析,即E1和E1.and.E2都发生的情况下,同时启动规则r1和r2是否合适。

数字矿床模型专家系统就规则优选问题对主观Bayes方法进行了更新,即如果合取式E1.and.E2.…and.En发生的情况下,只启动规则以E1.and.E2….and.En为前件的那一条规则,而不再启动以 E1、E2、…、En、Ei.and.Ej、Ei.and.Ej.and.Ek、…、E1.and.E2.…and.En-1为前件的那些规则。

四、示例

例 设有规则

r1:if E1then(2,0.0001)H1

r2:if E1.and.E2then(100,0.0001)H1

r3:if H1then(200,0.01)H2

已知:O(H1)=0.1,O(H2)=0.01,C(E1∣S1)=2,C(E2∣S2)=1;

求:O(H2∣S1,S2)。

解:

第一步,规则优选:

考虑到E1和E1.and.E2都能得到结论H1,只选择规则r2启动。

第二步,计算O(H1∣(S1.and.S2)):

由于r2的前件是E1,E2的合取,且已知C(E1∣S1)=2,C(E2∣S2)=1。

∵ 0<C(E2∣S2)<C(E1∣S1),

∴ P(E2∣S2)<P(E1∣S1)。

当前件为多个证据的合取时,按照取最小的原则,这里可只考虑E2的影响。即把计算O(H1∣(S1.and.S2))的问题转化为计算O(H1∣S2)的问题。

中国矿产资源评价新技术与评价新模型

∵ C(E2∣S2)=1>0,

∴ 使用CP公式的后半部分计算P(H1∣S2)。

中国矿产资源评价新技术与评价新模型

第三步,计算O(H1∣S1,S2)

O(H1∣S1,S2)=O(H1∣S2)=0.341.

第四步,计算O(H2∣S1,S2)

对r3,H1就相当于E。现已知O(H1)和O(H1∣S1,S2),为了确定应该选用EH公式的哪一部分,需要判断P(H1)与P(H1∣S1,S2)的大小关系。

∵ O(H1∣S1,S2)=0.341,O(H1)=0.1;

即O(H1∣S1,S2)>O(H1),

∴ P(H1∣S1,S2)>P(H1)。

∴ 应该选用EH公式的后半部分,即

中国矿产资源评价新技术与评价新模型

为使用该公式,需要先把O(H2)和O(H1∣S1,S2)转化成概率,并求出P(H2∣H1)。

中国矿产资源评价新技术与评价新模型

H2原先的几率是0.01,通过运用知识r1,r2,r3及初始证据的可信度进行推理,最后推出的H2的后验几率为0.143,相当于几率增加了14倍。

温馨提示:答案为网友推荐,仅供参考
相似回答