数字矿床模型专家系统推理系统

如题所述

举报该问题

推荐答案 2020-01-18

一、不确定性推理的概率基础

1.4个定义

定义1：试验中每一个可能出现的结果称为试验的一个样本点，由全体样本点构成的集合称为样本空间。

定义2：样本空间的某个子集称为随机事件。

定义3：在同一组条件下进行大量重复试验时，如果事件A出现的频率总是在某一常数P附近摆动，则称该常数P为随机事件A的统计概率，通常记为P(A)。

定义4：设A与B是两个事件，P(B)＞0，则称

中国矿产资源评价新技术与评价新模型

为在事件B已发生的条件下事件A的条件概率。

2.2个定理

定理1：设事件A₁，A₂，…，A_n满足：

1)任意两个事件都互不相容；

2)P(A_i)＞0(i=1，2，…，n)；

。

则对任何事件B有下式成立：

中国矿产资源评价新技术与评价新模型

该公式称为全概率公式。

定理2：设事件A₁，A₂，…，A_n满足：

1)任意两个事件都互不相容；

2)P(A_i)＞0(i=1，2，…，n)；

。

则对任何事件B有下式成立：

中国矿产资源评价新技术与评价新模型

该定理称为Bayes定理，上式称为Bayes公式。

二、主观Bayes方法

主观Bayes方法是由R.O.Duda等人于1976年提出的一种不确定性推理模型，并成功地应用在他自己开发的PROSPECTOR专家系统中。

1.知识不确定性的表示

(1)知识表示方式

主观Bayes方法中，知识用产生式表示，其形式为

if E then(LS，LN)H

其中E是前件结点，H是结论结点，(LS，LN)表示该知识的知识强度，LS和LN分别定义为：

中国矿产资源评价新技术与评价新模型

LS和LN的取值范围均为[0，+∞]。

(2)修改的Bayes公式

设几率函数为：

中国矿产资源评价新技术与评价新模型

则

O(H∣E)=LS×O(H)

O(H∣E)=LN×O(H)

上述两个式子称为修改的Bayes公式。

(3)充分性度量LS的性质

当LS＞1时，O(H∣E)＞O(H)，说明E支持H。LS越大，O(H∣E)就比O(H)大得越多，E对H的支持越充分。当LS→+∞时，O(H∣E)→+∞，即P(H∣E)→1，表示E存在将导致H为真。

当LS=1时，O(H∣E)=O(H)，说明E对H没有影响。

当LS＜1时，O(H∣E)＜O(H)，说明E的存在使H为假。

由上述分析可知，LS反映的使E的出现对H为真的影响程度，因此，称LS为知识的充分性度量。

(4)必要性度量LN的性质

当LN＞1时，O(H∣

)＞O(H)，说明

支持H，即由于E的不出现，增大了H为真的概率。LN越大，O(H∣

)就比O(H)大得越多，

对H为真得支持就越强。当LN→+∞时，O(H∣

)→+∞，即P(H∣

)→1，表示E存在将导致H为真。

当LN=1时，O(H∣

)=O(H)，说明

对H没有影响。

当LN＜1时，O(H∣

)＜O(H)，说明

不支持H，即由于

的存在，将使H为真的可能性下降，或者说由于E不存在，将反对H为真。当LN→0时，O(H∣

)→0，即LN越小，E不出现就越反对H为真，这说明H越需要E的出现。

当LN=0时，O(H∣

)=0，说明

的存在将导致H为假，或者说E不存在将导致H为假。

由上述分析可以看出，LN反映的是当E不存在时对H为真的影响，因此，称LN为知识的必要性度量。

(5)LS与LN的关系

由于E和E不会同时支持或排斥H，因此只有下述3种情况存在：

1)LS＞1且LN＜1；

2)LS＜1且LN＞1；

3)LS=LN=1。

事实上，如果LS＞1，即

中国矿产资源评价新技术与评价新模型

同理可以证明“LS＜1且LN＞1”和“LS=LN=1”。

(6)LS与LN的获取

在实际系统中，LS和LN的值均是由领域专家根据经验给出，而不是由LS和LN公式计算出来的。给值的基本原则是：当证据E越是支持H为真时，则LS的值应该越大；当证据E对H越是重要时，则LN的值应该越小。

数字矿床模型专家系统中，LS和LN的值由10位矿床地质专家给出，然后通过一定的数学模型输出，具有一定的可靠性和权威性。

2.证据不确定性的表示

(1)证据的动态强度

主观Bayes方法中，证据E的不确定性是用其概率或几率来表示的。在当前观察S下，证据E的先验概率P(E)更改为后验概率P(E∣S)，相当于给出证据E的动态强度。

(2)初始证据的可信度

由于概率或几率的确定比较困难，对于在观察S下的初始证据E，引入可信度C(E∣S)的概念。C(E∣S)的取值范围是-5到5之间的11个整数，C(E∣S)与P(E∣S)之间保持大小次序一致的对应关系(图6-11)：

C(E∣S)=-5，表示在观察S下证据E肯定不存在，即P(E∣S)=0；

C(E∣S)=0，表示观察S与E无关，即P(E∣S)=P(E)；

C(E∣S)=5，表示在观察S下证据E肯定存在，即P(E∣S)=1；

C(E∣S)为其它值时，与P(E∣S)的对应关系通过上述3个点进行分段线性插值得到。

C(E∣S)与P(E∣S)之间对应关系的解析表达式为

中国矿产资源评价新技术与评价新模型

这样，只要给出C(E∣S)，系统就会将其转化为P(E∣S)，转化的公式是：

图6-11 C（E∣S）与P（E∣S）对应关系图

中国矿产资源评价新技术与评价新模型

3.组合证据不确定性的表示

无论组合证据有多么复杂，其基本组合形式只有合取与析取两种。设在观察S下有单一证据E₁，E₂，…，E_n，且分别有概率P(E₁∣S)，P(E₂∣S)，…，P(E_n∣S)，若组合证据E=E₁and E₂and…and E_n，则

P(E∣S)=min{P(E₁∣S)，P(E₂∣S)，…，P(E_n∣S)}.

若组合证据E=E₁or E₂or…or E_n，则

P(E∣S)=max{P(E₁∣S)，P(E₂∣S)，…，P(E_n∣S)}.

4.不确定性的更新

由Bayes公式知道：

中国矿产资源评价新技术与评价新模型

当P(E∣S)=1时，P(

∣S)=0，可得

中国矿产资源评价新技术与评价新模型

当P(E∣S)=0时，P(

∣S)=1，可得

中国矿产资源评价新技术与评价新模型

当P(E∣S)=P(E)时，表示E与S无关，可得

中国矿产资源评价新技术与评价新模型

由上述分析得到了P(E∣S)上的3个特殊值：0、P(E)和1，并分别取得了对应值P(H∣

)，P(H)和P(H∣E)，这样就构成了3个特殊点。

当P(E∣S)为其它值时，P(H∣S)的值可以通过上述3个特殊点的分段线性插值函数求得。该插值函数P(H∣S)如图6-12所示。

图6-12 P（H∣S）与P（E∣S）对应关系图

函数解析式为

中国矿产资源评价新技术与评价新模型

该公式称为EH公式。

EH公式处理用概率描述得非精确性，当证据的非精确性是用可信度C(E∣S)给出时，需要适当修改EH公式，得到

中国矿产资源评价新技术与评价新模型

该公式称为CP公式。

有了EH和CP公式，系统就可以根据这两个公式对可信度和概率进行不同处理。当用初始证据进行推理时，可根据用户给出的可信度C(E∣S)，通过运用CP公式求出P(H∣S)；当用前面推出的中间结论作为新的证据进行推理时，可根据该中间结论的概率，通过运用EH公式就可以求出P(H∣S)。

5.结论不确定性的合成

假设有n条知识都支持同一结论，并且这些知识的前提条件分别是n个相互独立的证据E₁，E₂，…，E_n，而每个证据所对应的观察分别是S₁，S₂，…S_n。在这些观察下，求H的后验概率的方法是：首先对每条知识分别求出H的后验几率O(H∣S_i)，然后利用这些后验几率并按下述公式求出所有观察下H的后验几率：

中国矿产资源评价新技术与评价新模型

6.主观Bayes方法的特点

主观Bayes方法的主要优点是理论模型精确，灵敏度高，不仅考虑了证据间的关系，而且考虑了证据存在与否对假设的影响。

主观Bayes方法的主要缺点是所需要的主观概率太多，专家不易给出。

三、主观Bayes方法在数字矿床模型专家系统推理系统中的更新法

主观Bayes方法在规则优选上理论不够充分。下面示例中可以看出一些需要更新的地方。

例设有规则

r₁：if E₁then(2，0.0001)H₁

r₂：if E₁.and.E₂then(100，0.0001)H₁

r₃：if H₁then(200，0.01)H₂

已知：O(H₁)=0.1，O(H₂)=0.01，C(E₁∣S₁)=2，C(E₂∣S₂)=1

求：O(H₂∣S₁，S₂).

解：由已知得到推理网络图(图6-13)。

图6-13 推理网络图

第一步，计算O(H₁∣S₁)

中国矿产资源评价新技术与评价新模型

∵ C(E₁∣S₁)=2＞0

∴ 使用CP公式的后半部分计算P(H₁∣S₁)。

中国矿产资源评价新技术与评价新模型

第二步，计算O(H₁∣(S₁.and.S₂))

由于r₂的前件是E₁，E₂的合取，且已知C(E₁∣S₁)=2，C(E₂∣S₂)=1

∵ 0＜C(E₂∣S₂)＜C(E₁∣S₁)

∴ P(E₂∣S₂)＜P(E₁∣S₁)

当前件为多个证据的合取时，按照取最小的原则，这里可只考虑E₂的影响。即把计算O(H₁∣(S₁.and.S₂))的问题转化为计算O(H₁∣S₂)的问题。

中国矿产资源评价新技术与评价新模型

∵ C(E₂∣S₂)=1＞0

∴ 使用CP公式的后半部分计算P(H₁∣S₂)

中国矿产资源评价新技术与评价新模型

第三步，计算O(H₁∣S₁，S₂)

中国矿产资源评价新技术与评价新模型

第四步，计算O(H₂∣S₁，S₂)

对r₃，H₁就相当于E。现已知O(H₁)和O(H₁∣S₁，S₂)，为了确定应该选用EH公式的哪一部分，需要判断P(H₁)与P(H₁∣S₁，S₂)的大小关系。

∵ O(H₁∣S₁，S₂)=0.471，O(H₁)=0.1

即O(H₁∣S₁，S₂)＞O(H₁)；

∴ P(H₁∣S₁，S₂)＞P(H₁)

∴ 应该选用EH公式的后半部分，即

中国矿产资源评价新技术与评价新模型

为使用该公式，需要先把O(H₂)和O(H₁∣S₁，S₂)转化成概率，并求出P(H₂∣H₁)。

中国矿产资源评价新技术与评价新模型

H₂原先的几率是0.01，通过运用知识r₁，r₂，r₃及初始证据的可信度进行推理，最后推出的H₂的后验几率为0.214，相当于几率增加了20多倍。

这个解答在推理H₁过程中没有对两个观察S₁和S₂是否可能产生重复推理进行分析，即E₁和E₁.and.E₂都发生的情况下，同时启动规则r₁和r₂是否合适。

数字矿床模型专家系统就规则优选问题对主观Bayes方法进行了更新，即如果合取式E₁.and.E₂.…and.E_n发生的情况下，只启动规则以E₁.and.E₂….and.E_n为前件的那一条规则，而不再启动以 E₁、E₂、…、E_n、E_i.and.E_j、E_i.and.E_j.and.E_k、…、E₁.and.E₂.…and.E_n-1为前件的那些规则。