搜索
写经验 领红包
 > 知识

贝叶斯定理的本质是什么(贝叶斯定理运用)

导语:贝叶斯(Bayes)定理的理解

贝叶斯定理的本质是什么(贝叶斯定理运用)

贝叶斯定理是概率学里面的一个比较基础的知识点(当然其延伸开来的应用就太多了),也是比较有趣的一个定理。上学时候的东西都差不多还给老师了,最近又捡起来看看;学习知识的一个好办法就是能自己给别人讲清楚,同时能结合实际问题。网上贝叶斯讨论得够多够深了,我不惮狗尾续貂,讨论一点自己的理解,欢迎指正。

概率学里面P(A)表示事件A发生的概率,比如今天下雨的概率的30%,那么可以记作P(今天下雨)=0.3。P(A|B)表示发生B的时候发生A的概率,比如看见天上有云彩,下雨的概率是80%,记作P(下雨|看见天上有云彩)=0.8。

贝叶斯定理是,P(A|B)=P(A)xP(B|A)/P(B),具体推导用到条件概率,就不多说了。其中P(A)是先验概率,不考虑B的因素,P(B)亦然;P(B|A)是B的后验概率,即发生了A后B的条件概率。贝叶斯定理就是用先验概率及A发生后B发生的后验概率(已有的经验、结果),去逆向推测B发生情况下A的概率;其中P(B|A)/P(B)是调整因子,也就是我们可以用观察到的关联事件去调整推测的A的后验概率。

有两点值得注意,一是P(A|B)和P(B|A)不一样但是有关联,这是贝叶斯描述的关系;二是先验概率对于计算是有影响的,或者说如果先验概率有修正,那这个计算结果也需要修正(这似乎是很明显的,但是有时候会被忽视而产生一些有趣的现象,这一点在这儿就不展开了)。

一个很具体的问题,预测标题包含的邮件是垃圾邮件的概率。我们先根据已有的邮件,来看看经验数据,(1)每天收到的邮件有30%是垃圾邮件(先验),P(垃圾邮件)=0.3;(2)每天收到的邮件标题出现的概率是10%(先验),P(标题含)=0.1;(3)检查垃圾邮件,发现垃圾邮件中标题包含的占20%(后验概率,结果),P(标题含|垃圾邮件)=0.2。获取了以上经验,我们就可以推测二者的关联度,P(垃圾邮件|标题包含)=P(垃圾邮件)xP(标题含|垃圾邮件)/P(标题含),结果为0.6(0.3x0.2/0.1),这是比较高的一个概率。同时,通过经验的积累,这个数据还可以不断修正

原创内容,参考了网上的资料,欢迎讨论。

免责声明:本站部份内容由优秀作者和原创用户编辑投稿,本站仅提供存储服务,不拥有所有权,不承担法律责任。若涉嫌侵权/违法的,请反馈,一经查实立刻删除内容。本文内容由快快网络小彤创作整理编辑!