Tracy's Studio.

概率图模型python库 -pgmpy

字数统计: 610阅读时长: 2 min
2021/07/30 Share

概率图模型python库 - pgmpy

Reference: https://pgmpy.org/index.html

概率图模型的介绍

机器学习是一门科学学科,探索可以从数据中学习的算法。此类算法通过从示例输入构建模型并使用该模型进行预测或决策来运行,而不是遵循严格的静态程序指令。

举个例子,花的种类可以由其萼片长、宽来预测,那么我们可以根据给定的数据集来预测一个新的数据点。那么很自然的想法就是可以是拟合一个能够将输入值映射到花朵类型空间的函数。还有一种做法就是找到变量之间的概率分布,利用分布来得到花朵的类型。

目前已经有许多用于寻找映射函数的算法:线性回归试图找到一个可以解释数据的线性方程;支持向量机试图找到可以分离数据点的平面;决策树试图找到一组简单的大于和小于方程来对数据进行分类。

对于分类问题,使用概率模型显然需要计算所有变量之间的联合概率分布,根据我们的新数据点对这些进行边缘概率的求解。

贝叶斯推理的工作原理是我们在数据上构建一个联合分布,以观察到的变量为条件来计算后验分布,通过查询这个后验分布来预测新数据点的值。但是这种方法的问题在于联合概率分布与每个变量的状态数(基数)呈指数关系。因此,对于具有大量特征或具有高特征基数的问题,由于计算限制,推理成为一项艰巨的任务。例如,对于 10 个随机变量,每个变量有 10 个状态,联合分布的大小将为

概率图形模型 (PGM):PGM 是一种通过利用变量之间的(条件)独立性来紧凑地表示随机变量上的联合概率分布的技术。 PGM 还为我们提供了对这些联合分布进行有效推理的方法。

每个图形模型都以图结构(可以是有向、无向或两者都有)和与每个图关联的一组参数为特征。

未完待续..

CATALOG
  1. 1. 概率图模型python库 - pgmpy
  2. 2. 概率图模型的介绍