python指数分布函数的简单介绍

如何在Python中实现这五类强大的概率分布

R编程语言已经成为统计分析中的事实标准。但在这篇文章中，我将告诉你在Python中实现统计学概念会是如此容易。我要使用Python实现一些离散和连续的概率分布。虽然我不会讨论这些分布的数学细节，但我会以链接的方式给你一些学习这些统计学概念的好资料。在讨论这些概率分布之前，我想简单说说什么是随机变量（random variable）。随机变量是对一次试验结果的量化。

创新互联建站是一家集网站建设,沅陵企业网站建设,沅陵品牌网站建设,网站定制,沅陵网站建设报价,网络营销,网络优化,沅陵网站推广为一体的创新建站企业，帮助传统企业提升企业形象加强企业竞争力。可充分满足这一群体相比中小企业更为丰富、高端、多元的互联网需求。同时我们时刻保持专业、时尚、前沿，时刻以成就客户成长自我，坚持不断学习、思考、沉淀、净化自己，让我们为更多的企业打造出实用型网站。

举个例子，一个表示抛硬币结果的随机变量可以表示成

Python

X = {1 如果正面朝上,

2 如果反面朝上}

随机变量是一个变量，它取值于一组可能的值（离散或连续的），并服从某种随机性。随机变量的每个可能取值的都与一个概率相关联。随机变量的所有可能取值和与之相关联的概率就被称为概率分布（probability distributrion）。

我鼓励大家仔细研究一下scipy.stats模块。

概率分布有两种类型：离散（discrete）概率分布和连续（continuous）概率分布。

离散概率分布也称为概率质量函数（probability mass function）。离散概率分布的例子有伯努利分布（Bernoulli distribution）、二项分布（binomial distribution）、泊松分布（Poisson distribution）和几何分布（geometric distribution）等。

连续概率分布也称为概率密度函数（probability density function），它们是具有连续取值（例如一条实线上的值）的函数。正态分布（normal distribution）、指数分布（exponential distribution）和β分布（beta distribution）等都属于连续概率分布。

若想了解更多关于离散和连续随机变量的知识，你可以观看可汗学院关于概率分布的视频。

二项分布（Binomial Distribution）

服从二项分布的随机变量X表示在n个独立的是/非试验中成功的次数，其中每次试验的成功概率为p。

E(X) = np, Var(X) = np(1−p)

如果你想知道每个函数的原理，你可以在IPython笔记本中使用help file命令。 E(X)表示分布的期望或平均值。

键入stats.binom?了解二项分布函数binom的更多信息。

二项分布的例子：抛掷10次硬币，恰好两次正面朝上的概率是多少？

假设在该试验中正面朝上的概率为0.3，这意味着平均来说，我们可以期待有3次是硬币正面朝上的。我定义掷硬币的所有可能结果为k = np.arange(0,11)：你可能观测到0次正面朝上、1次正面朝上，一直到10次正面朝上。我使用stats.binom.pmf计算每次观测的概率质量函数。它返回一个含有11个元素的列表（list），这些元素表示与每个观测相关联的概率值。

您可以使用.rvs函数模拟一个二项随机变量，其中参数size指定你要进行模拟的次数。我让Python返回10000个参数为n和p的二项式随机变量。我将输出这些随机变量的平均值和标准差，然后画出所有的随机变量的直方图。

泊松分布（Poisson Distribution）

一个服从泊松分布的随机变量X，表示在具有比率参数（rate parameter）λ的一段固定时间间隔内，事件发生的次数。参数λ告诉你该事件发生的比率。随机变量X的平均值和方差都是λ。

E(X) = λ, Var(X) = λ

泊松分布的例子：已知某路口发生事故的比率是每天2次，那么在此处一天内发生4次事故的概率是多少？

让我们考虑这个平均每天发生2起事故的例子。泊松分布的实现和二项分布有些类似，在泊松分布中我们需要指定比率参数。泊松分布的输出是一个数列，包含了发生0次、1次、2次，直到10次事故的概率。我用结果生成了以下图片。

你可以看到，事故次数的峰值在均值附近。平均来说，你可以预计事件发生的次数为λ。尝试不同的λ和n的值，然后看看分布的形状是怎么变化的。

现在我来模拟1000个服从泊松分布的随机变量。

正态分布（Normal Distribution）

正态分布是一种连续分布，其函数可以在实线上的任何地方取值。正态分布由两个参数描述：分布的平均值μ和方差σ2 。

E(X) = μ, Var(X) = σ2

正态分布的取值可以从负无穷到正无穷。你可以注意到，我用stats.norm.pdf得到正态分布的概率密度函数。

β分布（Beta Distribution）

β分布是一个取值在 [0, 1] 之间的连续分布，它由两个形态参数α和β的取值所刻画。

β分布的形状取决于α和β的值。贝叶斯分析中大量使用了β分布。

当你将参数α和β都设置为1时，该分布又被称为均匀分布（uniform distribution）。尝试不同的α和β取值，看看分布的形状是如何变化的。

指数分布（Exponential Distribution）

指数分布是一种连续概率分布，用于表示独立随机事件发生的时间间隔。比如旅客进入机场的时间间隔、打进客服中心电话的时间间隔、中文维基百科新条目出现的时间间隔等等。

我将参数λ设置为0.5，并将x的取值范围设置为 $[0, 15]$ 。

接着，我在指数分布下模拟1000个随机变量。scale参数表示λ的倒数。函数np.std中，参数ddof等于标准偏差除以 $n-1$ 的值。

结语（Conclusion）

概率分布就像盖房子的蓝图，而随机变量是对试验事件的总结。我建议你去看看哈佛大学数据科学课程的讲座，Joe Blitzstein教授给了一份摘要，包含了你所需要了解的关于统计模型和分布的全部。

指数分布与幂律分布的图像对比

指数分布（exponential distribution）和幂律分布（power-law distribution）有时看起来很是相似，但实际上极为不同。我用python做了两种分布的函数plotting，方便直观理解。可以看到，两种函数转化为双对数形式（这里我用的math.log()是自然对数ln）后图像差异非常明显。

注释里我给出了几个图分别对应的解析式，另外注意因为这里是用离散的点集近似，相当于对分布函数曲线的采样，所以可以得到一个power-law的数值mean，数学上power-law的均值存在须满足一些条件。

Python 怎样写一个函数使得返回值服从指数分布

不是服从指数分别, 你可以随机出来十万个数值, 然后绘制一下统计直方图, 就能很明显的看到了.

可以直接用

exprnd = random.expovariate

或者非要自己实现的话, 好好去推倒一下公式, 能发现其实是

def exprnd(mu):

return -1. / mu * math.log(1 - random.random())

网页名称：python指数分布函数的简单介绍
链接分享：http://chengdu.cdxwcx.cn/article/hjjics.html

甜橘子，专注成都网站制作网站设计与营销型网站建设与优化

首页

网站建设

网站制作案例

解决方案

网站设计报价

网站制作动态

关于我们

联系我们

成都网站建设设计将想法与焦点和您一起共享

python指数分布函数的简单介绍

如何在Python中实现这五类强大的概率分布

指数分布与幂律分布的图像对比

Python 怎样写一个函数使得返回值服从指数分布

其他资讯

美国主机商BlueHost七折优惠链接使用攻略

欧洲服务器怎么样欧洲服务器租用方案推荐

seo网站降权怎么处理？为什么会出现seo网站降权？

想要获取百万线上流量，你只需要这四招

11月26日全球六大国际域名解析量：前五强净增长

甜橘子，专注成都网站制作网站设计与营销型网站建设与优化

成都网站建设设计 将想法与焦点和您一起共享

python指数分布函数的简单介绍

如何在Python中实现这五类强大的概率分布

指数分布与幂律分布的图像对比

Python 怎样写一个函数使得返回值服从指数分布

其他资讯

美国主机商BlueHost七折优惠链接使用攻略

欧洲服务器怎么样欧洲服务器租用方案推荐

seo网站降权怎么处理？为什么会出现seo网站降权？

想要获取百万线上流量，你只需要这四招

11月26日全球六大国际域名解析量：前五强净增长

成都网站建设设计将想法与焦点和您一起共享