连续变量的累积分布函数(计算连续性随机变量需要用到哪些积分公式)
导语:积分的妙用——如何求连续变量的均值?
这是《机器学习中的数学基础》系列的第15篇,也是微积分的第8篇。
一说起均值,大家会觉得,这还不简单吗?加起来除以个数不完了吗?是的,但这是对于离散变量而言。举个例子,小明有3门课分别考了60、80、70分,那小明平均考了多少分呢?(60+80+70)/3=70。很简单,对吧。
那现在我有一个函数y=f(x),我想求它在区间[a,b]上的均值,该怎么办呢?如下图:
图1
要知道,a、b之间的点有无穷多个,对应的值也有无穷多个,我总不能用∞/∞来计算均值吧。那到底该怎么做呢?别慌,看下图:
图2
我们把区间[a,b]等分为n个点,每个点之间的间距都是dx,那么点的个数n=(b-a)/dx。我们就先求这n个点的均值,很简单,n个点对应的高度之和除以n就是均值了。我们用公式来表示下,就是(y1+y2+...+yn)/n (1)。其中y1、y2...yn分别是n个点对应的函数值。
ok,之前我们已经知道,n=(b-a)/dx,代入到(1)式,那么n个点的均值就是(y1+y2+...+yn)/[(b-a)/dx],我们把dx翻上去,写成(y1+y2+...+yn)dx/(b-a)。把分子展开,就是(y1dx+y2dx+...+yndx)/(b-a)。
神奇的一幕即将发生!y1dx在图2中代表什么呢?代表一个矩形的面积,这个矩形的长是函数值y1,宽是dx。那么y1dx+y2dx+...+yndx又代表什么呢?代表曲线下a、b区间内很多小长方形的面积,这些小长方形的长就是n个点分别对应的函数值,而宽都是dx。当n越来越大时,或者说当dx→0时,我们就认为长方形的面积之和就是曲线下[a,b]区间内的面积。别忘了,这部分面积可以用我们上一篇讲过的积分来求,也就是:∫f(x)dx(在[a,b]区间的积分)。
因此,函数y=f(x)在区间[a,b]上的均值就可以表示为:
我们假设函数f(x)的原函数为F(x),因此上式又可表示为:
这是啥?这不就是原函数F(x)在a、b两点之间的斜率吗?如下图:
图3
那为什么会这样呢?我们知道,导数可以直观理解为斜率。F(x)的导数是f(x),我们想要求f(x)在[a,b]的均值,也就是求F(x)的斜率在[a,b]的均值。那F(x)的斜率从a变化到b,就相当于a、b两点之间的斜率(F(b)-F(a))/(b-a)。
好了,这就是今天的全部内容,欢迎留言讨论。
本文内容由快快网络小娴创作整理编辑!