卡方分布密度函数的推导过程,用到了随机变量复合函数的概率,包括平方和求和两种运算,其过程还是比较复杂的。
假设
当
对于
由于
两个随机变量之和的概率密度是通过卷积来求的:
也就是
将图b与图x对比,不考虑系数因素,可以推知 fn 的表达式中包含因子
因为图x中包含因子y^(1/2-1),图b中包含因子x^(2/2-1)。这一点可以用另外方法证明。
再将图b中后面的积分用大写的C1表示,得到:
图b的意思是图a的积分中,x只是一个常数,因此可以假设t=ux,这应该没有问题。
意思是把自由度为n+1的卡方分布,分解成自由度为n和自由度为1的卡方分布之和,由意思分析可以得出:
其中的大写的Cn就代表
小写的cn就按公式
进行计算。
这段话的意思是说,图1与图2的表达式相比,经过暴力计算,
就等于
也就是自由度为(n+1)的卡方分布的系数。
由此可以看到,这个证明的最后,其系数的确定只是经过计算表明两者一致,这个证明还没有完全从理论上给出。
这个卡方分布令人感到困惑的地方就是,一个由很多个随机变量组成的变量,它的概率分布怎么就会和一个用于求阶乘的伽马函数如此紧密地联系在一起呢?