中央極限定理實驗體驗
中央極限定理:有一母體,期望值為μ,標準差為σ>0。從母體中取出樣本數為n的樣本 X1,X2,...,Xn,觀察其樣本平均¯X,樣本平均的分配我們用抽樣分配稱呼它。當n相當大時,其樣本平均¯X的抽樣分配近似於N(μ,σ2n),其中N(μ,σ2n)代表期望值μ,變異數σ2n(標準差σ√n)的常態分配。
例:丟擲一公正的骰子10次,求10次的平均點數的近似分配。
解:μ=16⋅1+16⋅2+16⋅3+16⋅4+16⋅5+16⋅6=3.5,σ2=16⋅(1−3.5)2+ 16⋅(2−3.5)2+16⋅(3−3.5)2+16⋅(4−3.5)2+16⋅(5−3.5)2+16⋅(6−3.5)2=3512。故丟擲10次的平均點數的分布近似於期望值3.5,標準差√35120≈0.54的常態分配。
所以,10次的平均點數落在區間[3.5−0.54,3.5+0.54]=[2.96,4.04]的機率大約0.68。
n 要多大,近似才夠準呢?
自己進行實驗來體會最真實。每次實驗,從母體中取樣n個求得樣本平均。實驗m次得m次的樣本平均,將這些樣本平均畫出累積相對次數折線圖與相對次數直方圖,分別與N(μ,σ2n)之累積機率分配函數及機率密度函數相比較。
母體元素有兩種輸入法。第一種,直接輸入以逗點分開的一串數值,這些數值代表從母體抽得的可能數值,每一數值抽到的機率皆相等。例如,要模擬公正的骰子,可輸入"1,2,3,4,5,6"(不包括兩頭的"")。第二種方法,每對資料用空白隔開,前者代表可能值,後者代表該可能值的機率,各對資料再以逗點隔開。例如,"0 0.3, 1 0.7"(不包括兩頭的""),代表母體有兩個元素,抽到0的機率為0.3,抽到1的機率為0.7。這相當於,某議案贊成的民眾有7成,抽中贊成者代表1,抽中反對者代表0。抽樣樣本數限制為1到10000的整數。實驗次數限制為10到10000的整數。組數限制為10到1000的整數。
圖中,下邊的橫軸以母體的原始資料之單位為單位;上邊的橫軸以樣本平均之標準差 σ√n為單位,以樣本平均期望值μ為原點。
當比較累績相對次數分配時,左邊的縱軸代表機率。當比較相對次數分配時,右邊的縱軸代表次數,長條圖的面積和與常態分配機率密度函數下面的面積相等。綠線代表近似的常態分配。
上限代表紅線的位置,實際頻率為樣本平均觀察值落在紅線左邊的頻率,近似機率為樣本平均的近似常態分配落在紅線左邊的機率。拖曳紅線上方的圓圈可得兩者差距的數值。
沒有留言:
張貼留言