中央極限定理實驗體驗
中央極限定理:有一母體,期望值為\(\mu\),標準差為\(\sigma>0\)。從母體中取出樣本數為\(n\)的樣本 \(X_1,X_2,...,X_n\),觀察其樣本平均\(\overline{X}\),樣本平均的分配我們用抽樣分配稱呼它。當\(n\)相當大時,其樣本平均\(\overline{X}\)的抽樣分配近似於\(N(\mu,\frac{\sigma^2}{n})\),其中\(N(\mu,\frac{\sigma^2}{n})\)代表期望值\(\mu\),變異數\(\frac{\sigma^2}{n}\)(標準差\(\frac{\sigma}{\sqrt{n}}\))的常態分配。
例:丟擲一公正的骰子10次,求10次的平均點數的近似分配。
解:\(\mu=\frac{1}{6}\cdot 1+\frac{1}{6}\cdot 2+\frac{1}{6}\cdot 3+\frac{1}{6}\cdot 4+\frac{1}{6}\cdot 5+\frac{1}{6}\cdot 6=3.5\),\(\sigma^2=\frac{1}{6}\cdot (1-3.5)^2 +\) \( \frac{1}{6}\cdot (2-3.5)^2 + \frac{1}{6}\cdot (3-3.5)^2 + \frac{1}{6}\cdot (4-3.5)^2 + \frac{1}{6}\cdot (5-3.5)^2 + \frac{1}{6}\cdot (6-3.5)^2 = \frac{35}{12}\)。故丟擲10次的平均點數的分布近似於期望值3.5,標準差\(\sqrt{\frac{35}{120}}\approx 0.54\)的常態分配。
所以,10次的平均點數落在區間\([3.5-0.54,3.5+0.54]=[2.96, 4.04]\)的機率大約0.68。
\(n\) 要多大,近似才夠準呢?
一般來講,母體的分配對稱時,\(n\)不需要很大。
自己進行實驗來體會最真實。每次實驗,從母體中取樣\(n\)個求得樣本平均。實驗\(m\)次得\(m\)次的樣本平均,將這些樣本平均畫出累積相對次數折線圖與相對次數直方圖,分別與\(N(\mu,\frac{\sigma^2}{n})\)之累積機率分配函數及機率密度函數相比較。
母體元素有兩種輸入法。第一種,直接輸入以逗點分開的一串數值,這些數值代表從母體抽得的可能數值,每一數值抽到的機率皆相等。例如,要模擬公正的骰子,可輸入"1,2,3,4,5,6"(不包括兩頭的"")。第二種方法,每對資料用空白隔開,前者代表可能值,後者代表該可能值的機率,各對資料再以逗點隔開。例如,"0 0.3, 1 0.7"(不包括兩頭的""),代表母體有兩個元素,抽到0的機率為0.3,抽到1的機率為0.7。這相當於,某議案贊成的民眾有7成,抽中贊成者代表1,抽中反對者代表0。抽樣樣本數限制為1到10000的整數。實驗次數限制為10到10000的整數。組數限制為10到1000的整數。
圖中,下邊的橫軸以母體的原始資料之單位為單位;上邊的橫軸以樣本平均之標準差 \(\frac{\sigma}{\sqrt{n}}\)為單位,以樣本平均期望值\(\mu\)為原點。
當比較累績相對次數分配時,左邊的縱軸代表機率。當比較相對次數分配時,右邊的縱軸代表次數,長條圖的面積和與常態分配機率密度函數下面的面積相等。綠線代表近似的常態分配。
上限代表紅線的位置,實際頻率為樣本平均觀察值落在紅線左邊的頻率,近似機率為樣本平均的近似常態分配落在紅線左邊的機率。拖曳紅線上方的圓圈可得兩者差距的數值。
沒有留言:
張貼留言