統計學的基本概念 | 統計學 概念

統計學的基本概念. 我以前在大學修過機率,在研究所上過兩次統計學,雖然考試都還可以過關,但是可能因為沒有實際去運用,因此有一些統計的 ...2008年6月19日星期四統計學的基本概念我以前在大學修過機率,在研究所上過兩次統計學,雖然考試都還可以過關,但是可能因為沒有實際去運用,因此有一些統計的基本觀念並不是真的很清楚。

這一年來修計量經濟學、研究方法、而且實際參與老師的研究計畫,接觸統計的機會增多,希望藉此機會慢慢將以前沒有融會貫通的統計概念釐出一個比較清楚的面貌。

敘述統計依照目的與功用的不同,統計學可以分為兩大類,一類稱為「敘述統計」(descriptivestatistics),另一類稱為「推論統計」(inferentialstatistics)。

敘述統計主要在幫助我們從一堆看似零亂的數字中整理出其中的型態、意義,讓我們對這些數字掌握其重點並能夠加以描述,將資料轉變為情報。

最常用的敘述統計值(statistic)有平均值、極大/極小值、範圍、中間值(median)、標準差(standarddeviation)等。

我們也經常用圖形來呈現一組數字的形態或關係,比如這組數字出現頻率的分布圖(distribution)是統計最常使用的概念與方法。

在各種機率分布圖中,常態分布(normaldistribution)是最基本也是最常見的一個,比如在一個60個人的班級裡,學生的身高通常會呈現常態分布的情況,也就是非常高與非常矮的學生人數會很少,越接近平均身高的學生人數會越多。

常態機率分布是一個鐘型的對稱圖型,對稱的中間點是此組數值的平均值μ,而該組數值的標準差σ決定其分布廣度,σ越大,分布圖型就越廣。

一個常態分布就是由μ及σ所決定的,而在μ±1σ之間的範圍佔整個圖型面積的67%,在μ±2σ之間的範圍約是95%,在μ±3σ之間的範圍約是99%,也就是:此組數字落在μ±1σ之間的值的個數佔總數的67%,落在μ±2σ之間的值的個數佔總數的95%,落在μ±3σ之間的值的個數佔總數的99%。

因此當我們從整組數據中抽到在介於μ±1σ之間的值的機會(機率)是67%;抽到μ±3σ之外的值的機率只有1%,也代表μ±3σ之外的值的發生機率只有1%。

常態機率分布不僅對敘述統計很重要,它也是推論統計的基礎。

推論統計推論統計基本出發點是要透過有限的樣本(sample)的資料讓我們去推論母體(population)的狀況。

母體就是我們所關切的現象或問題所涉及到的所有對象,不過有時候母體數目太多,或者因為資料欠缺,我們只能從中選擇具有代表性的一部分做為研究的sample來探討,希望藉此讓我們間接對population的狀況有所了解。

比如有一個老師出了一個作業,要學生在一天內找出今天花蓮縣所有家戶的平均子女數,可是不能直接去問戶政事務所,照理說學生應該要挨家挨戶去問,收集所有家戶的子女人數,加總之後再除以花蓮縣的總戶數,求得每戶的平均子女數。

不過這件工作不可能在一天內完成,學生只好退而求其次,用隨機抽樣取得的樣本來做估算或推論。

在這個例子中,全縣家戶(母體)的每戶子女數平均值是母體的一個特徵值或參數(parameter),由樣本所計算得到的每戶平均子女數是該參數的統計值(statistic)。

假設老師知道花蓮縣所有家戶的平均子女數是2人,但是事實上學生們並不知道這個數字。

於是學生用隨機抽樣的方式,取得10個家戶的子女數資料,假設是以下的數字:1223012420這個樣本的樣本數N為10,平均值μ是1.7,標準差σ是1.25。

由於每一個樣本都可能有取樣上的偏差,因此根據一個樣本所得到的估算值有可能很不準確(與母體的參數值差距很大),所以我們重複上面的取樣方式15次,共取得15個樣本(每個樣本都有10個數字),計算得到15個平均值(μ1-μ15)與15個標準差(σ1-σ15)。

假設這15個樣本的平均值(每戶平均子女數)分別是:1.72.11.52.51.92.02.61.91.82.21.72.32.02.21.8這個由樣本的統計值所構成的數字組合在統計學上非常重要,它們所形成的機率分布稱為「取樣分布」(samplingdistribution),統計學家已經證明,取樣分布是一個常態分配,而且當取樣進行的次數愈多,這些統計值的平均值(此取樣常態分布的中點)會愈接近母體參數值。

此外,取樣分布的標準差被稱為標準誤差(standarderror,用s代表,意義是用這


常見投資理財問答


延伸文章資訊