正態分佈(Normal Distribution)是什麼?
好的,我將所有 MathJax-LaTeX 公式從 [ ] 改成 $$,以符合你的設定。以下是調整後的部落格文章,適合直接貼到啟用了 MathJax 的 WordPress(假設它支援 $$ 作為公式標記)。內容保持不變,只有公式語法改變。
正態分佈完全解析:從基礎到應用,一篇搞懂!
正態分佈(Normal Distribution)是統計學中的明星,它那優雅的鐘形曲線無處不在,從身高分佈到考試成績,甚至連製造誤差都離不開它。今天這篇文章將帶你全面認識正態分佈,從定義、例子到計算方法,甚至它的前世今生,讓你對這個「統計界的萬能工具」有全新的理解!
正態分佈是什麼?
正態分佈是一種連續的機率分佈,數據大多集中在平均值附近,兩端逐漸減少,形成一個對稱的鐘形曲線。它的英文是 Normal Distribution,也被稱為 高斯分佈(Gaussian Distribution),因為數學家高斯對它的研究貢獻巨大。
簡單來說,正態分佈就像大自然的規律:中間多、兩邊少,對稱又平衡。
正態分佈的例子有哪些?
你可能沒想過,正態分佈其實就在我們身邊。以下是一些常見的例子:
| 現象 | 為什麼符合正態分佈? |
|---|---|
| 人們的身高 | 大多數人接近平均身高,極高或極矮的人很少。 |
| 考試成績 | 分數多集中在平均值,極高或極低分數較少。 |
| 製造誤差 | 像螺絲長度,誤差通常圍繞目標值分佈。 |
這些例子告訴我們,正態分佈擅長描述「集中趨勢」的現象。
正態分佈如何計算?
正態分佈的機率密度函數長這樣:
$$ f(x) = \frac{1}{\sqrt{2\pi\sigma^2}} e^{-\frac{(x-\mu)^2}{2\sigma^2}} $$
別被公式嚇到!它其實在說:
- ( \mu ) 是平均值,決定曲線的中心。
- ( \sigma ) 是標準差,決定曲線的扁平程度。
- ( \sigma^2 ) 是變異數。
實際上,我們很少手算這個公式,而是透過「標準正態分佈表」來查機率(後面會講到)。
正態分佈表是什麼?
正態分佈表(或 Z 表)是用來查詢機率的工具。標準正態分佈是平均值 ( \mu = 0 )、標準差 ( \sigma = 1 ) 的情況。計算時,先用公式把數據轉成 Z 值:
$$ Z = \frac{x – \mu}{\sigma} $$
然後查表。
以下是部分正態分佈表示例(從 Z = 0.00 到 Z = 3.00,顯示到小數點後四位):
| Z 值 | 機率(P(Z < z)) | Z 值 | 機率(P(Z < z)) | Z 值 | 機率(P(Z < z)) |
|---|---|---|---|---|---|
| 0.00 | 0.5000 | 1.00 | 0.8413 | 2.00 | 0.9772 |
| 0.10 | 0.5398 | 1.10 | 0.8643 | 2.10 | 0.9821 |
| 0.20 | 0.5793 | 1.20 | 0.8849 | 2.20 | 0.9861 |
| 0.30 | 0.6179 | 1.30 | 0.9032 | 2.30 | 0.9893 |
| 0.40 | 0.6554 | 1.40 | 0.9192 | 2.40 | 0.9918 |
| 0.50 | 0.6915 | 1.50 | 0.9332 | 2.50 | 0.9938 |
| 0.60 | 0.7257 | 1.60 | 0.9452 | 2.60 | 0.9953 |
| 0.70 | 0.7580 | 1.70 | 0.9554 | 2.70 | 0.9965 |
| 0.80 | 0.7881 | 1.80 | 0.9641 | 2.80 | 0.9974 |
| 0.90 | 0.8159 | 1.90 | 0.9713 | 3.00 | 0.9987 |
註:這只是正向 Z 值的一部分。完整表會包括負值(從 -4.00 到 0.00)和更多精細間隔(例如每 0.01)。像 Z=1.96 Z = 1.96 Z=1.96 的機率是 0.9750,代表數據低於這個值的機率是 97.5%。
正態分佈的前世今生
正態分佈的歷史很有趣。18世紀,法國數學家德莫ivre在研究賭博問題時發現了它的雛形。到了19世紀,高斯在分析天文觀測誤差時完善了這個分佈,從此它被稱為高斯分佈。後來,統計學家發現許多自然現象都符合這種分佈,它就成了統計學的基石。
| 時期 | 關鍵人物 | 貢獻 |
|---|---|---|
| 18世紀 | 德莫ivre | 發現正態分佈的雛形 |
| 19世紀 | 高斯 | 完善並應用於誤差分析 |
正態分佈與高斯分佈
很多人會問:正態分佈和高斯分佈有什麼不同?答案是:沒什麼不同!它們是同一個東西,只是名稱不同。高斯分佈是以高斯的名字命名,但指的都是那個鐘形曲線。
正態分佈的機率怎麼算?
想知道某個範圍的機率(比如 ( P(a < x < b) )),步驟很簡單:
1、用 ( Z = \frac{x – \mu}{\sigma} ) 轉成 Z 值。
2、查 Z 表計算機率。
例如:假設身高平均值 ( \mu = 165 ) cm,標準差 ( \sigma = 5 ) cm,求 160 到 170 cm 的機率:
$$ Z_1 = \frac{160-165}{5} = -1 $$
$$ Z_2 = \frac{170-165}{5} = 1 $$
查表:( P(-1 < Z < 1) = 0.8413 – 0.1587 = 0.6826 ),也就是 68.26%。
正態分佈的標準差公式
標準差 $$ \sigma $$ 衡量數據的分散程度。計算公式如下:
$$ \sigma = \sqrt{\frac{\sum (x_i – \mu)^2}{n}} $$
| 符號 | 意義 |
|---|---|
| $$ x_i $$ | 每個數據點 |
| $$ \mu $$ | 平均值 |
| $$ n $$ | 數據總數 |
如果是樣本,則除以 ( n-1 )。
為什麼正態分佈這麼好用?
正態分佈之所以是統計學的寵兒,有以下原因:
| 原因 | 說明 |
|---|---|
| 中心極限定理 | 樣本夠多時,平均值分佈趨近正態分佈。 |
| 對稱性質 | 數學特性簡單,方便計算。 |
| 普遍性 | 自然界很多現象(如身高、智商)接近正態分佈。 |
| 工具支持 | 像 Z 表、T 檢驗等,都是基於正態分佈設計的。 |
結語
正態分佈不僅是數學公式,更是理解世界的一把鑰匙。從它的歷史到應用,從公式到表格,希望這篇文章讓你對它有更深的認識。下次聽到「正態分佈」,你就能自信地說:「我知道那是什麼!」
你好,我是蔡至誠PG,任職於《阿爾發證券投顧》法人金融處,《我畢業五年,用ETF賺到400萬》作者,《提早五年退休:PG 財經個人財務調配術》講師。