定量分析方法(Quantitative Methods)所有文章

正態分佈(Normal Distribution)是什麼?

好的,我將所有 MathJax-LaTeX 公式從 [ ] 改成 $$,以符合你的設定。以下是調整後的部落格文章,適合直接貼到啟用了 MathJax 的 WordPress(假設它支援 $$ 作為公式標記)。內容保持不變,只有公式語法改變。


正態分佈完全解析:從基礎到應用,一篇搞懂!

正態分佈(Normal Distribution)是統計學中的明星,它那優雅的鐘形曲線無處不在,從身高分佈到考試成績,甚至連製造誤差都離不開它。今天這篇文章將帶你全面認識正態分佈,從定義、例子到計算方法,甚至它的前世今生,讓你對這個「統計界的萬能工具」有全新的理解!


正態分佈是什麼?

正態分佈是一種連續的機率分佈,數據大多集中在平均值附近,兩端逐漸減少,形成一個對稱的鐘形曲線。它的英文是 Normal Distribution,也被稱為 高斯分佈(Gaussian Distribution),因為數學家高斯對它的研究貢獻巨大。

簡單來說,正態分佈就像大自然的規律:中間多、兩邊少,對稱又平衡。


正態分佈的例子有哪些?

你可能沒想過,正態分佈其實就在我們身邊。以下是一些常見的例子:

現象為什麼符合正態分佈?
人們的身高大多數人接近平均身高,極高或極矮的人很少。
考試成績分數多集中在平均值,極高或極低分數較少。
製造誤差像螺絲長度,誤差通常圍繞目標值分佈。

這些例子告訴我們,正態分佈擅長描述「集中趨勢」的現象。


正態分佈如何計算?

正態分佈的機率密度函數長這樣:

$$ f(x) = \frac{1}{\sqrt{2\pi\sigma^2}} e^{-\frac{(x-\mu)^2}{2\sigma^2}} $$

別被公式嚇到!它其實在說:

  • ( \mu ) 是平均值,決定曲線的中心。
  • ( \sigma ) 是標準差,決定曲線的扁平程度。
  • ( \sigma^2 ) 是變異數。

實際上,我們很少手算這個公式,而是透過「標準正態分佈表」來查機率(後面會講到)。


正態分佈表是什麼?

正態分佈表(或 Z 表)是用來查詢機率的工具。標準正態分佈是平均值 ( \mu = 0 )、標準差 ( \sigma = 1 ) 的情況。計算時,先用公式把數據轉成 Z 值:

$$ Z = \frac{x – \mu}{\sigma} $$

然後查表。

以下是部分正態分佈表示例(從 Z = 0.00 到 Z = 3.00,顯示到小數點後四位):

Z 值機率(P(Z < z))Z 值機率(P(Z < z))Z 值機率(P(Z < z))
0.000.50001.000.84132.000.9772
0.100.53981.100.86432.100.9821
0.200.57931.200.88492.200.9861
0.300.61791.300.90322.300.9893
0.400.65541.400.91922.400.9918
0.500.69151.500.93322.500.9938
0.600.72571.600.94522.600.9953
0.700.75801.700.95542.700.9965
0.800.78811.800.96412.800.9974
0.900.81591.900.97133.000.9987

註:這只是正向 Z 值的一部分。完整表會包括負值(從 -4.00 到 0.00)和更多精細間隔(例如每 0.01)。像 Z=1.96 Z = 1.96 Z=1.96 的機率是 0.9750,代表數據低於這個值的機率是 97.5%。


正態分佈的前世今生

正態分佈的歷史很有趣。18世紀,法國數學家德莫ivre在研究賭博問題時發現了它的雛形。到了19世紀,高斯在分析天文觀測誤差時完善了這個分佈,從此它被稱為高斯分佈。後來,統計學家發現許多自然現象都符合這種分佈,它就成了統計學的基石。

時期關鍵人物貢獻
18世紀德莫ivre發現正態分佈的雛形
19世紀高斯完善並應用於誤差分析

正態分佈與高斯分佈

很多人會問:正態分佈和高斯分佈有什麼不同?答案是:沒什麼不同!它們是同一個東西,只是名稱不同。高斯分佈是以高斯的名字命名,但指的都是那個鐘形曲線。


正態分佈的機率怎麼算?

想知道某個範圍的機率(比如 ( P(a < x < b) )),步驟很簡單:

1、用 ( Z = \frac{x – \mu}{\sigma} ) 轉成 Z 值。

2、查 Z 表計算機率。

    例如:假設身高平均值 ( \mu = 165 ) cm,標準差 ( \sigma = 5 ) cm,求 160 到 170 cm 的機率:

    $$ Z_1 = \frac{160-165}{5} = -1 $$

    $$ Z_2 = \frac{170-165}{5} = 1 $$

    查表:( P(-1 < Z < 1) = 0.8413 – 0.1587 = 0.6826 ),也就是 68.26%。


    正態分佈的標準差公式

    標準差 $$ \sigma $$ 衡量數據的分散程度。計算公式如下:

    $$ \sigma = \sqrt{\frac{\sum (x_i – \mu)^2}{n}} $$

    符號意義
    $$ x_i $$ 每個數據點
    $$ \mu $$平均值
    $$ n $$數據總數

    如果是樣本,則除以 ( n-1 )。


    為什麼正態分佈這麼好用?

    正態分佈之所以是統計學的寵兒,有以下原因:

    原因說明
    中心極限定理樣本夠多時,平均值分佈趨近正態分佈。
    對稱性質數學特性簡單,方便計算。
    普遍性自然界很多現象(如身高、智商)接近正態分佈。
    工具支持像 Z 表、T 檢驗等,都是基於正態分佈設計的。

    結語

    正態分佈不僅是數學公式,更是理解世界的一把鑰匙。從它的歷史到應用,從公式到表格,希望這篇文章讓你對它有更深的認識。下次聽到「正態分佈」,你就能自信地說:「我知道那是什麼!」


    你好,我是蔡至誠PG,任職於《阿爾發證券投顧》法人金融處,《我畢業五年,用ETF賺到400萬》作者,《提早五年退休:PG 財經個人財務調配術》講師。

    Back to top button