第十章 決定樣本如何選擇 -...

21
1 第十章 決定樣本如何選擇 中興大學行銷系 黃文仙 2 本章大綱 1. 樣本和抽樣的基本概念 2. 抽樣的理由 3. 機率和非機率抽樣方法 4. 發展樣本計畫

Upload: others

Post on 15-Aug-2020

13 views

Category:

Documents


0 download

TRANSCRIPT

  • 1

    第十章 決定樣本如何選擇

    中興大學行銷系 黃文仙

    2

    本章大綱

    1. 樣本和抽樣的基本概念2. 抽樣的理由3. 機率和非機率抽樣方法4. 發展樣本計畫

  • 2

    3

    樣本和抽樣的基本概念

    母體 (population) 是由專案目標所詳細指定的整個研究群體。研究人員必須非常精確地使用母體的敘述。

    樣本 (sample) 是能夠適當地代表整個群體的母體子集合。

    樣本單位 (sample unit) 是調查的基本單位。例如,以個人或家庭為單位。

    普查 (census) 是清點整個母體。

    4

    樣本和抽樣的基本概念

    抽樣誤差 (sampling error):因為使用樣本所造成研究中的任何誤差,可能是因為樣本選擇的方法或是樣本大小所引起。

    樣本框架 (sample frame):係指在抽樣過程中可供選擇的所有抽樣單位名冊,用來代表母體的名單、索引、地圖或其他紀錄。

  • 3

    5

    樣本和抽樣的基本概念

    樣本框架誤差 (sample frame error):樣本框架無法涵蓋整個母體的程度。

    圖片來源:自由電子報

    6

    抽樣的理由

    經濟性:較普查節省人力和財力資源。

    時效性:即時獲取所需的資訊。

    母體過大:難以作普查。

    難以接觸:有時母體包含一些難以接觸或接近的份子。

    觀察的毀壞性:觀察的行為有時會毀壞被觀察的對象。

    樣本的正確性:普查易流於草率。

  • 4

    7

    機率和非機率抽樣方法

    「已知」機率的本質取決於抽樣方法,而非母體的大小精確度。

    母體的每個元素都有

    已知的機率可以被選

    為樣本

    母體中元素被選為樣

    本的機率是未知的

    非機率抽樣(nonprobability samples)

    機率抽樣(probability sampes)

    8

    機率抽樣

    集群抽樣 (cluster sampling)

    系統抽樣 (systematic sampling)

    簡單隨機抽樣 (simple random sampling)1

    2

    3

    分層抽樣 (stratified sampling)4

  • 5

    9

    機率抽樣:簡單隨機抽樣

    在母體中對每一個個體以隨機的方式抽出,每個個體被抽出的機率相等。

    尾牙餐會的抽獎活動就是簡單隨機抽樣。

    10

    機率抽樣:簡單隨機抽樣

    另一個常用的作法是使用「隨機號碼表」,又稱亂數表,就是依機率法則所編制,使用方法就是選取其中的任幾行或任幾列,直到選出欲抽樣的個數為止。

    隨機亂數表:

    29280 39655 18902 92531 90374 07109 26627 59587 84340 9835120123 82082 55477 22059 43168 12903 13436 25523 21090 7344966405 35287 33248 67657 07702 01474 66068 01125 59258 3013897299 83419 13069 17826 76984 48906 10567 17829 00723 4670083923 92076 98880 33942 46841 58731 36513 16681 88722 6198411258 92175 94894 97606 11134 51941 43733 00514 06694 27706

    隨機亂數表:

    29280 39655 18902 92531 90374 07109 26627 59587 84340 9835120123 82082 55477 22059 43168 12903 13436 25523 21090 7344966405 35287 33248 67657 07702 01474 66068 01125 59258 3013897299 83419 13069 17826 76984 48906 10567 17829 00723 4670083923 92076 98880 33942 46841 58731 36513 16681 88722 6198411258 92175 94894 97606 11134 51941 43733 00514 06694 27706

  • 6

    11

    機率抽樣:簡單隨機抽樣

    優點:每個母體元素都有相同的機率被抽中。

    缺點:

    1. 必須具有完整的母體清單。

    2. 要指定特定代碼或值給每個母體元素,將會非常麻煩。

    12

    機率抽樣:系統抽樣

    較簡單隨機抽樣簡單,只要將母體的每一單位編號,再計算樣本區間,再將第一個樣本單位號碼逐次加上樣本區間,直到樣本數足夠為止。

  • 7

    13

    機率抽樣:系統抽樣(案例)

    母體是2,000家零售店,樣本大小決定為100家商店,則樣本區間為2,000÷100=20,假定從01到20中隨機抽出了03,則樣本單位的號碼依次為3, 23, 43, 63….,直到樣本數達到100家為止。

    14

    機率抽樣:系統抽樣

    優點:

    1. 每個母體元素都有相同的機率被選進樣本2. 有效率…不需要選定每位母體成員3. 較不昂貴…比簡單抽樣來得快速 缺點:樣本框架誤差

  • 8

    15

    機率抽樣:系統抽樣

    一個系統抽樣的樣本通常比一個簡單隨機樣本更具有代表性。

    如上例,可將2,000家零售店依年營業額的大小依序排列編號,則系統樣本將包括不同營業額的零售店(簡單隨機不一定能)。

    16

    機率抽樣:系統抽樣

    但如果母體基本單位的名冊具有周期性的話,則系統抽樣有發生抽樣偏差的可能。如商業電話常喜歡用5,系統抽樣很可能抽到較多的商業電話。

  • 9

    17

    機率抽樣:集群抽樣

    是將母體按某一標準分成幾類群體,各集群要包括母體中的各類性質分子,要讓集體成為母體具體而微的縮小版;然後再對全數的集體,以簡單隨機抽樣取若干集體,對此些集體內的基本單位全數調查。

    區域抽樣為集群抽樣的形式之一:將地理

    區劃分成集群。

    18

    機率抽樣:集群抽樣(案例)

    某公司想調查台北市市民每月消費在甲產品的支出,計畫在所有12個行政區中隨機抽出4個行政區,然後再從被抽出的行政區中隨機抽出一條路(街),然後普查該條路(街)的所有住戶 (如遇街道跨區時,則僅調查屬於該區的住戶) 。這就是集群抽樣。

  • 10

    19

    機率抽樣:集群抽樣

    優點:經濟效率,集群抽樣比簡單隨機抽樣快速,且成本較低。

    缺點:集群規格誤差,當集群間不具相同質性時,即會出現此種問題。

    20

    機率抽樣:分層抽樣

    先將母體的所有基本單位分成若干互相排斥的組或層,然後分別從各組或各層中隨機抽選預定數目的單位為樣本。

    抽樣

    母體 樣本

  • 11

    21

    機率抽樣:分層抽樣

    分層基礎:所謂分層就是要根據母體的某一或某些特徵或變數將母體分成幾層,但到底要以母體的哪些變數做為分層的基礎,則有賴抽樣設計者的經驗和判斷。

    分層的數目:理論上分層的數目愈多愈好,因為層數愈多,每層內的樣本單位愈相似,樣本估計值的精密度愈高,惟基於成本和效率的考慮,分層仍應有限制。

    22

    機率抽樣:分層抽樣(案例)

    某護膚中心共有2700位VIP會員,欲從中抽取120位會員作為樣本,VIP會員中有1620位女性,1080位男性,若用簡單隨機抽樣抽出120位會員,抽出的結果可能女性過多,或男性過多,甚至也可能抽出沒有一個女性,或沒有一個男性。

  • 12

    23

    機率抽樣:分層抽樣(案例)

    若是想調查VIP會員每月花費於肌膚護理的次數和金額,則男女之間的差異就很大,若選取過多女生,這樣就會影響到最後調查的結果。

    24

    機率抽樣:分層抽樣(案例)

    因此最好的方式就是採用分層抽樣,按女男的比列3:2來選取。在女性部分抽取120×0.6=72位,男性部分抽取120×0.4=48位,其次在女性和男性中,利用簡單隨機抽樣分別抽出72人及48人,此120人便構成我們要的樣本。

  • 13

    25

    機率抽樣:分層抽樣

    優點:歪斜母體 (skewed population) 的整體樣本更為準確。

    缺點:抽樣方式較為複雜,每個分層需要

    不同的樣本大小。

    26

    機率抽樣:分層抽樣

    等比例分層樣本:按各層單位數佔母體總單位數的比例來決定各層的樣本數。此可避免各層樣本單位過多或過少的風險,從而減少潛在的抽樣誤差。

    不等比例分層樣本:如果各分層內部的變異性大小不一,則宜採用不等比例的分層樣本,亦即對層內單位的變異性比較大的層抽選比較多的樣本單位,層內變異比較小的層則抽選比較少的樣本單位。

  • 14

    27

    機率抽樣:不等比例分層(案例)

    例如,編製全國零售指數時,由於預期大零售商店在商品銷售上的變異會比小商店為大,因此,大商店的抽樣比例比小商店為高。

    28

    分層抽樣 vs. 簡單隨機抽樣

    分層抽樣與簡單隨機抽樣的區別在於後者是從全體母體中隨機抽選樣本,而前者只從各層中隨機抽樣,二者都需要有完整的母體名冊做為抽樣構架。

  • 15

    29

    分層抽樣 vs. 集群抽樣

    分層抽樣與集群抽樣兩者的差異:

    1. 分層抽樣時,所有的層或群中至少有一個單位被選入樣本中,但在集群抽樣只有部分群或層被選為樣本群。

    2. 分層抽樣只在每一群或層中抽選部分;集群抽樣則在被抽選的群或層中進行普查。

    3. 分層抽樣的目的在減少或消除抽樣偏差,提高樣本估計值的考靠性;集群抽樣的目的在減低抽樣的成本。

    30

    非機率抽樣

    推薦抽樣 (referral samples)

    判斷抽樣 (judgment samples)

    便利抽樣 (convenience samples)1

    2

    3

    配額抽樣 (quota samle)4

  • 16

    31

    非機率抽樣

    相對於機率抽樣,非機率抽樣法是憑主觀的判斷選擇樣本,樣本選中機率無法以統計機率理論計算。

    樣本代表性不夠及無法計算抽樣誤差,是非機率抽樣的主要兩項缺失。

    但其支出的成本較低,運用較方便,因此亦不失為廣泛利用的抽樣方法。

    32

    非機率抽樣:便利抽樣

    以便利為基礎的一種抽樣方法,樣本的選擇只考慮到接近或衡量的便利。

  • 17

    33

    非機率抽樣:判斷抽樣

    係根據抽樣設計者的判斷來選擇樣本單位,設計者必須對母體的有關特徵具有相當的了解。

    極易產生抽樣誤差。

    適用於母體的構成單位極不相似而樣本數又較少的情況。

    34

    非機率抽樣:判斷抽樣

    例如,在探索性研究中,專家的選擇就是一種判斷抽樣。焦點團體研究也常使用判斷抽樣,亦即研究者依個人經驗是否合乎研究需求為標準,來選擇受訪者。

  • 18

    35

    非機率抽樣:推薦抽樣

    有時又稱為滾雪球抽樣,研究人員一開始先編輯一份簡短的回應者清單,在訪談過每位回應者後,請他們推薦可能參與研究的名單。

    36

    非機率抽樣:配額抽樣

    建立一個特定的分額(或是總樣本的一個比率)來進行訪談。

    配額是透過研究目標所決定,並藉由確認母體的重要特色所定義。

  • 19

    37

    非機率抽樣:配額抽樣

    配額抽樣通常是由想要抓緊某些特色消費者的公司在進行特殊的行銷研究專案時所使用。

    配額抽樣可以減少便利樣本較不具代表性的問題。

    38

    配額抽樣 vs. 分層抽樣

    配額抽樣和分層抽樣有相似之處,二者都是將母體細分成若干子母體,然後把總樣本數分配到各子母體。

    二者的區別在於如何抽選各子母體中的樣本單位:分層抽樣時,樣本單位系以隨機抽樣方法從各層中抽選,但在配額抽樣時,訪問員有較大的自由去選擇子母體中的樣本單位,訪問員只要完成配額即可。

  • 20

    39

    發展樣本計畫

    樣本計畫 (sample plan):一個連續的步驟,研究人員可以遵循該計畫,取得最終的樣本。

    定義母體

    定義母體

    獲得母體清單

    獲得母體清單

    設計樣本計畫

    設計樣本計畫

    抽取樣本

    抽取樣本

    樣本驗證

    樣本驗證

    如果必要時,再次抽樣

    如果必要時,再次抽樣

    40

    如何替換樣本

    當有人滿足資格且成為樣本,卻不願意參與調查時,就會發生替換的問題。

    在實務上有三種替換的方法:

    向下替換 (drop-down substitution)

    過度抽樣 (oversampling)

    再次抽樣 (resampling)

  • 21

    41

    如何替換樣本

    打給名單上的下一位。使用時,訪談者必需有完整的樣本框架。

    向下替換

    過度抽樣

    如果知道無回應率為何,則可以推算應該要多寄多少份數,才能達到想要的樣本大小。

    在抽出第一次的樣本後,對樣本框架再抽一次,此時回應率會更低。

    再次抽樣

    42

    資料來源

    Alvin C. Burns and Ronald F. Bush (2009), Marketing Research, 6th edition, Pearson.

    黃俊英 (2008),行銷研究-管理與技術,八版,華泰書局。