一、 統計學概論〈共 25 題單選題,佔 50%85xb4y8f-33uk-3jr1-o0ru... · 一、...

13
科目:統計學分析與應用 一、 統計學概論〈共 25 題單選題,佔 50%1. 若資料之相對次數呈現對稱的圖形,請問下列敘述何者為真? A)平均數接近 0 B)中位數接近 0 C)平均數與眾數非常相近 D)平均數與中位數非常相近 2. 下列有關紀錄資料的變數,性別、出生地、婚姻狀況、政黨傾向、受教育年數、 所得級別(低、中、高)等屬性的敘述,何者為真? A)數值變數比類別變數多四個 B)數值變數比類別變數多二個 C)數值變數比類別變數少二個 D)數值變數比類別變數少四個 3. 某資料集有 1068 筆資料,其中一整數數值變數的樣本偏態係數(Coefficient of Skewness)為3.08。請問該資料集的平均數、中位數與眾數的順序關係為何? A)中位數<眾數<平均數 B)平均數<中位數<眾數 C)眾數<平均數<中位數 D)三者沒有一定的順序關係 4. 假設某問卷的第一題為填答者的政黨傾向, 題目中共有 5 個選項供填答者勾選且 只能勾選其中一個, 請問以下哪一個圖表不適合用來展現此題的問卷結果? A)直方圖 B)圓餅圖 C)累積次數分配表 D)次數分配表 5. 以下哪一種統計量,能比較兩組資料之變異程度的差異? A)全距 B)變異數 C)四分位距(IQRD)變異係數(Coefficient of Variation1 頁,共 12

Upload: others

Post on 22-Jun-2020

8 views

Category:

Documents


0 download

TRANSCRIPT

  • 科目:統計學分析與應用

    一、 統計學概論〈共 25 題單選題,佔 50%〉

    1. 若資料之相對次數呈現對稱的圖形,請問下列敘述何者為真? (A)平均數接近 0 (B)中位數接近 0 (C)平均數與眾數非常相近 (D)平均數與中位數非常相近

    2. 下列有關紀錄資料的變數,性別、出生地、婚姻狀況、政黨傾向、受教育年數、

    所得級別(低、中、高)等屬性的敘述,何者為真? (A)數值變數比類別變數多四個 (B)數值變數比類別變數多二個 (C)數值變數比類別變數少二個 (D)數值變數比類別變數少四個

    3. 某資料集有 1068 筆資料,其中一整數數值變數的樣本偏態係數(Coefficient of

    Skewness)為–3.08。請問該資料集的平均數、中位數與眾數的順序關係為何? (A)中位數

  • 中華應用統計學會 2018 年第一回資料科學專業能力認證

    6. 樣本平均數與樣本變異數的性質,下列何種敘述為真?

    (A)樣本平均數不可能為負,樣本變異數不可能為負 (B)樣本平均數可能為負,樣本變異數不可能為負 (C)樣本平均數不可能為負,樣本變異數可能為負 (D)樣本平均數可能為負,樣本變異數可能為負

    7. 下列有關統計量之敘述,何者錯誤?

    (A)平均數、眾數、中位數、中距,屬集中趨勢統計量,適用於量化資料 (B)全距、變異數 標準差,屬分散程度統計量數,適用於名目尺度資料 (C)四分位數、十分位數、百分位數,屬位置統計量,為資料位置之合適測量

    值 (D)繪製盒狀圖,需要用第一、第二、第三四分位數

    8. 以下何者是相對次數機率(又稱為實證機率)的理論基礎?

    (A)中央極限定理 (B)大數法則 (C)貝氏定理 (D)柴比雪夫不等式

    9. 隨機變數 X 為 25=n , 36.0=p 的二項分配,令 X 之期望值為µ,標準差為σ ,

    則: (A) 9=µ 、 4.2=σ (B) 9=µ 、 76.5=σ (C) 3=µ 、 76.5=σ (D) 5=µ 、 4.2=σ

    10. 假設某隨機變數(X)服從二項分配,則以下論述何者錯誤?

    (A)X 的最小值是 0 (B)X 的最大值是有限整數 (C)期望值 E(X)是連續型數值 (D)X 是連續型隨機變數

    11. 以下那一個機率分配最適合以常態分配近似之?

    (A)n=5;p=0.01 之二項分配 (B)平均數為 1 之卜瓦松分配 (C)自由度為 200 之 t 分配 (D)自由度為 1 之卡方分配

    第 2 頁,共 12 頁

  • 科目:統計學分析與應用

    12. 若 Z 為標準常態分配,請問 P(|Z|>1)為何?(四捨五入至小數點第二位)

    (A)0.16 (B)0.32 (C)0.68 (D)0.84

    13. 假設小老鼠的壽命為具常態分配,平均壽命為 5 年,標準差 2 年。現有三隻小老

    鼠,請問此三隻小老鼠的壽命都大於平均壽命之機率為何? (A)0.0625 (B)0.125 (C)0.25 (D)0.5

    14. 百貨公司化妝品櫃員之月銷售業績為一常態分配,月平均業績為 200 萬、標準差

    為 50 萬。假設小云是公司化妝品櫃員之一,她本月銷售業績會超過 315 萬之可能性為何? (A)0.0107 (B)0.0207 (C)0.0307 (D)0.0407

    15. 在小樣本的條件下,樣本平均數的抽樣分配是?

    (A)常態分配 (B)標準常態分配 (C)t 分配 (D)條件不夠無法判斷

    16. 對於信賴區間的敘述,下列何者有誤?

    (A)在樣本數固定,增加信賴係數,增加區間估計的精確度 (B)在樣本數固定,增加信賴係數,區間長度變長 (C)在變數固定,增加樣本數,區間長度變短 (D)信賴係數是指欲推估參數會落在信賴區間的機率

    第 3 頁,共 12 頁

  • 中華應用統計學會 2018 年第一回資料科學專業能力認證

    17. 下列有關估計之敘述,何者為真?

    (A)樣本平均數屬推論性統計 (B)信賴區間為區間估計值,屬敘述性統計 (C)推估母體平均數之信賴區間,需先預知母體所屬之分配;當分配未知,則

    無法推估母體平均數 (D)比例屬二項分配,當 np 與 nq 等於或大於 5 時,二項分配較對稱,因此在

    大樣本下,可以常態分配推估母體比例

    18. 下列有關型 I 錯誤率 α,型 II 錯誤率 β與樣本數 n 之間關係的敘述,何者為真? (A)n 增加時,α與 β同時增加 (B)n 增加時,α增加,β減少 (C)n 增加時,α減少,β增加 (D)n 固定不動時,α增加,β減少

    19. 設 1 2 24( , , , )X X XL L 與 1 2 18( , , , )Y Y YL L 分別為取自兩常態母體 N(µx, σ2X)與

    N(µy, σ2y )的隨機樣本,且其樣本平均數分別為 X 、Y ,樣本變異數分別為 S2x 與S2Y。設 120X = , 112Y = ;S2x=160,S2Y=200,在顯著水準為 0.05 時檢定假設 H0:µX=µY vs H1:µX≠µY,則檢定統計量為何?(小數第 2 位以下四捨五入) (A)1.81 (B)1.88. (C)1.91 (D)1.93

    20. 為建立兩母體變異數比, 21σ /

    22σ ,的 90%信賴區間,分別由兩母體隨機抽取樣

    本,樣本數為 10 與 12。如果樣本變異數為 515 與 920,則信賴上界為何? (A)1.539 (B)1.623 (C)1.723 (D)1.825

    21. 在變異數分析中,組間平方和(Sum of Squares Between Groups)除以組內平方和

    (Sum of Squares Within Groups)的機率分配與下列哪一個分配成比例? (A)常態分配 (B)F 分配 (C)卡方分配 (D)t 分配

    第 4 頁,共 12 頁

  • 科目:統計學分析與應用

    22. 一成對樣本資料(X,Y)之散佈圖呈現絕對遞減,則下列何者為真?

    (A) YX > (B)樣本相關係數必為-1 (C)樣本等級相關係數必為-1 (D)如建立一迴歸模型,判定係數 R2 值必為 1

    23. 配適一條簡單迴歸模式Y=β0+β1X+ε,共取得150筆資料, 150=X , 85=Y ,

    20)( 2∑ =− XX , 2000)( 2 =−∑ YY , ∑ −=−− 180))(( YYXX 。請問ANOVA表內,MSR為多少?

    (A)16.2 (B)180 (C)810 (D)1620

    24. 衡量反應變數 Y 與解釋變數 X 的樣本相關係數 r 的範圍,下列何者正確?

    (A)0≤r≤1 (B)-1≤r≤1 (C)0≤r≤100 (D)1≤r≤100

    25. 假設一簡單線性迴歸之判定係數 R2=1,則 SSE 應為?

    (A)0 (B)1 (C)必為正數 (D)必為負數

    SOURCE DF SS MS F-VALUE P-VALUE MODEL a SSR MSR F

  • 中華應用統計學會 2018 年第一回資料科學專業能力認證

    二、 統計學實務〈共 25 題單選題,佔 50%〉

    1. 某研究機構欲針對全國之觀光飯店,進行一項觀光問卷調查,試問下列何者錯誤? (A)全國所有觀光飯店為此調查之母體 (B)若從全國所有觀光飯店中,抽出 30 家調查,此即為樣本 (C)若針對全國所有觀光飯店作調查,此即為普查,由分析結果可作為推論統

    計之基礎 (D)問卷中調查之項目,如飯店類型、員工人數、房間數、營業收入等為分析

    之隨機變數

    2. 有關於資料轉換, 下列何者正確? (A)順序尺度可轉換成名目尺度 (B)區間尺度可轉換成順序尺度 (C)區間尺度可轉換成名目尺度 (D)以上皆是

    3. 以下那一種抽樣方法最能取得具有代表性的樣本?

    (A)簡單隨機抽樣 (B)滾雪球抽樣 (C)分層隨機抽樣 (D)系統隨機抽樣

    4. 大聰明公司目前每日生產十種不同款式腳踏車各 100 輛, 若總經理想削減賣得最

    差的車款以減少存貨壓力, 請問總經理可根據以下何種統計量來調整? (A)眾數 (B)全距 (C)四分位距 (D)標準差

    第 6 頁,共 12 頁

  • 科目:統計學分析與應用

    5. 某軟體開發商研發一套運動賽事的預測系統,開發商想瞭解使用者對便利網站視

    覺與操作設計的滿意度,隨機抽取 50 位使用者來調查其滿意度,變數包含 1.網路格局符合要求 2.網路以台灣運彩賠率做為下注賠率,符合你的預期。問項包含非常不同意、不同意、尚可、同意、非常同意,開發商順便詢問使用者基本資料、

    性別、年歲(單位:歲)、教育程度、及職業類別,其中教育程度總共有 5 個選項:國小(含)以下、國中、高中/職、大專/大學、研究所(含以上),而職業類別包含 4個選項分別為學生、服務業、軍公教與其它。試問以下何者不適合用來摘要年齡

    的變異? (A)相關係數 (B)變異係數 (C)四分位距 (D)全距

    6. 小明想瞭解台灣各主要城市每日氣溫的變化過程,故資料必須依據下列何者進行

    排序? (A)城市 (B)氣溫 (C)日期 (D)國家

    7. 若全班 10 位同學的平均分數可以完美的預測班上的每一位同學的考試成績,則代

    表? (A)樣本變異數=1 (B)樣本標準差=0 (C)每位同學的成績與平均分數的差異平方和=1 (D)平均分數=0

    8. 以下哪一個敘述顯示,隨機變數 X 的變異程度大於隨機變數 Y?

    (A) 2 25, 9; 3, 8X YX s Y s= = = = (B) 2 230; 8X Ys s= = (C) 2 22, 16; 10, 64X YX s Y s= = = = (D) 2 25, 16; 4, 10.24X YX s Y s= = = =

    第 7 頁,共 12 頁

  • 中華應用統計學會 2018 年第一回資料科學專業能力認證

    9. 以下之為 20 位同學之統計學期中考成績的次數分配表,則樣本變異數為?

    組別 組界 組中點(𝑥𝑥𝑖𝑖) 次數(f𝑖𝑖)

    2 50-60 55 5 3 60-70 65 10 4 70-80 75 5

    (A)52.63 (B)90.02 (C)101.45 (D)103.89

    10. 一噴射機有 4 個引擎,每個引擎的故障率均為 0.01,且每個引擎故障之事件均互

    相獨立。若只要有兩個引擎可以正常運作,則此噴射機即可以安全飛行。令 p 表此噴射機可以安全飛行的機率,則:

    (A) 999996.0999995.0

  • 科目:統計學分析與應用

    13. 某公司從其產品線中隨機抽取 20 個樣本,樣本平均數 X =5,樣本變異數 2s =0.81。若想使母體平均數之估計誤差小於 0.1 的機率為 0.90,則總樣本數應至

    少為多少?假設母體為常態分配。 (A)220 (B)221 (C)223 (D)224

    14. 隨機抽 104 個家庭詢問「家裡是否有電腦」及「今年暑期是否會全家出遊」,得到

    下表: 今年暑期是否會全家出遊

    是 否 可能 合計 家裡是否

    有桌上型

    電腦

    是 37 2 6 45 否 40 18 1 59 合計 77 20 7 104

    請估計「家中有桌上型電腦」在 90%的信心水準下之雙尾信賴區間下限為何?(計算到小數點第二位,四捨五入) (A)0.33 (B)0.35 (C)0.51 (D)0.53

    15. 小陳想要估計全校學生身高的變異數,假設已知身高資料服從常態分配,則小陳

    可根據何種抽樣分配,建立母體變異數的 95%信賴區間? (A)F 分配 (B)卡方分配 (C)Z 分配 (D)t 分配

    16. 若兩個獨立隨機樣本來自獨立的常態母體,樣本數分別為 16 與 25,變異數分別

    為 9 與 4,則兩個樣本平均數之差異的標準差為?假設兩母體之變異數相等。 (A)0.607 (B)0.725 (C)0.779 (D)1.594

    第 9 頁,共 12 頁

  • 中華應用統計學會 2018 年第一回資料科學專業能力認證

    17. 為估計民眾對消費券的支持度,隨機以電話訪問 800 人,調查結果顯示 77%的民

    眾支持消費券的發放。若以此結果估計民眾對消費券的支持度,在 95%的信心水準之下,該估計量的抽樣誤差為何? (A)0.0268 (B)0.0292 (C)0.0316 (D)0.0340

    18. 以下何種論述屬於對立假說(Alternative Hypothesis)的內容?

    (A)年齡與薪資不具有線性相關 (B)成年人的平均體重至少 60 公斤 (C)小學生的平均身高矮於 150 公分 (D)統計學成績的變異數是 50

    19. 小文想知道二種行銷策略對網購行為的影響, 檢定結果無法拒絕虛無假設: 二種策

    略對網購行為沒有影響. 如果跟據行銷理論, 第二種策略應該比較有效, 請問以下說明何者有誤? (A)可能是兩種行銷策略造成的差異很小 (B)增加樣本數可增加檢定力 (C)提高型一過誤率可增加拒絕虛無假設的機率 (D)可以嘗試檢定力較大的檢定方法

    20. 小文國小二年甲班有 25 名學生,有學過鋼琴社者 12 位,有參加足球隊者 8 位,

    同時學過鋼琴且參加足球隊者 3 位。請問學鋼琴與參加足球隊是否獨立? (A)檢定統計量為卡方分配, 自由度為 3, p 值大於 0.05 (B)檢定統計量為卡方分配, 自由度為 2, p 值大於 0.05 (C)檢定統計量為卡方分配, 自由度為 1, p 值大於 0.05 (D)資料不足, 無法判定

    21. 若想檢定消費者在觀看過某一廣告後,其購買意願是否有顯著之改變,下列哪一

    個敘述是錯誤的? (A)若以每一個人觀看此一廣告前、後之購買意願的差異進行檢定,是屬於成

    對樣本(Matched Sample)設計 (B)若比較實驗組與控制組之差異,應採獨立樣本(Independent Sample)檢定 (C)一般而言,若顯著水準相同,成對樣本設計的自由度較小,其臨界值小於

    獨立樣本設計的臨界值 (D)若要求樣本估計值的標準誤相等,則成對樣本設計的信賴區間,大於獨立

    樣本設計的信賴區間

    第 10 頁,共 12 頁

  • 科目:統計學分析與應用

    22. 消費者基金會抽查市面上兩種品牌之飲料的容量是否有差異,各隨機抽取 40 個樣

    本。第一個品牌之平均數為 25.5,變異數為 1.04。第二個品牌之平均數為 20.3,變異數為 1.05。下列哪一敘述是正確的。 (A)應以 t 統計量進行雙尾檢定 (B)若以 95%的信賴區間進行檢定,第一個品牌之平均容量顯著高於第二個品

    牌 (C)在以 t 統計量進行檢定前,應先以 F 統計量檢定兩母體之變異數是否有顯著

    差異 (D)除非兩種飲料之容量的母體分配為常態分配,否則無法確定應以何種統計

    量進行檢定

    23. 某大學宣稱該校教師平均每天用在吃午飯的時間不超過 40 分鐘,該校統計系一位教師不相信此說法,因此決定進行統計檢定。他隨機訪問了 12 位教師並紀錄他們吃午飯所用的時間,由計算得知,平均值為 37.5 分,標準差為 3 分。假設教師吃午飯所用的時間服從常態分配,請問在 5%的顯著水準下,此檢定的臨界值為何? (A)-1.645 (B)1.645 (C)-1.796 (D)1.796

    24. 某飲料商在試飲會後對部分消費者抽查他們對該飲料的看法與性別的關係如下

    表。欲檢定「對該飲料的看法」與「性別」間是否獨立,在顯著水準α=0.05 下的檢定統計量之臨界值為?

    喜歡 不喜歡 無意見

    男性 50 40 10

    女性 30 50 20

    (A)χ20.05(2) (B)χ20.025(2) (C)χ20.05(5) (D)χ20.025(5)

    第 11 頁,共 12 頁

  • 中華應用統計學會 2018 年第一回資料科學專業能力認證

    25. 某保險公司隨機抽樣調查分析之結果發現,過去兩年中,400 個年輕保險客戶中

    有 76 個要求保險賠償,800 個中老年保險客戶中有 84 個要求保險賠償。該保險公司想在α=0.05 檢定年輕保險客戶的求償比例( 1P )與中老年保險客戶的求償比例( 2P )是否有顯著差異。下列哪一個敘述是錯誤的? (A)虛無假設(Null Hypothesis) 0: 210 =− PPH (B)檢定統計量之變異數為 0.595 (C)標準化臨界值為 025.0Z− 與 025.0Z (D)若虛無假設(Null Hypothesis)為 0: 210 =− PPH ,則 95%的信賴區間為

    ﹙0.05,0.12﹚

    第 12 頁,共 12 頁

  • 科目:統計學分析與應用

    2018 年第一回 CASA 資料科學專業能力認證

    統計分析能力證照 試題解答

    第一節科目:統計學分析與應用 答案

    1 2 3 4 5 6 7 8 9 10

    (D) (D) (B) (A) (D) (B) (B) (B) (A) (D)

    11 12 13 14 15 16 17 18 19 20

    (C) (B) (B) (A) (D) (A) (D) (D) (D) (B)

    21 22 23 24 25 26 27 28 29 30

    (B) (C) (D) (B) (A) (C) (D) (C) (A) (A)

    31 32 33 34 35 36 37 38 39 40

    (C) (B) (C) (A) (B) (A) (C) (A) (B) (B)

    41 42 43 44 45 46 47 48 49 50

    (C) (B) (C) (C) (C) (C) (B) (C) (A) (B)

    第 13 頁,共 12 頁