蘇格蘭與英格蘭小學階段 之國家考試的比較研究 - ntue.edu.tw · 2010. 10. 14. ·...

22
國立台北師範學院學報,第十四期(九十年九月)3556 國立台北師範學院 35 蘇格蘭與英格蘭小學階段 之國家考試的比較研究 吳麗君 本文以國家考試為焦點,比較分屬南北的英格蘭與蘇格蘭在國家考試這一 個機制上的異同,在南北進行對話與詮釋之後,鍛鍊出觀照本土的智慧。 在前言之後,第二部分的脈絡分析,採漸進方式慢慢逼入核心,首先鳥瞰蘇 格蘭與英格蘭,然後進入教育系統的並列與排比,最後則比較英國南、北兩地的 小學課程。 第三部分進入核心議題-國家考試-的南北對話,比較的面向含制度及國家考 試發展的歷程。第四部分則站在本土的考量,以蘇格蘭及英格蘭經驗為主提問兩 個問題:第一,在小學階段需要國家考試嗎?第二,宜建構什麼型態的國家考試? 全文最後提出本研究的限制以及未來的展望作為代結語。 關鍵詞:國家考試/國家課程評量、評量的改革、5-14 課程方案、蘇格蘭/ 英格蘭的教育 吳麗君:初等教育學系副教授

Upload: others

Post on 01-Sep-2020

6 views

Category:

Documents


0 download

TRANSCRIPT

  • 國立台北師範學院學報,第十四期(九十年九月)35~56 國立台北師範學院 35

    蘇格蘭與英格蘭小學階段 之國家考試的比較研究

    吳麗君∗

    摘 要

    本文以”國家考試”為焦點,比較分屬南北的英格蘭與蘇格蘭在國家考試這一個機制上的異同,在南北進行對話與詮釋之後,鍛鍊出觀照本土的智慧。

    在前言之後,第二部分的脈絡分析,採漸進方式慢慢逼入核心,首先鳥瞰蘇

    格蘭與英格蘭,然後進入教育系統的並列與排比,最後則比較英國南、北兩地的

    小學課程。

    第三部分進入核心議題-國家考試-的南北對話,比較的面向含制度及國家考

    試發展的歷程。第四部分則站在本土的考量,以蘇格蘭及英格蘭經驗為主提問兩

    個問題:第一,在小學階段需要國家考試嗎?第二,宜建構什麼型態的國家考試?

    全文最後提出本研究的限制以及未來的展望作為代結語。

    關鍵詞:國家考試/國家課程評量、評量的改革、5-14 課程方案、蘇格蘭/

    英格蘭的教育

    ∗ 吳麗君:初等教育學系副教授

  • 36 國立台北師範學院學報,第十四期

  • 國立台北師範學院學報,第十四期(九十年九月)35~56 國立台北師範學院 37

    蘇格蘭與英格蘭小學階段 之國家考試的比較研究

    吳麗君∗

    壹、前言

    雞蛋孵化時,小雞在裡邊啐,母雞在外邊啄,若啐啄同時,小雞便得脫殼而

    出。而這個研究之醞釀也拜兩股力量的啐啄,一股來自於評量這個學術領域的典

    範轉移;另外一股力量則是教育改革對於評量的重視。評量在教育的舞台上已經

    成為鎂光燈追逐的焦點,因此本研究以英國的小學階段為範圍,探討英格蘭與蘇

    格蘭在上一個世紀末評量改革的重頭戲—國家考試,藉由異文化的觀照反身檢視

    我國的評量。本文第二部份的脈絡比較採取逐步對焦的方法,首先鳥瞰、比較英

    格蘭與蘇格蘭,然後進入教育制度,接著則比較蘇格蘭與英格蘭的國家課程。本

    文第三部分進入英格蘭與蘇格蘭國家考試的南北對話;第四部分試圖以本土的觀

    點萃取智慧。最後則以研究的限制與展望作為代結語。 本文以國家考試為題,因為蘇格蘭地區的官方文件一向使用國家考試

    (national test)這個用語。在英格蘭地區則使用國家課程評量乙詞,但是 1993 年之後英格蘭地區國家課程評量中的 SATs 從原先的 Standard Assessment Tasks 進一步轉變成為 Standard Tasks and Tests(但是在一般文章的討論及中、小學裡老師則依然習慣地稱呼它為 SATs),此外並進一步減少了歷程性的活動,數學和科學也以書面方式(worksheet-based)取代活動性的評量(吳麗君,1999)。在這個轉變裡我們除了見証考試文化的頑強,也得知在英格蘭的國家課程評量中仍然含有濃厚的

    考試文化。雖然英格蘭地區多數使用國家課程評量(national curriculum assessment)

    ∗ 吳麗君:初等教育學系副教授

  • 38 國立台北師範學院學報,第十四期

    乙詞,但也有使用國家考試(national test) 這個用語的。Broadfoot 等(1996)雖然區辨只重視紙筆的考試文化以及以學習為核心的評量文化,但本文的焦點主要為國

    家層級的機制,尤其比較的範圍跨英格蘭與蘇格蘭,所以採用國家考試為題。此

    外,P.Black (2001, p.66)認為形成式評量與總結性評量的區隔與二分,多少可以使用「評量」及「考試」這兩個不同的用語來加以反映。而英國國家層級的考試在

    性質上當然具有總結性評量的色彩,因此全文的標題採用「國家考試」,唯在文

    內則不刻意區分評量與考試這兩個語彙,有時甚至以交換互用的方式呈現。

    貳、脈絡的比較

    教育改革的研究顯示:在某些情況下能奏效的改革,並不代表在其他情境也

    同樣的有效( Fullan, 1991 )。這個研究的智慧把我們的思考由線性的天真模式擴展

    為非線性的複雜樣態。同時也提醒研究者,必須將注意力放在複雜動態的脈絡因

    素上。此外,在比較教育的研究傳統中,整全性及脈絡的探討向來都受到重視,

    正如二十世紀初英國的比較教育學者 M. Sadler 所說「學校外的事務比學校內的

    事務更為重要,它支配並解釋學校內的事情」(王家通,1997;吳文侃、楊漢清,

    1992)。運用相同的邏輯來觀看本研究,可以說「課程改革的外在脈絡比課程改革更重要,它支配並解釋改革」。易言之,如果要從這個比較研究中萃取出智慧

    以滋養本土,則不能忽略脈絡的了解。

    一、蘇格蘭與英格蘭之鳥瞰

    表 2-1 蘇格蘭與英格蘭之基本資料比較

    蘇格蘭 英格蘭

    人口 約五百萬

    2/3 居住於都市地區

    約四千八百九十萬人(佔全英人口

    的 83%)

    土地面積 77, 080 平方公里

    (29, 750 平方英哩)

    130, 423 平方公里

    (50, 356 平方英哩)

    製表主要資料來源包括:Clark, 1997; Encarta Encyclepedia, 2000 等

  • 蘇格蘭與英格蘭小學階段之國家考試的比較研究 39

    蘇格蘭的人口大約有五百萬(全英國的人口大約是五千八百萬),而其中約

    98%左右是白種人。少數民族以巴基斯坦人居首位,其次是華人。英格蘭的人口

    是蘇格蘭人口的九倍強;面績大約是蘇格蘭的兩倍。愛丁堡是蘇格蘭的首府,目

    前蘇格蘭雖然已經擁有國會,但全英國的首府倫敦仍是最高的權力中心之所在。

    二、蘇格蘭與英格蘭基本教育脈絡之比較 有系統而完整地比較英格蘭與蘇格蘭的教育系統之研究並不多見,尤其在上

    一個世紀末(2000),威爾斯、蘇格蘭與北愛爾蘭紛紛成立了當地的國會(Welsh Assembly, Scottish Parliament and Northern Ireland Assembly),可以預見其教育的未來發展必然更分歧、更多元。因此,從時間推移的角度來看,目前著手進行比較

    的研究,相當具有歷史性的意義。站在英國的系統之內,一個局內人會告訴你蘇

    格蘭和英格蘭有非常不同的歷史文化傳統,教育系統也大相逕庭,例如 Clark(1997)的研究就是其中一個典型的例子。但是如果把蘇格蘭與英格蘭的比較放入國際的

    視野之中,則很清楚可以看到兩個系統的確有諸多相似之處(Raffe, 2000)。蘇格蘭與英格蘭在政經上的相互依賴,以及在時間的推移中二者的關係的改變等,都是

    在比較之前值得放入視野的。

    英格蘭與蘇格蘭於 1707 年統一,但蘇格蘭一直擁有其獨立的法律系統,保

    有自己的教會,獨立的教育體系並且發行自己的鈔票 。1999 年 5 月 6 日蘇格蘭

    並進一步擁有屬於自己的國會(Parliament) (Encarta Encyclopedia, 2000)。蘇格蘭在傳

    統上非常重視教育,也十分自負於他們高品質的教育(Hunter, 1968),遠在十九世

    紀時教會學校就非常發達,1872 年教育的管轄權由教會手中讓渡到世俗的組織─

    ─一個選舉而產生的學校委員會,該委員會提供蘇格蘭兒童從 5 歲到 13 歲的教

    育,1901 年又延長至 14 歲,比英格蘭和威爾斯早了 17 年有該項創舉。1918 年成

    立地方教育當局來取代學校委員會,而且中學也規定成為義務教育(mandatory)。

    1947 年學生離校年齡又延長至 15 歲,1972-1973 年間則延長至 16 歲(Encarta

    Encyclopedia, 2000) 。

    從教育的角度來看蘇格蘭具有下面兩項特色:

    (一)從整個英國來看,蘇格蘭人口分布的情形非常的零星而疏散,因此在蘇

    格蘭有許多郊區的小學校,有的教育當局轄下所有的小學其學生數都只比一百人

    多一點兒,並且擁有許多混齡的班級,甚至有一百多所小學的學生人數在 20 人上

    下(Margaret, 1997, p.7),學生人數會影響到經濟規模,學校規模越小,學生的教育

    單位成本就越高。此外,也會影響到學校的資源,因此諸多學校在採用 5-14 課程

  • 40 國立台北師範學院學報,第十四期

    方案時以小組的方式進行,以便各校之間相互支援,共同承擔一些工作負荷

    (MaLColm & Schlapp, 2000, p.2) 。 (二)蘇格蘭地區人民的貧窮程度相對於英國而言也相當的高,依據 1995 年的

    資料顯示:平均 20%的學生可以免費享用學校的午餐,有些地區甚至高達 40%,

    如 Glasgow,而邊境地方則因為拜石油產業之賜,免費享用學校午餐的比率較低,

    有的地方只有 6%。

    蘇格蘭的學制與英格蘭略有不同,小學的就讀年限七年,由 5 歲至 12 歲。

    前期中等教育由 12 歲至 16 歲,16 歲之後繼續留在學校就讀的比例,在蘇格蘭地

    區遠比在英格蘭地區來得高,但蘇格蘭沒有第六級學程(或稱預科)(sixth form)。

    此外,學生所參加的資格考,其設計亦不同於英格蘭地區(Raffe, 1997)。就綜合

    中學的傳統來看,其普及率高達 100%,遠比英格蘭徹底而深入。這與蘇格蘭不喜

    分流的價值觀有關聯。以下是蘇格蘭與英格蘭之基本教育圖像的比較。

    表 2-2 蘇格蘭與英格蘭之基本教育圖像的對照

    蘇格蘭 英格蘭

    中央教育部門 蘇格蘭執行教育部

    Scottish Executive Education Department

    教育與就業部

    (Department for Education and Employment,簡稱 DfEE)

    小學的校數 約 2300 所(沒有中間學校) 1 約 20000 所(有中間學校) 小學就讀年限 5-12 歲 5-11 歲 視導單位 由皇家督學(HMI)視導

    沒有教育標準局(OFSTED) 2由教育標準局(OFSTED)進行視導工作

    學校結構 七年的小學教育及至少四年的中學教育

    六年的小學教育及至少五年的

    中學教育

    班級大小 每班法定最高人數 33 人 沒有法定最高人數限制

    學校預算 除教師薪水外,經費由學校管理 包含教師薪水均由學校管理

    學校管理 學校委員會的功能較弱 學校管理委員會的功能較強

    製表主要資料來源包括:Clark, 1997; Encarta Encyclopedia, 2000 等

    1 中間學校:招收的學生年齡由 8、9 歲至 12、13 歲左右。在制度上的劃分屬於小學還是

    中學則視該校大多數的學生年齡是超過 11 歲還是在 11 歲之下而定。 2 教育標準局(OFSTED):Office for standards in education 的簡稱,英格蘭地區的皇家督學於

    1992 年的 9 月改組,目前以 OFSTED 見稱。

  • 蘇格蘭與英格蘭小學階段之國家考試的比較研究 41

    三、課程架構的比較:5–14 課程方案 vs 國定課程 英格蘭地區的學校在國家課程頒布之前,理論上可以自行決定課程與目標,

    唯這種專業自主從 1960 年代之後就已經開始遭到質疑。1988 年教育改革法案中的

    國家課程則以分水嶺之姿,使密秘花園從此洞開。為了促使國家課程落實並提昇

    教育水準更進一步有了國家課程評量的設計。換言之,國家課程評量是英國 1988

    年教育改革中的監控機制。

    1988 年頒布之國家課程強調兒童學習的均衡、廣度與銜接性。1999 年之最新

    修訂,則更進一步勾勒了學校課程的兩項目標與國家課程的四個目的,依據此一

    最新修訂,英格蘭地區之學校課程的兩項目標分別是:(一)、學校課程必須提供

    所有學生學習與成就的機會。(二)、學校課程必須促進學生在精神、道德、與社

    會、文化方面的發展,並且為學生做好回應生活機會、生活責任與生活經驗的準

    備。至於國家課程這一個架構的主要目的有四,它們是:

    (一)授予學生接受國家課程中之各項學習的資格(To establish an entitlement)

    (二)建立全國性的學生表現標準(To establish standards)

    (三)促進課程的銜接與連貫性(To promote continuity and coherence)

    (四)促進大眾對於學校教育的了解(To promote public understanding) ( DfEE,

    1999, pp.12-13)

    蘇格蘭地區的 5-14 課程方案不同於英格蘭的國家課程,它只是一種建議性的綱要,而沒有強制的性質。在這種姿態之下可以解讀出蘇格蘭的中央與地方仍維

    持較強的夥伴關係,而不像英格蘭具有比較濃厚的中央集權以及行政官僚色彩,

    從課程這一個窗口可以隱約看到英國南北兩地不同的政治風貌。從另一個角度來

    看,也見証了政治脈絡對於課程的影響。

    蘇格蘭地區的教育研究局(SCRE, Scottish Council for Research in Education)從

    1991 年起就對 5-14 課程方案進行持續的評鑑,截至 1996 年為止,5-14 課程方案

    這一項來自官方的建議,但並非強制性的課程,在中、小學的落實情形大略是:

    英語和數學課程幾乎對所有的學校都產生了非常深遠的影響,環境研究的落實情

    形大約超過半數以上的學校,至於宗教道德教育則大約是半數的學校採用,此外

    有低於半數以下的學校使用表現藝術的課程指引。5-14 課程方案中有關評量與成

    績報告的建議,在中小學也產生相當深遠的影響,過去未採用者也正積極發展之

    中。由上述的評鑑性研究可知,5-14 歲的課程方案在蘇格蘭地區具有深遠的影響。

    此外,從表 2-3 可知蘇格蘭地區 5-14 歲的課程方案是領域取向,而英格蘭地區的

    國家課程則是科目取向,這是一個值得注目的不同。

  • 42 國立台北師範學院學報,第十四期

    表 2-3 英格蘭與蘇格蘭之課程架構對照表

    蘇格蘭 5-14 課程方案 英格蘭的國定課程

    建議性質,邀請的態度 強迫性的課程

    5 歲-14 歲 5 歲-16 歲

    領域取向

    小學的課程有五個大領域:英語、數學、

    環境研究、表現藝術、宗教教育(中學則

    有八個領域)

    學科取向

    英語、數學、科學、歷史、地理、音

    樂、體育、藝術與設計、資訊與溝通

    科技、設計與科技

    製表主要資料來源包括:Malcolm & Schlapp (2000); DfEE(1999)

    參、國家考試的比較

    在英格蘭地區國家課程評量經常是報章媒體追逐的熱門話題,從 1991 年第

    一次試辦以來就風波不斷,在教師的抗議與中央政府的回應下英格蘭地區國家課

    程評量不斷的整形變臉,但是它的強制性則是始終如一的。至於蘇格蘭地區也幾

    乎所有的學校都參與了國家考試(national test),但是目前超過五分之四的校長相當

    滿意這項機制(Malcolm & Schlapp, 2000, pp.1-2) ,這是一個有趣而值得省思的對

    比。蘇格蘭 5-14 課程方案雖然以低姿態的邀請方式呈現,但是它的影響力仍然相

    當深遠而普及。尤其是蘇格蘭的學校幾乎都參與了國家考試這一個 1991 年之後才有的新遊戲,因此拿它來和英格蘭地區的國家課程評量 (national curriculum assessment)進行比較,應該具有合理的基礎。本節將從制度、發展歷程兩種層面來進行比較,然後進入南與北的對話。

    一、制度面的比較 以下先呈現英國國家考試制度的南北對照表(表 3-1),而後再進行簡要的說明

    詮釋。

  • 蘇格蘭與英格蘭小學階段之國家考試的比較研究 43

    表 3-1 英格蘭與蘇格蘭之國家考試制度的比較

    英格蘭 蘇格蘭

    對於學生學

    習進展的描

    分成 10 個等級(1-10)

    關鍵階段 1:1-3(絕大多數達到 2)

    關鍵階段 2:2-5(絕大多數達到 4

    關鍵階段 3:3-7(絕大多數達到 5/6)

    分成 6 個等級

    (A 到 F,F 是近期才發展出來

    的,過去僅有 A 到 E,5 個等

    級)

    評量的目的

    ─對個別學

    生而言

    ─對群體學

    生而言

    形成性評量+診斷性評量+總結性

    評量

    總結性評量

    評鑑性評量

    形成性評量+診斷性評量

    總結性評量(僅送交學校管理

    委員會)

    校外測驗 標準化評量任務(SATs) 3

    在 7,11,14 歲三個階段施測

    在小學四年級(P.4,約 8 至 10

    歲)、七年級(P.7,約 11 至 12

    歲)舉行。教師可以從測驗目錄

    中選擇合適的測驗來施測。中

    學階段沒有校外測驗。

    教師評量的

    角色

    以持續性的方式進行教師評量,但

    校外測驗(SAT)是重心所在。

    教師評量的角色比較被倚重。

    給父母的成

    績報告

    關鍵階段結束時學校給父母的成

    績單必須含有國家課程評量的等

    級。

    蘇格蘭的 5-14 課程方案發展了

    新的成績報告書的規格。

    給學校管理

    委員的報告

    (governors/sch

    ool boards)

    在 11、14、16 歲等(即關鍵階段 2、

    3、4 結束時)必須向學校管理委員

    呈現具有校際比較的測驗成果

    (在關鍵階段 1,即 7 歲時只鼓勵這

    麼做,但沒有硬性規定)

    加總全班表現情形,以等級的

    方式進行呈現,不要求校際比

    較的結果。

    評分調整

    (moderation)

    對過程及結果均進行評分調整 仍處於嘗試階段

    測試內容 關鍵階段 1: 英語、數學

    關鍵階段 2: 英語、數學、科學

    讀、寫和數學

    註:製表主要依據是 Harlen(1993),唯加入部分新近的調整資料。

    從表格 3-1 可以得到的第一個意象是:英格蘭地區的國家考試是一個龐大而

    3 SATs: 標準化評量任務與考試,它是英格蘭家課程評量中的校外評量部分,與教師評量

  • 44 國立台北師範學院學報,第十四期

    發展比較精緻的機器;蘇格蘭地區的國家考試制度則顯得比較陽春而簡約。例如:

    英格蘭地區的國家考試跨中、小學,而蘇格蘭地區的國家考試則僅限於小學階段;

    從科目來看,英格蘭地區的國家考試在關鍵階段二、關鍵階段三皆需測試三個科

    目,而蘇格蘭地區則一直都未把科學的相關領域放進去。此外,在英格蘭地區有

    教師評分調整(moderation)的動作,而蘇格蘭地區則幾乎沒有這個機制。另外蘇格

    蘭地區對於學生學習進展的描述也比較粗略。蘇格蘭地區在有限的經費下,發展

    出一個小型的國家考試機器是可以理解的。

    第二個意象是:英格蘭地區的國家考試是一個競爭色彩比較濃厚的機制,因

    此出現了評鑑性的評量目的,各校給予學校管理委員會的報告必須含有校際排行

    榜。至於校外考試的部分在英格蘭地區不但比較標準化,而且相對而言是比較被

    倚重的。換言之,教師評量雖然也是國家課程評量的一部分,但往往僅是聊備一

    格。這種種跡象都共同建構了「英格蘭地區備配了一個競爭色彩濃厚的國家考試」

    這個意象,而這一個具備市場競爭色彩的機制如果安放在政治的氛圍底下,則能

    清楚地看到英格蘭藉助由上而下的考試方式並策動市場競爭的機制,以弔詭管理

    的精神企圖提昇學生的學力,因此是一個政治色彩比較濃厚的國家機器。針對上

    述的分析,進一步整理出表 3-2 如下:

    表 3-2 英格蘭與蘇格蘭之國家考試的特色

    英格蘭 蘇格蘭

    競爭的色彩濃厚,評量結果的呈現,

    強調校際比較與績效責任的概念。政

    治氣息瀰漫。

    重視效度與管理上的可行性

    (manageability),而不強調校際比較與競

    爭,其教育色彩比較濃厚。

    大型的國家機器 儉約的機制

    總之,從制度面切入,蘇格蘭與英格蘭的評量系統有不少的差異。而其中以

    評量結果的呈現這乙項最具顯著性,評量結果的呈現方式深刻地影響評量的性

    質,在英格蘭地區因為有排行榜 (league table)的介入,把國家課程評量轉化為高風險的評量/影響重大的評量(high stake assessment);至於蘇格蘭地區過去未採行此種競爭性的機制,因此國家考試為教育服務的色彩遠高於為政治服務的功能。

    共同構成英國的國家課程評量。

  • 蘇格蘭與英格蘭小學階段之國家考試的比較研究 45

    這一個珍貴的經驗顯示:評量結果的呈現方式不可輕忽。

    二、國家考試發展歷程的比較 從過程的面向來看,英格蘭地區的國家課程評量從 1991 年實施之後,就因

    為各種反對聲浪而不斷調整、簡化。1991 年小學二年級老師使用 SATs 的經驗顯示:在一班約 25-30 人的班級中,老師平均用掉了 40-45 小時於 SATs 的施測之上,至於事前準備材料的時間還不包括在內(Gipps et. al., 1995, pp.52-53)。這些消息在媒體上引起了相當多的注意與反彈,因此英國首相旋即於 1991 年的夏天宣佈:1992 的測驗會比較短,並採用較多標準化紙筆測驗以節省評量的時間。結果 1992年進行 SATs 時,在一班約 25-30 個二年級(七歲)孩子的班級用掉了 24 小時,雖然時間驟降但是很多題目仍然是以個別或小組的方式進行,而且也非以標準化的

    方式施測。對於施測所需時間的減少普遍受到肯定,但是施測內容偏重紙筆也引

    起有識之士的擔憂,他們深恐這種窄化的 SATs 施測方式會對中、小學課程與教學產生負面的影響。

    1993 年的SATs依然花了老師平均 30 小時的時間,比 1992 年所花的時間稍多。為國家課程評量所付出的時間及精力,依然是老師的關切及新聞媒體的頭條。

    93 年因為教師工會發動罷考的風潮,英國政府組織了一個半官方組織在Sir Ron Dearing的帶領下對國家課程及評量進行總體檢並找尋減化評量方案的途徑。而Dearing Reprot也不負期望地為國家課程與評量做了一番瘦身的功夫。整體而言,英格蘭的國家課程評量在SATs的部份由活動本位的、個別或小組實施的表現評量而轉變成為計時的、全班一起實施的紙筆測驗則是一個主要的大趨勢(Broadfoot, 1997)。套用Daugherty(1995)的話它的發展是一種由標準任務到書面測驗的反轉。至於教師評量的部分則由TGAT報告4 中與SATs平行並重,淪為SATs的附庸,直到Dearing Report才有了象徵性的轉機,唯教師評量的分數仍未被善用。在英格蘭這一段課程史中我們很遺憾地看到TGAT報告書中理想的陷落。借用Broadfoot和Gipps的概念,驚豔地看到評量文化(assessment culture)的乍現,可惜的是它依然抵不過可行性的現實考驗而重返傳統只重紙筆的考試文化(examination culture)(吳麗君,1999)。

    至於蘇格蘭地區的國家考試,則從一開始就不像南方的英格蘭那麼繁複,在

    經費的考量下以比較簡單易行的方式來推行,也因此具備比較高的可行性,這些

    4 TGAT: 代表 Task Group on Assessment and Testing. 由 Paul Black 領銜,其報告乃英格蘭地

    區國家課程評量政策之藍本。

  • 46 國立台北師範學院學報,第十四期

    年來也未再受到蘇格蘭教育部門的介入與調整。所以相對於英格蘭而言,它的調

    整、修正較少。既然評量已經被重新概念化為課程,則這一段評量改革的歷史當

    然也是一段課程改革史,比較蘇格蘭與英格這段課程改革史,我聯想到 D. Pratt (2000, p.394)的譬喻,他說:課程實施是個大暗礁,新課程的高傷亡似乎是常態。一般專業化的課程實施研究之觀點,常常侷限在「先對課程進行設計,然後再實

    行」,D.Pratt 則認為需求的評估必須在課程設計開始之前便進行,否則高傷亡率乃是必然。英格蘭與蘇格蘭在規劃其國家考試之前是否進行需求的評估不得而

    知,但是蘇格蘭的方案較能符合現實條件則是不言自明的,因此相較於英格蘭而

    言,歷程中痛苦的調整少了許多,這也許是歷程面向所給予我們的珍貴教訓。

    三、南北對話

    (一)看見差異的背後

    為什麼蘇格蘭的評量系統比較富有教育色彩?為什麼南方英格蘭的國家課

    程評量充斥著強烈的政治性色彩與工具理性的語言?下面數項是可能的詮釋:

    (McPherson, 1993) 1.歷史性的因素:比起英格蘭而言,蘇格蘭比較早就擁有國家課程指引這樣

    的機制,但一直是採用建議的姿態而並非強迫推行。換言之,中央與地方的伙伴

    關係藉由歷史的視野而投射於當前的制度。誠如歷史學界所言「過去的從未真正

    的過去」,在邀約不同的文化對話時,如果能加入歷史的厚度則所見應能更加豐富。 2.經濟的因素:蘇格蘭必須在相當有限的經費下來進行國家測驗,因此無法

    像南方的英格蘭發展出龐大的評量機器。如果把國家考試視為一種工具,由此可

    見工具能回身形塑本質,豈可小視;此外,值得思量的是把評量、考試發展成龐

    大的機器是福嗎? 3.強勢的皇家督學:蘇格蘭強勢的皇家督學教育調節了官員們對於簡化式的

    校際比較之熱忱。在英格蘭的學校評鑑方面,因為教育標準局(OFSTED)的介入而有非常不同的生態。

    4.文化上的因素:蘇格蘭在文化上比較尊重教師專業,因此教師評量的部分在蘇格蘭被看重,也因此降低了國家考試的影響力。蘇格蘭早在 1965 年就成立了

    專業色彩非常濃厚的教師總會(general teaching council)(Archer&Peck, 1988),而南方

    的英格蘭則歷經挫折與打壓,好不容易才在上一個世紀末也有了屬於英格蘭的教

  • 蘇格蘭與英格蘭小學階段之國家考試的比較研究 47

    師總會。此外,英格蘭地區對於教師的不信任與敵意也是鮮見於蘇格蘭的。這種

    種文化上的因素都會綿綿密密地形塑國家考試的性格。

    (二)在歷史的偶然與必然中看到人的力量 在蘇格蘭與英格蘭的對話中,筆者解讀到了歷史的偶然與必然。蘇格蘭的國

    家考試宣佈不久,就因為家長的介入而改觀,雖然這一項抗議沒有全盤推翻國家

    考試的做法,但是家長的聲音讓蘇格蘭地區的小學老師可以更自主的決定孩子的

    考試時間。在蘇格蘭地區連學校委員會也起來反對政府的該項政策,此外,皇家

    督學也表示:5-14 課程方案的成功經驗,可能因為反對國家考試的聲浪而遭到嚴

    重的威脅(McPherson, 1993, pp.44-45) 。而另一方面,在南方的英格蘭地區,學校

    教師因為國家課程評量的實施耗費時間而起來杯葛、罷考,首相的回應與不斷形

    塑 SATs 的結果是:理想色彩濃厚的 TGAT 報告書幾乎被典當,活動式的評量被

    紙筆測驗所取代,而且英格蘭所有參加 SATs 的孩子都在固定的時間測試。在英

    國南北兩地反對國家考試的政黨人員組成、理由等等可能是不同的,但是國家考

    試(國家課程評量)這個做法初期在英格蘭與蘇格蘭都遭到反對的命運則是相同

    的。這些反對的聲音在各自的文化脈絡下與國家考試互動之後締造了兩個頗為不

    同的圖像。

    特別值得矚目的是蘇格蘭在大選前夕匆忙的決定不公佈國家考試的結果,這

    一個迫在眉睫的決定,卻深遠的影響到蘇格蘭之國家考試發展成為對教育比較友

    善的一個機制。而相對的,在南方的英格蘭則因為安裝了一個影響重大的評量機

    制(high-take assessment)並與市場競爭接軌,而把 TGAT 原本有理想、有抱負的評

    量計劃輸得幾乎只剩下評鑑功能乙項。不管這些事件是歷史的偶然還是必然,都

    可以看到人的回應在這個綿綿密密的織網中可以是有力量的、有影響的。Raffe

    ( 2000 )比較了英格蘭與蘇格蘭之後說,脈絡因素確實是有影響的,但是它並不如

    傳統比較教育研究之社會取向者所說那般的具有決定性。在歷史的長河中我們被

    脈絡所形塑,但也在形塑著綿綿密密的脈絡。Aldrich ( 1998 ) 探討 1979 到 1990

    年代初期,在 Thatcher 保守黨政府領導下,教育改革的情形。他用文化的角度回

    顧這一段改革時提到,如果整個社會的大脈絡不變,則教育系統中小部份的激烈

    變革,不會收到太大的影響。他是對的,但是教育系統中的變革必然會滲透到大

    脈絡而發揮漸進的、點滴式的影響。

  • 48 國立台北師範學院學報,第十四期

    肆、本土的學習

    一、在小學階段需要國家考試嗎? 九年一貫課程即將全面實施,關心教育者不免憂心,當我們給予教師自主空

    間的同時是否應該備配類似國家考試這樣的機制,以績效責任的精神來確保教育

    的品質。的確以評量、測驗或考試為手段來提昇教育水準的並不限於英國,Noah

    和 Eckstein(1990)在進行了國際比較之後不得不說:以考試來進行教育制度的改

    革是經濟而快速的方法。唯 P. Black (2001) 認為許多非教育專業者未能洞識教育

    的複雜,而期盼以方便、經濟、快速的外在考試來做為水準提昇的工具,但是深

    諳教育之複雜的專業人員則通常持比較保留的態度。在小學階段建構國家考試

    嗎?針對這個問題,我們首先需要回答的是:英國國家層級的考試確實提昇學童

    的學力了嗎?如果沒有,它還具有什麼功能嗎?針對第一個問題,在英格蘭地區

    可以找到許多相關的論述,但是蘇格蘭地區則似乎未把焦點放置於此。因此,以

    下僅以英格蘭的經驗來加以分析。

    學童的學業成就提昇了嗎?這個問題的答案呈現出橫看成嶺側成峰的多元

    樣態。英國官方從相關數據發表了樂觀、肯定的看法;但學界則持比較保留的態

    度。例如: Gipps(1994)等以學校校長為研究對象指出:國定課程評量所帶動的教

    學改變是相當複雜的,即使教育水準真的提昇了,也不全然是因為校外評量/考試

    的執行所單獨造就的。其次必須考慮的是測驗分數的污染(test-score pollution),

    所謂測驗分數的污染指的是考試領導教學的結果,表面上分數雖然提高了,但是

    真正的知識、技能等卻未必提昇(吳麗君,1999)。換言之,分數的增加只是一種幻

    覺(Black, 2001)。有趣的是 P.Black 是 TGAT 的首腦人物,換言之,英格蘭地區的國家課程評量主要乃出自於他的手筆,而他在最近發表的乙篇文章—Dreams,

    strategies and systems: portraits of assessment past, present and future—卻指出:藉著外

    在考試的方式來提昇學力,似乎是一種天真的想法,這是評量從心理計量的夢醒

    之後,再一次必須面對的現實(Black, 2001)。

    即使承認國家課程評量是一個褪色的夢,它是否還具有其它功能呢?

    Gipps(1995)等認為評量本身未必能提昇教育水準,誠如 Philip Gammage 所說:「沒

    有人會因為被測量而長高」(Meighan, 1994),但是藉由評量所引發的複雜變化,

    卻可能帶動教學的品質,或締造出不同的班級氣氛等等這些中介變項卻可能提昇

  • 蘇格蘭與英格蘭小學階段之國家考試的比較研究 49

    教育的水準。愈是影響重大的評量(high-stakes)愈有可能造成這種影響。換言之,

    如果你同意 Gipps 的論述,那麼國家考試仍然具有一點兒可欲的價值,但能否發

    揮正向的引導功能則要視其設計能否引發有利的中介變項而定。如果你依然對於

    國家考試情有獨衷,那麼依據蘇格蘭與英格蘭的經驗我們該如何建構這個國家考

    試呢?

    二、宜建構什麼形態的國家考試? 如果被Gipps等不是非常堅強的理由所說服,而欲引進國家考試,怎麼樣的設

    計有助於引發有利的中介變項呢?從上面的比較我們至少可以得到的粗淺結論

    是:沒有必要建構一個高競爭性的國家考試。以競爭的方式公布評量結果,會把

    評量推往高風險的一端,高風險的評量對課程、教學會發揮磁鐵一般的影響作用,

    換言之,要藉著高風險的考試來帶動課程與教學的改變比較快,但是考試所能涵

    蓋的範圍終究是有限的,再加上如果以競爭的方式公布評量結果,則公平性將成

    為重要的考量,而公平性的考量必然會回過頭來影響評量的方式,例如教師評量

    的主觀性將因此被強調,多元評量的方式也從可行性的角度被拒絕,而這些都是

    英格蘭過去十幾年的經驗與教訓。再進一步來看則是評量的方式又會回身影響到

    課程與教學的實施,在競爭氛圍下強調公平,在大型考試下強調經濟、可行的考

    試型態會把小學的課程與教學帶到哪裡呢?在這個循環裡我們看到了競爭性高的

    國家考試走進了死胡同,它沒有辦法發揮MDI (Measurement-driven-instruction) 的正

    向功能。換言之,英格蘭的經驗清楚地告訴我們沒有必要建構一個高競爭性的國

    家考試。相反地,從蘇格蘭地區之肯定其國家考試制度的相關現象,也可以支持

    如上的解讀。

    在心理計量的夢醒之後,教育典範的評量成為另一個夢想的國土,在這一個

    夢想的視野之下,學界呼籲只重紙筆測驗的考試文化(examination culture)必須轉

    形為評量文化(assessment culture),否則真正的改革不可能在學校中落實(Broadfoot,

    1996﹔Gipps, 1994)。以目前的脈絡而言,締造一個更人性、更適合於學習的評量

    文化似乎是大勢所趨。美國學者 C. A. Dwyen(1990)說:好的評量要落在教學的

    脈絡裡,不要對教學造成干擾與妨礙,在英國 TGAT 報告中,我們看到了努力的

    痕跡。顯然 TGAT 報告書的首腦人物 P. Black 試圖將學界中新的評量典範—亦即教育的典範或脈絡的典範—展現在官方的政策上,因此該報告書在用詞上選擇了任務(task)而非測驗(test),在設計上讓評量的活動猶如教室中的教學活動,而

    且是好的教學活動,評量方式也是多元的,包含口頭的、圖畫的、活動的等等。

  • 50 國立台北師範學院學報,第十四期

    至於實施的方式則包含了個人的及小組的,這種設計旨在追求教室效度(classroom

    validity)(Black, 1997)。

    Torrance(1997)認為 MDI (measurement-driven-instruction) 的色彩很清楚地顯

    現在英格蘭這一波的評量改革裡。TGAT 報告的主持人 P.Black(2001, p.72)本人則

    更清楚地說:「…其基底層的目的乃是希望為考試而進行的教學是一種有利於學習

    的良好教學」。遺憾的是這種深具理想色彩的新評量典範在現實因素的考驗下節節

    敗退,最後終於潰不成軍,而回歸傳統紙筆測驗的大本營(Black, 01, 73; 吳麗君,

    1999 )。在這裡見証了國家級的評量方案採用多元評量方式的限制。奠基在英格蘭

    的經驗之上,P. Black (2001)認為用國家考試來提昇學業成就是一個破碎的夢,它

    是繼心理計量之後另一個幻滅的夢土。他繼而勾勒評量的第三個與第四個夢。評

    量的第三片夢田乃是更激進、更根本地發展教師形成性評量 (非教師總結性評

    量),因為有太多的研究顯示:教師形成性評量的改進才是提昇學習品質的根本之

    道,唯過去在這一個面向所付出的關切與支持都太少了。要往這個方向邁進,仍

    有許多的議題待探討,也有不少困境橫在前方,但是它的確是一個可以耕耘的夢

    田。此外,P. Black 又勾勒了另一片桃花源—以心理學的新近理論來建構新的評量

    策略(評量的第四個夢),他批評目前的評量實踐乃是以 19 世紀的心理學來駕馭

    20 世紀的統計運算。因此 P. Black 建構了評量的第四個夢,這個尚未尋獲的桃花

    源在某種程度上已經宣告了現況的缺失,但是如果你堅持要在娑婆中找尋極樂世

    界,要就地建造桃花源,那麼可以努力的方向有二:

    *如何藉著國家考試這一個機制來激發與活化教師的形成性評量;

    *以心理學的最新發展趨勢為基礎來建構新的評量策略,並用於國家考試之

    上。

    伍、研究的限制與未來的展望—代結語

    進入田野的必要性

    從英國學者的研究中,我們固然可以獲得不少的洞識與滋養,但誠如袁汝儀

    (1995)所說:異文化中的作者不可能照顧到我們的困難,不可能提供我們所需

    要的所有資訊。異文化研究者在為他自身所處文化裡的讀者做研究,整理文獻或

  • 蘇格蘭與英格蘭小學階段之國家考試的比較研究 51

    演講、寫作時,不可能考慮我們台灣讀者在文化上的差異,因此他不可能特別去

    說明一些他們本土習以為常的背景。而諸多他們習以為常,或異文化的研究者不

    認為值得一提的事實性資料,對我們而言卻是相當重要的。在檢視、閱讀英國評

    量之相關文件與文獻時,我常常找不到相關的資料來回答心中的困惑,這是本研

    究的限制,而這個限制自身也指出了未來需要的研究努力。希望田野工作的涉入

    能增加以原級的事實性資料為核心,以本土為視角來進行的解讀,而非取巧地直

    接用英國人的眼睛看英國。這是個人應該努力的方向,而國內的比較教育社群亦

    宜建構有利個別研究者至海外進行田野工作的環境。

    習慣性地依賴異文化研究者之研究,將貧瘠了對同一現象的多元詮釋,誠如

    英國的歷史學者 K.Jenkins 在其著作 ” 歷史的再思考” 乙書中提到「雖然原始資料可以防止隨意的曲解引述,但是同樣的事件和原始資料卻不必然產生獨一無二

    的解釋」(賈士蘅譯,1996)。只有在本土的視框下,發揮我們的學術實踐主體性,

    才能對國外的教育現象產出更深入、更具文化厚度的研究詮釋。行筆至此,又思

    及 Elmord (1989) 的論述,他說前進式的規劃(forward mapping)是一個「高貴的謊言」,因為政策決定者無法完全掌握所有影響政策實施的組織、技能、政治等過

    程。因此“逆向式的規劃"(backward mapping)代之而起。逆向式的規劃之概念也再次說明了進入田野的重要性。遺憾的是,囿於資源、時間等等限制,本文仍以

    文件分析及文獻探討為主要的探索途徑,所分析、比較者仍停留在制度面居多,

    而且諸多的視野仍是安格拉式的,因為英格蘭的相關資料遠遠多於北方的蘇格

    蘭。此外,制度落實的情形也是本研究的盲點,尤其在蘇格蘭的部分,這是本研

    究的限制,同時也是未來要努力的方向。

    參考文獻

    一、中文部分

    王家通(1997)。比較教育論叢。高雄:麗文。

    吳文侃、楊漢清(1992)。比較教育學。台北:五南。

    吳麗君(1999)。交互損益見真章—談英國國定課程評量的來時路。發表於 1999 年亞

    太地區課程改革國際學術研討會。

    袁汝儀(1995)。荷蘭視覺藝術教育與師資訓練:一個西方案例的教育民族誌研究。台

  • 52 國立台北師範學院學報,第十四期

    北:五南圖書出版公司。

    黃銘惇、張慧芝譯(D.Pratt 著)(民 89)。課程設計—教育專業手冊。台北:桂冠。

    賈士蘅譯 (K.Jenkins 著)(1996)。歷史的再思考。台北:麥田。

    二、英文部分 Aldrich, R. (1998). A Curriculum for the Nation. In R. Aldrich and J. White (Eds.), Perspectives

    on education policy. London: Institute of Education University of London.

    Archer, E. G. and Peck, B. T. (1988). Beginning teaching: Professional development and

    probation in Scotland. Southbrae Drive: Jordanhill College of Education.

    Black, P. (1997) Whatever happened to TGAT? In C. Cullingford (Ed.), Assessment versus

    evaluation. London: Cassell.

    Black, P. ( 2001) Dreams, strategies and systems: Portraits of assessment past, present and

    future. Assessment in Education, 8(1), 65-85

    Broadfoot, P. M. (1996). Education, assessment and society. Buckingham: Open University

    Press.

    Broadfoot, P. (1996). Performance assessment in perspective-international trends and current

    English experience. In A. Craft (Ed.), Primary education-assessment and planning

    learning (pp.35-65 ). London: Routledge.

    Broadfoot, P. (1997). Assessmet: The English panacea? (review Article). Oxford Review of

    Education, 23(3), 401-405.

    Clark, M. M. (1997). Education in Scotland: setting the scene. In M. M. Clark & P. Munn (Eds.),

    Education in Scotland (pp.1-18 ). London: Routledge.

    Daugherty, R. (1995) National curriculum assessment-a review of policy 1987-1994. London:

    The Falmer Press.

    DfEE (1999). The National Curriculum: Handbook for primary teachers in England key

    stages 1 and 2. London: QCA.

    Dwyer, C. A. (1990). Trends in the assessment of teaching and learning: educational and

    methodological perspectives. In P. Broadfoot, R. Murphy and H. Torrance (Eds.),

    Changing educational assessment (pp.23-31). London: Routledge.

    Elmorem, R. F. (1989). Backword mapping: Implementation research and policy decision. In B.

    Moon (Eds.), Policies for the curriculum . London: Hodder and Stoughton.

    Encarta Encyclopedia 2000. http: //www.Microsoft.com/Encarta/eng

    Epstein, E. H. (1990). The problematic meaning of “comparision” in comparative education

  • 蘇格蘭與英格蘭小學階段之國家考試的比較研究 53

    (2nd ed.). Frankfurt am Main: Peter Lang.

    Fullan, M (1991). The new meaning of educational change (2nd ed.). London: CASSELL.

    Fullan, M (1993). Change forces. London: Falmer Press.

    Gipps, C. (1994). Beyond testing-towards a theory of educational assessment. London: The

    Falmer Press.

    Gipps, C (1995) National curriculum assessment in England and Wales. In D.S.G. Carter and

    M.H.O’Neill (Eds.), International perspectives on educational reform and policy

    implementation. London: The Falmer Press.

    Harlen, W. et al. (1993). A comparison of the proposals for national assessment in England and

    Wales, Scotland and Northern Ireland. In P. Broadfoot et al (Eds.), Policy issues in

    national assessment (pp.13-27). Clevedon:Multilingual Matters.

    Hunter, S. L. (1968). The Scottish educational system. Oxford: Pergamon Press.

    Malcolm, H. and Schlapp, U. (2000/12/8). 5-14 in the Primary School: A Continuing

    Challenge. http://www.scre.ac.uk/summary/rr82.html

    McPherson, A. (1993). National testing in Scottish primary schools. In P. Broadfoot et al (Eds.),

    Policy issues in national assessment (pp.43-57). Clevedon: Multilingual Matters LTD.

    Meighan, R. (1994) The free thinkers’ guide to the educational universe. Nottingham:

    Educational ideretics Press.

    Noah, H. J. & Eckstein, M. A. (1990) Trades-offs in examination policies:an International

    comparative perspective. In P. Broadfoot, R. Murphy and H. Torrance(Eds.), Changing

    educational assessment-interational perspectives and trends. London: Routledge.

    Raffe, D. (1997) Upper- secondary education. In M. M. Clark and P. Munn (Eds.), Education in

    Scotland. (pp.67-80) London: Routledge.

    Raffe, D. (2000). Investigating the Education Systems of the United Kingdom. In D. Phillips

    (Eds.), The education systems of the United Kingdom. Oxford: Symposium Books.

    Torrance, H. (1997) Assessment, accountability, and standards: using assessment to control the

    reform of schooling. In A. H. Halesy et. al. (Ed.), Educational- culture, economy, society.

    Oxford University Press.

    誌 謝

  • 54 國立台北師範學院學報,第十四期

    本報告是國科會 NSC89-2413-H-152-011-F14 的一部分,特別感謝感謝國科會對於學術研究工作的支持。

    幾位匿名的評審委員提供了相當豐富而珍貴的修改意見,「我不知道你們是誰,但是我深深的感謝」。

    謝謝國北師心輔系吳毓瑩教授在忙碌中撥空先看完草稿,並提供修改的想法。

    謝謝吳淑敏同學不憚其煩的協助打字、修改工作。

  • Journal of National Taipei Teachers College, Vol. ⅩⅣ(Sep. 2001)35~56 NATIONAL TAIPEI TEACHERS COLLEGE 55

    The Comparison of National Examination between England and Scotland

    Li-juing Wu∗

    ABSTRACT

    This article tries to exame the similarities and difference of national examination between England and Scotland. Drawing the British lessons so as to enhance the understanding of assessment reform is the main focus of this study.

    This study is mainly based on the analysis of documents as well as literature review. The first section looks into the rationales of the report and the second part of the article analize the context of England and Scotland by layers. The third section focuses on the “national examination”, juxtaposition between England as well as Scotland, and the further dialogue between the two counterparts also has been tried out. The forth section tries to draw the lessons from the perspective of Taiwan, and the last section is the conclusion.

    Key words: national examination, 5-14 programme, assessment reform, education

    in Scotland

    ∗ Li-juing Wu: Associate Professor, Department of Elementary Education

  • 56 Journal of National Taipei Teachers College, Vol. ⅩⅣ

    ABSTRACT