译者:sibyl玥 原文地址:nytimes.com
译者:akisakura、bluetoblue、飞在江边没有尾巴的红燕子、大兔子和小马儿、五月撄宁、小花儿、sibyl玥(负责人)
2012年7月,在大卫·科尔曼(David Coleman)正式就任美国大学理事会(College Board)主席的几个月前,他邀请当时的麻省理工学院写作项目部主任莱斯·佩雷尔曼(Les Perelman)到曼哈顿下城区与他会面。美国大学理事会的众多工作包括参与研究、制定教育政策及编写课程,而其中最被公众认知的可能就是监管学习能力倾向测验(Scholastic Aptitude Test,以下简称SAT)了。佩雷尔曼是该考试最苛刻也最无情的批评者之一。2005年,美国大学理事会在SAT考试中增加了写作(总分值也从1600分上升为2400 分)。自此以后,佩雷尔曼一直着重研究他所认为的写作命题及评分的内在荒谬性。他最早的研究发现表明:与其他任何因素相比,作文字数与作文成绩的关系更为密切。最近,佩雷尔曼辅导了16名因写作成绩欠佳而重考的学生。他告诉他们细节重要而事实准确性并不重要。他说,“你可以告诉他们1812年美英战争始于1945年”。他鼓励他们使用少量生僻花哨的单词,如“plethora(冗余)”或“myriad(繁多)”。同时,他还鼓励他们使用两到三个预先准备好的名人名言(如:富兰克林·德拉诺·罗斯福),无论这与问题是否有关。他说,重考后有15名学生的作文分数高于90%的考生。
当科尔曼被任命为大学理事会下一任主席时,他在《纽约时报》上读到一篇有关佩雷尔曼研究的文章,因此决定跟他联系。上个月我去到位于林肯中心附近的大学理事会总部,在他的办公室里与他会面,他说道:“有人猛烈抨击SAT,那又怎样?他们获得了媒体的关注,那都没什么意思。但是,佩雷尔曼为我关心的事业奉献了一生。他教学生写作,并审视这种旨在赞美写作的方法。”科尔曼的话音逐渐减弱。“我想更加深入地研究他的观点,”他最后说道,“而非只是读读与他的观点有关的新闻访谈。”
在他们交谈的两个小时中,佩雷尔曼告诉科尔曼他并不反对写作测试本身。他认为这项工作如果做好了,也不失为一个好想法。但是,他问道:“在大学或在生活中,何时会有人要求你就你从没想过的东西写篇文章?我从未从老板那收到过这样的邮件:‘失败是否是成功的必要因素?25分钟后回复我?’但SAT就是那样做的。”佩雷尔曼谈到,辅导教师通常会教他们的学生去撰写并记忆一篇万能作文。这种作文包含获得高分的必要因素——“一个个人轶事或一些历史典故;弗洛伦斯·南丁格尔1(Florence Nightingale)似乎是一个特别受欢迎的历史人物。”在考试当天,他们照搬所记住的东西,再针对问题将答案稍加变化。可是,没人真正学到任何写作知识。
科尔曼告诉我,佩雷尔曼对他们富有成效的谈话感到惊讶,但他根本不认为这次谈话会有多少成果。大学理事会是一个大型的非盈利组织,每年有数亿万美元收入(部分来源于它每年针对高中生举行的近300万场SAT考试)。尽管在过去它一直受到外界的强烈批评,但佩雷尔曼估计它从未有过实质性的改变。当时他认为:“大卫·科尔曼的想法是对的,他其实是信任教育的。” 但是佩雷尔曼还说,尝试改变大学理事会的经营方式,“就像试图使泰坦尼克号转向一样。”科尔曼的机构是出了名的行动缓慢、戒备心强,无论谁掌舵,这样的一个机构也不会改变航向。
到2012年10月科尔曼就职时,科尔曼不仅了解了佩雷尔曼的观点,而且也熟悉了更多来自大学理事会支持者的投诉,其中包括教师、学生、家长、大学校长、大学招生人员、高校辅导员。他们对这项考试不满,且均有正当的理由。
学生们鄙视SAT不仅是因为它带来的强烈焦虑感(它是阻碍他们进入自己梦想中的大学的最大障碍),还因为他们不知道能从这项考试中得到什么。他们认为这项考试玩弄了一些巧妙的花招,提出的问题在高中课程中极其罕见。由于每做错一道选择题会倒扣1/4分,因此,学生们需要花时间去分析以决定要回答哪道题和弃答哪道题。老师们也认为这项考试不是按他们的授课内容出题的。然而,国家教育部门会公布许多高校的SAT平均分,这意味着老师往往会成为学生考试成绩不佳的指责对象。
对这项考试更严重的指控是:因为富裕家庭的家长能承担昂贵的考前辅导班及辅导教师,所以它使富裕家庭的学生具有优势。几年前,莲花软件公司(Lotus Software)创始人米切尔·卡普尔(Mitch Kapor)在《旧金山纪事报》(The San Francisco Chronicle)上与人合写了一个专栏。被上述不公激怒的他建议大学应该强制要求学生和家长公开“已购的所有形式的辅助”,以建立公平竞争机制。
SAT始于1926年,那时人们将其提倡为一种创建无阶级的杰弗逊式英才教育制度的手段。这项旨在评估先天智力的考试最初改编自一战军队智力测试。在20 世纪30年代,它被十几个重点大学用作奖学金评选方法。那时人们认为学生无法为先天智力测试做有效准备。但是,早在1938年,斯坦利·卡兰普 (Stanley Kaplan)便开始提供培训课,承诺提高分数。现今,无数小规模的专业辅导公司(且不说昂贵的私人教师)也加入卡兰普公司及其主要竞争对手普林斯顿评论(Princeton Review)的行列。这个年营业额达45亿美元的产业大大迎合了那些忧心忡忡的美国富人们的需求。这些富人们认为这项测试有对策可循,而他们的孩子需要的则是花钱学习对策。
美国大学理事会主席大卫·科尔曼在其任职期间对SAT考试进行了全面改革,使其能更好地体现学生在校期间应该学习的知识。照片由布赖恩·芬克(Brian Finke)为《纽约时报》提供
科尔曼与那些对大学理事会失望的支持者们举办了一次“倾听活动”。他当时认为,要想成为一个伟大的机构,大学理事会必须承认它有很多不足之处。“不公平的考前辅导是一个问题,”他说,“考试范围不明确以及评分复杂亦是一个问题。我了解SAT背后的一些科学理念,而且我也欣赏其中大部分的道理。但是,由于那些随之发展起来的事物将这项考试由鼓励英才教育的工具变成了在美国教育中巩固特权的手段并对一切造成了威胁,我觉得某些改变是必须的。”
很明显,科尔曼说,无论家长的社会和经济地位如何,他们都不会感到满意。富裕家庭学生的成绩并不是“干净”的,因为他们的分数是用钱“买”来的。中产阶级的学生则抗议不公,因为他们无法得到,或者需超额开支才可能得到“良好的考前辅导”;而那些贫困生,通常是少数民族学生,则完全被考前辅导拒之门外。瑞克·布里格斯(Derek Briggs)是位于博尔德的科罗拉多大学分校的研究和评估方法论项目主管。他在2009年的一篇论文中强调,除1000美元以上的课程费以及私人教师费以外,还有另一种考前辅导成本,他称之为机会成本,即学生花费大量时间一味追求考试过关,结果无暇顾及家庭作业和课外活动,而这些活动实际上是学生在大学成功的必要准备。
除了这些教育(及道德的)困局外,科尔曼还必须明白,作为一个企业,大学理事会却让SAT的可信度受到质疑,这到底意味着什么。数年前,几个小型的文科大学取消SAT并将相应的A.C.T.2(美国大学入学考试)作为入学标准。后来,由于对2005年SAT改革甚微感到失望,且受2008年全国大学招生咨询协会(Nacac)发布的报告所鼓动,越来越多的高等学府开始纷纷效仿。该报告的作者引用了加利福利亚大学的一项研究,将SAT描述为“不能准确预测学生表现”,并且质疑大学倾向于将SAT作为“最重要的入学方法之一”的做法。(许多撤销考试要求的学校,至少在第一年,出现了入学申请人数激增的现象。)
大约在报告公布之时,在维克森林大学社会学教授约瑟夫·A·索尔斯出版了《特权的力量》一书,解释了标准化测试怎样推动了耶鲁大学的歧视性招生政策之后,威客森林大学就成为了《美国新闻与世界报道》评出的全美前三十所大学里第一个提出选择性考试招生政策的大学。维克森林大学的后续研究表明,在学校停止将标准测试的分数作为考核因素后,入学新生的的高中平均绩点增加了。2012届新生中有79%的学生在其高中班级里排名为前10%。在实行选择性考试之前,此数目只比60%多一点。此外,学生的构成更加多样化。索尔斯编写了一本书,其中有一部分探讨了SAT在佐治亚大学、约翰·霍普金斯大学及维克森林大学的低预测准确度,他说,“考试成绩在很大程度上与家庭收入有关,但与高中成绩无关。”他接着说:“此外,我们的社会、种族和生活方式变得更加多样化,这在校园里得到了体现。在我们采取选择性考试招生政策之前,维克森林大学的学生构成就像J.Crew3的产品目录一样单一。”
上个月贝茨学院招生办前主任威廉·C·希斯(William C. Hiss)和前副主任瓦莱丽·W·弗兰克斯(Valerie W. Franks)发布的研究报告支持维克森林大学的经验。他们评估了33所不要求SAT或A.C.T.分数的高等学校,发现参与测试与未参与测试的学生之间的大学平均成绩与毕业率无明显差异。特别是, 他们还发现高中成绩优异的学生在大学里的表现也不错,即使他们的SAT分数不高。而高中成绩较差的学生就算SAT分数优异,在大学里的表现仍较差。未参与SAT的学生往往是少数民族学生、女性、佩尔助学金4获得者或家庭中第一个上大学的孩子。
尽管有更多的院校决定退出标准化考试,但全国大学咨询会的大卫·霍金斯(David Hawkins)认为,预计仍有80%的四年制大学要求SAT或A.C.T.分数。招生办负责人们也报告说已习惯于通过测试筛选数目惊人的申请者,感觉难以将其割舍。著名作家、康奈尔大学教授罗伯特·斯滕伯格(Robert Sternberg)对《前线》记者说,当他在耶鲁大学审阅入学申请时,他难以忽视分数。“我意识到当我在阅读申请书时,随着夜晚渐深,阅读的申请书越来越多,我会越来越看重SAT分数,”他说,“这比阅读长篇的论文及老师的推荐信更简单。这是人的本性。”除了筛选申请人的压力,全国大学咨询会的报告还提到了《美国新闻与世界报道》因采用SAT及A.C.T.分数来给大学排名而导致的问题,表明分数“不能有效评估重要的品质”。此外,它还批评证券评级公司采用SAT及A.C.T.来协助评定学校财务状况,认为这“对招生办施加了不必要的压力以追求越来越高的测试分数。”
科尔曼说,许多与他交谈过的招生办工作人员明确表示,依赖这类考试,至少是依赖这项考试让他们心里不舒服。但是,怎样的考试会让所有人认为公平且愿意接受,他们并没有一致意见。
科尔曼一直沉迷于解决难题。1994年,在科尔曼获得耶鲁大学哲学学士学位,牛津大学英语文学学士学位(同时他是牛津大学罗德奖学金5的获得者)以及剑桥大学古代哲学硕士学位( “即使拥有三个学位也无法获得就业机会”)之后,科尔曼打算回纽约,去一所公立学校当老师。但当他发现无法找到一份高中英语老师的工作后,他成为了麦肯锡咨询公司(McKinsey & Company)的一名咨询顾问。在这里的五年中,他越来越沉迷于以证据为基础的来解决问题。在那段期间,他曾为想要提高教学质量的学区提供无偿服务。1999 年,他离开了麦肯锡咨询公司,并帮助创建了成长网络公司(Grow Network)。该公司主要致力于帮助学生及家长(包括非英语家庭)应对越来越受标准化测试影响的教育制度。他与教育者和学生们进行交流,沉浸于对标准化测试的研究之中,这让他确信必须改变那些考试要测评的能力标准,因为那使得考试过于庞大和模糊,而且人们在生产教科书时也同样毫无目的。
科尔曼说:“当测评范围过大时,用于测评那些标准的测试必定是肤浅的。”他指出有研究表明现在有更多的大学新生并未做好准备,于是被迫参加“从未摆脱过的补习课程。”以数学为例,如果你研究成绩最好的国家的数据,你会发现它们的学习方法强调“范围窄,研究深”。相反地,他发现美国的课程则是“一英里宽,一英寸深”
。
2008年,科尔曼协助创立了一个名为“学生成就伙伴”(Student Achievement Partners)的非盈利组织。该组织坚持在决定教育方针时“依据行事”。在该组织期间,科尔曼对塑造《共同核心6》起到了不可或缺的作用。《共同核心》是一套完整的学术标准,已陆续在40多个州实行。虽然这个标准不乏批判者——许多家长和教育者认为它让一种有问题的“应试教育”思想在学校和教师中根深蒂固——但是科尔曼认为,它不仅是抵御美国公共教育的水准下降的堡垒,还是是一次罕见的两党合作。在去年五月波士顿召开的战略数据项目报告会上,他要观众说出一个“共和党和民主党曾同心协力有所成就的重要国内政策领域”。他说,《共同核心》是一个令人振奋的想法,“在一切想法似乎都止步不前时,它却风靡全国。”
当科尔曼就读于曼哈顿史帝文森高中(Stuyvesant High
School)时,他曾是辩论冠军队的一员。显而易见的是,与人交谈时他总是迫切地想要用证据制服对方,并对愚人极不耐烦。(他说辩论是为数不多的“使人极度好辩并助人进步”的活动之一。)
2011年4月,在纽约州教育部门组织的一次推广《共同核心》的会议中,他得罪了在场所有的教师和行政人员。在表达对高中作文注重个人叙述的不满时,他谈到成人生活的现实:“别人真[脏话]不会在意你的想法或感受。”当那时的视频在网上疯传之后,他道歉并解释说,他当时是在提倡一种在大学及职业生涯中无疑有用的技巧,即基于证据的分析型作文。但他的言论还是加深了一些人对他的坏印象,他们认为他麻木不仁且激进极端,是那种自以为是的万事通。
2012年10月,在迈阿密举行的美国大学理事会年度会议上,他间接引用了这则逸事,同时还提到自己习惯使用直率多变的语言。他还开玩笑说人群中有“惊慌失措的”理事会成员。
参与制定《共同核心》给他带来的教训是显而易见的,即美国的教育需要多些专注少些肤浅,且它应该能够通过反映课堂教学的考试来评测新定义标准的成效。 这正是大学理事会主持的大学预修课程7(Advanced Placement)项目的运作程序(在福特汉姆研究所(Fordham Institute)的一项研究中,参与调查的80%的教师表示,大学预修课程考试能较好地反映他们的工作情况以及学生的学习情况)。这也是全国大学招生咨询协会2008年报告中的一项主要建议,即大学录取考试应重新设计为类似于美国大学预修课程考试的成果式测试。这将会给学生们传达一种信息——学习他们的高中课程以及不参加以应试技能为主的课外备考课程是在大学录取考试中取得好成绩及适应严格的大学课程的方法。
对于科尔曼来说,问题在于如何让一项考试准确评测学生成绩及大学学习适应能力,且逐步向原先期望达到的精英化目标发展,而非妨碍目标发展。
一年多前,科尔曼与一批大学理事会工作人员及顾问开始尝试进行这项工作。大学理事会的主要评估员辛蒂·施迈瑟(Cyndie Schmeiser)告诉我他们要做的第一件事就是确定这项考试要测评的能力。从2012年底起直到2013年春季,她和她的团队与学生、教师、家长、辅导员、招生人员及高校辅导员进行了广泛的交流,要求各类人员详细地告知他们对测试的期望。他们首先得出的结论为:一个测试应该反映最优秀的老师传授的最重要的技能。施迈瑟解释到,例如,一个好的导师教授马丁·路德·金的演讲《我有一个梦想》时,应鼓励讨论,包括分析文章及找出有力的(事实或修辞性)论据。“我们不想老师只会在课堂上询问:‘这篇演讲是在什么时间、什么地点发表的?’”施迈瑟这样说道。
随后辛迪·施迈瑟的团队着手设计了一些考试题目以投入到这项更有意义的事业中。施迈瑟曾有言,过去SAT的出题非常注重实用性,即对大多数学生而言,这些题目的难易程度是否合适;针对来自不同民族、种族和宗教的考生,这些题目是否没有任何歧视?考试目的是将考生的“差异最大化”,即要找到好学生能答对但差学生不能答对的问题。科尔曼说,达成此目标的一个简单办法是考查一些晦涩词汇,这也是SAT著名(或臭名昭著)的手法。他还说道,考试结果在数据上与预测极为吻合——只有少部分学生知道这些词汇,而大多数学生则一无所知——但是这一结果并不能充分反映科尔曼所信奉的教育意义。美国大学理事会在重新设计考试时改变了考试重点,优先考虑考试内容,测试的每个问题则要参照一系列能反映出学生将在大学和工作中遇到的阅读和数学问题。去年年初,施迈瑟和其他工作者一起花了大量时间来观察学生在回答大约20一组的问题时的表现,并在考后与这些学生一起讨论这些问题。施迈瑟在谈到修订版考试时说,“新版对学生正确率的预测准确度还是和旧版一样,但是在新考试中,我们能更好地控制考查的内容和技能。”
上个月,我与科尔曼在他办公室会面,讨论SAT的改革。谈到令他激动的想法时,他会时不时地从椅子上跳起来。有一次他跳起来在白板的中间从上到下画了一条分界线(他非常喜欢使用白板),然后在线的一侧写到“以证据为基础的阅读和写作”,另一侧写到“数学”。他正在白板上展示过去数月的反思与测试所得到的结果。
从2016年春季开始,学生将参加新的SAT——延用旧考试系统中长达3小时满分为1600分的考试,另外附加一篇单独计分的可选作文。科尔曼说,以证据为基础的阅读和写作将会取代目前的相应部分。新的阅读和写作将以科学文章,历史文献和文学摘录为素材,因为研究表明,这些材料是受过教育的美国人理应熟知并深刻理解的。科尔曼曾言,“在美国乃至整个世界,《独立宣言》、《美国宪法》、《权利法案》和《联邦论》都引发了关于自由、公平和人格尊严的重大讨论”,——因此,每一次SAT都将从建国文件或者从这类文件激发的“伟大的全球性讨论”的文章中节选一部分,比如林肯的《葛底斯堡演说8》(Gettysburg Address)。
科尔曼给我举了一个相关的简单例子。学生会读到一段摘自德克萨斯代表芭芭拉·乔丹(Barbara Jordan)于1974年的讲演节录 。在这段节录中,芭芭拉说对尼克松的弹劾将把人民划分成两派(party)。这时学生要回答的问题是,“乔丹话中的‘派’是何含义?”并且问题后有几个选项供选择。此类词汇问题会取代目前SAT中深奥难懂的问题。这种设计思路是,考试应该注重学生可能会遇到的多义词,比如“合成”(synthesis)。这类词在不同的语境下可以有很多意思。考试不应该鼓励学生死记硬背,相反应当提倡在高中阶段进行广泛阅读。
关于芭芭拉·乔丹的这道题还有后续题目:“你如何知道你选的答案是正确的?”要回答这道题,学生必须在文中划出能证明自己选项的文字。(到2016 年,SAT将有机考版。到那时学生可以在电脑上检索并标出相关原文。)考试还要求学生审查文本和数据,包括找到并改正两者的不一致。
科尔曼说,“任何时候当一个问题在大学或工作中有其重要性时,仅仅给出一个答案是远远不够的。至关重要的是提供证据来证明你的答案(这样别人就能了解学生的真实水平)。这项改革对学生的考前准备来说意义重大。只重视技巧和排除选项法再也行不通了。我们关注的不是学生对选项的选择,而是他们对其选项
合理性的证明。”
要实现这点,写作部分的题目也会修改。如此一来,所有的题目都会遵循一个思路:“读文章并思考作者是怎样把事实或者实例当成证据来使用的,如何展开思路以及怎样将论点和论据结合起来,以及如何用极具风格或说服力的内容增强所述观点的力度,然后写一篇作文解释作者是怎样进行论证来说服读者的”。考试选取的段落会不停变化,但分析和论证能力将会一直作为考察重点。科尔曼说,“学生会被要求做一些我们每天在工作和大学里做的事情:分析材料,理解观点并加强论据。”
数学部分也会以研究结果为基础考察“许多大学课程(和行业)必备的数学知识”。科尔曼承认,有人可能会以为由复杂题变成基础能力题会使考题简单化,但是他坚称实际情况并非如此。他解释道,数学部分会重视三个方面:一是问题解决和数据分析,包括比例、百分比和其他用于解决现实问题的数学推理;二是核心的代数问题,考查学生处理线性方程(“广泛运用于许多科研领域的有力工具”)的能力;三是人们所说的“前往高等数学的通行证”,这方面将着重考查学生是否熟悉复杂方程及其在自然科学和社会科学领域的应用。
去年六月,在哈佛夏季学院(Harvard Summer
Institute)的多天研讨会上,科尔曼就高校招生和专业咨询人员问题发表了讲话。发言前,他与威廉·菲茨西蒙斯(William Fitzsimmons)进行了会面。威廉·菲茨西蒙斯长期担任哈佛招生部和经济资助部主任,同时还是2008年美国大学招生咨询协会委员会报告的主要作者。为了给菲茨西蒙斯留下深刻印象,科尔曼带去了一份SAT改革大纲。
菲茨西蒙斯告诉我,他看了那份大纲后完全惊呆了。其中的考试设计似乎是对08年全国大学招生咨询协会委员会报告提出的最重要建议的直接回应。“与任何极为重大的改革一样,这项改革必将引发争议。”他补充道。然而他又继续说道:“在过去,有时考试会让人觉得它是在考察一些难以衡量的素质,诸如资质与能力,却丝毫不顾‘资质’和‘能力’究竟意味着什么。而现在的改革则发出了一个明确的信号:努力和成果都将得到相应的回报。这是我从事高等教育招生工作四十余年来见过的极其重大的进步之一。”
数据来源:美国大学理事会
然而,单纯改革考试内容并没能解决盘踞在科尔曼心头的所有问题。他仍为教育机会的各种不公感到困扰,并认为美国大学理事会应&