来源:光明日报 2015-04-16
在教育领域,数据是描述事实的符号序列,是信息载体。教育数据大致可以分为三类,包括结构化、半结构化和非结构化的数据,通常,这些数据以数字、文字、图像、声音或视频等形式进行存取。在大型教育信息的专用平台上,统计数据大多是以结构化数据的形式存取的,用户利用信息平台所提供的应用软件,可以自行生成所需的教育信息和知识。美国的国家教育统计中心网站就是这样一个平台,在此平台上,连续性的开放获取的数据既可以为教育决策提供决策支持,为教育研究提供数据支持,也可以为公众在教育领域行使知情权、选择权和监督权提供信息保障。
与数据不同的是,信息是为了某种目的而组合的数据,用来传达某种意思。以数学课的考试成绩为例,单一学生的考分只是一个数据,而全班学生的平均考分就是一条信息,它可以用来反映该班学生在年级的排名位置,也可以用来说明数学课的教学和学习情况。另外,如果把数学课的考分与学生的性别、家庭收入、教师的教学行为和学生的学习行为联系起来,进行长期的跟踪研究,研究的结果就可以揭示数学成绩与学生性别、家庭收入、教学行为和学习行为之间是否存在某种关系,由此而产生的新知识就有助于促进数学课程的教学和学习,有助于证实或证伪某些假设。
教育教学知识的创造和创新,需要教育研究方法和数据具有多样性和互补性。以定量研究和质性研究为例,通常,定量研究需要结构化的数字数据,教育统计软件和大数据的研究也需要结构化的数据,定量方法及其数据特点使得大样本的研究成为可能,但定量研究的结果往往缺乏深度的解释力。在此方面,质性研究恰好可以用来弥补不足,质性研究一般采用半结构化、非结构化的数据,如研究笔记、访谈记录和音像图片等形式数据,研究结果解释力强,但不宜概化。因而,在方法和数据方面,上述两种研究的局限性使二者互为需要,数据挖掘方面更是如此。
教育教学知识的创造和创新,需要顶层设计的引导,也需要底层设计的支持。在此,顶层设计指的是自上而下的设计,其中的主要部分一般需要识别、分解和优化,直至成为可执行的行动方案。例如,促进公平和提高质量是我国教育顶层设计的目标,但能否实现目标,它们能否被分解成具体的、可测量的、可达到的、脚踏实地的和具有时间边界的数据指标,很大程度上取决于权责一致的原则能否落实。同理,如果底层设计缺乏激励全员参与的机制、学习型的组织或社会就难以建立,嵌入式知识和隐性知识就难以转化为显性知识,这当然不利于教育教学知识的创造和创新。
某种程度上,注重数据就是注重事实,就是注重把研究者的偏见及研究方法的局限性压缩在最小限度,最大限度地还原事实真相。为此,教育领域至少采用两种方式保证研究的客观性,其一是规范研究设计。例如,美国的国家教育统计中心制定了《统计标准》,要求所有进入其数据平台的统计数据,在问卷调查的规划设计、数据收集、数据处理、数据分析、信息审核和信息发布等过程中,都必须严格遵循《统计标准》的相关规定,以确保数据质量——客观性、实用性和诚实性。其二是注重科研伦理的教育,敦促教育研究人员必须了解、尊重相关的科研伦理。
随着知识时代的到来、问责之风的兴起,教育数据已不再是教育专家和学者的专利。事实上,包括网络、媒体和市场在内的众多利益相关方无时不在点评教育,有些点评还内含精心筛选的教育数据。因此,尊重不同的观点是必要的,尊重不同观点背后的事实依据更加必要,一是因为事实是观点自由和言论自由的保障基础,二是因为教育需要凝练共识,而不带偏见和歧视的共识恰恰需要建立在事实基础之上。在此前提下,教育领域的利益相关各方才可能对彼此抱有更为理性的期望,利益相关各方才更有可能协同建立360度的教育问责系统,使科层问责、专业问责、政治问责和市场问责形成互补性的关系格局,共同促进教育的健康发展。