一般而言,大数据的处理流程包括数据采集、数据处理、数据分析与应用服务四个环节。
从下往上依次是:教育数据采集层、教育数据处理层、教育数据分析与展现层和教育数据应用服务层——通过数据传输接口,数据采集层将采集到的各类教育数据传递给数据处理层,并通过数据整合、存储形成教育数据平台;基于该教育数据平台,分析与展现层可实现教育数据的可视化展现和大数据的分析与挖掘,并将分析结果通过数据接口传递给应用服务层。
安全与监控贯穿整个流程,以保证教育数据各个环节的安全性和可控性;标准与规范则是整个框架的基础,以保障各个环节之间以及整个系统教育数据的融通与共享。
各个环节的主要任务及其涉及的关键技术如下:
1、教育数据采集
数据采集涉及的关键技术包括:数据源的选择和高质量原始数据的采集方法,多源数据的实体识别和解析方法,数据清洗和自动修复方法,数据演化的溯源管理,数据加载、流计算、信息传输技术等。
2、教育数据处理
教育数据处理环节包含数据整合和数据存储。其中,数据整合是指通过高质量的数据整合方法,对数据进行加工处理,并在尽可能保留原有语义的情况下去粗取精、消除噪声,从全局的角度保证数据的一致性和相关性;数据存储是所有数据的集中存放地,主要用来存放各种结构化、半结构化和非结构化的历史数据、预测数据、汇总数据以及需要共享的数据等。
3、教育数据分析与展现
(1)教育数据挖掘
教育数据挖掘是一个将来自各教育系统的原始数据转换为有用信息的过程,这些有用信息可为教师、学生、家长、教育研究人员以及教育软件系统开发人员所利用。
(2)学习分析
学习分析是指通过测量、收集、分析、汇报学习者和他们所处环境的数据,用以理解和优化学习以及学习发生的环境。
目前,学习分析领域常用的分析方法包括网络分析法、话语分析法和内容分析法。
4、教育数据应用服务
通过对教育大数据的分析,可以辅助教师更好地调整和改进教学策略,重构教学计划,完善课程的设计与开发;向学生推荐个性化的学习资源、学习任务、学习活动和学习路径;帮助家长更加全面、真实地认识孩子,与学校一起促进孩子的个性化成长;帮助教育管理者进行更科学的管理决策;帮助社会公众把握教育的发展现状,享受更具针对性、更适合自己的终身学习服务。
后续深入介绍。
参考文献
教育大数据的技术体系框架与发展趋势——“教育大数据研究与实践专栏”之整体框架篇 杨现民