印象笔记Evernote

龚绮:数据驱动的教育变革

2016.11.11

1478873306408119.jpeg

芥末堆 2016 年 11 月 11 日 报道

在“互联网化”之后,数据化正在成为教育变革的下一个主题。教育的数据化有多难?需要考虑多少维度?从测评到用户画像,再到规划用户的成长路径,应该经历怎样的过程?

申请方联合创始人龚绮在今日的“GET2016教育科技大会”上做了以“数据驱动的教育变革”为主题的演讲。

以下为演讲实录:

今天想实打实说一些战术层的事情。我们是一家创业公司,申请方作为专家系统,以数据驱动的方式来做面对高等教育学生的发展平台。

看我们的名字叫申请方,很容易让人联想到好像是做留学的公司,很多人问过我这个问题。我在美国读博士期间读的是数据模型专业,最开始是以留学切入,但是我们不只是想做留学,而是通过留学学业场景来研究高等教育的本质,待会我会讲到这个事情。

1478863112650484.jpg

一个很普通的问题,大家都在谈大数据,数据到底是什么?有人说数据是和用户上一门课它的分数,它本身的品质等等,包括和用户之间的关系,可成为数据的东西太多了。我们能不能从数学的层面上抽离出来它到底是什么东西?经过我们的思考,我们认为可以用这样的数学结构表示。分为Entity、Relation,我们认为这个结构就是所有的数据。

1478863161444305.png

有了这样的图之后,举一个例子,先看上面,这是一个图我们暂且分为Entity是人和内容部分,人有各种各样的用户,它有各种各样的品质。内容之间是跟MIT开发的项目,它是和人有关系,人和数据和内容又有关系,通过这三者构成的图谱。人这边有人的图谱,有时候我们称之为 Social Network,内容之间有内容图谱,然后有知识图谱,知识投影在人身上是认知图谱,把这两个结合到人的画像。我们得出一个非常重要的结论,用人的画像刻画教育,人受教育的过程等价于人的画像是被不断更新的过程,这是我们的认识。每个人的画像有个性化的差异,有个性化的终点,因为有不同的追求。我想去做计算机,我想做工程师,这是不同的目标。画像与画像之间的过程是受教育的过程,在这个过程中要有作用,它被教育作用了,作用之后一定要被测量,你怎么能知道扔给他这个东西之后是好还是坏?所以有测量之后要有反馈去迭代。像刚才说的自适应是一样的道理,只不过用这套语言呈现出来,动态更新的过程就是教育的过程。我们通过画像的更新定义了教育之后,怎么定义好的教育?基于起点和终点的个性化差异,帮助更有效率的画像,这就是好的教育。

在座很多做垂直细分,你可以考虑我做的这个事情在体制上有没有价值。比如说有个同学做考试,考试是做什么事情?就是通过教育测试你的成果。有的同学做慕课还有远程教育,这个是在环境上的教育,所以这是好的教育,因为这个符合框架。

这些都是很理论的说法,我们的产品观念就非常重要了,如何去刻画一个人的画像?我们做的是高等教育的一个场景,怎么去刻画高等教育场景下同学的画像,非常重要。刚才是基于理论的分析,实际上操作时到底怎么做呢?这是一个问题。我们分为理想层和现实层,对于理想层,我们要通过学术层、理论层、工程层、技能层、专业层真正部署自己怎么去产品实施。基于理论层我们要做需求分析,要做数据模型,要做数据的收集,要做数据库的建立,数据库进来之后要做数据的清理和整合,要做数据的分析,最后做数据的传递、评估,再反回去做需求的分析。在数据安全整个涵盖所有的路谱,这是基本的理论层。理论层往上学术层,大概做的这些事情是对学术支撑。往下是技能层,指我们做的这些事情需要具备哪些技能。再往下是专业层,专业层是指我们找的这些人在哪个专业去找,这是部署的结构,由于时间的关系,下面的我就不展开说了。

实际上你压根找不到这样的团队做这种事情,我们通过自身的感受抽象出来需要的团队具有什么样的素质。第一要做 Modeling 的人,第二个一定要懂 Programming,第三要懂 Data Processing人,第四要懂 Percepion,Modeling 是建模,建模之后需要工程化需要 Programming,工程化以后进行一系列的处理,抓取、网上爬数据,建数据库以及数据分析都是 Data Processing,最后把这些都做出来了还要做 Perception 数据可视化。我们是一个创业公司,也是一支奇葩的团队,作为创业公司我们成立了高等教育研究部,为什么做这件事情呢?是研究高等教育的规律把它变成数学上可以理解以及建模的元素,数据部需要做很多真正数据上面的事情。

1478870109312112.png

接下来这张图,我们申请方是做高等教育的学业规划平台,我们从高等教育入口和出口换成几个场景,第一个场景是升学场景,升学进来以后有课程的基础训练,基础训练之后有以背景提升为核心的高级训练分为科研、职业、公共服务、创业指导。之后通过继续深造,然后到了学术界、业界、社会公共服务、创业学业的出口。因为我们是研究高等教育底层的框架做这方面的尝试和突破,所以不得不把高等教育相关的场景全部囊括下来。基于我们团队的背景,我们团队最开始的创始人 70% 都是海归,50% 以上都是博士生,我们对留学包括整个的科研训练这条线非常熟悉,我们当时就切了以升学那边为例的留学场景,基于这个场景做整个的学业规划数据研究。

做了这个公式之后怎么去覆盖呢?例如升学当中也包括高考的报考,我们的做法基于本身的个人画像普及性研究,那是一把尺子,有了这把尺子之后,就可以把其他的学业场景要参考的数据维度映射到这把尺子上面,肯定有人说了,映射的话你的维度是不是不全的,因为那么多的数据你也不知道,这就涉及到底层架构的问题,这把尺子按照数学的方法所有的尺子都是正交的。任何一个新东西进来,一定会用所有的维度被线性表达,我们做这样的尝试,我们跨场景跟别人合作。你有你的评价方式,我有我的评价方式,为什么我的评价方式比你好呢?第一,我比你更完备,你所有的维度能够被我的正交表达,这个很重要,否则做不了底下的事情。我们按照这个方面,按照一个场景一个场景去突破。返回到人的个人画像,这是我们的核心,变得非常完备好用了。如果加维度的话,除非所有的维度都不能被正交表达,否则都可以加。

我们做的这个事情首先以数据为核心,机器端包括数据库、学业数据库、职业数据库,第二个是管理工具、社区数据库和测评体系。我们有非常大的数据库,有很多人抄我们,没有关系,因为它只能抄表层的内容,不能抄这些关联、数据维度,这些数据维度拆出来才能为学业传承所服务,所以我们根本不担心,这是数据库层级。

重点说一下测评体系,测评体系包含个性化评测,用那把尺子量一下学业状态,量了之后告诉我的学业目标是什么方向?我们给用户智能化推荐,有了这个推荐之后,很多的测评场景就到头了,你适合什么,这种感觉跟算命一样。推完之后我们给你规划一条路径,你在什么节点做什么事情,怎么去推。这就包含了刚才说的专家场景。比如说以留学场景,在留学场景你把那些画像全部告诉我们,之后就可以做智能化推荐。你适合选什么样的专业,以及适合去申请哪些学校。告诉你之后,你怎么申请不知道?你需要学很多的知识,这些事情就在规划中已经有了。

怎么做这个事情?因为我们现在有留学的经验,有很多这样的业务经验,所以我们可以找专家系统进行推荐。马上问题就出来了,你怎么保证这个事情是 OK 的?你推荐的准确与否?我们的核心不是测评场景,核心是个人画像,给了这样东西之后,我们现在部署这件事情,我们希望跟用户实时反馈。你做的这个事情,到底离你的学校近了多少,这个东西可以基于个人画像功能进行实时反馈。最后,你达到的目标是很久以后了,但没有关系,你一旦达到那个目标之后,就可以完全看我们的整个推荐系统算法模型是不是 OK,进行自己进化的改变。我们想把这个做法推广到其他的场景,包括升学场景包括学业场景,在做各种各样的场景铺设。

人机混合智能引擎是多平台、多周期会话,这是很重要的发展趋势。第一个是标准化需求智能解决方案,机器前端、人工后端支持。因为我们是做学生学业发展规划的公司,我们帮他做学业规划。我们希望通过这一套系统标准化的需求,以及标准化的学业状态,告诉用户可能做什么样的事情。当这个机器不能满足需求时,人就可以进去,从此机器在前端人在后端。我们可以做 To B 的合作,刚才有人说培训界的咨询师非常缺乏,缺乏的背后是缺乏经验,哪有那么多时间培养他呢?你能做到人在后面,后面有机器支持你的规划。因为我们是做学业规划的,这个有可能实现。还是以留学咨询为例,一个留学咨询师其实你根本不知道这样的状态适合读什么样的东西?你可能说很适合去哈佛,但是没有理由去支持,有了后面的机器就有理由支持他,这个支持并不是把结论告诉他,而是有一套的资源,你为什么这样做?这就是人在前,机器在后,这就构成了 C 端的核心点,以人的画像作为主核心,贯穿所有的产品功能。

我们的 PGC 数据库有学校、专业、课程、校园机会等等的数据库,像校园机会还是比较少,我觉得做数据方面的东西一定有很多的文章可做。我们花了差不多两年的时间整理这些数据,而且很好的更新这些数据。校园机会包括讲座、论坛、讲学机会、论赛,只要对学业有帮助的都可以拿出来。

工具是怎么样帮你更好的管理资源进行搜索,还有UGC的数据是社区,还有测评产品,大家可以看到已经发布了专业测评、留学测评、高考报考测评,第四个图像是测评规划,就是说测了之后告诉你怎么去做。

另外,做学业规划,研究用画像,需要一把尺子,这个尺子不是谁都可以用的,不是谁都可以支持的,如果用的话就要实现 To B 的突破,让大 B 去做背书,我们做了这样的尝试,这个是 To B 的品牌,一定要准备好一些策略,才能打胜仗。

我们 To B 有三个概念,第一个是高等教育、科研机构的学术组织,第二个是企业机构,第三个是公共事业,政府、教育研究机构及公益组织。我们对他们是技术与数据驱动的互联网方案提供商,以及践行教育研究的群求智库。我们作为创业公司对于学术层级、政府层级有自己的独特优势,这些不是所有的创业团队可以复制的。我们在全国真的有智库,我们研究高等教育会自上而下打一些东西,我们会发一些报告,会发其他国家怎么样,他们的评价是怎么回事,他们的机制是怎么回事,会有这样的报告。我们有全球战略的研究报告。我们发的美国、欧洲多一些,澳洲、南亚也有一些。

基于高等教育入口-过程-出口全过程研究报告有评价机制研究报告有高考报考报告有大学生的 RISE 体系发展报告,大学生就业机会研究报告,这些是基于我们的理论体系做背书。

谢谢大家!


印象笔记(Evernote) 是一款风靡全球的免费笔记应用,是全球 2 亿人的工作空间。你可以使用任何一台设备打开印象笔记,在这里专注完成写作、收集有用信息、快速发现所需、随时演示想法。

印象笔记企业版致力于为教育培训机构打造强大、易用、触手可及的教学资源库。
  • 无限量存储空间,汇聚教研资料于一处
  • 跨设备无缝同步,随时随地查找知识
  • 智能信息挖掘引擎,让知识触手可及


新技能get√

长按并识别以下二维码,关注【我的印象笔记】,即可永久保存嘉宾完整分享内容。

9cf39f51e6696cb24fcb232827299045.jpg