辽宁省招考办技术人员运行“考场违规行为智能分析系统”。 南都记者 冯群星 摄
2020年辽宁高考监控视频回放。 南都记者 冯群星 摄
在高考中,人工智能可以发挥什么作用?最近,辽宁省在全国率先做出尝试:用人工智能辅助分析考场监控视频,检测打小抄等疑似违规行为。
辽宁省高中等教育招生考试委员会办公室(以下简称“辽宁省招考办”)相关负责人对南都记者强调,应用人工智能的主要目标不是抓作弊,而是希望起到震慑作用,让抱有侥幸心理的考生不敢、不能、不想作弊,营造更加公正、公平的考试环境。
80台智能分析服务器
每小时可分析320个考场视频
7月7日傍晚5点,交卷铃声响,辽宁省2020年高考第一天考试结束。
3个小时后,辽宁省招考办的近10位技术人员忙碌起来:当天的全部监考视频已被加密传输到云端数据库,考场违规行为检测随之开始。
办公室里没人说话,只能听见电脑主机运行发出的嗡嗡声。每位技术人员都守着一台电脑,全神贯注地盯着电脑屏幕上若干个整齐排列的程序窗口——他们没有敲击键盘或鼠标,程序窗口内却有一行行代码以肉眼几乎看不清的速度飞快闪过。
这些代码的背后,正是辽宁省今年首次引入高考的“考场违规行为智能分析系统”。
通过研判监考视频排查考场违规行为,是各省市每年高考期间的例行工作。但多年下来,辽宁省招考办也发现了一些“痛点”问题:投入人力多,需要100名以上的专业人员;花费时间长,100多人也得看上7-10天;每个监考视频的时长都在3小时以上,研判人员一直盯着倍速播放的视频,很容易出现疲劳,专注度和辨识能力不足。
人类的短板,人工智能恰好可以补上:它具备自我学习能力,数据处理速度快,能7×24小时全自动运行。
辽宁省招考办数据部副部长刘健介绍,今年辽宁共有7585个考场,生成监考视频3.3万个,视频总时长近11万小时。人工智能系统配备了80台智能分析服务器,每小时可以分析320个完整的考场视频,仅用170个小时的时间就完成了全部检测。
这170个小时,还包括视频文件的获取和存储所占用的时间。如果据此对系统的运行时间做一个保守的换算,80台智能分析服务器同时工作,每检测一场考试视频的平均用时大约是18秒。
需要说明的是,系统检测出的异常行为,只能被称为“疑似违规行为”。研发团队负责人、沈阳航空航天大学教授、沈阳图为科技有限公司创始人石祥滨告诉南都记者,考试违规的判定是一个复杂且谨慎的过程,系统给出的参考结果要经过多轮人工核查,最终由各级考务人员判定是否违规。
运行不到一小时
发现疑似违规视频
据了解,7月7日晚系统正式启动运行后,不到一个小时就发现了第一条考生行为异常视频。疑似违规的两名考生,协同作弊、互对答案,并没有被监考老师发现。
两名考生没想到的是,他们的一举一动都被人工智能“尽收眼底”。只要研判人员登录到业务管理模块,就可以一目了然地看到疑似违规情况。
“去年研判时,分配给我们的是一堆原视频,每个视频都要从头看到尾。每个考场里有30个左右的考生,你想想视频画面里的人得有多小!时间没少花、累没少挨。”一位参与过去年高考的研判人员说,有了人工智能系统,回看视频的总量一下子减少到原来的1/20,研判工作更有针对性。
“前期人工智能系统已经把大量视频筛掉了,各级考务工作人员只需对系统检测出来的疑似违规行为进一步甄别判断。”刘健说,在防控新冠肺炎疫情的特殊形势下,应用人工智能不仅提升了研判工作的效率,也避免了大量研判人员聚集带来的潜在风险。
据辽宁省招考办介绍,今年发现的诸多疑似违规行为中,有部分被考务人员判定为确实违规。经过实际检验,系统能有效识别旁窥、前窥、回头、递纸条等常规性抄袭行为,在人工不易判断的高科技作弊行为检测方面也取得了较好的效果。
细微动作或仅是几个像素
研发过程历经重重挑战
疑似违规行为是怎么被发现的?系统算法负责人、沈阳航空航天大学副教授、沈阳图为科技有限公司核心成员刘翠微解释说,团队通过研究大量的考试视频和心理学资料,发现有违规行为的学生会产生一些心理波动,进而表现出行为异常。“通过分析画面中考生的动态和静态特征,人工智能系统可以捕捉到一些异常行为。”她说。
原理解释看上去非常简单,真正的研发过程却艰辛而漫长。辽宁省招考办早在2017年便有意使用人工智能,但受技术水平限制没能实现——相关工作人员接触了不少公司,包括一些互联网大厂,得到的答复都是“做不了”。直到2018年,沈阳航空航天大学团队才接受了这个“挑战”。
让人工智能炼就“火眼金睛”,难在哪儿?刘翠微告诉南都记者,在考场上,不同考生之间的差异性很大,违规行为的特征是不确定的。即便同样是打小抄,100个学生可能也会有100种不同的表现。这就要求研发人员明确违规行为的特征,让系统能够作出有效区分。
考生精细动作的可辨识性,则是另一种难题。由于现实条件限制,考场内不可能安装多个摄像头,只能靠教室前端的一个摄像头来俯拍全景,不同的考生之间可能出现遮挡。一个教室大约有30位考生,即便考场视频已达到高清级别,画面中的每位考生还是很小,被拍下来的身体姿态、动作也局限于特定的角度。
“一个想作弊的考生会有很强的主观隐蔽性,不可能把他的行为公然展现出来。他的动作都是细微的动作,变化幅度非常小,反映到图像当中可能就是几十个像素甚至几个像素。”刘翠微说,此前的一些人工智能系统可以检测幅度较大的快速运动,比如打架斗殴、异常奔跑等。但室内环境下的多人精细行为分析,仍然面临较大挑战。研发工作曾多次陷入瓶颈,因为视频的数据量太大,他们有时候让系统运行一个测试,都要花上一两天之久。
据了解,也正是由于多项工作属于“勇闯无人区”,研发团队目前已申请了11项发明专利。为了让相关应用得到更好的发展,团队还孵化了沈阳图为科技有限公司,专攻视频领域的行为识别。
人工智能没有KPI
主要目的是震慑
从2018年研发启动到如今的应用落地,两年多的时间过去了。团队负责人石祥滨坦言,当初接下工作的时候就知道挑战很大,但还是没想到花了这么长时间。
在两年多的时间里,系统曾在辽宁省的普通高考、高中学业水平考试、研究生入学考试、自学考试和成人高考等考试中进行试点实验,确认了实际效果之后,辽宁省招考办才决定在今年的普通高考中正式应用。
不过,从7月7日开始,石祥滨还是每天都要去一趟辽宁省招考办检查情况。技术人员们也实行了“两班倒”,确保系统可以24小时不间断无故障运行。
“这么复杂的一个系统,只要有一个环节出问题,就会影响到后面的工作。但高考是不允许出错的,我们要对考生负责。”石祥滨坦言,压力很大,每天看到系统正常运行才能安心。目前来看,系统成功经受住了考验。
值得注意的是,刘健告诉南都记者,智能系统并没有设定“抓多少个违规行为”的“KPI指标”。“不是说抓到的违规考生越多就越好,更多的是要起到震慑的作用,让考生清楚知道作弊必被抓,实现考生不敢、不能、不想作弊的目标,营造更加公正、公平的考试环境。”刘健说。
近年来,人工智能的效用屡屡被党和政府提及。辽宁省招考办表示,未来希望将人工智能技术应用于招生考试工作的更多环节,如识别试卷保密室工作人员、智能评卷等,实现招考工作中的治理能力提升。
采写:南都记者 冯群星 潘颖欣