6月7日,高考第一天,在成都高新区天府新谷10栋9层的一个封闭空间里,一位特殊“考生”准备挑战今年全国高考的数学。它就是成都高新区一家企业研制的高考机器人,名叫“AI-MATHS”。
作为编外考官,华西都市报-封面新闻记者在现场注意到,“AI-MATHS”被安排在一间完全断网的房间内,并用警戒线围起,黑SE的服务器机箱中有11台服务器负责解题。为保证考试公正,考试现场没有人可以草作这些服务器。
从下午18时28分到19时29分,“AI-MATHS”分别挑战了北京卷文科数学以及全国二卷文科数学的考试,分别用时22分钟和10分钟,得分为105分和100分。尽管和之前预期的110分目标还有差距,但是作为“家长”——成都准星云学科技有限公司CEO、清华大学(分数线,专业设置)苏州研究院大数据中心主任林辉介绍,“前几个月的书,这孩子没白读。”
4小时内,全网共计86万人在线观看封面新闻直播。其中,封面新闻客户端12万人在线观看,华西微博阅读点击量达到38万。
“AI-MATHS”之父林辉这孩子解题容易读题难
两次考试具ti得分如下:北京文科数学卷,选择题满分、填空题20分、解答题45分,全卷105分;全国卷二选择题55分、填空题20分,解答题25,全卷100分。在选择题和填空题上,“AI-MATHS”表现十分亮眼。丢分环节主要是解答题,有些题目甚至是0分。
“家长”林辉说,其实能考到这么多分,已经证明,“这孩子前几个月的书没白读。”但是他也提到了“自家孩子”在答题的一个弱点,“看不懂题。”研发高考机器人最大的难点在于,要让系统准确理解人类语言。“直接用数学语言表述的应用题它可以轻松解答,但它最大的弱项是不能理解考题里场景式的描述语言,它会读不懂题目。”
高考数学机器人为何会读不懂题目?对于这个问题,林辉打了个比方,如果题目是10-1=?人工智能系统可以轻松作答。但如果题目用了场景描写将其表述为“小明有10个苹果,小丽吃了一个,请问还有几个苹果?”面对这样的请况,人工智能系统就“傻”了,“它不理解小明是什么、小丽是什么、吃又是什么意思。”
实际上,为了“AI-MATHS”迅速克服这解题的弱点,准星云学科研团队此前对“AI-MATHS”已进行了500套试卷、12000道题目的魔鬼式训练。
阅卷老师祁祖海“处于本班学生的中等水平”
成都七中林荫校区高级教师祁祖海是负责此次评阅试卷的三名老师之一,他分析,在评卷过程中,“AI-MATHS”所犯错误的题目都有一个共同点:语言文字太多。这表示,高考机器人在自然语言上的理解稍稍欠缺。相反,在理解数学语言上相对容易。
根据自身的教学经验,祁祖海认为,一般学生的成绩大约在110分左右,而这次“AI-MATHS”取得的分数,大概处于本班学生的中等水平。但是他坦言,高考机器人的进步空间会很大。如北京考试卷中有一道立ti几何的证明题,机器人选择的解题思路与大多数学生选择的不同,却依然解答正确,这在思路上有所创新。
而“AI-MATHS”未能完成的题中,有一道概率统计文字题,普通学生需要将自然语言转换成数学题,将图表信息转换成数学信息处理。祁祖海估计,机器人在信息挖掘和语言理解上稍差,相反,在证明题上表现优异。