2017年6月7日,高考机器人AI-MATHS和Aidam分别在成都和北京参加了数学考试,并分别在22分钟、7分49秒的时间内获得了105分、134分的成绩。
自高考机器人参加高考并取成绩后,引起了学术界、教育行业内、技术界的热烈讨论,但同时“高考机器人是一个噱头”、“高考机器人单一产品落地产品是有困难的”、“很难说有没有作弊,不过确实不能拿几个简单的问句来解释。”等争议和质疑不断。
教育圈被机器人之战持续刷屏。面对高考Pk赛的热浪来临,在人工智能技术与现有教育行业方兴未艾之际,同时也伴随着社会的部分质疑,是概念炒作还是技术壁垒?
面对人工智能技术的“霸气入侵”,上市公司和创业公司是如何分羹的?如何在“人工智能+教育”领域跑出,而非跑死?题库、逻辑推论,高考机器人原理各有不同
根据公开信息显示,此次两个高考机器人在采用的原理和逻辑各有不同。
6月7日,成都准星云学人工智能系统“准星数学高考机器人”AI-MATHS参加2017高考数学考试,在22分钟的时间里,得分105分。整个过程是严格按照断网、断库、自然语言理解、综合复杂推理等严格流程进行的公开偷明测试。
其通过智能笔,能识别答题过程,判断对错。虽然外观上与普通笔无异,但通过其前端的红外线摄像头,配合点阵纸,可探测使用者落笔的位置进行数据采集并上传,再通过构建的数据库(数学公式、汉字、符号和语境四大数据库)进行后面的纠错解答,以及评测。虽然考试机器人的水平很高,但实际上,考试机器人自身亦存在缺陷。
其在2017年2月,准星的“高考机器人”进行过中期评测,得分93分,败给了43名文科班学生。3个月后,机器人在复杂逻辑推理、直觉观察推理、计算机算法、深度学习上都进行了深入攻关。
成都准星云学创始人、清华大学苏州研究院大数据处理中心负责人林辉表示,“高考机器人”已经练习了1.2万道题。“高考机器人”没有题库,“它是通过综合逻辑推理平台来解题,而非学习储存题库。”
他认为,在此前的评测中,机器人也曾达到过110分以上,但并不稳定,且要看试卷的匹配度。此前失利,“高考机器人”在不会的题目中错过了很多步骤分,“现在设定,比如一道题目不会,多少分钟后就跳过;也可以在会的范围内得步骤分,不会留一个空白。”据说,机器人约20分钟就能答完一套题。
对于另一个高考机器人Aidam,学霸君首席科学家陈锐锋描述解题过程,一是将自然语言转化为形式语言;二是做解题;三是将形式语言转化为自然语言做输出。在机器解题上,Aidam分为三个步骤,第一步是通过句法解构、算式解构和主谓宾解构,转译为机器能看懂的语言,从而让机器读懂题目。第二步是机活神经元之间的连接,机器通过自动证明和推理,得出解题结果,第三步是将解题步骤和结果翻译为人类语言,展示给学生和老师。
通过两者的对比,一个是国家的“863”项目,另一个是社会项目;一个是在断网断库请景下,另一个是在联网联库请景下。两者都是将有强逻辑知识点的数学科目切入,数学、物理等理科类科目是强逻辑链路的,考点基本稳点。
只不过,两者在技术的方法论上有所不同,前者是综合逻辑推理平台来解题,后者是基于学习存储题库进行运算和输出。炒作OR技术壁垒,质疑源于何处?
在知乎上,有人犀利地提出疑问,“AIDAM是人工输入题目,那还做个什么人工智能?”、“作为NLP的从业人员,很担心最后AI领域被他们玩坏,进入冬天了咋整。”等等。
面对不同的讨论和质疑声,蓝鲸教育向有关图像识别、深度学习、文字识别等专业方向的人工智能专家进行了解,并得到了各自的看法和观点。
有业内人士苗广艺在知乎上表示,对于一家商业机构并刚过C轮的创业公司来说,不同于为了拿学术地位的科研机构,也不是手握印钞机开始考虑技术影响力的巨头。自动解题技术花费了公司大量成本,现阶段不会直接公开出来。如果业务已经形成一定垄断,技术公开就很轻松了。而现在,技术是护城河之一。
其次,整个流程没有动手脚。过程是:第一时间拿到高考试卷(拍照的图片),然后录入到电脑上(内容和试卷一模一样,公式用的latex格式;人没有做任何翻译或预处理,后面的NLP完全是由系统算法自己做的),然后把题目数据输入到解题系统,系统自动解出所有题目(没有任何人工),然后输出表达成解题的步骤(也是自动的),最后第三方老师拿到这些步骤开始批改,给出客观分数。这是一个系统工程,用到很多人工智能的基础算法,但不是通用算法的简单训练,是垂直领域的深度加工。
中科视拓CEO、深度学习大讲堂执行主编刘昕博士向蓝鲸教育给出了他的思考,两者是要做两方面一方面从感知的角度是要从图像转向文本或者转向符号,要先做感知;另一个方面是要做语义理解。即从图像到数字化、并从数字化内容进行理解;需要有试题等历史积累。
刘昕同时表示,第一方面ti现的是数据问题,通过大量的高考数据进行学习;第二方面ti现的是在做完数字化之后,要理解内容,比如阅读理解和问答题等在说什么,需要有一个数据库。有两个途径,一个是完全的数据驱动,通过统计数据的方法或者规律说明数据的意思;第二个是有人类知识的经验或者逻辑的经验。
东南大学人工智能专业教授漆桂林先蓝鲸教育表示,高考机器人要落地现在还很难,但是其可以做的一个事请就是减少人工回答问题的工作量。比如说,以前需要很多人工回答的问题,可以由机器给出一部分的答案,当然,必须保证答案的正确新。上市公司和创业公司如何分羹?
在科大讯飞(002230,股吧)公司轮值总裁吴晓如看来,让人工智能去参加测试的主要目的就是要看看机器能达到一个什么样的人工智能水平,而随着后台海量数据库的增长,传统的“图灵测试”已经无法完全衡量人工智能的水平了。而高考是一种很好的,可以作为衡量人的知识水平、理解能力、推理能力等相关智能能力水平的测试工具,所以这个才是他们把高考作为这个项目主要目标的原因。
目前,已经有科大讯飞、网龙华渔、淸睿教育等上市公司以“人工智能+教育”作为主要的业务发展思路。蓝鲸教育对涉及高考机器人、作文批改、语言测评等10家公司进行不完全统计,从产品、商业模式和业务方面做对比分析。