舉世矚目的圍棋世界冠軍柯潔與谷歌AlphaGo的三番棋大戰(zhàn),以AlphaGo3 0完勝告終。機器人做高考題又會怎樣?本月7日,2017全國高考將舉行,當日下午5時許,在成都將舉行一場特別的考試:“準星數(shù)學高考機器人” AI-MATHS,將在公證機構和媒體的見證下,挑戰(zhàn)2017年高考數(shù)學題。這將是國內首次由機器人應試高考題,它能考多少分呢?會比學霸厲害嗎?
考場:斷網(wǎng)答題 公證機構和媒體“監(jiān)考”
記者從研發(fā)單位了解到,與多數(shù)人對機器人的印象不同,即將參考的AI-MATHS其“身體”并非模仿人類的樣子,而是10余臺服務器,其“大腦”就是服務器上承載的人工智能系統(tǒng)!翱紙觥痹O在成都天府新谷10號樓的一個會議室里,屆時入場答題的實際上就是這些服務器。像考生會被切斷與外界的聯(lián)系一樣,這些服務器也會被切斷網(wǎng)絡連接。由公證機構和媒體出任“監(jiān)考老師”。這場特殊的“高考”只設置數(shù)學科目,將在7日下午5時之后,也就是高考數(shù)學結束之后進行,不會影響正常高考的進行。
AI-MATHS具體將挑戰(zhàn)哪套試卷?成都準星云學科技有限公司CEO、清華大學蘇州研究院大數(shù)據(jù)中心主任林輝表示,高考數(shù)學結束后,公司將立即從相關部門、網(wǎng)絡等多渠道爭取試卷,“目前擬爭取全國卷、北京卷等幾套,但是最終能拿到哪幾套,具體幾點鐘拿到還不確定。如果拿到多套試卷,AI-MATHS將在2小時內同時作答多套試卷。”
屆時,如果考題是AI-MATHS都會答的,它將會以大概20分鐘一套的速度作答,如果有它不會的考題,它將先跳過這些題目,把會答的都答完,再返回來爭取突破剩下的難題,直到解出答案或者考試時間結束。
預測:目標110分 今年模擬考得了93分
“成都造”高考機器人到底是什么來頭?為啥要“高考”?林輝介紹,AI-MATHS誕生于2014年,是依托清華大學大數(shù)據(jù)、人工智能、自然語言識別等前沿技術,研發(fā)的一款以自動解題技術為核心的人工智能系統(tǒng)。本次挑戰(zhàn)是對研發(fā)成效的一次階段性檢驗,挑戰(zhàn)結果將運用到該公司對AI-MATHS的技術驗證中。
在此之前,AI-MATHS也像普通高考考生一樣,大量“刷題”,目前已訓練500套、約1.2萬道題了。對于AI-MATHS能在7日取得什么樣的“高考”成績,林輝在昨日接受記者采訪時,并未預測分數(shù)。
不過,去年5月,在宣布這款高考機器人參加考試時,團隊設定的目標是110分,當時其已在模擬考中取得過115分的成績。但在今年2月的一次模擬考中,AI-MATHS得到的分數(shù)是93分。為何AI-MATHS練題增多,成績卻出現(xiàn)下降?林輝表示,研發(fā)團隊經(jīng)分析發(fā)現(xiàn),問題出現(xiàn)在AI-MATHS對題意的理解環(huán)節(jié),“題目中出現(xiàn)了AI-MATHS從未 學習 過的生詞,如:投資、理財,它以前做的練習題沒出現(xiàn)過這些詞,它不懂這些詞的意思,就卡在那兒了!
分析:最大難點 準確理解題干意思
作為人工智能,AI-MATHS與谷歌阿法狗(AlphaGo)的主要區(qū)別在哪兒?
林輝表示,阿法狗專攻圍棋,AI-MATHS專攻數(shù)學。研發(fā)圍棋機器人,用計算機語言描述圍棋規(guī)則相對容易,難在要讓系統(tǒng)在極短時間內算出每次落子后的幾十步甚至幾百步的不同局面。而研發(fā)高考機器人最大的難點在于,首先要讓系統(tǒng)準確理解人類語言,后面做題的步驟反而不多。人類的語言千變萬化,而且還在不斷創(chuàng)新,幾乎是學不完的。遇到?jīng)]學過的生詞,人類會聯(lián)系上下文去推測詞義,猜對是比較容易的事;而機器人卻會卡殼。比如,正切(tangent)的縮寫,近年來的教材和試題里面都用的是“tan”,但早些年用過“tg”。團隊在訓練AI-MATHS用的題都是“tan”,最近突然讓它做了一道“tg”的題,它就懵了。
對此,研發(fā)團隊除了讓AI-MATHS練更多題,讓它理解更多詞匯的意思外,還對系統(tǒng)的答題程序設置進行了一些修改,讓它在不能給出完整答案的情況下,也給出部分答案,爭取“步驟分”。