
劉淇,中國科學(xué)技術(shù)大學(xué)計(jì)算機(jī)學(xué)院副教授、博士生導(dǎo)師, CCF大數(shù)據(jù)專家委員會(huì)委員,CAAI機(jī)器學(xué)習(xí)專委會(huì)委員、中科院青促會(huì)優(yōu)秀會(huì)員。主要研究數(shù)據(jù)挖掘與知識(shí)發(fā)現(xiàn)、機(jī)器學(xué)習(xí)方法及其應(yīng)用。
教育的發(fā)展歷程
從古至今,時(shí)代的變革往往會(huì)伴隨著教育發(fā)展的重大變化。當(dāng)下時(shí)代,隨著人類社會(huì)信息化進(jìn)程的不斷深入,教育教學(xué)方式從依賴于黑板和紙筆的經(jīng)驗(yàn)?zāi)7陆虒W(xué)范式逐漸轉(zhuǎn)變?yōu)橛?jì)算輔助教學(xué)范式。通過綜合應(yīng)用計(jì)算機(jī)、互聯(lián)網(wǎng)等各種新興技術(shù),計(jì)算輔助教學(xué)使得教學(xué)內(nèi)容與教學(xué)媒介更加豐富。例如,多媒體課件早已大范圍普及我國的課堂教育,各類網(wǎng)絡(luò)教育、遠(yuǎn)程教育也極大地方便了人們學(xué)習(xí)的過程。然而,在計(jì)算輔助教學(xué)范式下的中國教育,尤其是基礎(chǔ)教育仍然存在諸多痛點(diǎn),優(yōu)質(zhì)教師依然匱乏、教育資源越來越不均衡、學(xué)生學(xué)習(xí)壓力較大卻效率低下等問題依然是當(dāng)前教育發(fā)展的重要問題,亟需借助更先進(jìn)的思想和技術(shù)進(jìn)行解決。
近年來,信息技術(shù)革命與經(jīng)濟(jì)社會(huì)發(fā)展的交融,帶來了數(shù)據(jù)爆炸式增長。海量數(shù)據(jù)的收集和積累,在諸如金融、電子商務(wù)、軍事、醫(yī)療、交通、氣象、教育等行業(yè)領(lǐng)域均發(fā)揮了重要的作用,使得大數(shù)據(jù)從“概念”走向“價(jià)值”。現(xiàn)如今,基于大數(shù)據(jù)分析技術(shù)的智能化服務(wù)系統(tǒng)極大地便利了人們的日常生活,分析大數(shù)據(jù)已經(jīng)成為科研的核心任務(wù),解讀大數(shù)據(jù)已經(jīng)成為決策的基本依據(jù),應(yīng)用大數(shù)據(jù)成為民生的重要助力。
特別是在教育行業(yè)領(lǐng)域,大數(shù)據(jù)為教育信息化、智能化注入了新的活力。其中,教育大數(shù)據(jù)是指整個(gè)教育活動(dòng)過程中所產(chǎn)生的以及根據(jù)教育需要所采集到的,一切用于教育發(fā)展并可創(chuàng)造巨大潛在價(jià)值的數(shù)據(jù)集合。事實(shí)上,我國有非常好的教育大數(shù)據(jù)基礎(chǔ),據(jù)《2016年全國教育事業(yè)發(fā)展公報(bào)》顯示,我國有超過51萬所學(xué)校而且絕大部分都實(shí)現(xiàn)了互聯(lián)網(wǎng)接入,擁有大于2.6億的學(xué)生,在線教育用戶超過1.4億,數(shù)字化校園系統(tǒng)、在線學(xué)習(xí)平臺(tái)以及智能教輔系統(tǒng)層出不窮,產(chǎn)生了大量的教育數(shù)據(jù)。在大數(shù)據(jù)的驅(qū)動(dòng)下,教育發(fā)展正在迎來新的變革,2017年發(fā)布的《中國基礎(chǔ)教育大數(shù)據(jù)發(fā)展藍(lán)皮書》認(rèn)為,教育在大數(shù)據(jù)技術(shù)與理念的沖擊下正在發(fā)生一場“靜悄悄的革命”。即,從計(jì)算輔助教學(xué)范式走向數(shù)據(jù)驅(qū)動(dòng)教學(xué)范式。
相比較而言,數(shù)據(jù)驅(qū)動(dòng)的教學(xué)范式具有“高效率”、“有智慧”、“產(chǎn)業(yè)化”等優(yōu)點(diǎn):1)利用教育大數(shù)據(jù),可以模擬優(yōu)質(zhì)老師做出決策,實(shí)現(xiàn)優(yōu)質(zhì)師資的快速、規(guī)模化“復(fù)制”。利用大數(shù)據(jù)技術(shù)進(jìn)行資源收集存儲(chǔ)、協(xié)同管理、開放獲取,可以自動(dòng)、高效地對(duì)教育資源進(jìn)行整合;2)通過對(duì)學(xué)生的性格、綜合能力、知識(shí)狀態(tài)等特征進(jìn)行診斷量化,實(shí)現(xiàn)深度、全面的學(xué)生精準(zhǔn)畫像,進(jìn)而提供千人千面的個(gè)性化、自適應(yīng)智能教育,真正實(shí)現(xiàn)“因材施教”;3)有效協(xié)調(diào)教育各類資源,實(shí)現(xiàn)智能教育智能服應(yīng)用的實(shí)際落地,為教育產(chǎn)業(yè)化的商業(yè)模式提供了可能,使得教育發(fā)展形成了良性閉環(huán)。與此同時(shí),我國各級(jí)政府和部門也十分重視,把大數(shù)據(jù)驅(qū)動(dòng)的智慧教育作為國家信息化戰(zhàn)略的重要組成部分。國務(wù)院印發(fā)的《新一代人工智能發(fā)展規(guī)劃》中強(qiáng)調(diào):要加快智能教育建設(shè),利用智能技術(shù)加快推動(dòng)人才培養(yǎng)模式、教學(xué)方法改革,構(gòu)建包含智能學(xué)習(xí)、交互式學(xué)習(xí)的新型教育體系。在此背景下,教育正在漸漸從線下走向線上,從人工走向智能。
大數(shù)據(jù)驅(qū)動(dòng)的智慧教育
大數(shù)據(jù)驅(qū)動(dòng)的智慧教育已經(jīng)初步運(yùn)用在教育領(lǐng)域的多個(gè)方面。對(duì)于教學(xué)者而言,可以幫助調(diào)整教學(xué)方案、打造精準(zhǔn)教學(xué);對(duì)于學(xué)習(xí)者來說,可以幫助制定個(gè)性化學(xué)習(xí)計(jì)劃、選擇學(xué)習(xí)路徑;同時(shí),智慧教育也可以運(yùn)用到教學(xué)媒介與產(chǎn)品中,如教育機(jī)器人、智能教育平臺(tái)等??梢哉f,教育大數(shù)據(jù)分析研究已經(jīng)滲透至教育領(lǐng)域的各個(gè)環(huán)節(jié),發(fā)揮著重要的作用。參考學(xué)者們的已有分類,從教、學(xué)、考、評(píng)、管這五個(gè)方面簡要介紹智慧教育的研究進(jìn)展情況。
在“教”方面,主要研究如何提升教學(xué)方式與質(zhì)量,從而更有效的給學(xué)生教學(xué),包括基于深度學(xué)習(xí)技術(shù)的智能搜題、基于深度增強(qiáng)學(xué)習(xí)的智能解題、基于腦科學(xué)的智能輔助學(xué)習(xí)系統(tǒng)以及針對(duì)不同教學(xué)情境和教學(xué)對(duì)象的個(gè)性化教學(xué)設(shè)計(jì)方案生成等。在“學(xué)”方面,主要針對(duì)于如何深度理解和掌握學(xué)生的行為以及給學(xué)生推薦個(gè)性化的學(xué)習(xí)內(nèi)容,例如在MOOC上研究學(xué)生的學(xué)習(xí)行為預(yù)測、基于深度學(xué)習(xí)的行為軌跡模式挖掘以及個(gè)性化學(xué)習(xí)內(nèi)容、學(xué)習(xí)路徑推薦等。在“考”方面,試題作為衡量學(xué)生學(xué)習(xí)水平、檢驗(yàn)學(xué)生學(xué)習(xí)成果的工具,包含有大量的可挖掘信息,目前,主要研究關(guān)注于試題知識(shí)點(diǎn)的自動(dòng)標(biāo)注、試題的難度預(yù)測以及試題的自動(dòng)生成、智能組卷,智能批改等。對(duì)于老師和學(xué)生更好的理解試題、使用試題非常有幫助。在“評(píng)”方面,智能評(píng)測是重要的研究方向。其中,知識(shí)與能力結(jié)構(gòu)的智能化表征與學(xué)生靜態(tài)、動(dòng)態(tài)的認(rèn)知診斷,生成個(gè)性化的認(rèn)知診斷報(bào)告,可以幫助學(xué)生更好的認(rèn)知自己的學(xué)習(xí)情況。同時(shí),研究對(duì)教師的多維知識(shí)界定,衡量教師專業(yè)能力的評(píng)估,形成精準(zhǔn)的教研評(píng)價(jià)也是目前的研究熱點(diǎn)。在“管”方面,基于教育大數(shù)據(jù)可以生成各種管理平臺(tái),輔助學(xué)校以及機(jī)構(gòu)完成各方面的管理,例如電子科技大學(xué)開發(fā)了校園大數(shù)據(jù)分析決策平臺(tái),中國科學(xué)技術(shù)大學(xué)也通過行為預(yù)測來挖掘貧困生,形成了“隱形補(bǔ)助”體系。

近年來,我們團(tuán)隊(duì)針對(duì)智慧教育諸多場景中都涉及的學(xué)生認(rèn)知水平“不可見”、教育資源“不可比”、教育推薦結(jié)果“難評(píng)價(jià)”等關(guān)鍵科學(xué)問題,著重從學(xué)生認(rèn)知水平建模、教育資源深度表征與分析、以及個(gè)性化學(xué)習(xí)推薦等方面開展了技術(shù)攻關(guān),取得了一系列研究成果(研究框架如圖1所示),代表性論文發(fā)表在人工智能、數(shù)據(jù)挖掘領(lǐng)域的重要國際會(huì)議和期刊,如IJCAI2015、AAAI 2017、AAAI 2018、KDD 2018、KDD 2019和ACM TIST。例如,提出了結(jié)合注意力機(jī)制的教育資源深度表征框架,它不僅利用深度表征思想實(shí)現(xiàn)了異構(gòu)資源各部分內(nèi)容(如文本、圖像)的統(tǒng)一建模,而且設(shè)計(jì)了注意力機(jī)制自動(dòng)學(xué)習(xí)信息資源的內(nèi)部序列關(guān)系(如文本的語義關(guān)系)并識(shí)別出與所預(yù)測的屬性最為相關(guān)的內(nèi)容,在試題資源“難易度”屬性自動(dòng)標(biāo)注任務(wù)中,通過與教育專家的人工標(biāo)注進(jìn)行比較,深度表征框架不僅提高將近25%的標(biāo)注精度,而且還能為試題找到關(guān)鍵語句,提升標(biāo)注結(jié)果的可解釋性。
總結(jié)與展望
從工業(yè)化時(shí)代的模仿經(jīng)驗(yàn)教學(xué)范式到信息化時(shí)代的計(jì)算輔助教學(xué)范式再到數(shù)據(jù)驅(qū)動(dòng)的教學(xué)范式,教育不斷發(fā)生著變革,逐漸從線下走向線上、從人工走向智能、從千人一面的“照本宣科”走向千人千面的“因材施教”。無論是在日常教學(xué)還是各類考試等,大數(shù)據(jù)分析驅(qū)動(dòng)的智慧教育都取得了很多令人驚嘆的研究和應(yīng)用成果。然而我們?nèi)匀灰吹剑谥腔劢逃陌l(fā)展過程中,仍然面臨諸多需要解決的問題,例如:(1)現(xiàn)階段教育大數(shù)據(jù)分析技術(shù)研究多集中于單學(xué)科(如數(shù)學(xué)等結(jié)構(gòu)化學(xué)科和英語、語文等語言學(xué)科)以及單學(xué)段(如初高中學(xué)段)。在其它學(xué)科(如物理、化學(xué))上的數(shù)據(jù)理解困難。同時(shí)在其它學(xué)段(如幼兒)的數(shù)據(jù)收集困難,因此,將教育大數(shù)據(jù)分析技術(shù)推廣到全學(xué)科、全學(xué)段,服務(wù)更廣泛的老師與學(xué)生仍有待于基礎(chǔ)條件、理論方法等的突破;(2)在智慧教育的應(yīng)用中,一個(gè)核心的問題是如何增強(qiáng)智能服務(wù)的可解釋性。例如,對(duì)于學(xué)生而言,試題答錯(cuò)了,學(xué)生更想知道為什么答錯(cuò),以及如何學(xué)習(xí)能夠掌握相應(yīng)的知識(shí)。同時(shí),對(duì)于老師而言,很想了解自己的教學(xué)方式有哪些地方需要改善,以及如何改善。目前,基于大數(shù)據(jù)的智慧教育研究在可解釋性的方面還涉及較少,需要我們更進(jìn)一步的研究;(3)數(shù)學(xué)、物理等學(xué)科均對(duì)邏輯能力要求很高,要使教育服務(wù)更具有智慧,必需從數(shù)據(jù)中抽取教育知識(shí)、進(jìn)行融合與關(guān)聯(lián),實(shí)現(xiàn)類人智能的知識(shí)理解與邏輯推理,即實(shí)現(xiàn)從數(shù)據(jù)驅(qū)動(dòng)到知識(shí)驅(qū)動(dòng)的跨越。這就涉及如何從多源異構(gòu)數(shù)據(jù)中提煉教育知識(shí)、如何構(gòu)建知識(shí)庫并實(shí)現(xiàn)邏輯推理、如何基于知識(shí)庫與推理完成決策等一系列關(guān)鍵問題。
總之,在大數(shù)據(jù)和人工智能的浪潮下,智慧教育正在不斷發(fā)展,不斷快速變革,教育領(lǐng)域涉及的各種問題正在漸漸被解決。在教育變革的風(fēng)口下,需要我們有發(fā)展的眼光、過硬的技術(shù)、交叉創(chuàng)新的思維以及堅(jiān)定的決心,才能砥礪奮進(jìn),不斷前行。