多鄰國成立于2012年,是一個跨平臺的語言學習應用程序,全球用戶高達3億。為了打造真實的人與人的學習場景,多鄰國一直在投資人工智能和機器學習,以便通過自動化使課程更具吸引力為每個人量身定制。
“我們人工智能戰略的核心部分是盡可能地接近一種人與人之間的體驗。”多鄰國人工智能和研究主管Burr Settles在上月倫敦AI峰會的一次采訪中說。
多鄰國是一個跨平臺的應用程序,用戶可以免費學習語言,也可以每月支付7美元購買一項高級服務,可以刪除廣告、提供離線訪問等。通過游戲化的模式和時間較短的課程,任何人都可以學習閱讀、聆聽和說幾十種語言。
人們學習一門新語言的理由各不相同,但無論動機是什么,學習一門語言都需要花費很多的時間和精力,如果學習者不全天候地沉浸在語言中,那就更是如此。人們不會為了學習一門語言換一個國家居住,而多鄰國這樣的公司,正是利用智能手機的興起和無處不在的網絡為用戶帶來學習經驗,無論他們身在何處。
多鄰國已經支持世界上許多最常見的語言,包括漢語和印地語等。本周早些時候,它還推出了推出了對阿拉伯語的支持。多鄰國目前在全球擁有約3億用戶,已籌集到1億美元的資金,估值約為7億美元,其中包括Alphabet的Capitalg和Kleiner Perkins等知名贊助商。
據市場研究公司稱,2018年全球在線語言學習市場的規模定為90億美元,到2026年可能達到200億美元以上。在此背景下,多鄰國一直在投資人工智能和機器學習,以便通過自動化使課程更具吸引力為每個人量身定制,就像是人類老師教學的方式。
數據
在卡內基梅隆大學擔任博士后研究科學家后,Settles于2013年加入多鄰國,擔任軟件工程師,負責從前端到后端的所有事務。他說,他之所以選擇多鄰國而不是大公司,是因為他看到了這個公司的潛力。
“我的興趣集中在語言、人工智能技術和認知科學的交叉點上,”Settles指出,在這三者的交叉點上,并沒有多少工作可以做。
Settles加入多鄰國不久之后,他和團隊開始研究如何轉換多鄰國學習模型的構建模塊,這些模型基于70年代的閃存卡調度算法。根據Settles的說法,利用人工智能進行任何實際教育的研究目前相關研究很少。
多鄰國所擁有的是豐富的學習數據,可用于從頭開發新的模型和算法。
“我接受這份工作的部分原因是數據量、數據類型和數據的唯一性,”Settles說。“我們一直在使用啟發式方法,我們收集有關學生正確的練習、錯誤的地方以及他們上次在應用程序中看到這些練習的時間的數據。既然我們在跟蹤這些統計數據,我們就想‘為什么不創建預測模型來代替呢?”
半衰期
多鄰國一直在開發自己的統計和機器學習模型,同時還結合了一些久經考驗的學習技術,如間隔重復,以優化和個性化課程。間隔重復的理論是,間隔地重復簡短的課程比在短時間內死記硬背相同的信息要好。還有所謂的“滯后效應”,如果逐漸增加練習課程之間的差距,則用戶可以進一步提高。
但是,人類個體的差異性很大,機器學習模型往往是二元的,而不是考慮到個體的細微差別。這就是多鄰國的統計模型——“半衰期回歸” ,它分析了數百萬語言學習者的錯誤模式,以預測個體長期記憶中每個單詞的“半衰期”。
“當我們投入生產時,我們看到用戶參與率提高了12%,”Settles說。
在物理學中,半衰期概念經常被用來描述一個量下降到初始值一半所需的時間。在語言學習中,可以用它來描述大腦中的詞匯或語法知識。例如,如果半衰期是一天,而一天都沒有練習一門新語言,將會有50%的機會忘記這堂課。
但這并不是一個精確的科學,半衰期回歸就是進入一個人的大腦,弄清楚他們知道或不知道什么,然后相應地針對課程材料。
對于不同學習背景的人,“衰退”模式截然不同。已經有背景的人會犯更少的錯誤,他們犯的錯誤類型可能會有所不同,這意味著他們不必經常練習這些知識。
用來定位內容的方法是很重要,但內容本身也同樣重要。在內容方面多鄰國也在轉向人工智能,以幫助其團隊建立正確的課程。
“英語中有數百萬個單詞,也許有1萬個高頻詞,用什么順序教?怎么把它們串在一起?”Settles 說,“因此,我們建立了系統,來幫助內容創作者定制初級、中級和高級材料。”
另一個挑戰是,盡管多鄰國的用戶中只有40%的人正在學習英語,但該公司用于培訓其AI系統的大部分教學數據都是針對英語開發的。因此,多鄰國不得不采用其系統并將其投射到其他語言上,在AI世界中稱為轉移學習。
盡管人才庫正在緩慢增長,但有充分的證據表明人AI技能短缺,許多大型科技公司一直在努力收購有前途的人工智能初創公司。人才緊缺是多鄰國在過去幾年中遇到的挑戰,特別是考慮到它專注于特定的技能組合。除語言和語言學外,它正在進行的人工智能研究跨越了一系列學科,并與心理學和學習科學交叉。
“我們希望在語言、人工智能和認知科學的交叉點上有更多的人。”Settles說。“我們的標準也很高。在申請我們AI工作的人中,只有不到0.5%能夠完成這項任務。”
Settle補充說,該公司在過去18個月左右的時間里,發現合格人員的興趣小幅增長,其中包括來自其他科技公司和學術界的申請人。
人對人
遠程教授語言面臨的最大挑戰之一是,很難創建一種吸引人且充滿沉浸感的體驗,以保持學習者的回歸。為了提高參與度,多鄰國在2016年推出了機器人程序,通過其應用程序內的自動文本對話來幫助教授語言。
各種機器人角色被設計為對一系列可能的答案做出不同的反應,如果用戶卡住,用戶可以點擊“幫我回復”按鈕。理論上,機器人程序應該越用越聰明。
但現在,多鄰國的機器人似乎服務似乎暫停了,但是自動化代理取代了人類導師的這種學習,可以將虛擬教學提升到下一個層次。會話AI助手的最新發展,如亞馬遜的Alexa和谷歌智能助手,可能為語言學習者打開一個全新的機會世界。
將虛擬現實(VR)的可能性投入到混合中,用戶可以通過耳機進入虛擬教室環境,很容易想象學習新語言會變得多么有吸引力。
當被問及多鄰國是否有可能擴展到如此沉浸式的領域時,除了承認“這是可能的”。多鄰國似乎很清楚這些新興技術帶來的固有好處,并且更大沉浸的潛力可能是巨大的。
雖然多鄰國沒有透露有關智能語音助手集成或沉浸式視覺世界的任何計劃,但它已承諾在將人的元素放入自動化學習的過程中,進一步個性化其內容和交付。
“如果你思考一個好老師的教學方式,他們有三種屬性,”Settles說。“一是他們非常了解內容,二是他們有辦法進入你的腦海,弄清楚你知道什么不知道什么。三是他們非常有吸引力,能夠找到在你所處的水平上讓你學習的方法。”
他說: “半衰期回歸是進入用戶腦海中的一個例子,找出用戶的心理模型,并將這些材料定位到用戶。”
“那里有很多未知領域,”Settles補充道。“我認為,我認為,人工智能有很多機會創造新的、吸引人的學習體驗。”
-
AI
+關注
關注
87文章
31143瀏覽量
269478 -
智能教育
+關注
關注
0文章
198瀏覽量
15899
原文標題:背了單詞再也不怕忘,多鄰國的AI要逆天!
文章出處:【微信號:Aiobservation,微信公眾號:人工智能觀察】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論