近日,憑借自研BERT+WWM+MT的單模型,小i機(jī)器人在國際權(quán)威機(jī)器閱讀理解評測SQuAD1.1挑戰(zhàn)賽中排名全球第三。深耕行業(yè)18年,這家國產(chǎn)AI公司認(rèn)為認(rèn)知智能才是AI未來競爭的核心,并快速推進(jìn)產(chǎn)業(yè)化應(yīng)用——在商用智能客服領(lǐng)域,行業(yè)市場占有率已超過80%。
一家中國人工智能技術(shù)公司成立長達(dá)十八年之久,還在成長期趕上了第三次AI浪潮。
作為有著這樣背景的小i機(jī)器人對未來AI發(fā)展有著更成熟且明確的方向:
認(rèn)知智能是人工智能未來競爭的核心。
而認(rèn)知智能技術(shù)需要多向積累,技術(shù)和應(yīng)用互生互補(bǔ)。除18年產(chǎn)業(yè)應(yīng)用經(jīng)驗(yàn)外,小i機(jī)器人在AI技術(shù)方面仍在不斷突破:
憑借最新研究成果——BERT+WWM+MT的單模型,在由斯坦福大學(xué)發(fā)起的國際權(quán)威機(jī)器閱讀理解評測SQuAD1.1挑戰(zhàn)賽中排名全球第三,超越人類平均水平。不同于前兩名企業(yè)+學(xué)校的聯(lián)合模式,小i完全是由研究院團(tuán)隊(duì)獨(dú)立完成;
分別實(shí)現(xiàn)了基于機(jī)器學(xué)習(xí)和深度學(xué)習(xí)方法的各個NLP基礎(chǔ)能力模塊,覆蓋了詞法分析、句法分析、語義分析、篇章分析等基礎(chǔ)技術(shù)的能力;
參加情感計(jì)算國際標(biāo)準(zhǔn)建設(shè),并在其中擔(dān)綱重要角色。
另外,不同于近幾年成立的AI公司,小i早就開始推進(jìn)認(rèn)知智能商業(yè)化——小i機(jī)器人以開辟智能客服這一典型AI應(yīng)用場景為基礎(chǔ),在金融、汽車、醫(yī)療等數(shù)個行業(yè)均有布局,其中商用智能客服領(lǐng)域,其行業(yè)市場占有率已超過80%。
邁向認(rèn)知智能的技術(shù)底氣:自研BERT+WWM+MT的單模型,NLP權(quán)威測試全球第三
現(xiàn)在大家習(xí)慣將人工智能分為三個臺階,計(jì)算智能、感知智能和認(rèn)知智能,認(rèn)知智能位于AI金字塔結(jié)構(gòu)的頂部。
目前計(jì)算智能與感知智能,機(jī)器已經(jīng)可以媲美甚至超越人類,但認(rèn)知智能方面與人之間依然存在差距。
認(rèn)知智能是人工智能發(fā)展的未來趨勢。
認(rèn)知智能涉及到語義理解、知識表達(dá)、聯(lián)想推理、智能問答、自主學(xué)習(xí)。人工智能的一個重要目標(biāo)就是希望機(jī)器能夠與人類進(jìn)行更加自然高效的交流,希望機(jī)器讀懂人類深奧的語言,同時以一種我們習(xí)慣的方式進(jìn)行交互。
其中,使機(jī)器讀懂人類深奧的語言、同時也是認(rèn)知智能方面最典型的任務(wù)就是閱讀理解。
2019年7月,小i機(jī)器人研究院團(tuán)隊(duì)在由斯坦福大學(xué)發(fā)起的國際權(quán)威機(jī)器閱讀理解評測SQuAD1.1挑戰(zhàn)賽中,憑借最新研究成果——BERT+WWM+MT的單模型,以EM(精準(zhǔn)匹配率)和F1(模糊匹配率)超越人類平均水平的優(yōu)異成績排名第三。
此次在考慮Whole Word Masking的BERT預(yù)訓(xùn)練模型基礎(chǔ)之上,小i引入輔助任務(wù)如NewsQA等數(shù)據(jù)集,采用多任務(wù)學(xué)習(xí)的思路來改進(jìn)現(xiàn)有模型的效果,進(jìn)一步提升模型的最終預(yù)測評價指標(biāo)(主要為Exact Match和F1值)。
具體來看,小i分別對目標(biāo)任務(wù)和輔助任務(wù)中的答案集合進(jìn)行長度頻率統(tǒng)計(jì),以及各自訓(xùn)練一個語言模型,來綜合判斷輔助任務(wù)中的數(shù)據(jù)樣本與目標(biāo)任務(wù)中的數(shù)據(jù)樣本之間的相關(guān)性。
最后將這個相關(guān)性指標(biāo)進(jìn)一步引入到模型訓(xùn)練過程中損失函數(shù)Loss的計(jì)算過程中,以充分利用并學(xué)習(xí)到來自目標(biāo)任務(wù)和有關(guān)輔助任務(wù)中的知識,從而最終提升模型的預(yù)測效果。
小i機(jī)器人參賽模型在此次比賽中獲得EM指標(biāo) (精準(zhǔn)匹配率)達(dá)到88.650,F(xiàn)1指標(biāo)(模糊匹配率)達(dá)到94.393的成績。
排名前兩位的谷歌大腦和Facebook人工智能研究部門都選擇了與高校聯(lián)手進(jìn)行挑戰(zhàn),而小i機(jī)器人則是完全獨(dú)立參加比賽。
SQuAD被譽(yù)為自然語言處理領(lǐng)域金字塔尖的比賽,旨在促進(jìn)智能搜索引擎的發(fā)展。
國際機(jī)器閱讀理解評測SQuAD自2016年發(fā)布以來,共吸引了包括谷歌、微軟亞洲研究院、IBM研究院、阿里巴巴達(dá)摩院、上海交通大學(xué)等眾多國內(nèi)外知名研究機(jī)構(gòu)和高校參加。
而在實(shí)際應(yīng)用中,小i也把機(jī)器閱讀理解的最新研究成果應(yīng)用于有關(guān)產(chǎn)品和實(shí)際項(xiàng)目中。例如,在小i機(jī)器人開發(fā)的Bot開放平臺中,集成了基于機(jī)器閱讀理解的能力。
除此之外,小i機(jī)器人分別實(shí)現(xiàn)了基于機(jī)器學(xué)習(xí)和深度學(xué)習(xí)方法的各個NLP基礎(chǔ)能力模塊,覆蓋了詞法分析、句法分析、語義分析、篇章分析的基礎(chǔ)技術(shù)的能力,上述的機(jī)器閱讀理解即為其中的能力之一。
小i機(jī)器人創(chuàng)始人、董事長兼CEO袁輝曾表示:感知、思考、運(yùn)動三部分構(gòu)成了人工智能,其中最核心的是擁有思考力的“大腦”,也就是認(rèn)知智能,它決定著人工智能的水平高度。當(dāng)機(jī)器的認(rèn)知能力獲得重大突破,AI的應(yīng)用度和滲透力就會更強(qiáng)。
小i機(jī)器人創(chuàng)始人、董事長兼CEO 袁輝
正因如此,小i機(jī)器人一直堅(jiān)持“大腦”研發(fā)。
目前,小i機(jī)器人已在上海、貴陽、深圳、南京、香港、美國硅谷設(shè)立6大研發(fā)中心,與華東師范大學(xué)、香港科技大學(xué)、中國科學(xué)院軟件所等建立聯(lián)合實(shí)驗(yàn)室。在自然語言處理、深度語義交互、機(jī)器學(xué)習(xí)和大數(shù)據(jù)等認(rèn)知智能相關(guān)以及圖像、語音識別等核心技術(shù)上擁有全面、自主的知識產(chǎn)權(quán)。
推動情感計(jì)算國際標(biāo)準(zhǔn)建設(shè),將情感量化成機(jī)器能理解的數(shù)值
在認(rèn)知智能中,除當(dāng)下熱門的各項(xiàng)NLP能力外,小i機(jī)器人專攻另一獨(dú)特技術(shù)方向——情感計(jì)算,即將人類情感量化成機(jī)器可以理解的數(shù)值。
事實(shí)上,認(rèn)知智能的發(fā)展分為語言理解、分析推理,以及人格和情感三個層次,情感可以說是AI金字塔頂尖中的頂尖,是AI最終需攻克的難關(guān)之一。
情感計(jì)算的概念早在1997年由MIT媒體實(shí)驗(yàn)室Picard教授提出,她指出情感計(jì)算是與情感相關(guān),來源于情感或能夠?qū)η楦惺┘佑绊懙挠?jì)算。
但在用戶界面中的對情緒交互信息的表示方式,仍缺乏規(guī)范化和統(tǒng)一的標(biāo)準(zhǔn),使得人機(jī)交互中對用戶情緒信息的理解、處理,以及情緒的回饋呈現(xiàn)等過程存在差異,阻礙了情感計(jì)算用戶界面的應(yīng)用和發(fā)展。
2013年著手研究情感計(jì)算以來,小i機(jī)器人在 2017年作為牽頭單位之一提交了國際上第一個有關(guān)情感計(jì)算的國際標(biāo)準(zhǔn)ISO/IEC 30150-1《信息技術(shù) 情感交互 第一部分:模型》,這也是中國在該領(lǐng)域的首個國際標(biāo)準(zhǔn)。此標(biāo)準(zhǔn)也在今年8月正式通過國際標(biāo)準(zhǔn)草案(DIS)投票。
事實(shí)上,情感計(jì)算的應(yīng)用前景相當(dāng)廣闊,用戶與計(jì)算機(jī)系統(tǒng)之間依然存在情緒和表達(dá)上的障礙,如果制定相關(guān)國際標(biāo)準(zhǔn),將有利于實(shí)現(xiàn)情感計(jì)算用戶界面的應(yīng)用推廣。
今年8月,小i機(jī)器人聯(lián)合中國電子技術(shù)標(biāo)準(zhǔn)化研究院和中國科學(xué)院軟件研究所三家共同提交了ISO/IEC 30150-11《信息技術(shù) 情感計(jì)算用戶界面 Part 11:情緒表示》和ISO/IEC 30150-2 《信息技術(shù) 情感計(jì)算用戶界面 Part 2:情感特性》。
深耕行業(yè)18載,崛起之路是偶然也是必然
認(rèn)知智能技術(shù)需要多向積累,技術(shù)和應(yīng)用互生互補(bǔ),螺旋上升。小i很早就入局智能機(jī)器人行業(yè),在這方面已有深厚的積累。
2001年,小i機(jī)器人在上海成立,但它最早出現(xiàn)在大眾視野是在2004年。那一年,小i機(jī)器人出現(xiàn)在MSN和QQ這兩大社交軟件上。憑借此次合作,小i機(jī)器人用戶達(dá)到近一億人次,同時,此舉讓小i積累起了龐大的中文語義庫。從那以后,小i機(jī)器人開始進(jìn)入聊天機(jī)器人和AI領(lǐng)域。
自2008年江蘇移動i8智能客服上線后,小i打開了企業(yè)智能客服的大門。
此后,小i在智能客服領(lǐng)域迎來爆發(fā)期,合作對象也拓展到聯(lián)想、聯(lián)通、建行、招行等大型互聯(lián)網(wǎng)、電信和金融機(jī)構(gòu)。它們的機(jī)器人均使用了來自小i機(jī)器人的技術(shù)作為支撐。
除此之外,通過技術(shù)和資源的開放,小i還試圖激活A(yù)I時代開發(fā)者潛力,共享AI紅利,同時也使生態(tài)體系建設(shè)初具規(guī)模。
小i機(jī)器人發(fā)布了新一代智能Bot開放平臺,集合了Chatting Bot、FAQ Bot、Discovery Bot三大核心能力以及深度學(xué)習(xí)、知識管理、知識學(xué)習(xí)、計(jì)算機(jī)視覺、知識融合等基礎(chǔ)能力。
目前,平臺支持智能客服場景的直接使用,為企業(yè)和開發(fā)者提供機(jī)器人服務(wù)無縫轉(zhuǎn)人工服務(wù)以及通過智能學(xué)習(xí)構(gòu)建知識庫的完整使用閉環(huán)。除此之外,企業(yè)和開發(fā)者還可通過標(biāo)準(zhǔn)接口獲得各類定制服務(wù)。
以智能客服為突破口,走出一條真正的“產(chǎn)業(yè)化之路”
在人工智能的浪潮中,客服被認(rèn)為是最先被取代的一類人群。傳統(tǒng)的人工客服往往都是高密集性勞動,而智能客服可很好地改進(jìn)成本高、服務(wù)效率低等問題。
人工智能技術(shù)有望在智能客服領(lǐng)域率先完成商業(yè)化落地。根據(jù)Gartner預(yù)測,2020年左右85%的客服服務(wù)都將由人工智能完成。
在小i的生態(tài)產(chǎn)業(yè)落地領(lǐng)域當(dāng)中,智能客服是主要業(yè)務(wù)方向之一。
據(jù)了解,小i機(jī)器人在智能客服實(shí)現(xiàn)過程中,技術(shù)層面主要分為三塊:一是自然語言處理和理解技術(shù),二是需要機(jī)器人掌握根據(jù)上下文進(jìn)行推理的能力,三是在不同領(lǐng)域中,利用人和機(jī)器的協(xié)作,半自動化地構(gòu)建各行各業(yè)的知識體系。
作為國內(nèi)智能客服領(lǐng)域的開拓者,小i在商用智能客服領(lǐng)域,行業(yè)市占率已經(jīng)超過了80%。
如今,小i機(jī)器人的業(yè)務(wù)涉及電信運(yùn)營商、銀行、證券行業(yè)、互聯(lián)網(wǎng)金融、機(jī)場、電商、汽車、3C、醫(yī)院、房地產(chǎn)、酒店、手機(jī)、物流、餐飲等各行各業(yè)。
從技術(shù)、產(chǎn)品到解決方案、服務(wù)體系、再到生態(tài)建設(shè),小i機(jī)器人這18年來穩(wěn)扎穩(wěn)打,為業(yè)界踏出了一條真正的“產(chǎn)業(yè)化之路”。
-
機(jī)器人
+關(guān)注
關(guān)注
211文章
28607瀏覽量
207884 -
人工智能
+關(guān)注
關(guān)注
1793文章
47590瀏覽量
239486
原文標(biāo)題:這個基于BERT的單模型,NLP權(quán)威測試全球第三!小i機(jī)器人押注認(rèn)知智能再發(fā)威
文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論