財經(jīng)365訊(編輯 孟洋) 人工智能再取得重大突破!據(jù)觀察者網(wǎng)報導(dǎo),1 月11 日,由斯坦福大學(xué)發(fā)起的機器閱讀理解領(lǐng)域頂級賽事SQuAD最新排名刷新,人工智能的閱讀能力歷史上首次超越人類。阿里巴巴憑借82.440的精確率打破了世界紀錄,并且超越了人類82.304的成績。
據(jù)報導(dǎo),SQuAD 的負責人Pranav Rajpurkar 難掩興奮之情。他在社交媒體上表示,2018 年一個強勁的開始,第一個模型(阿里巴巴iDST 團隊提交的SLQA +)在精確度匹配上超越人類表現(xiàn)!下一個挑戰(zhàn):模糊匹配,人類仍然領(lǐng)先2.5 分!
SQuAD 比賽構(gòu)建了一個大規(guī)模的機器閱讀理解數(shù)據(jù)集(包含10 萬個問題),文章來源于500 多篇維基百科文章。人工智能在閱讀完數(shù)據(jù)集中的一篇短文之后,需要回答若干個基于文章內(nèi)容的問題,然后與標準答案進行比對,得出精確匹配(Exact Match) 和模糊匹配(F1-score) 的結(jié)果。
SQuAD 是行業(yè)內(nèi)公認的機器閱讀理解頂級賽事,吸引了包括谷歌、卡內(nèi)基梅隆大學(xué)、斯坦福大學(xué)、微軟亞洲研究院、艾倫研究院、IBM、Facebook 等知名企業(yè)研究機構(gòu)和高校的深度參與。
報導(dǎo)指出,此次技術(shù)的重大突破源于阿里巴巴研究團隊提出的“基于分層融合注意力機制”的深度神經(jīng)網(wǎng)絡(luò)模型。該模型能夠模擬人類在做閱讀理解問題時的一些行為,包括結(jié)合篇章內(nèi)容審題,帶著問題反覆閱讀文章,避免閱讀中遺忘而進行相關(guān)標注等。
模型可以在捕捉問題和文章中特定區(qū)域關(guān)聯(lián)的同時,借助分層策略,逐步集中注意力,使答案邊界清晰;另一方面,為避免過于關(guān)注細節(jié),采用融合方式將全局信息加入注意力機制,進行適度糾正,確保關(guān)注點正確。
阿里巴巴自然語言處理首席科學(xué)家司羅表示,對于解決客觀知識問答,機器已經(jīng)取得非常好的結(jié)果,將繼續(xù)向?qū)νㄓ脙?nèi)容的“能理解會思考”的終極目標邁進。今后,研發(fā)的重點在于把這項技術(shù)真正應(yīng)用在廣大實際場景,讓機器智能普惠生活。
事實上,這項技術(shù)已經(jīng)在阿里巴巴內(nèi)部被廣泛使用。比如,每年雙11 都會有大量的顧客對活動規(guī)則進行咨詢。阿里小蜜團隊通過使用司羅團隊的技術(shù),讓機器直接對規(guī)則進行閱讀,為用戶提供規(guī)則解讀服務(wù),是最自然的交互方式。