搜狗奪國際頂級挑戰賽CoQA第一名

尋夢新聞LINE@每日推播熱門推薦文章,趣聞不漏接❤️

加入LINE好友

2019年1月3日,搜狗搜尋人工智能研究團隊在對話型機器閱讀理解挑戰賽CoQA(Conversational Question Answering Challenge)中全面刷新所有評價指標成績,以總成績82.8%奪得第一。

CoQA是面向建立對話式問答系統的大型數據集,挑戰賽的目標是衡量機器對文本的理解能力,以及機器面向對話中出現的彼此相關的問題的回答能力的高低。與業界所熟知的機器閱讀理解評測SQuAD相比,該挑戰賽集中的問題不再是單輪的一問一答的形式,而是擴展到多輪的對話交互;SQuAD 中約一半都是what型,該挑戰賽問題種類更多;SQuAD中沒有共識推斷,該挑戰賽幾乎每組對話都需要進行上下文理解推斷;SQuAD中所有答案均可從原文本中提取,該挑戰賽中這一比例僅為66.8%。2018年8月,CoQA挑戰賽正式啟動,吸引了眾多國內外知名研究機構和高校,其中包括微軟、艾倫研究院(AI2)、史丹佛大學、清華大學COAI實驗室、北京大學、復旦大學、北京郵電大學、中國科技大學等。

搜狗奪國際頂級挑戰賽CoQA第一名

圖1:CoQA挑戰賽最新成績榜單(截至2019年1月3日)

1月3日,搜狗研究團隊憑借BERT + Answer Verification(單一模型),全面刷新CoQA所有評價指標,以總成績82.8%進一步縮小機器與人類在該數據上的平均水平差距。據悉,搜狗的算法模型能綜合考慮答案抽取和證據對答案的支撐作用,同時融入對話歷史的問題和答案信息,極大提升了對當前問題的理解和回答的準確性。

搜狗奪國際頂級挑戰賽CoQA第一名

圖2:CoQA閱讀素材

搜狗奪國際頂級挑戰賽CoQA第一名

圖3:CoQA問題與答案

搜狗奪國際頂級挑戰賽CoQA第一名

圖4:COQA閱讀理解錄頻gif

讓機器掌握閱讀理解能力究竟意義何在?搜狗一直堅持探索以語言為核心的人工智能戰略,相信搜尋的未來是問答,而機器閱讀理解是現今問答技術發展的核心之一。在AI技術的實用化方面,搜尋走向問答將會在一些專業領域產生顛覆性的效果,如醫療、法律領域。

目前,搜狗已經將相關技術應用於產品及業務中。在醫療領域,搜狗明醫智能自診分診功能,首創引入了基於人工智能技術的智能診斷助手,模擬醫生與病人對話的模式與用戶進行病情溝通。在法律領域,搜狗大律師的問答機器人具備邏輯分析和推理能力,在遞進式問詢過程中,挖掘判決書中的結構化數據,幫助用戶理清已發生的事實,並在充分、準確理解用戶法律訴求的基礎上,給出可能的判決結果、法律建議或相似案例。

此次AI技術的突破,為搜狗更多AI技術的實用化奠定技術基礎,也意味著搜狗在人工智能賽道上將繼續保持其固有領先優勢。

About 尋夢園
尋夢園是台灣最大的聊天室及交友社群網站。 致力於發展能夠讓會員們彼此互動、盡情分享自我的平台。 擁有數百間不同的聊天室 ,讓您隨時隨地都能找到志同道合的好友!