引領前瞻創新、顛覆舊有認知:百度輸入法的AI新賽道競逐之路

尋夢新聞LINE@每日推播熱門推薦文章,趣聞不漏接❤️

加入LINE好友

大多數人看來已經十分成熟的互聯網產品——輸入法,躁動還在繼續。

1月16日,百度輸入法搞了一場名為「AI·新輸入 全感官輸入2.0」的發布會,發布了其宣稱為「國內首款真正意義上的AI輸入法」的百度輸入法AI探索版,百度高級副總裁王海峰表示,「百度輸入法將扮演好溝通橋梁的重要角色,讓人機交互進入一個全新的階段」。

該輸入法是一款默認輸入方式為全語音輸入,並支持表情、肢體等進行所謂「全感官」輸入的輸入產品。看起來,百度想要憑借一貫的AI技術優勢來獲得輸入法市場的突破,而用「溝通橋梁」來定義,也說明百度嘗試在「輸入」二字上進行新的玩法探索。

事實上,AI與輸入法的結合併非什麼新鮮事,鬧出過「6億用戶」笑話(吹牛被識破)的科大訊飛就經常把AI技術掛在嘴邊,去年12月還推出了由所謂「訊飛超腦計劃」加持的訊飛輸入法。

被外界認為優化空間越來越小的輸入法產品,開始從AI上找突破的機會,也惹得各路豪強爭相競逐。而AI的介入改變的可能不只有「輸入」,或還有整個「輸入法」的固有認知。

成熟的輸入法市場,用戶需求帶來革新動力

AI被深度應用到輸入法,與市場需求劇烈變化而目前多數產品形態仍然老舊有直接關係。

首先,是主體移動互聯網人群在語言輸入上有典型「混合化」需求:

不同漢語語系的基本的語法不斷融合,如北方語系「你先走」,到了廣東、香港南方語系,就變成「你走先」,如果是華人,則還有「你先走先」這樣的混合用法;

與此同時,包括四川話、長沙話、東北話等特色地區方言逐漸得到大眾認可,jio(腳)之類的語音開始混用;

部分走向精英化,或者出於特定社交目的的人群,中英夾雜成為常態,「我不care」、 「Emma,我覺得的這個idea真的很amazing」,諸如此類在輸入情境中出現得越來越多。

其次,是移動互聯網人群進一步下沉,讓產生輸入的「需求錯配」。

張小龍說55歲以上的中老年人在微信用戶中占據了可觀的比例,事實上,包括微信在內的需要大量使用輸入法的移動互聯網產品向低線城市、農村的中老年滲透是不爭的事實,這些用戶一方面不懂常規輸入操作,另一方面作為「新網民」又對輸入需求更為迫切,需求產生了錯配。不巧的是,這些人當中,方言習慣又占了絕大多數。

最後,就是所有互聯網產品都在津津樂道的95後、00後新新人類,他們隨著時間的推進逐漸占據移動互聯網主舞台,不喜歡陳舊的事物、總是在追求新奇體驗。

不是說「老產品」輸入法就一定不得他們喜歡,只不過,抓住這些新新人類需求容易形成新的競爭優勢。

帶來多樣性與創新性,AI技術成輸入法「香餑餑」

總的來看,變化了的「輸入」需求並不一定都需要AI來解決,但AI無疑最具備多樣性與創新性可能。

如開篇所言,靠技術發家的科大訊飛對輸入法AI應用最為積極,2018年6月其推出的輸入法版本號稱可針對嘈雜環境進行智能降噪,在主動轉換後能支持多種方言輸入,且可以中英混合識別。此外,還推出所謂「同音字詞智能分辨」,可以判斷「他」、」她「、」他「等。

作為輸入法領域占據先發優勢的玩家,搜狗也不忘在AI上下功夫。CEO王小川2018年開年強調AI賦能輸入法與搜尋,要「通過AI技術大力發展語音、對話、翻譯」,隨後,搜狗AI技術的重心放到了可以直接帶來營收的翻譯機硬件上,翻譯寶Pro的42種語言實時互譯,在輸入端加入了語音識別支持。

而以AI技術立身的百度自然也不會放棄用AI獲取輸入法競爭優勢的機會。只不過,百度的玩法有些不同,這次發布的「AI探索版」乾脆把默認輸入方式改成了語音輸入,表情、肢體的全感官輸入很明顯是要把AI當做「主業」來搞,而不只是提升準確性的輔助技術。

百度的做法,與AI技術的屬性密切相關。原本AI就是要讀懂人類的語言、識別人類的命令並做出相應的反饋,而AI獲得信息的方式有很多種,它們都可以看作是「輸入」,用戶原本也有很多對移動終端的「輸入」需求,而不只是文字信息。

例如,早期的輸入法以字符輸入為主(用戶敲鍵盤,如同碼代碼),到後來語音輸入大行其道(用戶只需要用口說),現在,百度推出的輸入情境下的拍立活(讓用戶通過自己的動作「驅動」對方做出相同表情)、AR表情(為用戶自拍添加背景場景)、凌空手寫等AI功能,其實就是沿襲AI技術本身的特性,在輸入的方式上進行了某種「維度」提升,用戶可以照照自己、照照某些東西就可以進行「輸入」。

全感官輸入的意義,無非是讓用戶通過「輸入法」輸入的信息,在文字之外還有更多選擇,從這個意義上說,AI既是輸入法們提升產品多樣性和創新性的技術手段,反過來它本身的屬性也給出了輸入法打破舊有「文字信息」桎梏的路徑。

也由此,百度輸入法這個所謂「AI探索版」,先不論實質內容是否有價值,至少在模式上給出了AI輸入法樣板。

除了創新,輸入法AI競爭還需要抓住用戶需求的「細節」

輸入法是不太起眼卻又讓用戶離不開的「小產品」,由此,應用AI技術進行競爭除了理念與方向,在具體操作上對細節的關注可能更能俘獲用戶。

1、準確性提升是永恒的主題

如同手機跑分一樣,準確性不論何時都是檢驗輸入法能力的硬指標。時至今日,輸入法的準確性提升已經是「高位榨取」的過程,變得越來越極致也越來越難。

例如,訊飛喜好宣傳其語音輸入的準確率,據稱已經提高到98%,並且1分鐘可以輸入400字,搜狗也有類似的準確性宣傳。而百度此次之所以敢推出全語音輸入,除了用戶需求,更在於其所說的「領先業界的語音技術」。

百度輸入法發布了在線語音的「流式截斷多層注意力建模」(SMLTA)技術,按其說法,是「世界上首次做到了局部注意力建模識別精度超過全局注意力模型」,以及「世界上第一次大規模部署在線語音交互注意力模型」。該技術可以解決傳統模型存在的「時延性」問題,百度方面宣稱其「將在線語音識別精度提升了15%,超越行業最高水平15%」。

2、一邊是5G時代到來,一邊更應關注「沒網」的需求

刷短視頻、聊微信、打遊戲、購物……這些地鐵族的標配,其實隱含了輸入法的另一個需求:如何解決旺盛的離線識別需求。

5G時代的腳步越來越近,但列車、電梯、隧道、高密度人群(例如春運的火車站)環境下,網慢、無網給語音輸入提出了更嚴峻的挑戰。而越是斷網的場景,用戶對輸入法的需求其實越高,在寫字樓網路好的場景其使用頻率反而降低(工作等原因)。

由此,AI語音離線識別近來成為輸入法產品爭相打造的技術。搜狗就宣稱其可以做到4國語言離線翻譯,而百度則盯住Deep Peak 2系統進行優化嘗試解決用戶多元輸入場景的需求。目前,在地鐵、電梯、隧道或人流密集等離線場景中,百度輸入法仍然可做到精準的語音輸入,官方稱「高於行業平均水平35%」,從這次發布會的一段各輸入法即興離線語音識別PK來看,百度輸入法的確占優。

3、只有一個產品,卻必須滿足極端多樣化的需求

誠如前文所言,在中文環境下,輸入法不得不面臨多樣化的輸入需求,方言、英文、不同語法……而輸入法不可能為各地、各用戶群分別開發,由此,如何更好地同時兼容各語言,成為輸入法「體驗」的重要環節。

例如,方言識別已經是多數輸入法的「標配」,然而,由於技術的限制,用戶往往還需要一個「進入」方言的切換動作,一方面這與互聯網盡量簡潔的產品思維相悖,另一方面對很多對電子產品不熟的下沉用戶而言形成了天然阻隔。

這給了百度輸入法機會,其「方言與方言、方言與普通話的混合語音輸入」技術,目前做到了無縫切換,用戶可做到「自由說」。與此類似地,中英文夾雜亦可來回切換。目前為止,百度輸入法應當是市面上唯一做到了高精度中英文混合語音輸入、方言免切換語音輸入的輸入法產品。

AI技術PK後,輸入法還有你想像不到的「新機會」

客觀地說,在AI技術浪潮下,上述技術革新帶來的細節體驗,相信各大輸入法一定會盡快補齊,畢竟產品目標擺在那里,去做到就行了。

然而,從這次發布會來看,百度輸入法或還「留了一手」,AI輸入法樣板的聚焦點可能不只有AI,百度還意圖顛覆關於輸入法的舊有認知,為輸入法應用打開新的應用場景與商業可能。

從百度輸入法AI探索版新交互、新表達、新探索三大產品主題來看,其試圖結合用戶需求、互聯網產品理念、AI技術趨勢等大環境,顛覆輸入法三個固有認知:

1、”輸入法只是C端產品「

輸入法當然是給普通用戶使用的,它是最成功、最普及的C端產品之一。不過,視頻維度的信息輸入可能為輸入法打開了新的商業空間大門。

百度輸入法AI探索版的拍立活、秀場,需要平台提供特定的元素配合。百度海外輸入法曾經與超級IP《變形金剛》系列首部獨立電影《大黃蜂》聯手推出「大黃蜂」系列主題貼圖和AR表情,此外,還與Hello Kitty、小黃鴨、小王子、格林奇等全球100餘個知名IP達成合作,推出IP皮膚和表情。

在此基礎上,百度輸入法針對海外用戶還設計了本地網紅合作推廣等定制化傳播,而這,可能就是搜狗輸入法等產品一直夢寐以求的變現路徑,有了B端合作的可能。

2、”輸入法是工具產品「

用完就扔,召之即來揮之即去,輸入法做個最普及的「工具產品」倒也沒什麼,但是偏偏全感官輸入給輸入法撕開了一個貼合當前移動互聯網內容需求的口子。

不久前,微信力推朋友圈的小視頻功能,用戶可即時拍攝視頻分享。很明顯,社交+泛娛樂(尤其是短視頻)成為各家都在爭搶的潛力領域,頭條系、微信都試圖往對方領域滲透。

而「全感官輸入」一個討巧的地方就在於,類似AR這種應用,讓一對一聊天和群聊環境下,用戶可以直接髮出類似小視頻的內容進行共享,做到小視頻社交的目的,這就是大佬們都在追求的社交與視頻融合。

不過,目前來看,AR應用只處在增強輸入體驗階段,社交泛娛樂產品只是未來的想像空間。

3、”輸入法只能用來PC、手機輸入「

最早的漢字輸入還需要專門的「漢卡」硬件,到後來PC時代開始進入軟件化,移動互聯網時代更是帶來多種便捷輸入體驗。

現在,這一進程還在繼續,輸入法可能將有脫離於PC、手機的可能。

百度輸入法AI探索版的「新探索」推出了凌空手寫,用手指在錄影頭取景範圍內的空中手寫,輸入法即可識別並生成文字。乍看這是利用手機錄影頭和AI技術的一種新奇玩法,而事實上,這意味著輸入法有了脫離PC和手機的機會,比如,在目前已有的案例中,百度輸入法凌空手寫技術已經在小尋手表、小天才電話手表上得到應用。

這意味著,凌空手寫或類似的AI技術,有可能將輸入法可導入到更多智能終端當中,為輸入法打開完全不一樣的場景新天地,同時推動智能硬件的體驗更新。

拭目以待吧。

About 尋夢園
尋夢園是台灣最大的聊天室及交友社群網站。 致力於發展能夠讓會員們彼此互動、盡情分享自我的平台。 擁有數百間不同的聊天室 ,讓您隨時隨地都能找到志同道合的好友!