深度剖析Amazon AI技術運用和戰略布局:Alexa篇

尋夢新聞LINE@每日推播熱門推薦文章,趣聞不漏接❤️

加入LINE好友

Amazon超過微軟成為全球市值最高的公司,市值7900萬美元。Jeff Bezos一直有個非常著名的「Day 1」哲學,就是讓公司永遠保持在一個”Day 1″的狀態,他認為一旦到了「Day 2」,就意味著進入停滯期。

那如何保持「Day 1」?Jeff在2017年給股東的公開信中提到了4個策略:用戶至上(Amazon內部神一般的教條),抵制形式主義,關注外部趨勢和快速決策。

Jeff早在1997年Amazon還剛起步的時候提到」Day1」。

當時的vision:But this is Day 1 for the Internet and,if we execute well for Amazon.com. Today, online commerce saves customers moneyand precious time. Tomorrow,through personalization online commerce well accelerate the very process ofdiscovery。

從網上書店起步的Amazon,Jeff已經很早預測到技術對驅動業務發展的重要性——1998年推出的協同過濾推薦引擎充分體驗了這一點。

這就是Amazon為什麼在「Day1」就對機器學習和人工智能非常的重視,從面向消費者的語音助手Alexa,showcase的無人商店Amazon Go,到藏在電商王國背後的AI技術,從inside到outside,從topdown到bottomup,AI滲透進Amazon內部每一個細胞。

相對其他巨頭,Amazon在AI領域的收購稍顯保守,但Amazon Alexa基金就非常aggressive,後面會作介紹。2013年,收購英國公司Evi Technology,該公司當時開發了一款跟Siri類似的語音助手Evi。據了解,Amazon Echo的語音技術來自於Evi。

2016年,收購做圖像識別的華人初創公司Orbeus,這是目前AWS上提供計算視覺服務Rekognition的前身。同年9月,收購聊天機器人平台Angel.ai,顯然是為Alexa布局。2017年,收購AI雲服務安全公司Harvest.ai,就是目前AWS推出的支持ML技術的安全服務Macie。

Amazon的AI應用可分為三大類:

一類是能「看得見、摸得著」的前沿技術moonshot產品,像Alexa, Amazon Go和無人機Prime Air;

一類是「不可見、藏在後台」的AI技術,如推薦引擎、倉庫機器人和fulfillment中心的「最後一公里」;

另外就是企業級應用AWS雲平台,提供AI工具和服務,讓企業構建自己的AI應用。

下面會分為3篇文章,全面、深入地剖析Amazon的AI技術應用和戰略布局。

Amazon在2004年成立Lab126, 專注於硬件產品的研發。實驗室曾有4個神秘的項目,代號為」ABCD」。擁有3000多名研發人員的Lab126以2007年發布的Kindle一戰成名。

但後來卻因重壓賭註的智慧型手機Fire Phone的失敗而大規模重組,項目C(據說是AR產品)也隨之流產。但萬萬想不到,一直不受重視的項目D,竟然打了一場漂亮的翻身仗,成為Amazon歷史上第二個成功的硬件產品。

2014年Echo從Lab126孵化出來,先定位Prime會員做市場試水,直到2015年在美國地區開放給全部用戶,接著就一發不可收拾,高歌猛進。

憑著快速的語音響應,多場景的語音交互能力,親民的價格,瞬間秒殺市場上的音箱產品。Echo從「點」到「面」的鋪開戰略,從音箱到家電,從家庭到汽車,全面占據消費者的生活場景。

Amazon最新對外公布,Alexa的設備超過1億。雖然一直處於虧損狀態,但這並不阻擋「Alexa Everywhere」的戰略。靠硬件盈利並不是Amazon的目的,布局才是大棋。

這跟當年AWS「低價切進,閃電式占領市場」的策略如出一轍。AWS開始target中小型企業,財務上一直虧損,但市場滲透極深,等競爭對手開始醒覺的時候,已被AWS拋離到很遠。

另外,Alexa最殺手的大招是開放,允許第三方的技能集成,吸引了大量的開發者進入生態。2018年,Alexa技能個數已超7萬。

這是一個典型的Alexa驅動開燈的場景。當用戶發起語音指令,傳給雲端的Alexa解析和處理。Alexa如果發現使用的不是它內帶技能,就會去調用外部第三方開發者的技能,最後發出「開燈」的指令。

Alexa主要通過2個核心服務連接開發者和消費者構建生態: AVS (Alexa Voice Service) 和 ASK (Alexa Skill Kit)。AVS讓設備廠商把Alexa的「智能大腦」內嵌進自己開發的設備里,讓Alexa「無處不在」。

而ASK提供工具和接口給第三方開發者添加定制化的Alexa技能,讓Alexa「無所不能」。另外,Amazon近期還推出連接工具箱 ACK (Alexa Connect Kit) ,允許設備製造商不聯網、不走雲端、不需開發技能,通過本地連接就可做到設備「智能化」。

很明顯,Amazon這些布局極具前瞻性,不但籠絡了消費者和開發者,還降低技術門檻讓傳統的硬件製造商進入生態。它的最終目標是讓Alexa無處不在,無所不能,統治從家居家電,消費級可穿戴設備到汽車的一切平台。

我們從技術層面drill down,對Alexa的處理流程進行拆解。AVS主要負責兩個轉化:語音轉文字(Speech-to-Text)和文字轉語音(Text-to-Speech)。這兩個轉化的背後是由兩個深度學習引擎所支撐:Amazon Lex和Amazon Polly。

1. Amazon Lex:語音轉文字服務,包含自動語音識別ASR和自然語言理解NLU的功能,可以獨立於Alexa使用,是Amazon AWS對外提供的chatbot服務

2. Amazon Polly:文字轉語音服務,利用的是語音合成技術(speech synthesis)

首先,AVS解析用戶發起的語音請求,識別技能的名稱,轉成結構化的信息。如果技能已經部署在AWS,ASK就直接運行AWS Lambda服務。

AWS Lambda是雲計算Serverless的計算架構,函數即服務(Function-as-a-Service, FaaS)。簡單的來說,就是開發人員直接編寫運行在雲端上的函數,後面AWS章節會詳細描述。

如果技能不在AWS,ASK就通過REST API調用外部服務。返回的結果通過AVS轉成語音信息傳給Echo,或者圖像形式發送到手機App。

Alexa的成功主要在產品、市場先機和開放策略。先從Echo單點爆發,迅速占領市場,形成第一道「護城河」。

然後,利用開放的策略,吸引更多的開發者研發第三方的Alexa設備,滿足消費者各種場景需求,用戶體驗不斷提升,然後帶來更多的流量,吸引更多的開發者進入,打造一個自給自足的生態循環,形成第二道「護城河」。

另外,生態的增長,持續產生大量有價值的用戶偏好數據,數據的反哺幫助ML算法優化,分析更加精確,個性化程度更高,客戶的體驗更好,形成第三道「護城河」。從用戶流量,到開發生態,到數據反哺,持續優化模型,層層遞進,形成一個讓競爭對手難以復制的巨大壁壘,最終壟斷市場。

Amazon在2015年成立1億美元的Alexa Fund,2017年再加註1億美元,target全球更多地區(美國、加拿大、澳新、印度等)。

基金目的主要是圍繞Alexa打造智能助手的生態,讓Alexa植入到更多的外部第三方產品,開發更多技能,引入先進的語音交互,NLP等AI技術。

基金除了關注ToC應用,還會進入ToB領域,這跟逐漸從消費級轉型到企業級的微軟Cortana正面交鋒。

除了基金,Alexa跟知名加速器Techstars合作,孵化以語音技術驅動的創業公司。據了解,Amazon與Techstars向每家加速器創業公司投資12萬美元,換取6%的普通股。

另外,基金還與大學,如卡內基梅隆CMU,Johns Hopkins,南加州大學,以及加拿大的Waterloo等,合作創辦fellowship項目,爭取從更早期階段孵化語音AI技術。

基金的portfolio有3家來自加拿大,7家來自歐洲,1家來自以色列和1家來自印度,其他均是美國地區。領域覆蓋了智能家居,汽車出行、教育、醫療護理、企業應用等領域。

很明顯,智能家居仍然是Alexa的重心,從智能冰箱貼,寵物餵食器到安防錄影頭,共投了14家。其中智能門鎖Garageio,智能門鈴Ring,安全路由器Luma,智能灑水系統Rachio均被收購。

兒童教育也是Alexa的關注領域,結合語音技術和IoT,賦能兒童STEM教育。核心技術和平台方面,KiTT.ai 專注語音喚醒和自然語音交互技術,尤其定制化的熱詞檢測和支持多回合、多平台的語音會話技術,2017年被百度收購。

DefinedCrowd針對的是語音識別,NLP和計算視覺方面的數據打標籤和訓練服務。還有明星公司Ctrl-Labs,同時獲得GV,Matrix Partners,Peter Thiel的Founders Fund等知名風投的投資,結合計算神經科學,機器學習,生物物理,人機交互等技術,打造新一代的「腦機接口」。

另外,Alexa也進入To B領域,包括銷售場景的Tact.ai、零售場景的Blutag、餐飲場景的SeverRooms。

80到90年代,微軟的Windows一直穩坐PC操作系統的王者地位。從2000年開始,移動互聯網開始崛起。2007年是一個關鍵里程碑,Google推出免費操作系統Android和Apple發布iPhone,標誌著正式進入移動互聯網時代。

雖然兩家走的路線不一樣,一個開放操作系統以應用生態為主,一個封閉走中高端路線,提供極致的用戶體驗,但並不阻擋iOS和Android的發展勢頭,完全占據了用戶手機使用的半壁江山。

2015年,Echo橫空出世,以極快地進入智能家居市場,從點到面地爆發。通過精準的產品定位,

閃電式的市場策略,開放的生態,以及投資布局,建立極高的競爭壁壘。得用戶者得天下,Amazon目標只有一個,就是打造下一代基於語音交互的操作系統。

根據「The Alchemy of Growth」理論(中文: 增長的煉金術),企業有三個層次的增長。第一個層次是Operator,維持當前業務的核心競爭力。

第二個層次是Business Builder,開拓新的業務增長模式和解決方案,擴展核心競爭力。第三層次是最高級別Visionary,也是離公司的comfort zone最遠的區域,創造獨有的解決方案,開拓全新市場,做到業務爆炸性的增長。

我們可以看出,Echo一系列智能產品利用語音技術,讓Amazon從電商業務拓展到智能家居,做到了新的業務模式,進入到Horizon II。

盈利不是首要目標,速度才是關鍵。這讓我想到了「The Lean Startup」里面的原則: learning and iterating as quickly as you can to build a viable business。

而Alexa最大的潛力在於開放API給第三方的開發者,打造生態系統,讓Alexa的設備達到1億多台,一年之內翻了5倍,把Amazon帶進了Horizon III,做到transformative的增長。是否能做到Amazon最終的目標?我們拭目以待。

About 尋夢園
尋夢園是台灣最大的聊天室及交友社群網站。 致力於發展能夠讓會員們彼此互動、盡情分享自我的平台。 擁有數百間不同的聊天室 ,讓您隨時隨地都能找到志同道合的好友!