【數據財富】文字數據化,Google不是第一個吃螃蟹的人

尋夢新聞LINE@每日推播熱門推薦文章,趣聞不漏接❤️

加入LINE好友

【數據財富】文字數據化,谷歌不是第一個吃螃蟹的人

Google並不是第一個夢想在計算機時代喚醒書寫文明所蘊含的財富的公司,它也不是第一個吃螃蟹的人。

1971年,一個志願者提出倡議把公共領域的書籍放上網路,制成電子書,方便更多的人閱讀,這就是古登堡計劃(Project Gutenburg)。這是非常有意義的,但是這個計劃沒有把書籍數據化,也沒有開發出書籍的其他功能;它關注的是閱讀,而不是擴充書籍用途。

同樣地,出版社多年來也一直致力於電子書領域的開發,但是他們都只是把書籍內容作為核心價值,而沒有把書籍看作一種數據並納入自己的商業模式中。

因此,他們沒有做到把書籍的數據價值挖掘出來,也不允許別人這樣做。他們沒有看到數據化的需求,也意識不到書籍的數據化潛力。現在很多公司都在電子書領域激烈地競爭著,亞馬遜連同它的Kindle電子書就是這個領域的先驅者。

同樣在這里,亞馬遜和Google的發展策略差異顯而易見。亞馬遜擁有數據化的書籍,卻不曾挖掘書籍數據化之後的附加價值。該公司創始人兼執行總裁貝索斯說服了上百家出版社在Kindle上發布它們的圖書,所以Kindle的圖書並不是數字圖像,人們可以更改字體大小和用黑白以及彩色兩種方式看書。

這些書籍是數據化了的,不只是數字化。事實上,亞馬遜把上百萬的新書都數據化了,而Google卻在費力地數據化很多舊版本的數據。然而,亞馬遜把它的眼光聚焦於用來閱讀的書籍內容上,而不是分析數據化文本上。

​當然,有可能它面對了來自傳統出版社的壓力,後者可能限制了書籍內容的使用方法,畢竟版權在人家手中。Google,作為一個喜歡跨界的叛逆的大數據公司,就沒有這樣的壓力了,畢竟Google的資源來源於用戶點擊,而不關出版社什麼事。至少現在,可以不失公允地說,亞馬遜深諳數字化內容的意義,而Google觸及了數據化內容的價值。

About 尋夢園
尋夢園是台灣最大的聊天室及交友社群網站。 致力於發展能夠讓會員們彼此互動、盡情分享自我的平台。 擁有數百間不同的聊天室 ,讓您隨時隨地都能找到志同道合的好友!