尋夢新聞LINE@每日推播熱門推薦文章,趣聞不漏接❤️
對於 Tera,很多人並不陌生,它是百度網頁搜尋部開源的一個高性能、可伸縮的結構化數據存儲系統,被設計用來管理搜尋引擎萬億量級的超鏈與網頁信息。在 GitHub 社區里,Tera 占據超過 1.3k 的 star,是百度開源項目中最受歡迎的項目之一。
大多數人對 Tera 感興趣,源於它是百度實時搜尋背後的關鍵數據存儲系統,其數十 PB 量級的數據存儲和百萬 QPS 的實時數據訪問能力,支撐著百度搜尋引擎的鏈接存儲、實時索引篩選、實時用戶行為分析等多個核心系統。
如果讓你有機會接觸百度網頁搜尋部門的技術大牛們,聽他們介紹 Tera 的數據模型和整體架構;介紹 Tera 如何支撐百度鏈接存儲、實時索引篩選、實時用戶行為分析系統,對你來說是不是非常有價值?
那麼機會來了,百度技術沙龍之 Tera 技術大揭秘將於本周六召開,講授乾貨技術、推動技術進步一直是百度技術沙龍堅守的原則,Tera 主題沙龍也會讓你不虛此行。
活動時間:2017 年 5 月 20 日 14:00~17:00
活動地點: 海淀區中關村創業大街 48 號 車庫咖啡二層
活動日程:
開場演講:百度開源最新狀況
講師介紹:
譚中意, 工程效率部資深工程師,架構師顧問團成員,百度工作 6 年多,目前負責平台化相關的技術工作。曾在多個開源社區工作過,對開源社區有較多經驗。
主題一:Tera 大型分布式表格系統的架構設計與實踐
講師介紹:
鄭然,百度網頁搜尋部資深工程師。2009 年加入百度網頁搜尋部,在網頁搜尋部工作的 7 年時間里,一直從事百度搜尋引擎的架構研發工作,先後負責過百度搜尋引擎的大規模索引構建工作,大數據離線平台架構工作,微服務架構以及大規模在線服務治理等工作。目前主要做 Tera 分布式存儲系統的研發工作。
演講概要:
Tera 是一個高性能、可伸縮的結構化數據存儲系統,被設計用來管理搜尋引擎萬億量級的超鏈與網頁信息。為做到數據的實時分析與高效訪問,百度使用按行鍵、列名和時間戳全局排序的三維數據模型組織數據,使用多級 Cache 系統,充分利用新一代服務器硬件大內存、SSD 盤和萬兆網卡的性能優勢,做到模型靈活的同時,做到了高吞吐與水平擴展。鄭然在演講過程中會詳細介紹 Tera 的架構設計,包括數據模型,整體架構,高可用技術和性能優化等內容。
主題二、Tera 在百度搜尋引擎中的應用
講師介紹:
齊志宏,現任百度網頁搜尋基礎架構 & 調研架構團隊技術經理。曾供職騰訊,2012 年加入百度網頁搜尋,從事搜尋架構相關的技術管理工作,目前主要負責百度海量數據存儲系統相關工作。
演講概要:
演講重點介紹 Tera 作為核心技術,是如何支撐百度鏈接存儲,實時索引篩選以及實時用戶行為分析等多個重要系統的。
戳 「 閱讀原文 」,立即報名!