從「電子索引」到「百度已死」,搜尋引擎最初的模樣究竟如何?

尋夢新聞LINE@每日推播熱門推薦文章,趣聞不漏接❤️

加入LINE好友

yee君說——

最近一篇名為《搜尋引擎百度已死》的文章刷屏網路,引人關注,該文認為百度搜尋名存實亡,已淪為百家號站內搜尋,百度股價大跌6%。搜尋引擎作為互聯網時代的寵兒,每天都被人們數以億記次的使用,但真正了解搜尋引擎的人少之又少。你還記得它最初的模樣嗎?

從“電子索引”到“百度已死”,搜索引擎最初的模樣究竟如何?

從“電子索引”到“百度已死”,搜索引擎最初的模樣究竟如何?

當「Google」「百度」已經成為互聯網搜尋時的常用詞時,大多數人可能都忘記了在它們出現之前搜尋引擎已經有了很長的歷史。我們很有必要重新回顧 ,認識一下在搜尋引擎時代之前對互聯網發展做出了最重要貢獻之一的人:互聯網搜尋的發明者,艾倫·埃塔奇(Alan Emtage)。

1989年,埃塔奇還是蒙特利爾麥吉爾大學的一名研究生,從家鄉巴巴多斯搬到了學校。成為了該校信息技術系的一名系統管理員,他的工作是為學生和教職員工尋找軟件——當時還需要人工挖掘分布在新生的互聯網上的各種FTP(文件傳輸協議)服務器。為了節省自己的時間,他便編寫了一些代碼幫助搜尋,並將他的FTP搜尋引擎命名為「ARCHIE」(以「archive」命名,沒有「v」)。

從“電子索引”到“百度已死”,搜索引擎最初的模樣究竟如何?

你可以從1994年的一篇文章中清楚地感受到這一貢獻究竟有多重要:

ARCHIE,被稱為「互聯網電子索引」,是麥吉爾大學開發的一組搜尋工具,用於在互聯網上電子搜尋計算機目錄。ARCHIE可以在幾分鐘內搜尋全球1200多個站點的210萬份文件。給定一個標題或主題,ARCHIE將搜尋Internet並報告包含與關鍵字匹配的信息的文件的位置。ARCHIE在定位科學教育者可用的公共領域軟件方面特別強大。因為文件的數量每天都在增加,所以ARCHIE數據庫大約每個月在國際上更新一次。

從“電子索引”到“百度已死”,搜索引擎最初的模樣究竟如何?

我們現在大概理所當然地認為搜尋引擎在我們線上生活的隨處可用——在互聯網上,在我們本地的計算機桌面上,在我們的手機上都能應用。但是在互聯網的早期則並非如此,人們仍然需要靠那種搜尋來對問題的出一個清晰的解釋。正如1995年發表在《英國醫學雜誌》上的一篇文章所解釋的那樣:

知道成千上萬的文件可能在數千個匿名FTP站點上可以利用是一回事;當您甚至不知道存在這樣的程序時,或者即使存在,也不知道在哪里可以找到它又是一回事,找到適合某個任務的程序和找到其他文件是完全不同的。您可以嘗試瀏覽各種匿名FTP站點。然而,站點索引的好壞以及查找給定類型的應用程序的難易程度各不相同……如果您知道要查找的文件的名稱,那麼就會變得易如反掌,這要感謝一個名為Archie的實用程序。Archie由Internet上的一組計算機組成,這些計算機不斷搜尋全世界所有的匿名FTP站點,然後將結果編譯成一個可搜尋的數據庫。

近三十年後,我們可以看到,Emtage的貢獻不僅改變了我們查找信息的方式,也改變了我們在索引良好的新互聯網上的力量平衡。不僅僅表現在強大的Google算法和網站之間的力量平衡,還有搜尋和搜尋者之間的力量平衡。

從“電子索引”到“百度已死”,搜索引擎最初的模樣究竟如何?

一篇文章中指出,「仆人-主人」的比喻可以幫助我們理解Google搜尋的內涵所在:

如果仆人知道的比主人多,而內部消息適合於下級,那麼誰來統治誰呢?在Google或Askjeeves的例子中,這個問題在很久以前就解決了:假設在搜尋引擎的用戶界面中輸入查詢時,沒有人聲稱自己是master。如果用戶和搜尋引擎之間的關係中最重要的是信息分析、準備和分發,那麼權力早已傳遞給了事物的主人。

如果說搜尋改變了互聯網用戶和互聯網本身之間的力量平衡,那麼它無疑也深刻地影響著我們的內在素質——我們要如何去學習,如何去思考。2010年, The National Science Teacher報導了一項研究:

對72名參與者的搜尋習慣進行研究,共進行了426項搜尋任務。研究人員發現,搜尋引擎主要用於核實用戶自身的內部知識,這意味著他們是學習過程的一部分,而不僅僅是信息的來源。

與此類似Sparrow et al.也以同樣的方式研究了搜尋對我們認知過程的影響。他們注意到:

我們很少離線,除非出於自願,而且我們很難記得在互聯網成為我們生活中無處不在之前,究竟是如何找到信息的。互聯網,以及搜尋引擎(如Google)和數據庫(如IMDB)和存儲在那里的信息,已經成為我們可以隨時訪問的外部內存源。

從“電子索引”到“百度已死”,搜索引擎最初的模樣究竟如何?

作者做了幾個實驗來測試互聯網搜尋和「傳遞性」記憶之間的關係。「傳遞性」記憶是由個人直接擁有的記憶存儲和他們可以訪問的記憶存儲的組合,因為他們知道某人知道這些信息。」這些實驗提供了「初步證據,證明當人們希望信息持續可用時(比如我們希望通過互聯網訪問),他們更有可能記住在哪里找到信息,而不是記住其它的細節。」文章的結論是:

這些結果表明,人類的記憶過程正在適應新的計算和通信技術的到來……我們正在學習的都是計算機「知道」的東西,以及我們什麼時候應該注意在基於計算機的記憶中存儲信息的位置。我們正與計算機工具共生,成長為相互關聯的系統,這些系統不是通過了解信息,而是通過知道信息可以在哪里找到來記住信息的。

從“電子索引”到“百度已死”,搜索引擎最初的模樣究竟如何?

這是一個令人震驚的結論——但如果你是那種一但想要記下電影名字的那一刻就伸手拿起手機的人,或者是好奇海淀到通州之間的距離也要搜一下的人,又或者是常保存「大學生最常讀的十本小說」的名單的人,那麼這個論斷就不得不讓人信服。搜尋已經鑽進了我們的靈魂深處……這就是為什麼我們應該記住那個把它放進去的人:艾倫·埃姆塔格(Alan Emtage)。

大家對搜尋引擎有哪些看法,歡迎在下方評論區留言~

About 尋夢園
尋夢園是台灣最大的聊天室及交友社群網站。 致力於發展能夠讓會員們彼此互動、盡情分享自我的平台。 擁有數百間不同的聊天室 ,讓您隨時隨地都能找到志同道合的好友!