燒了微軟10000張GPU，這夥人鐵了心要砸大家的飯碗

尋夢新聞LINE@每日推播熱門推薦文章，趣聞不漏接❤️

加入LINE好友

曉查發自凹非寺量子位報導 | 公眾號 QbitAI

2020年註定是不屈凡的一年。除了新冠疫情之外，今年還可能是「天網元年」。

因為在這一年誕生了「比特幣之後人類最重大發明」、顯卡毀滅者——史上最全能的AI模型。

現在你只要對它發號施令：

請幫助設計一個和XX網站一樣的網頁來介紹我的產品。

燒了微軟10000張GPU，這夥人鐵了心要砸大家的飯碗科技第1張

輸入完僅僅幾秒，它立刻就能輸出一個美觀的網頁設計。

遙想6月初，這個模型剛剛發布時，外界認為它「不過就是炫富而已」，和前代相比沒有太大的技術更新。

然而，內測試用後，風評立馬180度大轉彎，體驗過的程序員們紛紛表示：「真香」。

事實證明，「微軟的鈔票+英偉達的核彈」的確是可以為所欲為的。

燒了微軟10000張GPU，這夥人鐵了心要砸大家的飯碗科技第2張

是的，這就是OpenAI的GPT-3，原來只能用來生成文字，一周之內被腦洞大開的程序員們開發出了30多種功能：資料庫工程師、會計、運維、智能客服……儼然一副取代人類的架勢。

現在，它已經成為一名「真·全棧工程師」。

全能選手GPT-3

在後端，AI模型GPT-3成功「套娃」，能自己編寫AI模型。只要給GPT-3提出具體的需求：

構建一個圖像分類模型，把圖片分成5類，訓練數據集共有2.5萬張圖片，輸入圖片尺寸為500×500。

很快GPT-3就輸出了模型的完整代碼：

燒了微軟10000張GPU，這夥人鐵了心要砸大家的飯碗科技第3張

GPT-3甚至連代碼的註釋都寫好了，生怕你看不懂。

作為一個會寫AI模型的AI，懂一點資料庫總是必不可少的，SQL語言自然不在話下。

現在用SQL實現數據的統計查找，基本就是一句話的事情，提出需求，GPT-3幾秒內快速給出SQL查詢代碼。

燒了微軟10000張GPU，這夥人鐵了心要砸大家的飯碗科技第4張

既然是全棧工程師，只會後端代碼顯然是不夠的。

前面，我們已經見識過GPT-3設計網頁的能力。HTML前端工程師的事，GPT-3也會做。

GPT-3能根據描述生成網頁CSS代碼，稍加改動就能直接用在網頁設計裡。

燒了微軟10000張GPU，這夥人鐵了心要砸大家的飯碗科技第5張

還有運維的活兒，GPT-3也懂一點。

燒了微軟10000張GPU，這夥人鐵了心要砸大家的飯碗科技第6張

另外，程序員不會的事情，GPT-3也能做。

在沒有任何財務知識的情況下，告訴它你的每一筆開銷，GPT-3自動生成符合規范的財務報表。有了GPT-3，就能幫老板省下請會計的錢。

燒了微軟10000張GPU，這夥人鐵了心要砸大家的飯碗科技第7張

工作娛樂兩不誤。學習了一段棋譜後，GPT-3又掌握了國際象棋技能，不知道何時能與AlphaGo對戰。

燒了微軟10000張GPU，這夥人鐵了心要砸大家的飯碗科技第8張

還有人對GPT-3進行了圖靈測試，結果看起來真的很像人在回答。試用者說：「如果在十年前用同樣的問題做測試，我一定會認為答題者是人類。」

燒了微軟10000張GPU，這夥人鐵了心要砸大家的飯碗科技第9張

看到這裡，你是不是有一絲絲恐懼？不會天網真的要上線了吧？

深度學習之父、圖靈獎得主Hinton看得更遠，他認為GPT-3的未來不僅僅是取代人類，而是更遙遠的星辰大海，也許用它就能破解宇宙終極秘密。

從GPT-3驚人的性能可以推測：生命、宇宙和萬物的答案，只是4.398萬億個參數而已。

燒了微軟10000張GPU，這夥人鐵了心要砸大家的飯碗科技第10張

「鈔能力」的GPT-3

這「都怪」OpenAI最近內測了GPT-3的API，讓程序員得以腦洞大開，讓普通人感到「害怕」。

燒了微軟10000張GPU，這夥人鐵了心要砸大家的飯碗科技第11張

GPT-3能力超強，一方面是因為在激烈競爭中各家NLP技術突飛猛進，更主要原因還是OpenAI夠暴力、夠多金。

要知道，去年OpenAI發布的GPT-2（GPT-3的前輩）只有15億參數，而今年GPT-3參數量已經暴增到1750億個，是前者的100多倍！

參數的暴增無疑會給模型性能帶來明顯的改進，但問題是多出來的計算資源從哪來。

成立不到5年的OpenAI能讓GPT-3在一年內實現飛躍，其中當然少不了金主爸爸的支持。

燒了微軟10000張GPU，這夥人鐵了心要砸大家的飯碗科技第12張

去年，微軟10億美元投資OpenAI，讓原本拮據的OpenAI終於可以放開手腳開發更為強大的AI模型。

GPT-3採用了兩階段的思路。

首先，用海量語料庫對GPT-3進行無監督預訓練，數據集大約含有3000億個token，訓練目標是讓模型去預測下一個單詞。

如果模型預測結果是錯誤的，那麼就計算誤差並更新模型，以便在下一次做出更好的預測。這一過程要重復數百萬次，直到模型能生成正確的句子。

燒了微軟10000張GPU，這夥人鐵了心要砸大家的飯碗科技第13張

這一步是最最燒錢的。Google開發的BERT，「只有」3億參數，英偉達用1400多個V100 GPU組成的計算集群算了近1小時才完成訓練。

何況數據集規模超過500GB的GPT-3預訓練模型，還有1750億參數，訓練難度就可想而知了。

為了訓練GPT-3，微軟花錢攢了臺超級計算機。

今年5月，微軟官方公布推出一臺全球前五的超級計算機，專門用於OpenAI的模型訓練。它總共有28.5萬個CPU核心、1萬個英偉達V100 GPU。（黃仁勛看到這個配置，應該露出了笑容。）

燒了微軟10000張GPU，這夥人鐵了心要砸大家的飯碗科技第14張

有了這臺超算，OpenAI就能實現「更大膽的想法」。

有專業人士推測過，訓練一個GPT-3模型需要「355個GPU年」（一塊GPU運行355年的運算量），光是訓練費用就高達460萬美元。

在微軟和OpenAI的努（chao）力（piao）下，GPT-3終於被訓練出來。

以上只是第一階段，預訓練模型還不能直接用於具體任務，接下來只要對剛剛的模型進行微調，就能處理各種負責的NLP任務。

燒了微軟10000張GPU，這夥人鐵了心要砸大家的飯碗科技第15張

而這一部分的運算量要小得多，普通用戶也可以承受。於是我們就看到了GPT-3被用來寫代碼、做設計。

頗具爭議的GPT-3

GPT-3成為網紅，當然也少不了網友的激烈討論。

有reddit網友認為，GPT-3的出現證明了通用人工智慧不會太遙遠。GPT-3已經做了可以做的一切，我們甚至不需要做得更好，只要再等幾年，等算力增強，把數據集再擴大10倍。

燒了微軟10000張GPU，這夥人鐵了心要砸大家的飯碗科技第16張

也有人覺得，我們對GPT-3是否過於了樂觀，說它是「天網」太過誇張。GPT-3本質上還是個NLP模型，和GPT-2具有相同的結構，唯一的區別只是規模更大。

和其他神經網路模型一樣，GPT-3還是個黑箱子，我們不能知道它為什麼做出這樣的推理，而且它只有文檔預測，沒有邏輯推理、沒有思想，在訓練集之外的概括能力很差。

燒了微軟10000張GPU，這夥人鐵了心要砸大家的飯碗科技第17張

比如之前提到的寫代碼，可能更多的原因是技術論壇裡有相幹內容，被GPT-3複製了下來。

燒了微軟10000張GPU，這夥人鐵了心要砸大家的飯碗科技第18張

面對網友的讚美，OpenAI的CEO倒是非常謹慎，他認為現在關於GPT-3的炒作實在太多了。GPT-3仍然存在嚴重缺陷，有時候會犯一些低級的錯誤，還有很多需要改進的地方。

燒了微軟10000張GPU，這夥人鐵了心要砸大家的飯碗科技第19張

因為已經有人用來自互聯網的內容訓練出了一些帶有偏見的結果，在國外的氛圍中，一旦負面影響擴大化，對OpenAI將是個巨大的打擊，恐怕這也是OpenAI不敢擴大測試範圍的原因之一。

本來，OpenAI因為覺得GPT-3「實在太危險」選擇不開源。現在開放API應該也是處於試水狀態，出現任何問題都能快速關閉API，防止問題蔓延。

燒了微軟10000張GPU，這夥人鐵了心要砸大家的飯碗科技第20張

△OpenAI官方提示，GPT-3接受網路內容訓練，可能有令人反感的內容

正因如此GPT-3 API現在相當稀缺的資源，申請到的難度不下於北京車牌搖號，只能試試運氣了。

如何申請試用

如果你也對GPT-3感興趣，不妨去OpenAI官網申請試用。填寫下面這樣一份表格，靜靜等待官方通知吧。

燒了微軟10000張GPU，這夥人鐵了心要砸大家的飯碗科技第21張

如果申請成功，你將獲得一串API的試用密鑰，只需要會Python 3，並安裝yarn，按照GPT-3沙箱項目的指導，就能在Web端體驗它的種種「鈔能力」了。

這是一段將自然語言轉化為LaTeX格式的代碼：

#ConstructGPTobjectandshowsomeexamplesgpt=GPT(engine="davinci",temperature=0.5,max_tokens=100)gpt.add_example(Example('Twoplustwoequalsfour','2+2=4'))gpt.add_example(Example('Theintegralfromzerotoinfinity','\\int_0^{\\infty}'))gpt.add_example(Example('Thegradientofxsquaredplustwotimesxwithrespecttox','\\nabla_xx^2+2x'))gpt.add_example(Example('Thelogoftwotimesx','\\log{2x}'))gpt.add_example(Example('xsquaredplusysquaredplusequalszsquared','x^2+y^2=z^2'))#DefineUIconfigurationconfig=UIConfig(description="Texttoequation",button_text="Translate",placeholder="xsquaredplus2timesx")demo_web_app(gpt,config)

現在，你是個成熟個AI，應該能自動寫出「牛頓-萊布尼茲公式」了。

燒了微軟10000張GPU，這夥人鐵了心要砸大家的飯碗科技第22張

怎麼樣，你想去試試嗎？

參考鏈接：https://blogs.microsoft.com/ai/openai-azure-supercomputer/https://jalammar.github.io/how-gpt3-works-visualizations-animations/https://www.reddit.com/r/MachineLearning/comments/hymqof/d_gpt3_and_a_typology_of_hype_by_delip_rao/https://www.datanami.com/2020/07/21/openais-gpt-3-language-generator-is-impressive-but-dont-hold-your-breath-for-skynet/

GPT-3應用案例：https://gpt3examples.com/

GPT-3沙箱：https://github.com/shreyashankar/gpt3-sandbox

OpenAI API開發者工具包：https://www.notion.so/API-Developer-Toolkit-49595ed6ffcd413e93ebff10d7e70fe7

— 完 —

本文系網易新聞•網易號特色內容激勵計劃簽約帳號【量子位】原創內容，未經帳號授權，禁止隨意轉載。

每天5分鐘，抓住行業發展機遇

如何關註、學習、用好人工智慧？

每個工作日，量子位AI內參精選全球科技和研究最新動態，匯總新技術、新產品和新應用，梳理當日最熱行業趨勢和政策，搜索有價值的論文、教程、研究等。

同時，AI內參群為大家提供了交流和分享的平臺，更好地滿足大家獲取AI資訊、學習AI技術的需求。掃碼即可訂閱：

燒了微軟10000張GPU，這夥人鐵了心要砸大家的飯碗科技第23張

加入AI社群，與優秀的人交流

燒了微軟10000張GPU，這夥人鐵了心要砸大家的飯碗科技第24張

燒了微軟10000張GPU，這夥人鐵了心要砸大家的飯碗科技第25張

量子位QbitAI · 頭條號簽約作者

վ’ᴗ’ ի 追蹤AI技術和產品新動態

喜歡就點「在看」吧 !