我不是機器人：Google最新版驗證碼系統ReCaptcha破解已開源

2019-03-27 尋夢園戲劇 97 Views

尋夢新聞LINE@每日推播熱門推薦文章，趣聞不漏接

每個人都討厭驗證碼，這些惱人的圖片中包含你必須輸入的字符，我們只有正確地填寫才能繼續訪問網站。驗證碼旨在確認訪問者是人還是程序，並防止惡意程序的入侵。然而，隨著深度學習和計算機視覺技術的發展，現在這些認證方法可以被我們輕鬆破解了。

在這一個項目中，作者破解了最新版的 ReCaptcha，並開源了所有代碼。不過項目作者聲明:「這份代碼能夠解決最新版的 ReCaptcha，但僅限於在自己網站上使用，且僅用於教育目的。」

項目地址:https://github.com/ecthros/uncaptcha2

reCAPTCHA 項目是由卡內基梅隆大學開始構建的系統，這個項目將從書本上掃描下來、無法被 OCR 準確識別的文字顯示在 CAPTCHA 問題中，從而判斷訪問者到底是程序還是人類。自 2014 年以來，reCAPTCHA 改為在「我不是機器人」（I’m not a robot）的方框中打勾，進而完成判別。

這個名為 unCaptcha 的項目最早創建於 2017 年 4 月，並在當時做到了 85% 的 ReCaptcha 對抗率。不過後來Google發布了新版本的 ReCaptcha，且新版的 ReCaptcha 主要有以下兩個主要改進:

更好的瀏覽器自動檢測
使用短語語音而不是數字

這些改進最開始成功地防禦了第一版 unCaptcha 的攻擊，然而到了 18 年 6 月份，這些挑戰基本都已被解決。本項目的作者同樣與 ReCaptcha 團隊取得了聯繫，他們完全了解這次攻擊。此外，ReCaptcha 團隊還允許該項目作者發布 unCaptcha2 的代碼，盡管它目前仍然能有效破解 ReCaptcha 驗證碼。

unCaptcha2 簡介

由於 ReCaptcha 添加了語音形式的驗證碼識別，破解 ReCaptcha 比以前變得更加容易。因為我們只需要調用一個免費的語音識別 API，對所有驗證碼的識別準確率就能達到 90% 左右。另外由於 ReCaptcha 會阻止瀏覽器自動化引擎 Selenium，unCaptcha2 會使用螢幕點擊器（clicker）移動到螢幕上特定的像素，從而像人一樣瀏覽網頁。當然在模擬人類瀏覽的過程中，每一個新用戶的坐標都需要更新，這個目前並不是太魯棒。

unCaptcha2 的方法非常簡潔:

導航至Google的 ReCaptcha 演示網站
導航至 ReCaptcha 的語音庫
下載語音
使用語音識別 API 識別語音
解析 API 返回的參數和識別結果
提交識別結果，判斷是否成功

如下所示 unCaptcha2 的測試界面:

如何使用 unCaptcha2

因為 unCaptcha2 必須指定螢幕上的特定坐標，因此我們必須基於設置更新坐標。這些坐標更新的代碼寫在了 run.py 文件的最上面。在 Linux 系統中，使用命令行 xdotool getmouselocation—shell 可以定位滑鼠在螢幕上的坐標位置。

我們還需要配置到底使用哪一個語音識別 API，國內的 BAT、訊飛和搜狗等都提供高效的語音識別 API，而國外的Google、微軟和 IBM 也一樣。Google、微軟和 IBM 的的 API 結構都已經在 queryAPI.py 中，我們只需要配置用戶名和密碼就行了。如果你要使用Google API，我們需要使用Google應用的證書參數配置環境變量 GOOGLE_APPLICATION_CREDENTIAL。

最後，安裝剩下的依賴項就能愉快地破解了:pip install -r dependencies.txt。

不是機器人

About 尋夢園

尋夢園是台灣最大的聊天室及交友社群網站。致力於發展能夠讓會員們彼此互動、盡情分享自我的平台。擁有數百間不同的聊天室，讓您隨時隨地都能找到志同道合的好友！

尋夢新聞LINE@每日推播熱門推薦文章，趣聞不漏接

更多文章