尋夢新聞LINE@每日推播熱門推薦文章,趣聞不漏接❤️
Google於2018年首次公開發布了Colab。如果你需要一個穩定的筆記本電腦環境,並且有在筆記本、工作站和網路筆記本Chromebook之間無縫訪問和共享的需求,不妨試試Colab。
不要在瀏覽器中使用Colab
這條不算是Colab的管理技巧,但首先你最好讓Colab退出瀏覽器。使用Colab管理界面和一堆筆記本電腦是沒法解決問題的,因此要把Colab作為獨立應用程序運行。這依賴於操作系統(OS),但需要你在Chrome瀏覽器中安裝Colab「app」,並從應用程序上下文菜單(context menu)中選擇「打開為窗口」和「創建快捷方式…」,之後你需要找到快捷方式,並通過此快捷方式在自己的窗口中打開應用程序。
現在你可以在自己的窗口中打開Colab,如上圖所示,先從Colab的圖標開始。這條不是很切題,但仍然很有用。
1.下載文件到本地計算機
這是一個簡單但值得一提的技巧。一個用例:你創建了一個Keras模型,並希望可視化。然後調用plot_model來創建PNG文件,但由於Colab虛擬機不能永久存儲文件,因此你需要下載該圖像。部分執行代碼如下:
# plot model
plot_model(model, to_file=’rnn-mnist.png’ alt=”3個TIPS,教你玩轉Google Colab環境” title=”3個TIPS,教你玩轉Google Colab環境”, show_shapes=True)
# download model image file
from google.colab import files
files.download(‘rnn-mnist.png’)
執行上述代碼,將會彈出對話框,提示你輸入下載位置。這將引導我們到內聯顯示圖像。
是的,這是基本的。要內聯顯示上面的圖像,請使用:
# display model image file inline
from IPython.display import Image, display
Image(‘rnn-mnist.png’ alt=”3個TIPS,教你玩轉Google Colab環境” title=”3個TIPS,教你玩轉Google Colab環境”)
這是一個快速直觀的修改,通過它你會如預期一樣內聯各種其他文件。教訓:記住你在使用普通的Jupyter筆記本。
下面介紹關於Colab的相關內容。
2.訪問你的Google Drive文件系統
假設你想將該模型圖像文件保存到你的Google Drive中而不是保存到本地計算機。有多種方法可以將文件導入和導出Google Drive。這是獲取CSV數據的最直接的方式,比如從Google Drive中導出。
# save model image file to Google Drive
from google.colab import drive
drive.mount(‘/content/gdrive’)
單擊鏈接並輸入授權代碼後,你可以按如下方式訪問驅動器:
# save model image file to Google Drive
當然,它不是永久的,但並不費力,它似乎比使用任何其他方法更直接(並且是非永久的)。如果你使用像AutoKey(https://github.com/autokey/autokey)這樣的桌面自動化和文本擴展工具,那麼就會使常用的代碼和命令變得更加容易。
回到主題。現在你可以將文件保存到(或從中獲取文件)Google Drive了。放鬆點,只要你在終端感到舒服就好了。你可以使用數據文件所在的位置,也可以將其移動或復制到Colab VM根目錄的幾個目錄級別中。但是,它在刪除實例後就會從此處消失,因此如果只從文件系統中的CSV文件中讀取數據會更有意義:
# import pandas as pd
titanic_train = pd.read_csv(‘/content/gdrive/My Drive/Colab Notebooks/datasets/titanic/train_clean.csv’)
3.使用存儲在Google Drive中的自定義庫(custom libraries)和模塊
那麼,如果你要將自定義Python庫或模塊導入Colab項目,該怎麼做呢?
例如,在你的Colab目錄中有一個名為’my_modules’的文件夾,存儲了你希望在Colab中訪問的常見.py文件。你不想將它們存儲在GitHub上,而且它們不是乾淨的文件,你不想與他人分享。假設它們是你習慣使用的簡單輔助模塊集合; 數據加載器功能,數據清理功能等。
像這樣存儲在Dropbox文件夾中的任何文件,與你在Google Drive中同步的名稱都相同。這樣在Colab內部和外部都可以使用該文件。你可以直接利用操作系統訪問Google Drive內容 -在Chrome上,及在Ubuntu的ocamlfuse(https://github.com/astrada/google-drive-ocamlfuse)上——並且你可以利用之前提到的Google Drive文件系統訪問技巧,然後開始使用它們。
這段代碼很有用。假設你的my_modules目錄中有一個名為naive_sharding.py的模塊。由於它是一些目錄級別,如果想讓文件保持原樣並在Colab中導入,對你來說最簡單的方法如下:
import sys
sys.path.insert(0, ‘/content/gdrive/My Drive/Colab Notebooks/my_modules’)
import naive_sharding
就是這樣, naive_sharding.py模塊已導入,可以使用了。
修改上面的一些代碼,你可以看到,如果將權重模型放入和縮小到Colab環境中是多麼容易。因此,除了上面的簡短說明和創新思維之外,你可以用Google Colab完成非常多的工作。
由於沒有繁瑣的設置,Chromebook訪問也很普通,所以Colab是一個理想的編碼工具。