3個TIPS,教你玩轉Google Colab環境

尋夢新聞LINE@每日推播熱門推薦文章,趣聞不漏接❤️

加入LINE好友

3個TIPS,教你玩轉Google Colab環境

Google於2018年首次公開發布了Colab。如果你需要一個穩定的筆記本電腦環境,並且有在筆記本、工作站和網路筆記本Chromebook之間無縫訪問和共享的需求,不妨試試Colab。

3個TIPS,教你玩轉Google Colab環境

3個TIPS,教你玩轉Google Colab環境

不要在瀏覽器中使用Colab

這條不算是Colab的管理技巧,但首先你最好讓Colab退出瀏覽器。使用Colab管理界面和一堆筆記本電腦是沒法解決問題的,因此要把Colab作為獨立應用程序運行。這依賴於操作系統(OS),但需要你在Chrome瀏覽器中安裝Colab「app」,並從應用程序上下文菜單(context menu)中選擇「打開為窗口」和「創建快捷方式…」,之後你需要找到快捷方式,並通過此快捷方式在自己的窗口中打開應用程序。

3個TIPS,教你玩轉Google Colab環境

現在你可以在自己的窗口中打開Colab,如上圖所示,先從Colab的圖標開始。這條不是很切題,但仍然很有用。

3個TIPS,教你玩轉Google Colab環境

1.下載文件到本地計算機

這是一個簡單但值得一提的技巧。一個用例:你創建了一個Keras模型,並希望可視化。然後調用plot_model來創建PNG文件,但由於Colab虛擬機不能永久存儲文件,因此你需要下載該圖像。部分執行代碼如下:

# plot model

plot_model(model, to_file=’rnn-mnist.png’ alt=”3個TIPS,教你玩轉Google Colab環境” title=”3個TIPS,教你玩轉Google Colab環境”, show_shapes=True)

# download model image file

from google.colab import files

files.download(‘rnn-mnist.png’)

執行上述代碼,將會彈出對話框,提示你輸入下載位置。這將引導我們到內聯顯示圖像。

是的,這是基本的。要內聯顯示上面的圖像,請使用:

# display model image file inline

from IPython.display import Image, display

Image(‘rnn-mnist.png’ alt=”3個TIPS,教你玩轉Google Colab環境” title=”3個TIPS,教你玩轉Google Colab環境”)

這是一個快速直觀的修改,通過它你會如預期一樣內聯各種其他文件。教訓:記住你在使用普通的Jupyter筆記本。

下面介紹關於Colab的相關內容。

3個TIPS,教你玩轉Google Colab環境

2.訪問你的Google Drive文件系統

假設你想將該模型圖像文件保存到你的Google Drive中而不是保存到本地計算機。有多種方法可以將文件導入和導出Google Drive。這是獲取CSV數據的最直接的方式,比如從Google Drive中導出。

# save model image file to Google Drive

from google.colab import drive

drive.mount(‘/content/gdrive’)

3個TIPS,教你玩轉Google Colab環境

單擊鏈接並輸入授權代碼後,你可以按如下方式訪問驅動器:

# save model image file to Google Drive

3個TIPS,教你玩轉Google Colab環境

當然,它不是永久的,但並不費力,它似乎比使用任何其他方法更直接(並且是非永久的)。如果你使用像AutoKey(https://github.com/autokey/autokey)這樣的桌面自動化和文本擴展工具,那麼就會使常用的代碼和命令變得更加容易。

回到主題。現在你可以將文件保存到(或從中獲取文件)Google Drive了。放鬆點,只要你在終端感到舒服就好了。你可以使用數據文件所在的位置,也可以將其移動或復制到Colab VM根目錄的幾個目錄級別中。但是,它在刪除實例後就會從此處消失,因此如果只從文件系統中的CSV文件中讀取數據會更有意義:

# import pandas as pd

titanic_train = pd.read_csv(‘/content/gdrive/My Drive/Colab Notebooks/datasets/titanic/train_clean.csv’)

3個TIPS,教你玩轉Google Colab環境

3.使用存儲在Google Drive中的自定義庫(custom libraries)和模塊

那麼,如果你要將自定義Python庫或模塊導入Colab項目,該怎麼做呢?

例如,在你的Colab目錄中有一個名為’my_modules’的文件夾,存儲了你希望在Colab中訪問的常見.py文件。你不想將它們存儲在GitHub上,而且它們不是乾淨的文件,你不想與他人分享。假設它們是你習慣使用的簡單輔助模塊集合; 數據加載器功能,數據清理功能等。

像這樣存儲在Dropbox文件夾中的任何文件,與你在Google Drive中同步的名稱都相同。這樣在Colab內部和外部都可以使用該文件。你可以直接利用操作系統訪問Google Drive內容 -在Chrome上,及在Ubuntu的ocamlfuse(https://github.com/astrada/google-drive-ocamlfuse)上——並且你可以利用之前提到的Google Drive文件系統訪問技巧,然後開始使用它們。

這段代碼很有用。假設你的my_modules目錄中有一個名為naive_sharding.py的模塊。由於它是一些目錄級別,如果想讓文件保持原樣並在Colab中導入,對你來說最簡單的方法如下:

import sys

sys.path.insert(0, ‘/content/gdrive/My Drive/Colab Notebooks/my_modules’)

import naive_sharding

就是這樣, naive_sharding.py模塊已導入,可以使用了。

修改上面的一些代碼,你可以看到,如果將權重模型放入和縮小到Colab環境中是多麼容易。因此,除了上面的簡短說明和創新思維之外,你可以用Google Colab完成非常多的工作。

由於沒有繁瑣的設置,Chromebook訪問也很普通,所以Colab是一個理想的編碼工具。

About 尋夢園
尋夢園是台灣最大的聊天室及交友社群網站。 致力於發展能夠讓會員們彼此互動、盡情分享自我的平台。 擁有數百間不同的聊天室 ,讓您隨時隨地都能找到志同道合的好友!