Các bước để tải dữ liệu từ kaggle về Google Colab
Cài đặt kaggle lên Google Colab
- Đăng nhập và vào mục Account.
- Kéo xuống dưới phần API và bấm Create New API Token. Bạn sẽ tải về một tập tin
kaggle.json
về máy tính.
- Vào Google Colab và tạo một dự án mới rồi chạy các lệnh sau
!pip install -q kaggle
from google.colab import files
files.upload()
# Chọn file kaggle.json tải về ở bước 2 để tải lên
!mkdir '/root/.kaggle'
!cp kaggle.json '/root/.kaggle'
!chmod 600 /root/.kaggle/kaggle.json
!kaggle datasets list
# Chạy lệnh liệt kê các bộ dữ liệu của bạn để đảm bảo bạn đã cài đặt thành công
Tải dữ liệu trên kaggle
Bây giờ bạn vào một dataset bất kỳ mà bạn muốn tải về Google Colab. Ở đây Etrain sẽ chọn ví dụ tải về bộ dữ liệu VinBigData Original Image Dataset
Bạn bấm menu ở bên góc phải và chọn Copy API command
Sau đó dán vào Google Colab để chạy lệnh. Lệnh sau khi sao chép với bộ dữ liệu trên sẽ như sau
!kaggle datasets download -d awsaf49/vinbigdata-original-image-dataset
Bây giờ bạn có thể giải nén và sử dụng bộ dữ liệu
!unzip -q vinbigdata-original-image-dataset.zip