跳转至

公共数据集

查看数据集

提示

如果平台没有你需要的数据集,请在论坛数据集板块留言,技术会在 24 小时内进行更新。

平台提供了一些常见的数据集,可以在 实例与数据 - 公共数据集 中查看数据集列表。数据集名称搜索是模糊搜索,数据集名称和数据集文件夹同名,没有空白字符。搜索时可以输入数据集名称的一个单词或者数据集缩写来查找。

使用数据集

使用 oss 命令行工具 可以下载公共数据集。使用 -public 参数可以浏览和下载公共数据集中的文件,如果是专有云用户浏览和上传下载企业数据集,则使用 -ent-pub 参数。

# 登陆恒源云账号,使用恒源云的账号名与密码,账号名为手机号
# 如果是非中国大陆手机号码,需要加上带 + 的区号
~# oss login
Username:139********
Password:***********
139******** login successfully!

# 如果是专有云用户,需要增加 -cloud=ent 参数登陆专有云
# 用户名的格式为 专有云用户名@企业ID
~# ./oss login -cloud=ent
Username:username@panda
Password:***********
username@panda login successfully!

# 查看公共数据集的目录 (专有云用户查看企业数据集需要将 -public 替换为 -ent-pub)
~# oss ls -public -s -d oss://

# 查看某个公共数据集的文件 (专有云用户查看企业数据集需要将 -public 替换为 -ent-pub)
~# oss ls -public -s oss://MNIST

# 下载公共数据集中的 MNIST 目录到 /hy-tmp 目录 (专有云用户查看企业数据集需要将 -public 替换为 -ent-pub)
~# oss cp -r -f -public oss://MNIST /hy-tmp
~# cd /hy-tmp
/hy-tmp# ls
MNIST

# 下载公共数据集中的某个文件到 /hy-tmp 目录 (专有云用户查看企业数据集需要将 -public 替换为 -ent-pub)
~# oss cp -public oss://MNIST/t10k-images-idx3-ubyte.gz /hy-tmp

# 专有云用户可以上传数据到企业数据集中
~# oss cp -ent-pub MNIST.tar.gz oss://

或通过 SSH 客户端或 JupyterLab 进入实例终端,在 /hy-public 文件夹内可以找到公共数据集。使用数据集时先将数据集复制到 hy-tmp/hy-nas(仅包含共享存储机型)内,再进行解压。

~# cd /hy-public/
/hy-public# ls
A2D2  ADE20K  Argoverse  BSTLD  CCPD  CIFAR  COCO  CUHK  CWT MNIST ...

/hy-public# cp -r MNIST /hy-tmp
/hy-public# cd /hy-tmp
/hy-tmp# ls
MNIST