公共数据集¶
查看数据集¶
提示
如果平台没有你需要的数据集,请在论坛数据集板块留言,技术会在 24 小时内进行更新。
平台提供了一些常见的数据集,可以在 实例与数据 - 公共数据集 中查看数据集列表。数据集名称搜索是模糊搜索,数据集名称和数据集文件夹同名,没有空白字符。搜索时可以输入数据集名称的一个单词或者数据集缩写来查找。
使用数据集¶
使用 oss 命令行工具 可以下载公共数据集。使用 -public
参数可以浏览和下载公共数据集中的文件,如果是专有云用户浏览和上传下载企业数据集,则使用 -ent-pub
参数。
# 登陆恒源云账号,使用恒源云的账号名与密码,账号名为手机号
# 如果是非中国大陆手机号码,需要加上带 + 的区号
~# oss login
Username:139********
Password:***********
139******** login successfully!
# 如果是专有云用户,需要增加 -cloud=ent 参数登陆专有云
# 用户名的格式为 专有云用户名@企业ID
~# ./oss login -cloud=ent
Username:username@panda
Password:***********
username@panda login successfully!
# 查看公共数据集的目录 (专有云用户查看企业数据集需要将 -public 替换为 -ent-pub)
~# oss ls -public -s -d oss://
# 查看某个公共数据集的文件 (专有云用户查看企业数据集需要将 -public 替换为 -ent-pub)
~# oss ls -public -s oss://MNIST
# 下载公共数据集中的 MNIST 目录到 /hy-tmp 目录 (专有云用户查看企业数据集需要将 -public 替换为 -ent-pub)
~# oss cp -r -f -public oss://MNIST /hy-tmp
~# cd /hy-tmp
/hy-tmp# ls
MNIST
# 下载公共数据集中的某个文件到 /hy-tmp 目录 (专有云用户查看企业数据集需要将 -public 替换为 -ent-pub)
~# oss cp -public oss://MNIST/t10k-images-idx3-ubyte.gz /hy-tmp
# 专有云用户可以上传数据到企业数据集中
~# oss cp -ent-pub MNIST.tar.gz oss://
或通过 SSH 客户端或 JupyterLab 进入实例终端,在 /hy-public
文件夹内可以找到公共数据集。使用数据集时先将数据集复制到 hy-tmp
或 /hy-nas
(仅包含共享存储机型)内,再进行解压。
~# cd /hy-public/
/hy-public# ls
A2D2 ADE20K Argoverse BSTLD CCPD CIFAR COCO CUHK CWT MNIST ...
/hy-public# cp -r MNIST /hy-tmp
/hy-public# cd /hy-tmp
/hy-tmp# ls
MNIST