阅读量:0
- 创建COCO2017数据集的所在目录
mkdir -p ./datasets/coco
其中,mkdir表示创建目录;-p 表示一次性创建多级目录,如果上级目录(datasets)不存在,系统自动创建上级目录,再创建下级目录(coco)
- 进入所在目录
cd ./datasets/coco
- 下载COCO2017数据集
wget http://images.cocodataset.org/annotations/annotations_trainval2017.zip wget http://images.cocodataset.org/zips/train2017.zip wget http://images.cocodataset.org/zips/val2017.zip wget http://images.cocodataset.org/zips/unlabeled2017.zip
根据需要,自主选择要下载哪几个图像集及其标注,这里只列出了4个比较常见的数据子集,分别是训练集和验证集的标注、训练集、验证集、无标注集,完整的资源见https://cocodataset.org/
在所需的项目上右键->复制链接地址,可以获得URL,然后就可以下载了
wget URL -O filename
或者
curl -o filename URL
wget和curl都可以用于下载文件,filename表示保存到本地的新文件名
- 下载完毕以后,解压压缩文件到当前目录即可
unzip -q annotations_trainval2017.zip unzip -q train2017.zip unzip -q val2017.zip unzip -q unlabeled2017.zip
其中,unzip表示解压zip文件,-q表示静默解压,不输出日志信息
- 快速下载
由于下载源在国外,从深度学习服务器直接下载国外数据集可能会很慢,也许只有10KB/s。
下面介绍一种比较简单快速的下载方法:
Kaggle上有分享的COCO2017数据集备份,可以从这里下载,会比较快,网址是https://www.kaggle.com/search?q=COCO2017+in%3Adatasets
以第三个为例,如果想要整个下载,点击下载按钮,注意,先不要开始下载,我们需要的是跳出的地址
或者选择想要下载的部分项目,点击下载按钮
复制网址中所有的部分,即URL,在服务器里输入命令(实测,curl比wget快)
curl -o filename "URL"
注意,在URL两端加上双引号,因为URL中有很多特殊符号,容易被误解为命令。
这样下载就比较快了。