在服务器上下载COCO2017数据集

avatar
作者
筋斗云
阅读量:0
  1. 创建COCO2017数据集的所在目录
mkdir -p ./datasets/coco 

其中,mkdir表示创建目录;-p 表示一次性创建多级目录,如果上级目录(datasets)不存在,系统自动创建上级目录,再创建下级目录(coco)

  1. 进入所在目录
cd ./datasets/coco 
  1. 下载COCO2017数据集
wget http://images.cocodataset.org/annotations/annotations_trainval2017.zip wget http://images.cocodataset.org/zips/train2017.zip wget http://images.cocodataset.org/zips/val2017.zip wget http://images.cocodataset.org/zips/unlabeled2017.zip 

根据需要,自主选择要下载哪几个图像集及其标注,这里只列出了4个比较常见的数据子集,分别是训练集和验证集的标注、训练集、验证集、无标注集,完整的资源见https://cocodataset.org/
在这里插入图片描述
在所需的项目上右键->复制链接地址,可以获得URL,然后就可以下载了

wget URL -O filename 

或者

curl -o filename URL 

wget和curl都可以用于下载文件,filename表示保存到本地的新文件名

  1. 下载完毕以后,解压压缩文件到当前目录即可
unzip -q annotations_trainval2017.zip  unzip -q train2017.zip  unzip -q val2017.zip  unzip -q unlabeled2017.zip  

其中,unzip表示解压zip文件,-q表示静默解压,不输出日志信息

  1. 快速下载

由于下载源在国外,从深度学习服务器直接下载国外数据集可能会很慢,也许只有10KB/s。
下面介绍一种比较简单快速的下载方法:
Kaggle上有分享的COCO2017数据集备份,可以从这里下载,会比较快,网址是https://www.kaggle.com/search?q=COCO2017+in%3Adatasets
在这里插入图片描述
以第三个为例,如果想要整个下载,点击下载按钮,注意,先不要开始下载,我们需要的是跳出的地址
在这里插入图片描述
或者选择想要下载的部分项目,点击下载按钮
在这里插入图片描述
在这里插入图片描述
复制网址中所有的部分,即URL,在服务器里输入命令(实测,curl比wget快)

curl -o filename "URL" 

注意,在URL两端加上双引号,因为URL中有很多特殊符号,容易被误解为命令。
这样下载就比较快了。

广告一刻

为您即时展示最新活动产品广告消息,让您随时掌握产品活动新动态!