阅读量:6
Sqoop底层运行的任务是将关系型数据库中的数据导入到Hadoop集群中的HDFS或将Hadoop集群中的数据导出到关系型数据库中。具体来说,Sqoop会生成一个MapReduce作业来执行数据传输任务。在导入任务中,Sqoop会将关系型数据库中的数据按照分割规则划分为若干个数据块,并使用多个Map任务将数据块同时导入到Hadoop集群中的HDFS中。在导出任务中,Sqoop会使用多个Map任务将Hadoop集群中的数据块同时导出到关系型数据库中。这样可以充分利用Hadoop集群的分布式计算能力和数据处理能力,加快数据传输的速度。