DataX与Sqoop对比

Question

请比较DataX和Sqoop两个数据同步工具的异同，以及各自适合的同步场景。。大数据 面试题。百度 面试题

编译有声 · Accepted Answer

DataX（阿里巴巴开源）： 架构： 核心： Reader → Framework → Writer（插件化架构） 运行时： 单进程多线程（非分布式） 数据流向： 内存中的Channel传输 支持的源/目标： RDBMS： MySQL、Oracle、PostgreSQL、SQL Server、OceanBase NoSQL： HBase、MongoDB、Cassandra 数据仓库： HDFS、Hive、ClickHouse 消息队列： Kafka 其他： Elasticsearch、FTP、TxtFile 特点： 异构数据源支持极其丰富（80+插件） 使用JSON配置文件定义Job 支持断点续传（通道记录） 支持限速控制（byteSpeed / recordSpeed） 单机运行，配置简单 Sqoop（Apache/Hadoop生态）： 架构： 核心： 将SQL映射为MapReduce作业 运行时： MapReduce（分布式） 数据流向： HDFS中间存储 支持的源/目标： 导入： RDBMS → HDFS/Hive/HBase 导出： HDFS/Hive → RDBMS 增量同...

DataX与Sqoop对比

回答

编译有声