记一个Hive的Bug

描述:

从mysql用sqoop导入hive数据没有丢失,但是两边执行了同样的查询建表语句后,hive数据新表数据丢失了100多条,用sqoop将mysql生成的新表导入查看发现没有丢失数据,难道是hive过程的mr丢失了数据?

再记一个更大的问题:

同样是对tb00005 表统计总数:

select * from tb00005 ORDER BY total desc LIMIT 500;

来自MySQL的结果:

来自hive MR后的结果:

来自sqoop导入MySQL 的 tb00005 的表的结果:

感觉有点严重

 

留下评论

您的邮箱地址不会被公开。 必填项已用 * 标注