hive从mysql导入数据量变多的解决方案-巨人网络通讯

主页 > 知识库 > hive从mysql导入数据量变多的解决方案

hive从mysql导入数据量变多的解决方案

热门标签：地图标注被骗三百怎么办云南语音外呼系统平台常州电销外呼系统一般多少钱北京人工外呼系统价钱沃克斯电梯外呼线路图福州呼叫中心外呼系统哪家好房产智能外呼系统品牌 400电话郑州申请天智外呼系统

原始导数命令：

bin/sqoop import -connect jdbc:mysql://192.168.169.128:3306/yubei -username root -password 123456 -table yl_city_mgr_evt_info --split-by rec_id -m 4 --fields-terminated-by "\t" --lines-terminated-by "\n" --hive-import --hive-overwrite -create-hive-table -delete-target-dir -hive-database default -hive-table yl_city_mgr_evt_info

原因分析：可能是mysql中字段里面有'\n'等分隔符，导入hive时默认以'n'作换行符，导致hive中的记录数变多。

解决方法：

导入数据时加上--hive-drop-import-delims选项，会删除字段中的\n,\r,\01。

最终导数命令：

bin/sqoop import -connect jdbc:mysql://192.168.169.128:3306/yubei -username root -password 123456 -table yl_city_mgr_evt_info --split-by rec_id -m 4 --hive-drop-import-delims --fields-terminated-by "\t" --lines-terminated-by "\n" --hive-import --hive-overwrite -create-hive-table -delete-target-dir -hive-database default -hive-table yl_city_mgr_evt_info

参考官方文档：https://sqoop.apache.org/docs/1.4.7/SqoopUserGuide.html

补充：Sqoop导入MySQL数据到Hive遇到的坑

1.sqoop导入到HDFS

1.1执行sqoop job，会自动更新last value

# sqoop 增量导入脚本
bin/sqoop job --create sqoop_hdfs_test02 -- import \

--connect jdbc:mysql://localhost:3306/pactera_test \

--username root \

--password 123456 \

--table student \

--target-dir /user/sqoop/test002/ \

--fields-terminated-by "\t" \

--check-column last_modified \

--incremental lastmodified \

--last-value "2018-12-12 00:03:00" \

--append

说明：--append 参数是必须的，要不然第二次运行job 会报错，如下：

至此，sqoop job 已建设完毕！

2.Hive创建表，并读取sqoop导入的数据

create external table if not exists student_hive (SId int,Sname string ,Sage string,Ssex string , last_modified Timestamp) 
row format delimited fields terminated by '\t' location 'hdfs://node01:8020/user/sqoop/test002/';

注意：此处hive中时间的格式为timestamp，设置为date DB数据无法正常加载。

第一次全量加载，整条路线完全OK，hive表可以查询到数据。

-----------------------重点分割线-----------------------

* sqoop lastmodified格式的增量加载，会将last-value 保存为job执行的系统时间，若测试数据库的check-column 小于当前系统时间（即上一个job的last-value），则数据将不被加载。

如SId=6 就没有被加载，遂改为今日时间（2018-12-26 17:05）进行数据测试，数据成功被加载！哟呵！！

总结：

使用lastmodified格式，进行sqoop增量导入时，

1.注意--append的使用；

2.last-value为job运行的系统时间，在数据测试时，要保证数据的准确，数据的自增长。

3.一切皆有定数，查看资料，准确定位自己系统遇到的问题

以上为个人经验，希望能给大家一个参考，也希望大家多多支持脚本之家。如有错误或未考虑完全的地方，望不吝赐教。

您可能感兴趣的文章:

MySQL如何快速导入数据
MySQL 4种导入数据的方法
mysql如何利用Navicat导出和导入数据库的方法
Java利用MYSQL LOAD DATA LOCAL INFILE实现大批量导入数据到MySQL
MySQL命令行导出导入数据库实例详解
wampserver下mysql导入数据库的步骤
MySQL命令行导出与导入数据库
使用mysqldump导入数据和mysqldump增量备份(mysqldump使用方法)
MYSQL 导入数据的几种不同
修改php.ini实现Mysql导入数据库文件最大限制的修改方法
.Net Core导入千万级数据至Mysql的步骤

标签：移动盐城沈阳徐州珠海拉萨沈阳黔东

巨人网络通讯声明：本文标题《hive从mysql导入数据量变多的解决方案》，本文关键词 hive,从,mysql,导入,数据,量变,；如发现本文内容存在版权问题，烦请提供相关信息告之我们，我们将及时沟通与处理。本站内容系统采集于网络，涉及言论、版权与本站无关。

相关文章

下面列出与本文章《hive从mysql导入数据量变多的解决方案》相关的同类信息！

hive从mysql导入数据量变多的解决方案

原始导数命令： bin/sqoop import -connect jdbc:mysql://192.168.169.128:3306/yubei -username root -password 123456 -table yl_city_mgr_evt_info --split-by rec_id -m 4 --fields-terminated-by "\t" --lines-terminated-by "\n" --hive-import...

随身wifi和手机流量一样吗，随身WIFI要插卡吗？

同样可以上网，随身wifi和手机流量是一样的吗？近日有不少朋友疑惑这个问题，接下来跟着小编一块来了解一下吧。在这绍...

青岛移动电销线路办理多少钱,外呼线路-服务周到

青岛移动电销线路办理多少钱,外呼线路一旦建立了呼叫，就可以实现与电话输入相同的智能路由分配策略。一、工业应用1...

近的人工智能电话机器人（人工智能电话机器人软件）

本篇文章给咱们谈谈近的人工智能电话机器人，以及人工智能电话机器人软件对应的常识点，期望对各位有所协助，不要忘了...

外呼电销机器人现代企业营销的必备利器

它可能会或可能不会起作用，但你不会拥有自己的经验，当你做练习或有人和你起锻炼，你感受到自己内在的变化，而不是你...

电销机器人怎么打卡（智能语音电销机器人怎么操作）

今天给各位分享电销机器人怎么打卡的知识，其中也会对智能语音电销机器人怎么操作进行解释，如果能碰巧解决你现在面临...

中国移动400电话多少钱一分钟？（移动打400电话收费吗）

Q：公司想办理移动400电话，我对这块不太了解，有没有办过400电话的朋友？能否介绍下？感谢！ A：400电话费用代理商都不是...

2008中国软件企业出口(外包)20强发布

据《中国进出口软件》杂志、中国软件和服务外包网主编萧亚平先生介绍：本届出口20强企业2008年出口总额为8.26亿美元，平...

南川电话机器人（南川电话机器人售后电话）

本文目录一览：1、人工客服机器人的对话录音吗2、打电话的机器人?3、电话销售机器人靠谱吗4、电话智能客服机器人人工客...

商务部：我国服务外包发展持续向好

商务部今天公布的数据显示，5月份，我国企业承接服务外包合同额924.9亿元，执行额634.7亿元，同比分别增长10.4%和4.3%。新一...

Linux终端命令行的常用快捷键详解

history 显示命令历史列表 ↑(Ctrl+p) 显示上一条命令 ↓(Ctrl+n) 显示下一条命令 !num 执行命令历史列表的第num条命令 !! 执行上一...

如何申请400电话业务400电话的代理商都一样吗？选择错误会有哪些后果？

如果企业想要进行400电话申请的话比较推荐的一种做法，就是直接找代理商来进行办理，为什么推荐企业要直接找代理商来办...

青岛人工外呼系统软件（青岛外呼公司）

本篇文章给咱们谈谈青岛人工外呼体系软件，以及青岛外呼公司对应的知识点，期望对各位有所协助，不要忘了保藏本站喔。...

移动400电话如何申请免费中国移动有400电话号码

4000电话分为联通4006.4000，移动4007.4001和电信4008.4009，不同的运营商有不同的数字，移动400电话申请流程相对简单，每个运营...

上街区电话机器人价格（上海电话销售机器人）

本篇文章给大家谈谈上街区电话机器人价格，以及上海电话销售机器人对应的知识点，希望对各位有所帮助，不要忘了收藏本...

高频稳定电销卡充值-电销卡使用注意事项

高频稳定电销卡充值-电销卡使用注意事项巨人通信营电销卡、企业电销卡、不封号电话卡、电销系统、电销软件、高频防封...

400电话办理联系方式400电话办理

(400电话办理联系方式)(400电话办理)以下内容由巨人小编整理发布。在签订400电话合作协议的同时，还需要填写400电话受理单...

政务外包的隐忧

洋外脑有什么？无论从水平上或是视野上，国内的咨询机构的确是存在自身的不足，地方政府认为找国际大机构会取得更好...

杭州电话营销

外呼机器人的作用就是一个筛选，它的目的是帮助用户取得更好的利益，它可以帮助销售员从日常繁重的拨打任务中解脱出来...

400电话怎么申请，400电话怎么申请的

400电话怎么申请，400电话怎么申请的400电话代理商为你解答。填写400标准受理单（需加盖单位红色公章）；填写运营商400电...

电销专用卡湘潭

本公司专业服务于电话销售卡行业，可超频不封号，靠谱卡商，合作售后有保障。有需要的老板加微信咨询办理或电话联系...

打国内400电话需要加什么江苏400电话安装

现在有非常多的人都很关注中国400电话网,这是因为有非常多的企业都开始安装400电话,安装400电话之后,可以让企业的发展更加...

芜湖防封电销系统厂家

移动crm经过大数据、云计划调整云通讯，为企业供给调整“职工管理、客户管理、电话经营销售、ai机器人、微信经营销售、...

Docker images导出和导入操作

之前已配置好基础镜像，其他地方也需要用到这些镜像时怎么办呢？答案：镜像的导入和导出功能。 1、镜像的保存 [root@w...

贵阳网络外呼系统服务商（贵阳呼叫中心）

本文目录一览： 1、有靠谱的外呼体系吗，别让我再办卡，公司几百2、现在外呼体系哪家公司做的比较好？3、外呼体系哪家...

win7安装oracle10g 提示程序异常终止发生未知错误

oracle 10g 在win7下安装，选择高级选项，提示程序异常终止，发生未知错误修改Oracle 10G\database\stage\prereq\db\refhost.xml 在 /SYSTE...

郑州培训专用语音ai机器人办理价格-诚信优惠

郑州培训专用语音ai机器人办理价格我们可以利用好这个亮点来进行打造，具体用什么方法，那就是因人而异了。同时，随着...

关于ASP生成伪参数技巧简洁实用的伪（僞）参数

简洁实用的伪（僞）参数前两天在做一个站内版的企搜引擎，发现某些站点可以链接站点内容。。奇怪之下看了看，原来是...

枪机监控摄像头物联卡究竟哪种好？建议花3分钟看完！

随着人们生活“安全”意识的提高，监控蛇形头成为一个室内户外必备的智能设备。居家使用，不仅可以起做到安防的作用，...

金华靠谱电销卡为什么不封号

金华靠谱电销卡为什么不封号电销卡的使用成本相对来说是比较低的，一般来说都是套餐服务，一个外呼电话也就几分钱，...

吴江稳定电话软件怎么办理,电销软件价格-热点

吴江稳定电话软件怎么办理,电销软件价格但效率是人工劳动的六倍多。、电销机器人具有智能沟通的工作优势，无间断工作...

400开头的电话怎样办理400开头的号码如何办理

(400开头的电话怎样办理)(400开头的号码如何办理)以下内容由巨人小编整理发布。办理方必须是企业级用户(包括个体工商户...

如何关闭win10自动更新?只需2步永久关闭Windows Update

不是小编说Windows 10不好，是现在的微软实在是不老实，升级更新都不带打招呼的。稍不注意电脑就自动重启开始念诗了。耽...

通达信科呼叫中心正式投入运营

经过两个月紧锣密鼓的筹备，通达信科呼叫中心正式成立。通达信科呼叫中心将成为通达OA、T9等系列产品的统一电话服务中...

关于乌鲁木齐电销外呼系统公司的信息

本篇文章给咱们谈谈乌鲁木齐电销外呼体系公司，以及对应的知识点，期望对各位有所帮忙，不要忘了保藏本站喔。本文目...

电销外呼系统大约多少钱（电销外呼电话机）

今日给各位共享电销外呼体系大约多少钱的常识，其间也会对电销外呼电话机进行解说，假如能可巧处理你现在面对的问题，...

400电话广泛被应用

【400电话广泛被应用】400电话越来越被企业广泛使用，能够更好地与客户沟通，而今天的400电话也促进了企业营销的更好发展...

包含自动外呼系统的劣势的词条

今天给各位分享自动外呼系统的劣势的知识，其中也会对进行解释，如果能碰巧解决你现在面临的问题，别忘了关注本站，现...

广州智能电销机器人怎么样（广州机器人销售）

本文目录一览： 1、电销机器人作用怎么样???2、电销机器人怎么样3、电销机器人作用怎么样？电销机器人作用怎么样??? 作为...

宁波防封卡电销卡靠谱（电话卡防封系统）

本文目录一览：1、电销卡是否真的不封号?还是有其他的方法?2、做电销不封号电话卡有吗?3、防封号电销卡哪家的好?电销卡...

产品型网站如何优化站点结构最为合理

以产品销售为主的网站的结构优化是非常重要到，一定要易于抓取，而又便于浏览，这是为访客提供优质的用户体验不可或缺...

详解Linux系统下PXE服务器的部署过程

在大规模安装服务器时，需要批量自动化方法来安装服务器，来减少日常的工作量. 但是批量自动化安装服务器的基础是网络...

北京外呼系统平台（电话外呼平台）

本文目录一览： 1、外呼系统哪家好？2、北京电话打来,但是用外呼系统、显示的区号是我们市区区号码吗？3、外呼系统怎么...

外呼外呼系统是越升级越卡吗？

这个要两说了，如果在iPhone7之前的机型手机系统，我想外呼外呼系统是越升级越卡的，因为当时外呼曝出了“降频门”，也...

电销机器人供货厂家电话（电销机器人供货厂家电话是多少）

本篇文章给大家谈谈电销机器人供货厂家电话，以及电销机器人供货厂家电话是多少对应的知识点，希望对各位有所帮助，不...

德里高等法院审查商标侵权的中间责任（第二部分）

在上一篇文章中，我打破了Prathiba Singh女士最近在Christian Louboutin诉Nakul Bajaj案中的判决，并指出了其对印度中介责任和电子商...

免费的手机外呼系统（智能外呼软件）

本文目录一览： 1、好的电话外呼体系有哪些？求引荐2、现在市道上有哪些外呼体系？3、全国电销型外呼体系哪家好4、有靠...

哈尔滨餐饮加盟电销机器人办理价格,电话销售系统-看这里

哈尔滨餐饮加盟电销机器人办理价格,电话销售系统作为一种智能的流媒体销售工具，在人工智能网络上打电话可以为企业做...

服务哪家好呼叫中心系统如何选?关键看质检等4方面!

企业想要创造出更大价值，需要为自身打造出健全的沟通平台，传统呼叫中心存在一系列问题，想要解决问题，就需要了解一...

商标的声誉应在侵权实体进入市场时进行评估

Gino Rossi SA是一家波兰公司，生产鞋类和皮革配件。其商标“ Gino Rossi”来自公司创始人的姓氏，于1992年首次使用，并于1997年...

温州自动对话电销机器人（电销机器人电话机器

本文目录一览：1、电话机器人的操作方法，怎么用？2、电话机器人怎么样？3、电话机器人效果怎么样？4、电话机器人到...

hive从mysql导入数据量变多的解决方案

原始导数命令： bin/sqoop import -connect jdbc:mysql://192.168.169.128:3306/yubei -username root -password 123456 -table yl_city_mgr_evt_info --split-by rec_id -m 4 --fields-terminated-by "\t" --lines-terminated-by "\n" --hive-import...

本页收集关于hive从mysql导入数据量变多的解决方案的相关信息资讯供网民参考！

推荐文章

上一篇：navicat 连接数据库隔段时间后自动断开连接的解决方案

下一篇：使用mysql记录从url返回的http GET请求数据操作

一起分享吧

产品关键词： hive从mysql导入数据量变多的解决方案 hive,从,mysql,导入,数据,量变,