解决PDF 转图片时丢文字的一种可能方式-巨人网络通讯

主页 > 知识库 > 解决PDF 转图片时丢文字的一种可能方式

解决PDF 转图片时丢文字的一种可能方式

热门标签：螳螂科技外呼系统怎么用地图地图标注有叹号 400电话申请资格举办过冬奥会的城市地图标注阿里电话机器人对话 qt百度地图标注正安县地图标注app 电销机器人系统厂家郑州辽宁智能外呼系统需要多少钱

问题

Python 中 PDF 转图片一般用的是 pdf2image。有时我们会发现 PDF 转出来的图片都是空白，或者缺失了一些字，具体表现就是一些应该有字的区域是空白。

由于某些原因我不能把出现问题的文件放上来，不过大致就是这个情况。

主要的代码如下：

images = pdf2image.convert_from_path('/path/to/pdf', output_folder='images/', fmt='jpg')

运行时可能会发现代码没有任何异常，但是结果不对。

分析和解决

其实 pdf2image 底层默认使用的是 pdftoppm 来转图片，我们可以直接使用其来测试有问题的 PDF，会发现输出了一些警告：

除 pdftoppm 外，pdf2image 在两种情况下会使用 pdftocairo 来转图片，具体是：

当要转成 tif/tiff 格式时

当 transparent=True（默认为 False）且要转成 png/tif/tiff 时

Missing language pack for 'Adobe-GB1' mapping

很明显是缺失了语言包。

而且字缺失，自然而然想到的是字体缺失，即系统中没有 PDF 中的字体。

我们需要找到对应的字体，然后安装上。

一般来说，Linux 系统中，直接复制相应的字体文件到 /usr/share/fonts/ 目录下即可，可以使用 fc-list :lang=zh-cn 来查看当前系统有哪些中文字体。

对于中文来说，Noto CJK 字体可以覆盖所有的字，可以尝试下载安装此字体，有些系统可能自带。

有了字体，你再试的时候可能会发现还是不行，因为你还需要另一个东西：poppler-data。

这个东西是干嘛用的？根据作者的描述：

This package consists of encoding files for use with poppler. The encoding files are optional and poppler will automatically read them if they are present. When installed, the encoding files enables poppler to correctly render CJK and Cyrrilic properly. While poppler is licensed under the GPL, these encoding files have different license, and thus distributed separately.

大致就是这个包里是一些编码文件，可以让 poppler 正确渲染 CJK 文字。

我们可以通过 apt 来安装：

sudo apt install poppler-data

然后再次尝试，应该就可以成功转成正常的图片了。

总结一下，你需要两个东西：

正确的字体文件

poppler-data

Reference

以上为个人经验，希望能给大家一个参考，也希望大家多多支持脚本之家。如有错误或未考虑完全的地方，望不吝赐教。

您可能感兴趣的文章:

利用python将图片版PDF转文字版PDF
Python提取PDF内容的方法(文本、图像、线条等)
如何使用Python进行PDF图片识别OCR

标签：淘宝好评回访阜新济源合肥兴安盟昭通信阳随州

巨人网络通讯声明：本文标题《解决PDF 转图片时丢文字的一种可能方式》，本文关键词解决,PDF,转图,片时,丢,文字,；如发现本文内容存在版权问题，烦请提供相关信息告之我们，我们将及时沟通与处理。本站内容系统采集于网络，涉及言论、版权与本站无关。

相关文章

下面列出与本文章《解决PDF 转图片时丢文字的一种可能方式》相关的同类信息！

解决PDF 转图片时丢文字的一种可能方式

问题 Python 中 PDF 转图片一般用的是 pdf2image。有时我们会发现 PDF 转出来的图片都是空白，或者缺失了一些字，具体表现就是一些应该有字的区域是空白。由于某些原因我不能把出现问...

郑州外呼系统排名（郑州外呼公司）

本文目录一览： 1、公司要换一套外呼系统，稳定好用的有推荐吗？2、电销外呼系统品牌排名，哪家好3、哪家的外呼系统好...

Teleopti CCC呼叫中心排班系统将亮相呼叫中心及企业通信大会

CTI论坛(ctiforum)4月26日消息（记者杨毅）：中国呼叫中心及企业通信大会（Call Center & Enterprise Communication Expo China），是由CT...

聊城智能外呼系统公司招聘（聊城智能外呼系统公司招聘网）

本篇文章给咱们谈谈聊城智能外呼体系公司招聘，以及聊城智能外呼体系公司招聘网对应的知识点，期望对各位有所协助，不...

石家庄营销电销机器人加盟（销售电销机器人）

本文目录一览： 1、为什么越来越多的人挑选电销机器人项目创业2、有谁用过电销机器人？作用怎么样？3、AI智能电销机器人...

丽水房产电话营销线路公司,电销机器人办理商家-看这里!

丽水房产电话营销线路公司,电销机器人办理商家基于人工智能、大数据、云计算等核心技术贯穿整个客户生命周期，为企业...

安庆不封号电销卡加盟

安庆不封号电销卡加盟这种电销卡的好处是：通话是很稳定的，电销卡是虚商产品，与移动、联通、电信这些三大运营商相...

Nginx配置防盗链的完整步骤

需求：通常站点，都会想让自己网站的视频和图片，免被盗用，毕竟视频流量，花的都是白花花银子（土豪可以不用考虑）...

长春电销机器人排名品牌（电销机器人品牌排行）

今天给各位分享长春电销机器人排名品牌的知识，其中也会对电销机器人品牌排行进行解释，如果能碰巧解决你现在面临的问...

效率高外呼系统（如何提高外呼效率）

今天给各位分享效率高外呼系统的知识，其中也会对如何提高外呼效率进行解释，如果能碰巧解决你现在面临的问题，别忘了...

电销系统电话系统

3.人工成本高，工作效率低【电销系统电话系统】关于哪家产品好，我这边就不做多余的描述，作为同行，我们不会恶意贬低...

上海电销卡渠道-电销卡卡商

上海电销卡渠道-电销卡卡商巨人网络通讯是国内专业领先的电销卡服务商，主营电销卡、防封电话卡、不封号电销专用卡、...

青岛建材专用电话机器人好用吗-请看！

青岛建材专用电话机器人好用吗在操作使用过程中也会得到更好体验，操作使用过程更加便捷。多种功能于一。考虑到行业人...

联通一般用什么系统外呼（联通外呼好做吗）

今天给各位分享联通一般用什么系统外呼的知识，其中也会对联通外呼好做吗进行解释，如果能碰巧解决你现在面临的问题，...

绍兴东云电话销售卡

绍兴东云电话销售卡 ,办理绍兴东云电话销售卡 ,绍兴东云电话销售卡如何办理小芳通信是一家针对电话销售而成立的通讯...

400电话办理有何用处？看完你就知道了！

随着社会的日益发展，各行各业的竞争都是极其激烈的，企业如果想要在行业的竞争当中站稳脚跟，那么开通400电话就是一个...

大连营销外呼系统收费（电话营销外呼系统）

本文目录一览： 1、外呼体系多少钱一个月？2、电销外呼体系一个月贵吗？3、外呼体系一个多少钱，有哪些功用？4、外呼体...

电销机器人是骗局还是销售神器？

相对比传统的的人工外呼作业，电话机器人的优越性显而易见，针对一部分可重复性较高的简洁明了外呼作业，电话机器人现...

东软信息学院升级普通高校今年起在省内按二本录取

大连东软信息学院转设为普通高等学校人民网大连视窗5月19日电张弛报道:今天上午,大连东软信息学院正式成为国家教育部...

网站运营者必须要分析数据以及了解用户需求

对于大多数的网站运营者来说，可能大家只是一种你巧合的情况下进入这个行业，我们可能并不懂网站运营，不知道怎样去推...

呼叫中心如何管理(让客服团队高效、高产出)

很多企业喜欢提倡狼性文化，但如何让团队有凝聚力、创造力光喊口号可不行，尤其对于企业的营销市场部门，呼叫中心管理...

嘉兴电销卡代理

嘉兴电销卡代理电销卡办理简单，支持大批量办理，并且稳定不会被封号。电话销售卡都是有着一定拨打次数限制的,只需要...

广东crm外呼系统稳定吗（CRM外呼）

今天给各位分享广东crm外呼系统稳定吗的知识，其中也会对CRM外呼进行解释，如果能碰巧解决你现在面临的问题，别忘了关注...

乌兰市市场监管局全力推进我市区域商标品牌发展

来源：乌兰市人民政府为进一步提升我市品牌影响力，切实发挥商标品牌在引领经济转型升级中的促进作用，近日，市市场...

商标异议和争议的司法审查程序

一、增加商标异议和争议的司法审查程序,以确保商标权人的合法权益过去,我国对商标案件实行由商标评审委员会终局确权的...

400是什么服务电话企业400电话申请如何选择服务单位？

有了这个平台，400电话的平台，有了这个平台，我们处理这个电话非常方便。所以，这么多人才会选择这里。首先，服务速...

电销机器人费用大吗知乎（电销机器人app）

本文目录一览： 1、电销机器人费用高吗？2、电销机器人一年多少钱啊？3、电销机器人多少钱一台，详细是怎样收费的？4、...

海南电销电话机器人哪家强（电销机器人品牌）

今天给各位分享海南电销电话机器人哪家强的知识，其中也会对电销机器人品牌进行解释，如果能碰巧解决你现在面临的问题...

win7系统关闭“window安全网络身份验证”窗口的设置方法

问题现象：解决方法: 1、在桌面右下角点击网络连接图标选择打开网络和共享中心； 2、选择更改适配器设置； 3、右击本地...

腾讯地图添加商铺一周还在审核店，腾讯地图添加商铺一周还在审核

添加标注的地图已经通过审核一周时间了，在百度地图还是搜索不到是什么原因？百度地图的标注业务本来就是个收费业务...

沈阳知识产权电销线路服务商,呼叫中心系统-提醒!

沈阳知识产权电销线路服务商,呼叫中心系统不管怎么样，不能脱离监管。4.那种办一堆个人手机号来充当外呼线路的办法可能...

稳定电销卡办理-电销卡购买

稳定电销卡办理-电销卡购买电销卡购买电销卡在线网（运营主体：巨人网络通讯）是国内专业领先的电销卡服务商，主营电...

抖音代运营：掌握抖音发展趋势，抓住时代机遇？

有人说过，抖音是“城市版”快手，不错，抖音一开始定位的商场主力的确是一二线城市的95后年青小伙伴，一条抖音，能够...

400免费电话申请 – 方便快捷的通信方式-400免费电话申请

400免费电话申请作为一种免费通信方式，越来越受到人们的关注和利用。通过申请400免费电话，在商务领域和个人通信中都能...

咸宁自动电销机器人厂家（咸宁自动电销机器人厂家电话）

本篇文章给大家谈谈咸宁自动电销机器人厂家，以及咸宁自动电销机器人厂家电话对应的知识点，希望对各位有所帮助，不要...

Win10预览版14342无法运行LOL怎么解决?

Win10预览版14342无法运行LOL，这个问题主要是Tencent Protect（简称TP）这个程序导致的，这玩意更新的太慢不支持最新的系统。下...

湖南电话外呼系统收费（外呼电话怎么办理）

本文目录一览： 1、外呼体系一个多少钱，有哪些功用？2、外呼体系装置需求哪些费用？3、外呼体系多少钱一个月？外呼体...

桐乡服务外包产业园区列入嘉兴首批示范

日前，桐乡服务外包产业园区顺利被认定为首批嘉兴市国际服务外包示范园区。据了解，桐乡服务外包产业园区（桐乡科技...

asupport.exe是什么进程 asupport进程信息查询

进程文件： asupport or asupport.exe 进程名称： Trend Micro ActiveSupport 进程类别：存在安全风险的进程英文描述： asupport.exe is a p...

基于云计算的Aspect Social为联络中心增添社交功能

与Lithium Technologies合作实现了社交媒体的专业知识与联络中心的最佳实践相融合以客户为中心的企业可以将单向聆听转变为高...

湛江电话销售防封软件

湛江电话销售防封软件,湛江电话销售防封软件官方地址,湛江电话销售防封软件怎么办理防封号电销软件，提供多种防封解决...

借政策“春风”，打造服务外包新旗舰城市——专访青岛市商务局副局长张莉

此次国务院常务会议在讨论服务外包事项上政府不是对原来文件的重复加深，而是在产业发展思路、政策支持和认知上都有新...

如何才能带好电销团队（如何才能带好电销团队呢）

今天给各位分享如何才能带好电销团队的知识，其中也会对如何才能带好电销团队呢进行解释，如果能碰巧解决你现在面临的...

电销团队口号古诗（电销团队队名和口号）

本篇文章给大家谈谈电销团队口号古诗，以及电销团队队名和口号对应的知识点，希望对各位有所帮助，不要忘了收藏本站喔...

400电话套餐有哪些？

400电话，从业务方面来说，主要还是作为分摊付费的方式来进行让我们的客户在这个过程当中减免很多的费用，OK还是会在市...

联通400电话多少钱济宁400电话收费标准

400电话实行主叫分摊话费业务，即主叫承担市话接入费，被叫（400电话使用者）承担全部电话接入费，联通400电话是目前比较...

武汉ai智能电话机器人稳定吗（接电话ai智能机器人）

今天给各位分享武汉ai智能电话机器人稳定吗的知识，其中也会对接电话ai智能机器人进行解释，如果能碰巧解决你现在面临...

win10正式版应用商店中预装应用该怎么卸载？

与它的前辈Win8/Win8.1一样，Win10中继续内置了应用商店，所不同的是Windows10中已升级为通用应用商店，具有跨平台特性。但是...

天津市电话机器人维修（天津机器人体验店）

本文目录一览：1、新松机器人外部下电报故障怎么解决2、科沃斯扫地机器人维修点3、天津朗硕机器人科技有限公司招聘信息...

大连办400电话（大连400电话办理流程）

大连办400电话（大连400电话办理流程）大连办400电话是为了方便企业客服和服务的需求而设立的。办理这项业务需要遵循一...

包含安阳智能外呼系统公司的词条

本文目录一览： 1、外呼系统哪家公司做得好？？？2、自动人工智能外呼系统哪家好？3、智能电话外呼系统哪家的比较好用...

解决PDF 转图片时丢文字的一种可能方式

问题 Python 中 PDF 转图片一般用的是 pdf2image。有时我们会发现 PDF 转出来的图片都是空白，或者缺失了一些字，具体表现就是一些应该有字的区域是空白。由于某些原因我不能把出现问...

本页收集关于解决PDF 转图片时丢文字的一种可能方式的相关信息资讯供网民参考！

推荐文章

上一篇：pandas数据分组groupby()和统计函数agg()的使用

下一篇：selenium+python自动化78-autoit参数化与批量上传功能的实现

一起分享吧

产品关键词：解决PDF 转图片时丢文字的一种可能方式解决,PDF,转图,片时,丢,文字,