复制pdf文字出来是乱码

zoukankan html css js c++ java

复制pdf文字出来是乱码

PDF文件复制文本为乱码 - longzhinuhou的博客 - CSDN博客 https://blog.csdn.net/longzhinuhou/article/details/83758966

复制pdf文字出来是乱码的一种可能的解决方案 - ijustwanttorun - 博客园 https://www.cnblogs.com/followyourheart/p/5668857.html

本地字体缺失

最近在处理一个pdf文件，是一个地图文件，上面带各种文字的标注，地图比较大，而且文字信息比较多而且分散。因为字体的问题，在我的windows电脑上虽然可以正常显示，但是复制出来的文字都是方块，而且对应的文字也不能搜索。

如果不能搜索，也不能复制文字，那么后续的处理会非常棘手。通过不懈的google和尝试，发现了用Adobe Pdf虚拟打印机（别的虚拟打印机应该也可以，未尝试）打印成pdf可以解决这个问题，记录下来，以备有同样问题的朋友参考。

可能原因是原来的某些字体不能正确识别和嵌入，虽然可以用近似字体替代显示，但是pdf文字识别始终有问题。在用虚拟打印机处理后，系统带有的字体被嵌入到新的pdf中，原有的文字变得可识别，因此可以复制和搜索了。

-----------

最近又碰到另外一个pdf文件（200多页的博士论文），用LaTeX生成的，论文没法拷贝粘贴，也没法复制，搜索效果也很糟糕，上面的方法也无效。可能是因为作者是荷兰人，系统字体不同导致的吧。

请问PDF文件里的字体与用户电脑里存在的字体有关系吗？_百度知道 https://zhidao.baidu.com/question/232924314.html

1。由图片或扫描件制作成的pdf中的字体与电脑字体无关，此时文字只是位图的组成部分，是源文件的“照片”。
2.如果pdf里的对象是可以复制编辑的文字。那么，PDF文件里的字体与用户电脑里存在的字体有关系。1）制作pdf时，可以把字体嵌入，即文字代码文件置入pdf文档，这时打开pdf，无论电脑系统有无这种字体，都以该字体正常显示。2）如果制作pdf不嵌入字体，打开pdf时会调用系统最接近字体显示，系统没有合适字体时，或者非标准编码字体文件无法编译时，pdf显示会乱码、圆点、方框等等。

字体安装

C:WindowsFonts

下载

ArialMT-站长字体 http://font.chinaz.com/120216192521.htm#down

查看全文

相关阅读:
noip2007 tg day1t1 统计数字
 洛谷1123 取数游戏
 洛谷1123 取数游戏
 素数筛
 bzoj 1297 [SCOI2009]迷路
 bzoj 2115 [Wc2011] Xor——路径和环的转化
 poj 2154 Color——带优化的置换
 bzoj 1407 [Noi2002]Savage
poj 1286 Necklace of Beads
bzoj 4031 [HEOI2015]小Z的房间

原文地址：https://www.cnblogs.com/rsapaper/p/10780515.html