Python将HTML转换为PDF
使用pdfkit库和wkhtmltopdf,
pip install pdfkit wkhtmltopdflinux中一般需要添加sudo权限.
Windows安装独立版本的for Windows XP/2003 or later; standalone。
Linux直接使用命令安装就行, Fedora/CentOS系sudo yum install wkhtmltopdf,
Debian/Ubuntu系sudo apt install wkhtmltopdf
import pdfkit
pdfkit.from_file(input_file, output_file)
html转为pdf时的分页断行错误
在需要进行分页的块(如div)中添加样式page-break-inside:avoid;。
强制分页
想从html中的某个标签的位置进行强制分页, 添加样式page-break-after:always;
直接使用wkhtmltopdf的选项参数
使用字典的形式, wkhtmltopdf的选项作为字典的key, 删除选项前的--.
如果选项没有值, 使用None或者False.
对于可以有多个元素的选项来说(cookie, custom-header, post, postfile, run-script, replace等), 可以使用列表或者元组.
例如
options = {
"page-size": "Letter",
"cookie": [
('cookie-name', 'cookie-value')
],
"no-outline": None
}
wkhtmltopdf的选项信息,可以参考这个网页https://www.jianshu.com/p/4d65857ffe5e, 对帮助信息的一个翻译.
或者使用wkhtmltopdf -H显示所有的帮助信息, 官方的文档也是这个.