最好用的html批量转pdf工具-万兴PDF专业版(已破解)

  • 最好用的html批量转pdf工具-万兴PDF专业版(已破解)已关闭评论
  • 874 views
  • A+
所属分类:日常折腾

最近有一个需求。我在淘股吧发现一位真大神。他的技术很出彩。也是股票专做1进2的。这跟我最近的炒股理念相符。跟踪了他的每天的操作帖大概有一个多月了。确实实力过硬。

就想着把他每天的的帖子用火车头采集下来生成html。然后转换成pdf格式,最后汇总成一个pdf文档。再与我这些日子的复盘一一对比,揣摩他选股的逻辑。这个工作得抓紧时间干。时间一长。对这段时间的记忆就会逐渐模糊。这种不能结合情绪周期来看,都是参不到什么东西的。

说干就干。关于火车头的采集。我已经是轻车熟路了。不过,还是纠结于细节的问题。导致反复采集了好几遍。一开始是想直接生成word格式,再用word批量生成pdf,这样就省事许多。奈何,这火车头生成word有bug,根本实现不了。好吧,只能选择生成html来个迂回战术了。

火车头采集有2个注意要点:
1、在采集正文的时候,要勾选下载图片和将相对路径变成绝对路径。这样做的目的,是把图片链接从网络链接本地化。

最好用的html批量转pdf工具-万兴PDF专业版(已破解)图片 No.1
2、发布编码要选择“gb2312”,不然生成的html是乱码。

最好用的html批量转pdf工具-万兴PDF专业版(已破解)图片 No.2

html生成好了之后,就是要找“html批量转换成pdf的工具”。这是个难题啊。我找了许多个。其中有个在线工具的,纯免费:
http://www.pdfdo.com/html-to-pdf.aspx,一次可以转换20条。怎么说呢?这东西不能将图片转换出来,就很可惜。不过,好像也与我html的编码有关系。具体不知道原因在哪里。但即使是20条,也不够的。我这个批量html是100条整。

再找,就是“使用wkhtmltopdf将多个html批量转成pdf”。这个是个技术活儿。先要安装wkhtmltopdf这个软件。再使用命令行代码。这个在网络上有几简一模一样的文章。如下:

场景:比如笔者有 ognl中文文档,全部是html,现在想把它转成pdf,放到ipad阅读,文件如下:

下载好wkhtmltox(本地安装目录 D:\develop\wkhtmltox),在该目录(指html目录)下编写脚本convert.bat

@echo off
title html批量合成pdf
set PATH=D:\develop\wkhtmltox\bin;%PATH%
for /f %%i in ('dir /b *.html') do wkhtmltopdf.exe toc %%i %%~ni.pdf
pause

执行脚本生成以下文件:

多个pdf合并,目前找到体验相对好的网址:https://www.ilovepdf.com/zh-cn/merge_pdf

上面的代码中,有一处多个网页都是错误的。即:
for /f %%i in ('dir /b *.html') do wkhtmltopdf.exe toc %%i %%~ni.pdf

开始找的是错误的,导致命令行执行不了,说什么dir不存在。好在摸索了一下。去掉了错误的符号就可以了。
最终代码如下:

@echo off
title html批量合成pdf
set PATH=C:\Program Files\wkhtmltopdf\bin;%PATH%
for /f %%i in ('dir /b *.html') do wkhtmltopdf.exe toc %%i %%~ni.pdf
pause

然而,虽然可以工作了。但并没有什么卵用。因为生成的pdf不仅多出来一个“Table of Contents”的空白页之外,一样乱码,一样不能生成图片。

最好用的html批量转pdf工具-万兴PDF专业版(已破解)图片 No.3

好吧。继续找。说个小插曲。有人利用这个wkhtmltopdf,说是开发了个小工具,还到处发文章。我在b站见过,在知乎见过。还说要关注公众号,发关键词给软件。结果我tm关注了。发条链接出来。一看。好家伙,还tm要20块钱呢!!我真是服了你妈了。什么都想要钱。利用别人的免费工具。然后一条命令行就能搞定的事。你拿来收钱???想钱要疯了吧。

点个名“奔跑吧永恒君”。搞钱能不能用点纯自己原创的东西?知乎链接:https://zhuanlan.zhihu.com/p/442147499

我还用到一个工具叫“pdf candy”。这个东西有破解版。倒有一个html转换成pdf的选项。不过很遗憾。转换出来也是乱码,没有图。

所以,导致我一直有个焦点。就是找把gb2312转换成utf-8的工具。说到这个工具。我tm又遇到一个叫“我的abc软件工具箱”。又tm是一个收费软件。好吧,跳过。我又搜索一个大神在2015年发的一个自制软件。结果链接放在了帝国cms论坛上。好在我本身有论坛账号。就下载下来了。

最好用的html批量转pdf工具-万兴PDF专业版(已破解)图片 No.4

虽然我没有用上,但是把链接放出来。也许有人需求这个东西呢。名字叫:GBK和UTF8 批量互转工具。下载地址:
链接:https://pan.baidu.com/s/1cQSbpQOa6odatCBqpDZMEg
提取码:0cpi

转码还是没卵用。我只能再试试另外一个软件了,叫万兴PDF专业版。其实我最开始就是接触它的。而且也很轻易就找到了破解版。但是一看有压缩包有500多M,而且是个安装版,我就跳过了。抱着试一试的态度。安装上了它。

好家伙。这一下子所有问题都解决了。直接使用了火车头生成的html文件。在浏览器打开能正常渲染出本地化的图片。再拖入到万兴pdf里面一转换。生成的pdf就很完美。比如这样的:

最好用的html批量转pdf工具-万兴PDF专业版(已破解)图片 No.5

使用其中的“新建”功能,即:从其他文件生成pdf。可以直接把一个文件夹的html批量生成pdf。再也没有乱码,再也不会出现pdf没有图片了。perfect!

最好用的html批量转pdf工具-万兴PDF专业版(已破解)图片 No.6
附上万兴pdf专业版破解版下载地址:
链接:https://pan.baidu.com/s/1g_J7xEwFYJYD-bdnYHg7bw
提取码:4q6k

最后一步,将生成的100个pdf合并成一个有书签的pdf的方法,参考之前的一篇文章:

avatar