欢迎来到尧图网

客户服务 关于我们

您的位置:首页 > 教育 > 幼教 > Java html生成pdf和图片

Java html生成pdf和图片

2024/10/24 12:49:21 来源:https://blog.csdn.net/weixin_43898271/article/details/142170483  浏览:    关键词:Java html生成pdf和图片

在 Java 项目中将 HTML 生成图片是一项常见需求,特别是用于生成报告、预览页面截图等。不同的库和工具在渲染能力、性能以及支持的功能上有所不同。以下是几种主流的技术选型和对比,帮助你选择适合的解决方案。

技术对比总结

技术名称优点缺点适用场景
Html2Image简单易用,轻量级,Java 原生支持支持 HTML、CSS 和 JS 的能力较弱静态 HTML 到图片的简单场景
OpenHtmlToPdf支持丰富的 HTML 和 CSS,输出多种格式不支持 JS 动态内容,转换步骤稍复杂静态 HTML 生成 PDF 或图片
wkhtmltoimage高质量渲染,支持复杂 HTML、CSS 和 JS需要外部工具,性能可能较慢需要高质量渲染的复杂页面
Selenium + Headless完全支持动态页面和 JavaScript需要配置无头浏览器,资源消耗较大动态网页、复杂前端页面的截图
Puppeteer强大的渲染和操作能力,完全支持 HTML、CSS 和 JS依赖 Node.js,集成较为复杂动态网页渲染和交互,现代 Web 应用
Flying Saucer + Batik支持 XHTML、CSS 和 SVG,适合标准化文档不支持 JavaScript,支持的 CSS 有限静态 HTML 和 SVG 文档生成

下面主要对Html2Image和OpenHtmlToPdf进行讲解说明

1. Html2Image

简介

Html2Image 是一个 Java 库,能够直接将 HTML 转换为图片。该库依赖于 Flying Saucer 等 HTML 渲染引擎来处理 HTML 和 CSS。

优点
  • 轻量级:易于使用,依赖较少。
  • Java 原生支持:无需外部工具,适合与 Java 项目集成。
缺点
  • CSS 支持有限:对复杂的 CSS 或 JavaScript 支持较弱。
  • 渲染效果一般:渲染复杂页面或带有动态效果的内容时效果不佳。
适用场景

适合静态页面和简单的 HTML 转换需求,如邮件内容、简单报告等。

代码示例
   <dependency><groupId>gui.ava</groupId><artifactId>html2image</artifactId><version>2.0.1</version></dependency>

引包即用

Html2Image html2Image = Html2Image.fromHtml("<html><body>Hello, World!</body></html>");
html2Image.saveAsImage(new File("output.png"));

2. OpenHtmlToPdf(强烈推介)

简介

OpenHtmlToPdf 是一个用于将 HTML 转换为 PDF 的 Java 库,但它也支持将 HTML 转换为 PNG 等图片格式。它基于 Flying Saucer 渲染 HTML。

优点
  • 支持复杂的 HTML 和 CSS:对大部分 HTML 和 CSS 有较好的支持。
  • 多格式支持:除了 PDF,也支持 PNG、JPG 输出。
缺点
  • 不支持 JS 动态内容:不能处理需要 JavaScript 动态渲染的页面。需要额外引入中文字体包,对中文支持不是很友好。字体包链接提取
  • 相对复杂:需要渲染 PDF,再转换为图片,增加了步骤。
适用场景

适合生成静态报告、发票、合同等场景,尤其是同时需要生成 PDF 和图片格式时。

代码示例

需要引入如下包

  <!-- Openhtmltopdf 用于将 HTML 转换为 PDF --><dependency><groupId>at.datenwort.openhtmltopdf</groupId><artifactId>openhtmltopdf-java2d</artifactId><version>1.1.3</version></dependency><!-- PDFBox 用于将 PDF 转换为图片 --><dependency><groupId>org.apache.pdfbox</groupId><artifactId>pdfbox</artifactId><version>2.0.24</version></dependency><!-- PDFBox 渲染依赖 --><dependency><groupId>org.apache.pdfbox</groupId><artifactId>pdfbox-tools</artifactId><version>2.0.24</version></dependency>

核心代码如下

        ByteArrayOutputStream bao = new ByteArrayOutputStream();ITextRenderer renderer = new ITextRenderer();ITextFontResolver fontResolver = renderer.getFontResolver();// 设置字体fontResolver.addFont("中文字体包路径", BaseFont.IDENTITY_H, BaseFont.NOT_EMBEDDED);renderer.setDocumentFromString(html);renderer.layout();renderer.createPDF(bao);

注意如果中文字体识别需要在html中指定字体包
例如:

<body style="font-family: SimSun">

选择建议

  • 如果需要简单的 HTML 静态页面生成图片Html2ImageOpenHtmlToPdf 是较好的选择。
  • 如果需要高质量的图片输出,且页面较为复杂,使用 wkhtmltoimage 或 Selenium 结合无头浏览器会更好

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com