欢迎来到尧图网

客户服务 关于我们

您的位置:首页 > 新闻 > 会展 > OCR图片中文字识别(Tess4j)

OCR图片中文字识别(Tess4j)

2025/1/6 14:37:05 来源:https://blog.csdn.net/m0_64289188/article/details/144918893  浏览:    关键词:OCR图片中文字识别(Tess4j)

文章目录

      • Tess4J
      • 下载 tessdata
      • Java 使用Tess4j 的 demo

Tess4J

Tess4J 是 Tesseract OCR 引擎的 Java 封装库,它让 Java 项目更轻松地实现 OCR(光学字符识别)功能。

下载 tessdata

下载地址:https://github.com/tesseract-ocr/tesseract/releases

看网上教程,要下载相应的语言包,下 chi_sim.traineddata 即可
在这里插入图片描述

Java 使用Tess4j 的 demo

pom.xml 中加入以下依赖:

<dependency><groupId>net.sourceforge.tess4j</groupId><artifactId>tess4j</artifactId><version>4.5.4</version>
</dependency>

写一个main方法,使用 Tesseract OCR 引擎对图像进行文字识别

public class OcrExample {public static void main(String[] args) {// 设置图片文件路径File imageFile = new File("D:\\1.png");// Tesseract 是 Tess4J 提供的 OCR 引擎类,它封装了对 Tesseract OCR 引擎的调用ITesseract instance = new Tesseract();try {// 设置tessdata路径 最好写绝对路径instance.setDatapath("D:\\app\\tool\\tesseract-ocr\\tessdata");// 选择简体中文 Chinese simplifiedinstance.setLanguage("chi_sim");// 进行OCR识别String result = instance.doOCR(imageFile);System.out.println("识别结果: " + result);} catch (Exception e) {System.out.println("OCR识别失败: " + e.getMessage());}}
}

图片:
在这里插入图片描述

结果:
在这里插入图片描述

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com