怎么用python实现把图片上的字写入文本文件
发布时间:2026-05-08 10:04:52

将图片翻译成文字通常称为光学文字识别(Optical Character Recognition,OCR)。OCR可以实现 底层数据库不多。目前,许多数据库使用普通的底层OCR 库,或者在上面定制。
Tesseract 是OCR 目前由Google库组成的 赞助(Google OCR也是一个家庭 以机器学习技术闻名的公司)。Tesseract 它被公认为最好、最准确的开源OCR 系统。
安装使用Tesseract:
TesseractWindows安装包下载地址如下: http://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-setup-4.00.00dev.exe ,双击下载后直接安装即可。
安装后,需要将Tesseract添加到系统变量中。将Tesseractt输入CMD -v, 如果显示以下界面,则表示Tesseract已安装并添加到系统变量中。

Linux 使用者可以通过apt-get 安装:
$sudoapt-gettesseract-ocr
使用示例:
图片路径如下:E://figures/other/poems.jpg
输入命令 tesseract E://figures/other/poems.jpg E://figures/other/poems.txt, 然后poems就会出现.在poemss中写入jpg中的识别文本.txt中



有关Python的更多信息,请关注Python视频教程栏目。
下一篇 怎样在手机上运行python
