programming python

Làm thế nào để bạn triển khai tesseract trong python?

Tesseract là một công cụ nhận dạng ký tự quang học trong Python. Nó được sử dụng để phát hiện các ký tự nhúng trong một hình ảnh. Tesseract, khi được tích hợp với các thư viện mạnh mẽ như OpenCV, có thể được sử dụng để kết hợp các tác vụ bản địa hóa văn bản [Phát hiện văn bản] trong một hình ảnh cùng với việc hiểu văn bản đó là gì [Nhận dạng văn bản]

CÀI ĐẶT PYTHON [3. X]

Mở terminal/dấu nhắc lệnh và gõ.
______4
~pip install opencv-python

MỞ MỘT HÌNH ẢNH ĐƠN GIẢN

Nhập cv2
Nhập pytesseract
Lưu hình ảnh thử nghiệm trong cùng thư mục
Tạo một biến để lưu trữ hình ảnh bằng hàm cv2.imread[] và chuyển tên của hình ảnh làm tham số

OCR [Nhận dạng ký tự quang học] ngày nay rất nổi tiếng. Khái niệm này rất đơn giản và nó sẽ quét một hình ảnh và đọc văn bản bên trong nó. Bạn có biết OCR có thể được thực hiện dễ dàng bằng Python không?
Nhưng, trong trường hợp của tôi, tôi cần một chút thời gian vì bối rối về cách bắt đầu OCR từ Tesseract. Được rồi, trong câu chuyện này, tôi muốn làm cho bước cài đặt Tesseract trở nên đơn giản và rõ ràng. Tôi sẽ viết từng bước cài đặt Tesseract vào thiết bị của bạn. Hãy làm nó
quy trình làm việc
Quy trình làm việc của chương trình sẽ được giải thích bằng các hình ảnh bên dưới
Vì OCR sẽ đọc 'văn bản' từ 'hình ảnh', nên bạn cần có hai thư viện để bắt đầu với nó. Để đọc hình ảnh, thư viện chúng tôi sẽ sử dụng là pillow [PIL] và đối với quy trình trích xuất văn bản, bạn cần thư viện pytesseract. pytesseract là một thư viện có thể tương tác với
```
conda activate ocr
```
0
Nếu bạn cảm thấy bối rối, hãy nghĩ như thế này. Bất cứ khi nào bạn muốn dọn dẹp sân vườn [Target/OCR], bạn sẽ cần một cái liềm [Tesseract Engine], nhưng nếu bạn dùng liềm bằng tay không [chỉ dành cho Python], rất có thể tay bạn sẽ bị đau. Để dễ dàng hơn, bạn sẽ sử dụng găng tay [pytesseract thư viện]. Vâng, cuối cùng, sân của bạn sẽ sạch sẽ
Mục đích của bài viết này sẽ giải thích cách trích xuất văn bản từ hình ảnh, vì vậy nếu bạn muốn đọc văn bản từ hình ảnh mà không có bất kỳ thư viện nào, bạn có thể bỏ qua bài viết này và thử tìm một bài viết mới. Được rồi, tôi hy vọng bạn hiểu. Hãy chuyển sang phần tiếp theo
Yêu cầu
Vì dự án này sẽ sử dụng công nghệ OCR với Python, tôi khuyên bạn nên cài đặt Anaconda để môi trường Python chính của bạn không gặp sự cố, nhưng nếu bạn không muốn, hãy tải xuống Python 3. 8. x ở trên. Nếu bạn hỏi tại sao 3. 8, tôi nghĩ phiên bản 3. 8 là ổn định nhất cho đến khi tôi viết bài này. Bạn có thể bắt đầu Arima bằng phiên bản Python này. Tất nhiên, cứ thoải mái nếu bạn vẫn muốn sử dụng Python 3. 10 trở lên
Tiếp theo, hệ điều hành mà tôi sẽ sử dụng là Windows 11; . Bạn vẫn có thể theo dõi bất kỳ hệ điều hành nào bạn sử dụng vì chúng tôi không chơi ở cấp độ hệ điều hành mà ở cấp độ ứng dụng. Trong trường hợp này, chúng tôi đang tạo một chương trình bằng Python. Vì vậy, miễn là hệ điều hành của bạn có Python, bạn có thể dễ dàng làm theo hướng dẫn này
Đối với Windows, bạn có thể tải xuống Python 3. 8. 10 bằng cách nhấp vào liên kết này, nhưng nếu bạn muốn làm theo, tôi sẽ sử dụng Anaconda. Để cài đặt Anaconda, tải chương trình tại đây
Sự chuẩn bị
Tôi sẽ bỏ qua phần cài đặt Anaconda vì nó quá dễ và tôi tin rằng bạn sẽ không truy cập bài viết này nếu bạn muốn biết cách cài đặt Anaconda. Sau khi cài đặt, chúng ta nên tạo một môi trường mới để đảm bảo nó không ảnh hưởng đến bất kỳ môi trường Python nào đã tồn tại trong hệ thống của bạn
1. Tạo môi trường Conda mới trong cmd của bạn bằng lệnh này. Tôi sẽ đặt tên nó là
```
conda activate ocr
```
2 để tạo môi trường này cho OCR
```
C:\Users\asus>conda create -n ocr python=3.8.10
```
Tin nhắn hoàn thành sẽ như thế này
2. Sau khi môi trường
```
conda activate ocr
```
2 được tạo, hãy kích hoạt nó bằng lệnh này và bạn cũng có thể kiểm tra phiên bản Python trong môi trường này
```
conda activate ocr
```
3. Cài đặt các thư viện cần thiết cho OCR
Cài đặt pytesseract và pillow bằng lệnh này
```
pip install pytesseractpip install pillow
```
Nhận Công cụ Tesseract
Được rồi, trước khi tôi nói, để đọc hình ảnh, bạn cần có Công cụ Tesseract, phải không? . Nếu bạn kiên nhẫn và có thời gian để đọc tài liệu, bạn sẽ hiểu trang web này được viết rất tốt về tài liệu tesseract và cách cài đặt nó trong các hệ điều hành khác nhau
Sau khi cuộn xuống trang, tôi thấy rằng đối với Windows, Tesseract mới nhất không có trên trang web này nhưng trên Trang GitHub của UB Mannheim
Bạn có thể truy cập trang tại đây và nhấp vào trình cài đặt tại đó
Chỉ dành cho bạn, nhấp vào liên kết này để tải xuống trực tiếp tesseract-ocr-w64-setup-v. 5. 2. 0. 20220712. exe [64bit]. Lưu chương trình ở nơi bạn muốn
Sau khi tải về chạy chương trình setup và thực hiện các bước cài đặt như bình thường
Tôi muốn tất cả người dùng trên máy tính của mình có thể truy cập chương trình này, vì vậy tôi chọn lựa chọn này
Chà, nếu bạn muốn sử dụng ứng dụng này, hãy liệt kê đầy đủ tất cả các lựa chọn bên dưới; . Vì tôi muốn làm điều này đơn giản và rõ ràng, hãy cài đặt phiên bản tiêu chuẩn
Tiếp theo, câu hỏi sẽ hỏi bạn nơi cài đặt chương trình. Theo mặc định, nó sẽ cài đặt trong thư mục này 'C. \Tệp chương trình\Tesseract-OCR'. Nhưng tôi sẽ cài đặt nó trên đĩa E của mình. Bởi vì nó vẫn có dung lượng lưu trữ lớn
Bắt đầu cài đặt bằng cách nhấp vào cài đặt trên trang tiếp theo
Vì chúng tôi không cài đặt thêm dữ liệu, quá trình cài đặt sẽ nhanh chóng
Xin chúc mừng, chúng tôi có thể tương tác với công cụ OCR bằng cách sử dụng thư viện pytesseract
Sau khi chương trình được cài đặt, bạn có thể lấy đường dẫn
```
conda activate ocr
```
3 bằng cách sao chép chương trình trong đường dẫn thám hiểm như thế này. Chúng tôi sẽ sử dụng đường dẫn trong bước tiếp theo
Trong trường hợp của tôi, đường dẫn là "E. \Program Files\Tesseract-OCR\tesseract. exe"
Thu thập hình ảnh
Trong bước này, bạn sẽ tải xuống một số hình ảnh để kiểm tra chương trình của chúng tôi. Tôi đã tải xuống một số hình ảnh trích dẫn có chứa văn bản trên đó
Ngoài ra, đừng quên di chuyển thư mục của bạn từ cmd sang không gian làm việc bạn đang sử dụng
Tích hợp các dịch vụ
Chuẩn bị, động cơ và hình ảnh đã sẵn sàng. Hãy viết một số mã để làm cho chương trình này hoạt động. Mã sẽ như thế này
Đầu ra sẽ như thế này
Được rồi, như bạn thấy, chương trình sẽ đọc các hình ảnh và sau đó trích xuất tất cả văn bản bên trong chúng. Hãy thay đổi đường dẫn hình ảnh để làm cho nó linh hoạt hơn và yêu cầu người dùng nhập vị trí hình ảnh
Tài liệu
Tôi đã tạo tài liệu về cách chạy mã này bên dưới

Không phải là nó rất dễ dàng?
Phần kết luận
Rốt cuộc, chúng tôi đã trải qua, tôi hy vọng bạn hiểu khái niệm rất rõ ràng. Trong câu chuyện này, tôi chỉ đang tạo một hướng dẫn cài đặt và sử dụng Tesseract, và tôi đang cố gắng hết sức để làm cho bài viết thật đơn giản và rõ ràng. Cảm ơn đã quan tâm
Có mã đẹp
Thẩm quyền giải quyết
Bài viết gốc mà tôi tham khảo là dưới đây. Tôi đã viết lại nó với phiên bản của mình vì tôi đã mất một thời gian để làm cho chương trình hoạt động khi tôi đọc bài báo đó
Làm cách nào để trích xuất văn bản từ hình ảnh bằng Python?
OCR [Nhận dạng ký tự quang học] là quá trình chuyển đổi điện tử hình ảnh Kỹ thuật số thành…
www. chuyên viên máy tính. tổ chức
Đọc thêm
Tại sao bạn nên sử dụng TAGGUN thay vì mục đích chung OCR
Textract của Amazon, tesseract mã nguồn mở hoặc OCR trong các trình đọc PDF có sẵn rất phù hợp để số hóa…
tiếng Anh đơn giản. io
Tự động hóa các khoản phải trả. Mẫu OCR so với. OCR do AI hỗ trợ với TAGGUN
Cái chết, thuế và hóa đơn xử lý. Ba sự thật tuyệt đối của Tài khoản phải trả. Trong một thời gian dài, các khoản phải trả…
tiếng Anh đơn giản. io
Thêm nội dung tại PlainEnglish. io. Đăng ký nhận bản tin hàng tuần miễn phí của chúng tôi. Theo dõi chúng tôi trên Twitter, LinkedIn, YouTube và Discord. Quan tâm đến hacking tăng trưởng?

Làm cách nào để đào tạo mô hình Tesseract trong Python?

Tổng quan về quá trình đào tạo .

Soạn thảo văn bản đào tạo

Kết xuất văn bản thành tệp hình ảnh + hộp. .

Tạo tập tin unicharset. .

Tạo một dữ liệu được đào tạo khởi động từ unicharset và dữ liệu từ điển tùy chọn

Chạy tesseract để xử lý file image + box để tạo tập dữ liệu huấn luyện

Chạy huấn luyện trên tập dữ liệu huấn luyện

Kết hợp các tệp dữ liệu

Python Tesseract hoạt động như thế nào?

Tesseract đang tìm mẫu bằng pixel, chữ cái, từ và câu. Nó sử dụng phương pháp hai bước gọi là nhận dạng thích ứng . Nó yêu cầu một giai đoạn dữ liệu để nhận dạng ký tự, sau đó là giai đoạn thứ hai để hoàn thành bất kỳ chữ cái nào, nó không được bảo đảm bằng các chữ cái có thể khớp với ngữ cảnh của từ hoặc câu.

Làm cách nào để cài đặt Tesseract OCR trong Windows 10 Python?

Tải xuống exe tesseract từ https. //github. com/UB-Mannheim/tesseract/wiki. .

Cài đặt exe này trong C. \Program Files [x86]\Tesseract-OCR

Mở dấu nhắc lệnh của máy ảo trong cửa sổ hoặc dấu nhắc anaconda

Chạy pip cài đặt pytesseract

Để kiểm tra xem tesseract đã được cài đặt hay chưa, hãy nhập dấu nhắc python. nhập pytesseract. in [pytesseract]

OCR nào là tốt nhất trong Python?

Pytesseract hoặc Python-tesseract là công cụ OCR dành cho python, đồng thời đóng vai trò là trình bao bọc cho Công cụ Tesseract-OCR. Nó có thể đọc và nhận dạng văn bản trong hình ảnh và thường được sử dụng trong hình ảnh python ocr cho các trường hợp sử dụng văn bản.

CÀI ĐẶT PYTHON [3. X]

MỞ MỘT HÌNH ẢNH ĐƠN GIẢN

Làm cách nào để trích xuất văn bản từ hình ảnh bằng Python?

OCR [Nhận dạng ký tự quang học] là quá trình chuyển đổi điện tử hình ảnh Kỹ thuật số thành…

Đọc thêm

Tại sao bạn nên sử dụng TAGGUN thay vì mục đích chung OCR

Textract của Amazon, tesseract mã nguồn mở hoặc OCR trong các trình đọc PDF có sẵn rất phù hợp để số hóa…

Tự động hóa các khoản phải trả. Mẫu OCR so với. OCR do AI hỗ trợ với TAGGUN

Cái chết, thuế và hóa đơn xử lý. Ba sự thật tuyệt đối của Tài khoản phải trả. Trong một thời gian dài, các khoản phải trả…

Làm cách nào để đào tạo mô hình Tesseract trong Python?

Python Tesseract hoạt động như thế nào?

Làm cách nào để cài đặt Tesseract OCR trong Windows 10 Python?

OCR nào là tốt nhất trong Python?

Bài Viết Liên Quan

Toplist mới

Bài mới nhất

Chủ Đề