Hướng dẫn convert image to text python - chuyển đổi hình ảnh sang văn bản python

Xem thảo luận

Nội dung chính Show

Đầu ra mã:
Làm cách nào để chuyển đổi hình ảnh thành một chuỗi trong Python?
Làm cách nào để chuyển đổi hình ảnh thành văn bản?
Làm cách nào để trích xuất văn bản chính xác từ một hình ảnh?
Làm thế nào để bạn chuyển đổi thành văn bản trong Python?

Cải thiện bài viết

Lưu bài viết

Đọc

Bàn luận

Xem thảo luận

Cải thiện bài viết

Lưu bài viết

Đọc

Bàn luận

Mục tiêu của chúng tôi là chuyển đổi một hình ảnh văn bản nhất định thành một chuỗi văn bản, lưu nó vào một tệp và để nghe những gì được viết trong hình ảnh thông qua âm thanh.It is an optical character recognition (OCR) tool for python sponsored by google.
Đối với điều này, chúng tôi cần nhập một số thư việnIt is an offline cross-platform Text-to-Speech library
Pytesseract (Python-Tesseract): Đây là công cụ nhận dạng ký tự quang học (OCR) cho Python được tài trợ bởi Google.It adds image processing capabilities to your Python interpreter
PYTTSX3: Nó là một thư viện văn bản-nền tảng đa nền tảng ngoại tuyếnIt is a free python library that implements the Google Translate API.

Examples:

Hướng dẫn convert image to text python - chuyển đổi hình ảnh sang văn bản python

Input : We Have an image with some text 

Output: THE TEXT FROM THE IMAGE IS EXTRACTED AND A VOICE WILL SPEAK THE TEXT
      

          This is the first line of
           this text example.

          This is the second line
           of the same text.

       Translated(src=en, dest=de, text=Dies ist die erste Zeile von

           Dieses Textbeispiel.

            Dies ist die zweite Zeile
            desselben Textes., pronunciation=None, extra_data="{'translat..."

Thư viện hình ảnh Python (PIL): Nó thêm khả năng xử lý hình ảnh vào trình thông dịch Python của bạn

Googletrans: Đây là một thư viện Python miễn phí thực hiện API Google Dịch.

Mã: Mã Python để chuyển đổi văn bản thành bài phát biểu

import pytesseract

from PIL import Image

import pyttsx3

pytesseract 0pytesseract 1

pytesseract 2import4pytesseract 4

from import0import import2

pytesseract 8import6import7from1from2import4from4from5from6from7

from8from6PIL 0

from8pytesseract 0PIL 3

import3import4 import5import6import7import8import9

pytesseract 5import4 pytesseract 7

pytesseract 0import4

PIL 4import4 PIL 6

import8

import9

PIL 7import4 PIL 9import4import1import2 We can convert the text into any desired language. For Example Japanese, Russian, Hindi. But the only condition is that the googletrans should recognize the destination language. Also, pyttsx3 will speak only the languages which are recognized by it.

OCR là viết tắt của nhận dạng ký tự đối tượng !!!!

OCRIS Việc chuyển đổi điện tử hoặc cơ học của hình ảnh của văn bản được đánh máy, viết tay hoặc in thành văn bản được mã hóa bằng máy ảnh), hoặc từ văn bản phụ đề được đặt chồng lên một hình ảnh (ví dụ: từ một truyền hình phát sóng). OCR đã trở thành một công cụ Python phổ biến. Với sự ra đời của các thư viện như Tesseract và Ocrad, ngày càng có nhiều nhà phát triển xây dựng các thư viện và bot sử dụng OCR theo những cách mới lạ, thú vị.is the electronic or mechanical conversion of images of typed, handwritten, or printed text into machine-encoded text, whether from a scanned document, a photo of a document, a scene-photo (for example the text on signs and billboards in a landscape photo), or from subtitle text superimposed on an image (for example: from a television broadcast). OCR has become a common Python tool. With the advent of libraries such as Tesseract and Ocrad, more and more developers are building libraries and bots that use OCR in novel, interesting ways.

Một ví dụ tầm thường là một công cụ OCR cơ bản được sử dụng để trích xuất văn bản từ các hình ảnh để bạn không phải sắp xếp lại văn bản sau này.

Hãy bắt đầu với các bước

Bước 1: Cài đặt Tesseract bằng TessDocas theo tính khả dụng của HĐH.: Install tesseract using tessdocas per the OS availability.

Bước 2: Kiểm tra và xác nhận đường dẫn cài đặt cho TesseractPackage.: Check and confirm the installation path for tesseractpackage.

Đối với Windows, đường dẫn cài đặt mặc định sẽ là: Image 0.

Đối với Mac OS, đường dẫn cài đặt sẽ là: Image 1.

Bước 3: Cài đặt pytesseract bằng PIP: Install pytesseract using pip

Image 2

Bước 4: Đặt đường dẫn Tesseract trong tập lệnh (chỉ dành cho Windows): Set the tesseract path in the script (only for Windows)

Đặt đường dẫn Tesseract trong tập lệnh trước khi gọi Image 3:

Image 4

Bạn đã sẵn sàng với thiết lập cơ bản của các yêu cầu và bây giờ bạn có thể bắt đầu với mã hóa ……

Tôi đã sử dụng máy tính xách tay Jupyter Navigator Anaconda Navigator và Mac OS cho mã dưới đây. Nó có thể thay đổi theo thông số kỹ thuật HĐH.

Nhập các gói yêu cầu…

Nhập CV2 dưới dạng pytesseract cvimport như TES
import pytesseract as tes

Sử dụng OpenCV (ở đây gói CV2), hãy đọc hình ảnh mà bạn muốn chuyển đổi thành văn bản

IMG = CV.Imread (Demo demo.jpeg))

Nếu hình ảnh nằm trong cùng một thư mục với tập lệnh mã, thì chỉ cần cung cấp tên, nếu không hãy đề cập đến toàn bộ đường dẫn.

Nhận kích thước của hình ảnh và bạn có thể cắt hình ảnh đó vào văn bản chính xác để được chuyển đổi. Đây là hoàn toàn tùy chọn.

chiều cao, chiều rộng, _ = img.shaperoi = img [50: 500, 200: 600]
roi = img[50:500, 200:600]

Sử dụng hàm Image_TO_String () từ gói Tesseract để in các ký tự hình ảnh thành chuỗi.

print(tes.image_to_string(roi))

Cuối cùng, chúng tôi chỉ hiển thị khung kết quả và cũng đặt cách thoát khỏi vòng lặp vô hạn này và đóng nguồn cấp dữ liệu video.

cv.imshow (Hồi ROI, ROI) cv.waitkey (0) cv.destroyallWindows ()
cv.waitKey(0)
cv.destroyAllWindows()

Đầu ra mã:

Tôi hy vọng bạn thích blog !!!

Xin vui lòng đăng bình luận và phản hồi của bạn.

Don Tiết quên đánh vỗ tay nếu bạn thích nó :)

Cảm ơn!!!

Làm cách nào để chuyển đổi hình ảnh thành một chuỗi trong Python?

Chuyển đổi hình ảnh thành chuỗi..

Ở đây trước tiên, chúng tôi nhập phương thức Base Base64 để mã hóa hình ảnh đã cho ..

Tiếp theo, chúng tôi đã mở tệp hình ảnh của mình ở chế độ RB được đọc ở chế độ nhị phân ..

Chúng tôi đọc hình ảnh của chúng tôi với Image2.read () đọc hình ảnh và mã hóa nó bằng b64encode () Đó là phương thức được sử dụng để mã hóa dữ liệu thành base64 ..

Làm cách nào để chuyển đổi hình ảnh thành văn bản?

Chuyển đổi một tệp hình ảnh..

Trên máy tính của bạn, truy cập Drive.google.com ..

Nhấp chuột phải vào tệp mong muốn ..

Nhấp vào Mở với.Google Docs ..

Tệp hình ảnh sẽ được chuyển đổi thành Google Doc, nhưng một số định dạng có thể không chuyển: đậm, chữ nghiêng, kích thước phông chữ, loại phông chữ và ngắt dòng rất có thể được giữ lại ..

Làm cách nào để trích xuất văn bản chính xác từ một hình ảnh?

OCR là công nghệ nhận dạng ký tự quang học của người Viking được sử dụng để chuyển đổi bất kỳ hình ảnh nào có chứa văn bản viết tay hoặc in có thể đọc được.Khi tệp đã được xử lý thông qua OCR trực tuyến, văn bản được trích xuất có thể được chỉnh sửa thêm bằng cách sử dụng phần mềm xử lý văn bản như MS Word.. Once the file has been processed through the online OCR, the extracted text can be further edited by using word processing software like MS Word.

Làm thế nào để bạn chuyển đổi thành văn bản trong Python?

Để bắt đầu, hãy cài đặt các mô -đun cần thiết:..

PIP3 Cài đặt GTTS PYTTSX3 chơi ..

Nhập GTT từ Nhập khẩu Playsound chơi ..

# Yêu cầu đến Google để nhận TTS tổng hợp = GTTS.....

# Lưu tệp âm thanh TTS.....

# Phát tệp âm thanh Playsound ("Hello.mp3").

# Trong tiếng Tây Ban Nha TTS = GTT ..

Hướng dẫn convert image to text python - chuyển đổi hình ảnh sang văn bản python

Đầu ra mã:

Làm cách nào để chuyển đổi hình ảnh thành một chuỗi trong Python?

Làm cách nào để chuyển đổi hình ảnh thành văn bản?

Làm cách nào để trích xuất văn bản chính xác từ một hình ảnh?

Làm thế nào để bạn chuyển đổi thành văn bản trong Python?

Bài Viết Liên Quan

Quảng Cáo

Có thể bạn quan tâm

Toplist được quan tâm

Quảng cáo

Xem Nhiều

Quảng cáo

Chúng tôi

Điều khoản

Trợ giúp

Mạng xã hội