Hướng dẫn convert image to text python - chuyển đổi hình ảnh sang văn bản python

Xem thảo luận

Cải thiện bài viết

Lưu bài viết

  • Đọc
  • Bàn luận
  • Xem thảo luận

    Cải thiện bài viết

    Lưu bài viết

    Đọc

    Bàn luận

    1. Mục tiêu của chúng tôi là chuyển đổi một hình ảnh văn bản nhất định thành một chuỗi văn bản, lưu nó vào một tệp và để nghe những gì được viết trong hình ảnh thông qua âm thanh.It is an optical character recognition (OCR) tool for python sponsored by google.
    2. Đối với điều này, chúng tôi cần nhập một số thư việnIt is an offline cross-platform Text-to-Speech library
    3. Pytesseract (Python-Tesseract): Đây là công cụ nhận dạng ký tự quang học (OCR) cho Python được tài trợ bởi Google.It adds image processing capabilities to your Python interpreter
    4. PYTTSX3: Nó là một thư viện văn bản-nền tảng đa nền tảng ngoại tuyếnIt is a free python library that implements the Google Translate API.

    Examples:

    Hướng dẫn convert image to text python - chuyển đổi hình ảnh sang văn bản python

    Input : We Have an image with some text 
    
    Output: THE TEXT FROM THE IMAGE IS EXTRACTED AND A VOICE WILL SPEAK THE TEXT
          
    
              This is the first line of
               this text example.
    
              This is the second line
               of the same text.
    
           Translated(src=en, dest=de, text=Dies ist die erste Zeile von
    
               Dieses Textbeispiel.
    
                Dies ist die zweite Zeile
                desselben Textes., pronunciation=None, extra_data="{'translat..."
    

    Thư viện hình ảnh Python (PIL): Nó thêm khả năng xử lý hình ảnh vào trình thông dịch Python của bạn

    Googletrans: Đây là một thư viện Python miễn phí thực hiện API Google Dịch.

    Mã: Mã Python để chuyển đổi văn bản thành bài phát biểu

    import pytesseract      

    from PIL import Image    

    import pyttsx3           

    pytesseract      0pytesseract      1

    pytesseract      2import4pytesseract      4   

    from import0import import2

    pytesseract      8import6import7from1from2import4from4from5from6from7

    from8from6PIL 0

    from8pytesseract      0PIL 3

    import3import4 import5import6import7import8import9

    pytesseract      5import4 pytesseract      7

    pytesseract      0import4

    PIL 4import4 PIL 6

    import8

    import9

    PIL 7import4 PIL 9import4import1import2 We can convert the text into any desired language. For Example Japanese, Russian, Hindi. But the only condition is that the googletrans should recognize the destination language. Also, pyttsx3 will speak only the languages which are recognized by it.


    OCR là viết tắt của nhận dạng ký tự đối tượng !!!!

    OCRIS Việc chuyển đổi điện tử hoặc cơ học của hình ảnh của văn bản được đánh máy, viết tay hoặc in thành văn bản được mã hóa bằng máy ảnh), hoặc từ văn bản phụ đề được đặt chồng lên một hình ảnh (ví dụ: từ một truyền hình phát sóng). OCR đã trở thành một công cụ Python phổ biến. Với sự ra đời của các thư viện như Tesseract và Ocrad, ngày càng có nhiều nhà phát triển xây dựng các thư viện và bot sử dụng OCR theo những cách mới lạ, thú vị.is the electronic or mechanical conversion of images of typed, handwritten, or printed text into machine-encoded text, whether from a scanned document, a photo of a document, a scene-photo (for example the text on signs and billboards in a landscape photo), or from subtitle text superimposed on an image (for example: from a television broadcast). OCR has become a common Python tool. With the advent of libraries such as Tesseract and Ocrad, more and more developers are building libraries and bots that use OCR in novel, interesting ways.

    Một ví dụ tầm thường là một công cụ OCR cơ bản được sử dụng để trích xuất văn bản từ các hình ảnh để bạn không phải sắp xếp lại văn bản sau này.

    Hãy bắt đầu với các bước

    Bước 1: Cài đặt Tesseract bằng TessDocas theo tính khả dụng của HĐH.: Install tesseract using tessdocas per the OS availability.

    Bước 2: Kiểm tra và xác nhận đường dẫn cài đặt cho TesseractPackage.: Check and confirm the installation path for tesseractpackage.

    Đối với Windows, đường dẫn cài đặt mặc định sẽ là: Image    0.

    Đối với Mac OS, đường dẫn cài đặt sẽ là: Image    1.

    Bước 3: Cài đặt pytesseract bằng PIP: Install pytesseract using pip

    Image    2

    Bước 4: Đặt đường dẫn Tesseract trong tập lệnh (chỉ dành cho Windows): Set the tesseract path in the script (only for Windows)

    Đặt đường dẫn Tesseract trong tập lệnh trước khi gọi Image    3:

    Image    4

    Bạn đã sẵn sàng với thiết lập cơ bản của các yêu cầu và bây giờ bạn có thể bắt đầu với mã hóa ……

    Tôi đã sử dụng máy tính xách tay Jupyter Navigator Anaconda Navigator và Mac OS cho mã dưới đây. Nó có thể thay đổi theo thông số kỹ thuật HĐH.

    Nhập các gói yêu cầu…

    Nhập CV2 dưới dạng pytesseract cvimport như TES
    import pytesseract as tes

    Sử dụng OpenCV (ở đây gói CV2), hãy đọc hình ảnh mà bạn muốn chuyển đổi thành văn bản

    IMG = CV.Imread (Demo demo.jpeg))

    Nếu hình ảnh nằm trong cùng một thư mục với tập lệnh mã, thì chỉ cần cung cấp tên, nếu không hãy đề cập đến toàn bộ đường dẫn.

    Nhận kích thước của hình ảnh và bạn có thể cắt hình ảnh đó vào văn bản chính xác để được chuyển đổi. Đây là hoàn toàn tùy chọn.

    chiều cao, chiều rộng, _ = img.shaperoi = img [50: 500, 200: 600]
    roi = img[50:500, 200:600]

    Sử dụng hàm Image_TO_String () từ gói Tesseract để in các ký tự hình ảnh thành chuỗi.

    print(tes.image_to_string(roi))

    Cuối cùng, chúng tôi chỉ hiển thị khung kết quả và cũng đặt cách thoát khỏi vòng lặp vô hạn này và đóng nguồn cấp dữ liệu video.

    cv.imshow (Hồi ROI, ROI) cv.waitkey (0) cv.destroyallWindows ()
    cv.waitKey(0)
    cv.destroyAllWindows()

    Đầu ra mã:

    Tôi hy vọng bạn thích blog !!!

    Xin vui lòng đăng bình luận và phản hồi của bạn.

    Don Tiết quên đánh vỗ tay nếu bạn thích nó :)

    Cảm ơn!!!

    Làm cách nào để chuyển đổi hình ảnh thành một chuỗi trong Python?

    Chuyển đổi hình ảnh thành chuỗi..
    Ở đây trước tiên, chúng tôi nhập phương thức Base Base64 để mã hóa hình ảnh đã cho ..
    Tiếp theo, chúng tôi đã mở tệp hình ảnh của mình ở chế độ RB được đọc ở chế độ nhị phân ..
    Chúng tôi đọc hình ảnh của chúng tôi với Image2.read () đọc hình ảnh và mã hóa nó bằng b64encode () Đó là phương thức được sử dụng để mã hóa dữ liệu thành base64 ..

    Làm cách nào để chuyển đổi hình ảnh thành văn bản?

    Chuyển đổi một tệp hình ảnh..
    Trên máy tính của bạn, truy cập Drive.google.com ..
    Nhấp chuột phải vào tệp mong muốn ..
    Nhấp vào Mở với.Google Docs ..
    Tệp hình ảnh sẽ được chuyển đổi thành Google Doc, nhưng một số định dạng có thể không chuyển: đậm, chữ nghiêng, kích thước phông chữ, loại phông chữ và ngắt dòng rất có thể được giữ lại ..

    Làm cách nào để trích xuất văn bản chính xác từ một hình ảnh?

    OCR là công nghệ nhận dạng ký tự quang học của người Viking được sử dụng để chuyển đổi bất kỳ hình ảnh nào có chứa văn bản viết tay hoặc in có thể đọc được.Khi tệp đã được xử lý thông qua OCR trực tuyến, văn bản được trích xuất có thể được chỉnh sửa thêm bằng cách sử dụng phần mềm xử lý văn bản như MS Word.. Once the file has been processed through the online OCR, the extracted text can be further edited by using word processing software like MS Word.

    Làm thế nào để bạn chuyển đổi thành văn bản trong Python?

    Để bắt đầu, hãy cài đặt các mô -đun cần thiết:..
    PIP3 Cài đặt GTTS PYTTSX3 chơi ..
    Nhập GTT từ Nhập khẩu Playsound chơi ..
    # Yêu cầu đến Google để nhận TTS tổng hợp = GTTS.....
    # Lưu tệp âm thanh TTS.....
    # Phát tệp âm thanh Playsound ("Hello.mp3").
    # Trong tiếng Tây Ban Nha TTS = GTT ..