Trình chuyển đổi c++ sang php

You have 1 file tài liệu PDF. Bạn muốn hiển thị nội dung của nó lên trang web của mình dưới dạng text/html giống như một số trang tài liệu như tailieu. vn đang làm. Việc trang web của bạn hiển thị nội dung của tệp PDF dưới dạng văn bản thì sẽ có nhiều lợi ích về SEO

Nó làm cho nội dung bài viết của bạn ngoài việc sử dụng

$ whereis pdfinfo
2 hoặc
$ whereis pdfinfo
3 để chèn tệp PDF thì còn có văn bản nữa, làm tăng chất lượng cho bài viết của bạn. Tính năng này phù hợp với các trang web về tài liệu, sách

Hôm nay mình xin giới thiệu đến các bạn cách convert file PDF sang HTML bằng PHP. That is used package

$ whereis pdfinfo
4. Nó hoạt động dựa trên thư viện Poppler. (Poppler là thư viện hiển thị PDF dựa trên cơ sở là thư viện xpdf-3. 0. ). Mình sẽ cài đặt và sử dụng nó trên Laravel 5. 5

Cài đặt

Cài đặt Poppler

Trước hết, các bạn phải cài đặt thư viện Poppler (bắt buộc phải cài đặt để chuyển đổi PDF sang HTML)

Debian/Ubuntu

sudo apt-get install poppler-utils

hệ điều hành Mac

brew install poppler

các cửa sổ

Các bạn tải về và cài đặt theo hướng dẫn sau. http. //Blog. hồi sinh. com. au/poppler-windows/

Thư viện PDF sang HTML nằm ở đâu?

Sau khi cài đặt

$ whereis pdfinfo
5, bạn vào thư mục
$ whereis pdfinfo
6 (mình sử dụng Ubuntu) sẽ thấy nó có rất nhiều tính năng, ví dụ như.
$ whereis pdfinfo
7,
$ whereis pdfinfo
8,
$ whereis pdfinfo
9,
$ which pdfinfo
0,.
Trình chuyển đổi c++ sang php

Bạn có thể kiểm tra thư viện PDF sang HTML nó nằm ở đâu bằng lệnh như dưới đây

  • Debian/Ubuntu
$ whereis pdftohtml

pdftohtml. /usr/bin/pdftohtml

$ whereis pdfinfo

thông tin pdf. /usr/bin/pdfinfo

  • hệ điều hành Mac
$ which pdfinfo

/usr/local/bin/pdfinfo

$ which pdftohtml

/usr/local/bin/pdfinfo

  • Windows Nó ở trong thư mục
    $ which pdfinfo
    
    1

Cài đặt gói

Trong dự án của bạn, hãy chạy lệnh

  composer require tonchik-tm/pdf-to-html:~1

Hoặc thêm vào

$ which pdfinfo
2 và chạy
$ which pdfinfo
3

{
  "tonchik-tm/pdf-to-html":"~1"
}
Sử dụng

Sau khi cài đặt xong thư viện, chúng ta có thể chuyển đổi PDF sang HTML trên máy thật của mình bằng cách chạy lệnh của

$ whereis pdfinfo
5. Nhưng chúng ta đang muốn convert bằng code PHP, cụ thể là Laravel. Giờ thì chúng ta bắt đầu code nào

Ví dụ ban đầu mình có tệp PDF có tên

$ which pdfinfo
5. Mình sẽ convert file này sang HTML

  • cấu hình
// initiate
$pdf = new \TonchikTm\PdfToHtml\Pdf('pdf-sample.pdf', [
    'pdftohtml_path' => '/usr/bin/pdftohtml', // đường dẫn của `pdf to html` sau khi cài đặt
    'pdfinfo_path' => '/usr/bin/pdfinfo', // đường dẫn của `pdf info` sau khi cài đặt
    'clearAfter' => false, // xóa file pdf sau khi convert - mặc định là true
    'outputDir' => storage_path('app/ebooks'), // thư mục output của file html
]);

Ngoài các cấu hình trên, bạn có thể tham khảo danh sách đầy đủ cài đặt của nó như sau



$full_settings = [
    'pdftohtml_path' => '/usr/bin/pdftohtml', // path to pdftohtml
    'pdfinfo_path' => '/usr/bin/pdfinfo', // path to pdfinfo

    'generate' => [ // settings for generating html
        'singlePage' => false, // we want separate pages
        'imageJpeg' => false, // we want png image
        'ignoreImages' => false, // we need images
        'zoom' => 1.5, // scale pdf
        'noFrames' => false, // we want separate pages
    ],

    'clearAfter' => true, // auto clear output dir (if removeOutputDir==false then output dir will remain)
    'removeOutputDir' => true, // remove output dir
    'outputDir' => '/tmp/'.uniqid(), // output dir

    'html' => [ // settings for processing html
        'inlineCss' => true, // replaces css classes to inline css rules
        'inlineImages' => true, // looks for images in html and replaces the src attribute to base64 hash
        'onlyContent' => true, // takes from html body content only
    ]
]
Kết quả
  • Get information file pdf
brew install poppler
0

Trình chuyển đổi c++ sang php

  • Page number
brew install poppler
1

Trình chuyển đổi c++ sang php

  • Get content HTML of the first page
brew install poppler
2

Trình chuyển đổi c++ sang php

  • Lấy nội dung của tất cả các trang
brew install poppler
3

Trình chuyển đổi c++ sang php
Nó sinh ra đoạn code html kèm css luôn. Các bạn có thấy nó giống y chang file pdf ban đầu không?

Tuy nhiên, trong ví dụ này mình convert file tiếng Anh nên nó đẹp như vậy. Nếu bạn convert file tiếng việt hoặc file unicode thì lưu ý có thể bị lỗi font chữ

Sau khi chuyển đổi xong, bạn mở thư mục đầu ra (trong ví dụ của mình để trong thư mục

$ which pdfinfo
6 của dự án Laravel), sẽ thấy có 3 tệp. 1 file html được convert từ pdf, 1 file pdf ban đầu (file này mình để cài đặt
$ which pdfinfo
7 ở trên nên không bị xóa), 1 file ảnh chụp màn hình

Trình chuyển đổi c++ sang php

  • Source Code của mình các bạn có thể tham khảo
  • tuyến đường/web. php
brew install poppler
4
  • Bộ điều khiển sách điện tử
brew install poppler
5

Thật là 1 gói đơn giản, gọn nhẹ & tuyệt vời để convert từ PDF sang HTML phải không các bạn? . Cảm ơn các bạn đã đọc bài viết

Tham khảo

https. //github. com/tonchik-tm/pdf-to-html https. //github. com/mgufrone/pdf-to-html https. // poppler. máy tính để bàn miễn phí. tổ chức/