Làm cách nào để chuyển đổi RTF sang HTML trong JavaScript?

HTML là một ngôn ngữ đánh dấu được sử dụng để tạo các trang web. Trình duyệt web có thể phân tích tệp HTML. Định dạng tệp này sử dụng các thẻ (e. g ) để xây dựng nội dung trang web. Nó có thể nhúng văn bản, hình ảnh, tiêu đề, bảng, v.v. bằng cách sử dụng các thẻ. Các ngôn ngữ đánh dấu khác như PHP, CSS, v.v. có thể được sử dụng với các thẻ html

Bạn có thể chuyển đổi tệp đính kèm đối tượng đa phương tiện Định dạng văn bản có định dạng (RTF) sang định dạng văn bản Ngôn ngữ đánh dấu siêu văn bản (HTML). Tệp đính kèm đối tượng phương tiện được lưu trữ trong bảng Lưu trữ đối tượng phương tiện (F00165). Để thực hiện chuyển đổi, bạn chạy chương trình Convert RTF to HTML Text (P98MOHTM), chương trình này sẽ đọc các bản ghi trong F00165, tìm tất cả các tệp đính kèm văn bản và xác định những bản ghi cần chuyển đổi từ định dạng RTF sang HTML. Chương trình chuyển đổi cho phép bạn chuyển đổi tất cả các tệp đính kèm RTF trong F00165 trong một lần chạy hàng loạt hoặc bạn có thể chọn một nhóm bản ghi để chuyển đổi trong một lần chạy hàng loạt. Chương trình chuyển đổi đọc các tệp đính kèm văn bản trong F00165, tạo tệp đính kèm HTML tương đương cho bất kỳ tệp đính kèm RTF nào trong lần chạy hàng loạt và cập nhật các bản ghi F00165 thích hợp bằng văn bản HTML đã chuyển đổi

Khi quá trình chuyển đổi kết thúc, chương trình cung cấp trạng thái Đã hoàn thành hoặc Một phần cho các bản ghi được xử lý trong đợt. Trạng thái Một phần cho biết rằng một hoặc nhiều bản ghi không thể được chuyển đổi trong lô

Hệ thống tự động ghi lại các bản ghi không chuyển đổi được trong quá trình chuyển đổi vào nhật ký JAS của Trình quản lý máy chủ ở mức độ NGHIÊM TRỌNG. Bạn có thể đăng nhập vào Trình quản lý máy chủ và xem bản ghi nào không chuyển đổi được trong quá trình chuyển đổi. Bạn có thể sử dụng thông tin khóa chính (chẳng hạn như OBNM, TXKY và số thứ tự) để tìm tệp đính kèm cụ thể trong F00165 và sửa mọi lỗi theo cách thủ công

Trước khi bắt đầu quá trình chuyển đổi, bạn có thể định cấu hình nhật ký JAS của Trình quản lý Máy chủ ở cấp GỠ LỖI để xem các bản ghi đã chuyển đổi thành công trong quá trình chuyển đổi. Các bản ghi chuyển đổi thành công được ghi lại ở mức GỠ LỖI với tên thành phần RFTTOHTML

Chuyển đổi định dạng RTF thành HTML có thể là một việc vặt thực sự, nhưng nó chắc chắn là một tính năng hữu ích nếu bạn có thể tìm ra cách tốt để thực hiện nó. Đó là chủ đề của bài viết ngày hôm nay. làm cho việc thực hiện đó dễ dàng nhất có thể. Vì vậy, hãy quên tất cả những mã hóa mà bạn đang chuẩn bị thực hiện, vì bạn sẽ không cần đến nó. Tất cả những gì bạn thực sự cần là API Cloudmersive

Trước tiên hãy cài đặt ứng dụng khách

npm install cloudmersive-convert-api-client --save

Bây giờ gọi chức năng của chúng tôi, như vậy

var CloudmersiveConvertApiClient = require('cloudmersive-convert-api-client');var defaultClient = CloudmersiveConvertApiClient.ApiClient.instance;// Configure API key authorization: Apikeyvar Apikey = defaultClient.authentications['Apikey'];Apikey.apiKey = 'YOUR API KEY';// Uncomment the following line to set a prefix for the API key, e.g. "Token" (defaults to null)//Apikey.apiKeyPrefix = 'Token';var apiInstance = new CloudmersiveConvertApiClient.ConvertDocumentApi();var inputFile = "/path/to/file"; // File | Input file to perform the operation on.var callback = function(error, data, response) {if (error) {console.error(error);} else {console.log('API called successfully. Returned data: ' + data);}};apiInstance.convertDocumentRtfToHtml(inputFile, callback);

Xong. Phần còn lại của thư viện này bao gồm vô số định dạng tài liệu khác, cho phép chuyển đổi dễ dàng như thế này và cả các tùy chọn để thực hiện chỉnh sửa

Điều này tạo ra các tài liệu HTML hoàn chỉnh từ các tài liệu RTF. Hiện tại nó không có cơ sở để hoạt động trên các đoạn trích của một trong hai

Các tính năng được hỗ trợ

  • Phát hiện đoạn văn (kết quả là các thẻ

    ) cộng với việc cắt bỏ đoạn văn trống

  • Phông chữ (dưới dạng font-family: Font Name, Font Family). Các họ phông chữ trong RTF không ánh xạ hoàn hảo tới HTML. Đây là bản đồ chúng tôi hiện đang sử dụng
    • Roman. có chân
    • thụy sĩ. sans serif
    • script. chữ ẩu
    • thiết kế nội thất. tưởng tượng
    • hiện đại. sans serif
    • công nghệ. đơn cách
    • giá thầu. có chân
  • Cỡ chữ (như font-size: #pt)
  • In đậm (như )
  • Chữ nghiêng (như )
  • Gạch dưới (như )
  • Gạch ngang (như )
  • Chỉ số trên (như
    function outputTemplate (doc, defaults, content) {
      return `
    
      
        
        
      
      
        ${content.replace(/\n/, '\n    ')}
      
    `
    }
    0)
  • Chỉ số dưới (như
    function outputTemplate (doc, defaults, content) {
      return `
    
      
        
        
      
      
        ${content.replace(/\n/, '\n    ')}
      
    `
    }
    1)
  • Màu nền trước (như
    function outputTemplate (doc, defaults, content) {
      return `
    
      
        
        
      
      
        ${content.replace(/\n/, '\n    ')}
      
    `
    }
    2)
  • Màu nền (như
    function outputTemplate (doc, defaults, content) {
      return `
    
      
        
        
      
      
        ${content.replace(/\n/, '\n    ')}
      
    `
    }
    2)
  • Đoạn thụt lề dòng đầu tiên (như
    function outputTemplate (doc, defaults, content) {
      return `
    
      
        
        
      
      
        ${content.replace(/\n/, '\n    ')}
      
    `
    }
    4)
  • Vùng thụt lề (dưới dạng
    function outputTemplate (doc, defaults, content) {
      return `
    
      
        
        
      
      
        ${content.replace(/\n/, '\n    ')}
      
    `
    }
    5)
  • căn chỉnh văn bản. trái, phải, giữa, căn lề (như
    function outputTemplate (doc, defaults, content) {
      return `
    
      
        
        
      
      
        ${content.replace(/\n/, '\n    ')}
      
    `
    }
    6)

rtfToHTML([opts], cb) → WritableStream

  • opts - Các tùy chọn tùy chọn để chuyển tới trình tạo HTML. Xem phần trên để biết chi tiết
  • cb - Một cuộc gọi lại chấp nhận
    function outputTemplate (doc, defaults, content) {
      return `
    
      
        
        
      
      
        ${content.replace(/\n/, '\n    ')}
      
    `
    }
    7, xem phần trên để biết chi tiết

Trả về một WritableStream mà bạn có thể đưa vào

rtfToHTML. fromStream(stream[, opts], cb)

  • luồng - Một luồng có thể đọc được nên chứa RTF
  • opts - Các tùy chọn tùy chọn để chuyển tới trình tạo HTML. Xem phần trên để biết chi tiết
  • cb - Một cuộc gọi lại chấp nhận
    function outputTemplate (doc, defaults, content) {
      return `
    
      
        
        
      
      
        ${content.replace(/\n/, '\n    ')}
      
    `
    }
    7, xem phần trên để biết chi tiết

rtfToHTML. fromString(string[, opts], cb)

  • chuỗi - Một chuỗi chứa RTF
  • opts - Các tùy chọn tùy chọn để chuyển tới trình tạo HTML. Xem phần trên để biết chi tiết
  • cb - Một cuộc gọi lại chấp nhận
    function outputTemplate (doc, defaults, content) {
      return `
    
      
        
        
      
      
        ${content.replace(/\n/, '\n    ')}
      
    `
    }
    7, xem phần trên để biết chi tiết

Gọi lại

rtfToHTML trả về HTML được tạo từ RTF bằng Nút tiêu chuẩn. gọi lại kiểu js, sẽ chấp nhận các đối số sau. `(lỗi, html)`

Nếu chúng tôi gặp lỗi khi phân tích cú pháp thì nó sẽ được đặt thành rtf-parser0. Nếu không, HTML kết quả sẽ ở dạng rtf-parser1

Tùy chọn

Tùy chọn luôn là tùy chọn. Bạn có thể định cấu hình cách tạo HTML bằng cách sau
  • paraBreaks - (Mặc định là rtf-parser2) Được chèn vào giữa các đoạn kết quả
  • paraTag - (Mặc định là rtf-parser3) Tên thẻ để sử dụng cho các đoạn văn
  • mẫu - Một chức năng được sử dụng để tạo tài liệu HTML cuối cùng, mặc định là

    function outputTemplate (doc, defaults, content) {
      return `
    
      
        
        
      
      
        ${content.replace(/\n/, '\n    ')}
      
    `
    }

Bạn cũng có thể định cấu hình một số trạng thái bắt đầu (mặc định) của định dạng đầu ra với

  • disableFonts - Mặc định là rtf-parser4. Nếu bạn đặt giá trị này thành rtf-parser5 thì chúng tôi sẽ xuất thông tin thay đổi phông chữ khi chúng tôi gặp phải. Điều này hơi bị hỏng do kiểu không hỗ trợ của chúng tôi
  • fontSize - Mặc định cho kích thước phông chữ được khai báo trên toàn bộ tài liệu hoặc nếu thiếu, rtf-parser6
  • in đậm - Mặc định là rtf-parser5
  • in nghiêng - Mặc định là rtf-parser5
  • gạch dưới - Mặc định là rtf-parser5
  • gạch ngang - Mặc định là rtf-parser5
  • tiền cảnh - Mặc định là

    1

  • nền - Mặc định là

    2

  • firstLineIndent - Mặc định là giá trị toàn bộ tài liệu hoặc nếu giá trị đó bị thiếu,

    3. Đây là khoảng cách để thụt dòng đầu tiên của đoạn văn mới

  • thụt vào. Mặc định là

    3

  • căn chỉnh. Mặc định là

    5

  • valign. Mặc định là

    6

const rtfToHTML = yêu cầu('rtf-to-html/rtf-to-html. js')

rtfToHTML(doc[, opts]) → HTML

Đây là cách nội bộ các giao diện khác được triển khai. Không giống như các giao diện khác, giao diện này là đồng bộ

Làm cách nào để chuyển đổi văn bản thuần túy sang HTML trong JavaScript?

Bước 1. Thay thế các ký tự đặc biệt HTML bằng các tham chiếu ký tự được đặt tên. .
Step 2: Replace all line breaks with
.. .
Step 3: Replace double
tags with

.

Bạn có thể chuyển đổi RTF sang TXT không?

1. Chuyển đổi tệp RTF thành tệp văn bản bằng trình xử lý văn bản . Để thực hiện việc này, trước tiên hãy mở tệp trong một chương trình như Microsoft Word hoặc OpenOffice Writer. Chọn lệnh “Lưu dưới dạng” trong menu Tệp, chọn định dạng TXT trong menu thả xuống và nhấp vào “Lưu. ”

RTF sử dụng mã hóa nào?

Tệp RTF được mã hóa bằng cách sử dụng tiêu chuẩn American Standard Code for Information Exchange (ASCII) , giúp chúng dễ dàng chuyển giữa các máy tính khác nhau và . ASCII là mã tiêu chuẩn đại diện cho các ký tự sử dụng số và là mã hóa phổ biến nhất được sử dụng cho các tệp văn bản.

Làm cách nào để phân tích cú pháp RTF?

Cách trích xuất dữ liệu (trường, bảng và giá trị) từ tệp RTF .
Nhấp vào bên trong khu vực thả tệp để tải tệp RTF lên hoặc kéo và thả tệp RTF
Nhấp vào nút Phân tích cú pháp để phân tích dữ liệu từ tài liệu RTF của bạn
Khi tài liệu RTF của bạn được tải lên, ứng dụng Trình phân tích cú pháp sẽ được mở. Làm theo hướng dẫn để trích xuất dữ liệu