Hướng dẫn is an html file a plain text? - một tệp html có phải là một văn bản thuần túy không?

HTML (Ngôn ngữ đánh dấu siêu văn bản) là một cách tiếp cận dựa trên văn bản để mô tả cách cấu trúc nội dung trong tệp HTML. Đánh dấu này cho thấy một trình duyệt web cách hiển thị văn bản, hình ảnh và các hình thức đa phương tiện khác trên trang web.

HTML là một khuyến nghị chính thức của World Wide Web Consortium (W3C) và thường được tất cả các trình duyệt web lớn tuân thủ, bao gồm cả trình duyệt web trên máy tính để bàn và di động. & NBSP; HTML5 & NBSP;

Cách HTML hoạt động

HTML là một tệp văn bản chứa các quy ước, tệp và đặt tên cụ thể cho thấy máy tính và máy chủ web rằng nó có trong HTML và nên được đọc như vậy. Bằng cách áp dụng các quy ước HTML này vào tệp văn bản trong hầu hết mọi trình soạn thảo văn bản, người dùng có thể viết và thiết kế một trang web cơ bản, sau đó tải nó lên Internet.

Cơ bản nhất của các quy ước HTML là bao gồm khai báo loại tài liệu ở đầu tệp văn bản. Điều này luôn xuất hiện đầu tiên trong tài liệu, bởi vì đó là phần khẳng định thông báo cho một máy tính rằng đây là tệp HTML. Tiêu đề tài liệu thường trông như thế này:. Nó phải luôn luôn được viết theo cách đó, mà không có bất kỳ nội dung nào bên trong nó hoặc phá vỡ nó. Bất kỳ nội dung nào đến trước khi tuyên bố này sẽ không được công nhận là HTML bởi máy tính.

DocTypes không chỉ được sử dụng cho HTML, chúng có thể áp dụng cho việc tạo bất kỳ tài liệu nào sử dụng SGML & NBSP; (Ngôn ngữ đánh dấu tổng quát tiêu chuẩn). SGML là một tiêu chuẩn để chỉ định một ngôn ngữ đánh dấu cụ thể đang được sử dụng. HTML là một trong một số ngôn ngữ đánh dấu mà các tuyên bố của SGML và DOCTYPE áp dụng cho.

Yêu cầu quan trọng khác để tạo tệp HTML là lưu nó bằng phần mở rộng tệp .html. Trong khi Tuyên bố DOCTYPE tín hiệu HTML đến máy tính từ bên trong tệp, thì phần mở rộng tệp báo hiệu HTML đến máy tính từ bên ngoài tệp. Bằng cách có cả hai, một máy tính có thể cho biết rằng đó là một tệp HTML cho dù nó có đọc tệp hay không. Điều này trở nên đặc biệt quan trọng khi tải các tệp lên web, bởi vì máy chủ web cần biết phải làm gì với các tệp trước khi có thể gửi chúng đến máy khách để đọc nội dung bên trong.

Sau khi viết DoctType và lưu dưới dạng tệp HTML, người dùng có thể triển khai tất cả các công cụ cú pháp khác của HTML để tùy chỉnh một trang web. Sau khi hoàn thành, họ có thể sẽ có một số tệp HTML tương ứng với các trang khác nhau của trang web. & NBSP; Điều quan trọng là người dùng tải lên các tệp này theo cùng một hệ thống phân cấp mà họ đã lưu chúng vào, vì mỗi trang tham chiếu các đường dẫn tệp cụ thể của các trang khác, cho phép liên kết giữa chúng. Tải chúng lên theo một thứ tự khác sẽ khiến các liên kết bị hỏng và các trang bị mất, vì các đường dẫn tệp được chỉ định sẽ không khớp với các trang.

Các yếu tố cơ bản của HTML

Sử dụng HTML, một tệp văn bản được đánh dấu thêm với văn bản bổ sung mô tả cách hiển thị tài liệu. Để giữ cho đánh dấu tách biệt với nội dung thực tế của tệp HTML, có một cú pháp HTML đặc biệt, phân biệt được sử dụng. Các thành phần đặc biệt này được gọi là thẻ HTML & NBSP; Các thẻ có thể chứa các cặp giá trị tên được gọi là & nbsp; thuộc tính và một phần nội dung được đặt trong một thẻ được gọi là phần tử HTML.

Các phần tử HTML luôn có thẻ mở, nội dung ở giữa và đóng thẻ. Các thuộc tính có thể cung cấp thông tin bổ sung về phần tử và được bao gồm trong thẻ mở. Các yếu tố có thể được mô tả theo một trong hai cách:

  1. Các yếu tố cấp khối bắt đầu trên một dòng mới trong tài liệu và chiếm không gian riêng của họ. Ví dụ về các yếu tố này bao gồm các tiêu đề và thẻ đoạn văn.
  2. Các yếu tố nội tuyến không bắt đầu trên một dòng mới trong tài liệu và chỉ chiếm không gian cần thiết. Các yếu tố này thường định dạng nội dung của các phần tử cấp khối. Ví dụ về các yếu tố nội tuyến bao gồm các thẻ siêu liên kết và thẻ định dạng văn bản.

Ưu và nhược điểm của HTML

Ưu điểm của việc sử dụng HTML bao gồm:

  • Được áp dụng rộng rãi với một lượng lớn tài nguyên có sẵn.
  • Được chạy trên mỗi trình duyệt.
  • Là tương đối dễ học.
  • Có mã nguồn sạch và nhất quán.
  • Là nguồn mở và miễn phí để sử dụng.
  • Có thể được tích hợp với các ngôn ngữ lập trình phụ trợ khác như PHP.

Một vài nhược điểm cần xem xét là:

  • Không có chức năng rất năng động và chủ yếu được sử dụng cho các trang web tĩnh.
  • Tất cả các thành phần phải được tạo riêng biệt ngay cả khi chúng sử dụng các yếu tố tương tự.
  • Hành vi trình duyệt có thể không thể đoán trước. Ví dụ: trình duyệt cũ hơn có thể không tương thích với các tính năng mới hơn.

Thẻ HTML thường được sử dụng

Thẻ HTML chỉ ra cấu trúc tổng thể của một trang và cách các phần tử trong chúng sẽ được hiển thị trong trình duyệt. Thẻ HTML thường được sử dụng bao gồm:

  • trong đó mô tả một tiêu đề cấp cao nhất.
  • trong đó mô tả một tiêu đề cấp hai.
  • trong đó mô tả một đoạn văn.
  • trong đó mô tả dữ liệu bảng.
  • trong đó mô tả một danh sách thông tin được đặt hàng.
  • trong đó mô tả một danh sách thông tin không đặt hàng.

Như đã đề cập, có các thẻ mở và đóng bao quanh nội dung họ đang tăng cường. Một thẻ mở trông như thế này:. Một thẻ đóng là giống nhau nhưng chứa một dấu gạch chéo ngược trong đó để chỉ ra rằng đó là kết thúc của phần tử HTML đã cho. Đóng thẻ trông như thế này:.

Cách sử dụng và thực hiện HTML

Bởi vì HTML hoàn toàn dựa trên văn bản, một tệp HTML có thể được chỉnh sửa chỉ bằng cách mở nó trong một chương trình như Notepad ++, VI hoặc Emacs. Bất kỳ trình soạn thảo văn bản nào cũng có thể được sử dụng để tạo hoặc chỉnh sửa tệp HTML và miễn là nó được đặt tên với phần mở rộng tệp .html, bất kỳ trình duyệt web nào - chẳng hạn như Chrome hoặc Firefox - sẽ có khả năng hiển thị tệp dưới dạng trang web .

Đối với các nhà phát triển phần mềm chuyên nghiệp, có nhiều & nbsp; wysiwyg & nbsp; biên tập viên để phát triển các trang web. & Nbsp; Thực hiện HTML.

Các biên tập viên WYSIWYG này cũng cung cấp các phương tiện xử lý sự cố HTML, mặc dù các trình duyệt web hiện đại thường chứa các plugin nhà phát triển web sẽ làm nổi bật các vấn đề với các trang HTML, chẳng hạn như thẻ đóng hoặc cú pháp bị thiếu không tạo ra HTML được định dạng tốt.

Cả Chrome và Firefox đều bao gồm các công cụ phát triển HTML cho phép xem ngay tệp HTML hoàn chỉnh của trang web, cùng với khả năng chỉnh sửa HTML khi đang bay và kết hợp ngay lập tức các thay đổi trong trình duyệt Internet.

HTML, CSS và JavaScript

HTML được sử dụng để tạo các trang web nhưng không có giới hạn khi nói đến các thành phần đáp ứng đầy đủ. Do đó, HTML chỉ nên được sử dụng để thêm các thành phần văn bản và cấu trúc chúng trong một trang. Đối với các tính năng phức tạp hơn, HTML có thể được kết hợp với các bảng kiểu xếp tầng (CSS) và JavaScript (JS).

Tệp HTML có thể liên kết với tệp kiểu xếp tầng hoặc tệp JS - thường ở đầu tài liệu với đường dẫn tệp được chỉ định - sẽ chứa thông tin về màu sắc nào sẽ sử dụng, phông chữ nào để sử dụng và thông tin hiển thị phần tử HTML khác. JavaScript cũng cho phép các nhà phát triển bao gồm các chức năng động hơn, chẳng hạn như cửa sổ bật lên và thanh trượt ảnh, trong một trang web. Các thẻ được gọi là thuộc tính lớp được sử dụng để phù hợp với các phần tử HTML với các phần tử CSS hoặc JS tương ứng của chúng.

Ví dụ: nếu người dùng muốn màu của một lượng văn bản nhất định có màu đỏ, họ có thể viết mã trong tệp CSS với thuộc tính lớp đi kèm để chuyển văn bản màu đỏ. Sau đó, họ có thể đặt thuộc tính lớp liên quan trên tất cả các đoạn văn bản mà họ muốn có màu đỏ trong trang HTML. Phương pháp cơ bản tương tự áp dụng cho các tấm JS, với các chức năng khác nhau. & NBSP;

Tách thông tin về cách cấu trúc một trang, vai trò của HTML, từ thông tin về cách một trang web trông như thế nào khi nó được hiển thị trong trình duyệt là một mô hình phát triển phần mềm và thực tiễn tốt nhất được gọi là phân tách các mối quan tâm.

Lịch sử và phát triển

Trong những ngày đầu của World Wide Web, đánh dấu các tài liệu dựa trên văn bản bằng cách sử dụng HTML & NBSP; cú pháp & NBSP; quá đủ để tạo điều kiện chia sẻ các tài liệu học thuật và ghi nhớ kỹ thuật. Tuy nhiên, khi internet mở rộng ra ngoài các bức tường của học viện và vào các ngôi nhà của dân số nói chung, nhu cầu lớn hơn được đặt trên các trang web về định dạng và tương tác.

HTML 4.01 được phát hành vào năm 1999, vào thời điểm Internet chưa phải là tên hộ gia đình và & NBSP; HTML5 & NBSP; không được chuẩn hóa cho đến năm 2014. Vai trò của cũng mô tả cách nhìn nội dung khi một trang web hiển thị nó.

Do đó, các trang web dựa trên HTML4 thường bao gồm thông tin trong thẻ về những gì sẽ sử dụng phông chữ khi hiển thị văn bản, nên sử dụng màu nào cho nền và cách căn chỉnh nội dung. Mô tả trong thẻ HTML làm thế nào một phần tử HTML nên được định dạng khi được hiển thị trên trang web được coi là một html & nbsp; antippottern. HTML thường mô tả cách cấu trúc nội dung, chứ không phải cách nó được tạo kiểu và hiển thị trong một trình duyệt. Các ngôn ngữ đánh dấu khác phù hợp hơn với nhiệm vụ này.

Một sự khác biệt lớn giữa HTML4 và HTML5 là việc tách các mẫu mối quan tâm được thực thi nghiêm ngặt hơn trong HTML5 so với HTML4. Với HTML5, các thẻ in đậm và in nghiêng đã bị phản đối. Đối với thẻ đoạn văn, thuộc tính căn chỉnh đã bị xóa hoàn toàn khỏi đặc tả HTML.

Phiên bản HTML

Sau đây là danh sách các phiên bản HTML và những năm chúng được tạo ra. Một số lần lặp của mỗi phiên bản đã được phát hành theo thời gian. Danh sách này nhằm tập trung vào các lần lặp lại quan trọng.

  • HTML 1.0 - Được phát hành vào năm 1992 - có khả năng rất hạn chế và khoảng 20 yếu tố.
  • HTML 2.0 - được phát hành vào năm 1995 - bắt đầu kết hợp các yếu tố liên quan đến các chức năng toán học.
  • HTML 3.2 - được phát hành vào năm 1996 - đã loại bỏ sáng kiến ​​chức năng toán học hoàn toàn và cố định sự chồng chéo giữa các tiện ích mở rộng độc quyền khác nhau.
  • HTML 4.0 - được phát hành vào năm 1997 - đã cung cấp ba biến thể khác nhau về số lượng các yếu tố không dùng nữa được cho phép.
  • HTML 4.01 - Phát hành năm 1999 - phần lớn giống như 4.0.
  • HTML 5 - được phát hành vào năm 2014 - đã đến sau một thời gian dài cập nhật vì tổ chức đã phát triển nó - W3C - đã tập trung vào một ngôn ngữ song song khác được gọi là XHTML.
  • HTML 5.1 - Được phát hành vào năm 2016 - nhằm mục đích dễ dàng chứa nhiều loại phương tiện khác nhau với các thẻ mới.
  • HTML 5.2 - Được phát hành vào năm 2017 - nhằm mục đích dễ hiểu như con người và máy tính.
  • HTML 5.3 - Vẫn chưa được phát hành - W3C đang hợp tác với Whatwg trên một phiên bản mới. Sự hợp tác bắt đầu vào năm 2019.

Các tính năng của HTML5

HTML5 giới thiệu một số yếu tố để tăng khả năng tương tác, khả năng đa phương tiện và hiệu quả ngữ nghĩa. Thay vì sử dụng các plugin, có thể đặt đa phương tiện trong mã HTML. Những yếu tố này bao gồm:

  • Các yếu tố đồ họa:
    • , tạo ra một không gian hình chữ nhật trống trong đó các nhà thiết kế web có thể vẽ bằng JavaScript.
    • , là một thùng chứa cho đồ họa vector có thể mở rộng (SVG).
  • Các yếu tố ngữ nghĩa:
    • , tạo ra một tiêu đề ở đầu trang.
    • , tạo ra một chân trang ở cuối trang.
    • , tạo ra một khu vực cho nội dung độc lập.
    • , trong đó xác định các phần và phần phụ như chương, hoặc tiêu đề và chân trang khi cần nhiều hơn một.
    • , tạo ra một menu điều hướng.
  • Các yếu tố đa phương tiện:
    • , mô tả các tệp MP3, tệp WAV và tệp OGG trong HTML.
    • , trong đó mô tả các loại video MP4, WebM và OGG.
  • Các thuộc tính áp dụng cho phần tử, tạo ra một khu vực cho đầu vào người dùng trên trang web. Chúng bao gồm số, ngày, lịch và phạm vi.

Các tính năng chính khác của HTML5 bao gồm:

  • Loại bỏ các thuộc tính bị lỗi thời hoặc dư thừa.
  • Chỉnh sửa ngoại tuyến.
  • Khả năng kéo và thả giữa các tài liệu HTML5.
  • Cải tiến nhắn tin.
  • Phân tích chi tiết
  • MIME và & NBSP; Giao thức & NBSP; Đăng ký xử lý.
  • Một tiêu chuẩn phổ biến để lưu trữ dữ liệu trong cơ sở dữ liệu SQL (web SQL).
  • Giao diện chương trình ứng dụng (API) cho các ứng dụng phức tạp.
  • Chỗ ở cho phát triển ứng dụng thiết bị di động.
  • Mathml cho các công thức toán học và khoa học.

Mặc dù việc bổ sung các tính năng này thể hiện nỗ lực hỗ trợ nhúng đa phương tiện, các thay đổi đối với đặc tả HTML thể hiện mong muốn của cộng đồng đối với HTML để trở lại mục đích ban đầu là mô tả cấu trúc của nội dung. Về cơ bản, nhiều tính năng cấu trúc hơn đã được thêm vào, trong khi một số tính năng tập trung vào định dạng đã được phản đối. Với mục đích tương thích ngược, các trình duyệt web sẽ tiếp tục hỗ trợ các thẻ HTML không dùng nữa, nhưng cuối cùng HTML sẽ chủ yếu dựa trên cấu trúc.

Tiêu chuẩn cú pháp HTML

Trong ví dụ HTML sau đây, có hai phần tử HTML. Cả hai phần tử đều sử dụng cùng một thẻ đoạn văn, được chỉ định với chữ P và cả hai đều sử dụng DIR thuộc tính định hướng, mặc dù giá trị thuộc tính khác nhau được gán cho cặp giá trị tên của thuộc tính HTML, cụ thể là RTL và LTR.

Lưu ý rằng khi đoạn trích HTML này được hiển thị trong trình duyệt, các thẻ HTML tác động đến cách mỗi phần tử HTML được hiển thị trên trang, nhưng không có thẻ HTML nào được hiển thị. HTML chỉ đơn giản mô tả cách hiển thị nội dung. Bản thân HTML không bao giờ được hiển thị cho người dùng cuối.

Để trình duyệt web hiển thị trang HTML mà không có lỗi, nó phải được cung cấp HTML được định dạng tốt. Để được hình thành tốt, mỗi phần tử HTML phải được chứa trong thẻ mở--và thẻ đóng-. Hơn nữa, bất kỳ thẻ mới nào được mở trong một thẻ khác phải được đóng trước khi thẻ chứa được đóng. Vì vậy, ví dụ, HTML được hình thành tốt là HTML được hình thành tốt, trong khi HTML được hình thành tốt không phải là HTML được hình thành tốt.

Một quy tắc cú pháp khác là các thuộc tính HTML nên được đặt trong các trích dẫn đơn hoặc kép. Thường có tranh luận về định dạng nào là chính xác về mặt kỹ thuật, nhưng thế giới Web Consortium khẳng định rằng cả hai phương pháp đều được chấp nhận.

Lời khuyên tốt nhất để lựa chọn giữa trích dẫn đơn và đôi là giữ cho việc sử dụng nhất quán trên tất cả các tài liệu. Máy kiểm tra kiểu HTML có thể được sử dụng để thực thi sử dụng nhất quán trên các trang. Cần lưu ý rằng đôi khi sử dụng một trích dẫn duy nhất là bắt buộc, chẳng hạn như trong một trường hợp trong đó giá trị thuộc tính thực sự chứa một ký tự trích dẫn kép. Điều ngược lại cũng đúng.

Điều quan trọng cần lưu ý là ngôn ngữ HTML hoạt động với tiếng Anh cơ bản. Các ký tự không phải là tiếng Anh-hoặc các chữ cái-chẳng hạn như Trung Quốc hoặc các ký hiệu đặc biệt-như các chữ cái có điểm nhấn-có thể không hiển thị chính xác trên trang web theo mặc định. Để phù hợp với các bộ ký tự đặc biệt, người dùng cần chỉ định mã hóa ký tự với một phần tử trông như thế này:. Trong trường hợp này, UTF-8 là bộ ký tự. UTF-8 là Charset tiếng Anh mặc định của HTML.

Những gì được coi là văn bản đơn giản?

Văn bản thuần túy (. TXT) là một loại tệp kỹ thuật số không có thẻ máy tính, định dạng đặc biệt và mã.Đây là loại tệp duy nhất được công nhận bởi Trình phân tích Lexile.Lưu ý: Sao chép và dán hoặc tải lên các tệp văn bản và văn bản khác với văn bản thuần túy có thể bao gồm thẻ máy tính, định dạng đặc biệt và mã.a type of digital file that is free of computer tags, special formatting, and code. This is the only file type recognized by the Lexile Analyzer. Note: Copying and pasting or uploading text and text files other than plain text may include computer tags, special formatting, and code.

Làm cách nào để lưu HTML dưới dạng văn bản đơn giản?

Lưu trang web dưới dạng tệp trang web (. HTM hoặc. Tiện ích mở rộng tệp HTML) ...
Nhấp lại tab Tệp, sau đó nhấp vào tùy chọn Lưu dưới dạng ..
Trong danh sách lưu xuống dưới dạng loại, chọn tùy chọn văn bản đơn giản (*. TXT).....
Nhấp vào nút Lưu để lưu dưới dạng tài liệu văn bản ..