Trong regex Python

Một trong những ngôn ngữ lập trình phổ biến nhất hiện nay, Python có nhiều tính năng mạnh mẽ cho phép các nhà khoa học và nhà phân tích dữ liệu trích xuất giá trị thực từ dữ liệu. Một trong số đó, biểu thức chính quy trong Python, là tập hợp các ký tự đặc biệt được sử dụng để mô tả hoặc tìm kiếm các mẫu trong một chuỗi nhất định. Chúng chủ yếu được sử dụng để làm sạch dữ liệu hoặc khớp mẫu trong tệp văn bản.   

Biểu thức chính quy Python [RegEx] là gì?

Một biểu thức chính quy của Python là một chuỗi các siêu ký tự xác định một mẫu tìm kiếm. Chúng tôi sử dụng các mẫu này trong thuật toán tìm kiếm chuỗi để "tìm" hoặc "tìm và thay thế" trên các chuỗi.  

Thuật ngữ "biểu thức chính quy" thường được rút ngắn thành "RegEx"

Trong hướng dẫn này, chúng ta sẽ tìm hiểu những kiến ​​thức cơ bản về biểu thức chính quy trong Python thông qua phần trình diễn. Chúng ta sẽ bắt đầu bằng cách nhập mô-đun “re” của mình.  

Quả sung. Nhập mô-đun biểu thức chính quy [lại]

Hàm RegEx

Mô-đun “re” cung cấp một tập hợp các chức năng cho phép chúng tôi tìm kiếm một chuỗi cho phù hợp. Một số chức năng được liệt kê dưới đây

  • hàm findall[]

Hàm findall[] trả về một danh sách chứa tất cả các kết quả khớp

Ví dụ

Quả sung. hàm findall[]

  • chức năng tìm kiếm

Hàm search[] lấy một mẫu biểu thức chính quy và một chuỗi và nó tìm kiếm mẫu đó trong chuỗi. Nếu tìm kiếm thành công, search[] trả về một đối tượng khớp. Mặt khác, nó không trả lại bất kỳ

Ví dụ

Quả sung. chức năng tìm kiếm

  • chức năng tách []

Hàm split[] trả về một danh sách hiển thị vị trí chuỗi đã được tách ở mỗi lần khớp

Ví dụ

Quả sung. chức năng tách []

Nó tách chuỗi khi gặp khoảng trắng trong chuỗi

Khóa đào tạo Python

Tìm hiểu về thao tác dữ liệu trong Python Khám phá khóa học

Python RegEx. Siêu ký tự

Mọi ký tự trong Python RegEx đều là ký tự meta hoặc ký tự thông thường. Một siêu ký tự có một ý nghĩa đặc biệt, trong khi một ký tự thông thường khớp với chính nó

Một số siêu ký tự cơ bản được sử dụng trong RegEx bao gồm

  • “^”

Ký tự ‘^’ kiểm tra xem chuỗi có bắt đầu bằng một từ hoặc ký tự cụ thể không

Ví dụ.  

Quả sung. ký tự ^ trong Python RegEx

  • “$”

Ký tự ‘$‘ kiểm tra xem chuỗi có kết thúc bằng một từ hoặc ký tự cụ thể không

Ví dụ

  • “. ”

Các '. ‘ ký tự được sử dụng để kiểm tra một trong hai/hoặc điều kiện

Ví dụ

Quả sung. . nhân vật

  • “+”

Điều này khớp với một hoặc nhiều lần xuất hiện của một ký tự trong một chuỗi

Ví dụ

Quả sung. + nhân vật

  • “*”

Điều này trả về 0 hoặc nhiều lần xuất hiện của một ký tự trong một chuỗi

Ví dụ

Quả sung. * nhân vật

Nhân vật

Sự miêu tả

{ }

Khớp chính xác số lần xuất hiện đã chỉ định

*

Không khớp hoặc nhiều lần xuất hiện hơn

+

So khớp một hoặc nhiều lần xuất hiện

[ ]

So khớp với một tập hợp các ký tự

khóa học miễn phí. Giới thiệu về Numpy

Nắm vững các nguyên tắc cơ bản của Numpy Đăng ký ngay

Python RegEx - Trình tự đặc biệt

Một chuỗi đặc biệt là ký hiệu ‘ \ ‘, theo sau là một trong các ký tự cụ thể. Một số trình tự đặc biệt bao gồm

  • \MỘT

Điều này kiểm tra xem chuỗi có bắt đầu bằng một ký tự cụ thể không

Ví dụ

Quả sung. \Một chuỗi trong Python RegEx

  • "\S"

Chuỗi \s trả về kết quả khớp khi chuỗi chứa các ký tự khoảng trắng

Ví dụ

Quả sung. \s trình tự

  • “\d”

Trình tự \d kiểm tra xem có bất kỳ chữ số nào trong chuỗi đã cho không

Ví dụ

Quả sung. trình tự \d

  • “\Z”

Trình tự \Z kiểm tra xem chuỗi có kết thúc bằng một từ cụ thể không

Ví dụ

Quả sung. trình tự \Z

  • “\w”

Trình tự \w trả về kết quả khớp ở mọi ký tự từ

Ví dụ

Quả sung. \w trình tự trong Python RegEx

Python RegEx - Bộ

Nhân vật

Sự miêu tả

[ à ]

Trả về kết quả khớp khi có bất kỳ ký tự nào được đề cập

[ Ah ]

Trả về kết quả khớp cho các ký tự chữ thường giữa a và h

[ ^à ]

Trả về một kết quả phù hợp cho mọi ký tự ngoại trừ a, g và h

  • “[à]”

Ví dụ

Quả sung. đặt ví dụ

  • "[Ah]"

Ví dụ

Quả sung. Đặt ví dụ trong Python RegEx

  • “[^ah]”

Ví dụ

Quả sung. đặt ví dụ

Mong muốn chuyển sang lập trình?

Phần kết luận

Trong bài viết này, chúng ta đã thảo luận về các biểu thức chính quy của Python. Chúng tôi đã xem xét các hàm và siêu ký tự khác nhau trong Python RegEx thông qua các minh họa.  

Nếu bạn có bất kỳ câu hỏi nào, vui lòng hỏi họ trong phần bình luận và chúng tôi sẽ có các chuyên gia của chúng tôi trả lời ngay cho bạn

Bạn muốn tìm hiểu thêm về Python?

Python là một công cụ thiết yếu mà tất cả các nhà phân tích và nhà khoa học dữ liệu khao khát nên thành thạo. Nếu bạn quan tâm đến việc thêm kỹ năng rất được thèm muốn này vào sơ yếu lý lịch của mình, hãy đăng ký Khóa đào tạo Python của chúng tôi ngay hôm nay

Giới thiệu về tác giả

Aryan Gupta

Aryan là một người đam mê công nghệ, thích cập nhật các xu hướng công nghệ ngày nay. Anh ấy đam mê tất cả mọi thứ về công nghệ, một nhà nghiên cứu sắc sảo và viết để truyền cảm hứng. Bên cạnh công nghệ, anh ấy là một cầu thủ bóng đá tích cực và là một người đam mê trò chơi

\\ A trong regex là gì?

\A luôn khớp ở đầu chuỗi chỉ trong tất cả các hương vị hỗ trợ nó . Không có vấn đề với ngắt dòng. ^ chỉ có thể khớp ở đầu chuỗi hoặc ở đầu bất kỳ dòng nào tùy thuộc vào hương vị regex và các tùy chọn regex.

'\ s +' trong Python là gì?

Vì \S+ có nghĩa là “ chuỗi ký tự không phải khoảng trắng ” và \s+ có nghĩa là “chuỗi ký tự khoảng trắng”, điều này đúng .

?= * Có nghĩa là gì trong regex?

?= là một cái nhìn tích cực, một loại xác nhận có độ rộng bằng 0 . Điều nó nói là trận đấu được bắt phải được theo sau bởi bất cứ điều gì trong ngoặc đơn nhưng phần đó không được bắt. Ví dụ của bạn có nghĩa là trận đấu cần phải được theo sau bởi 0 hoặc nhiều ký tự và sau đó là một chữ số [nhưng một lần nữa, phần đó không được ghi lại].

D+ trong regex Python là gì?

Cái này đang làm gì vậy? . Vì vậy, \D+ khớp với một hoặc nhiều ký tự không phải là chữ số . Đây là những gì chúng tôi đang sử dụng thay cho dấu gạch nối theo nghĩa đen, để cố gắng khớp các dấu phân cách khác nhau.

Chủ Đề