Hướng dẫn regex trong python
RegEx hay biểu thức chính quy (Regular Expression) là một chuỗi ký tự tạo thành một biểu mẫu tìm kiếm (search pattern). RegEx được sử dụng để kiểm tra xem một chuỗi có chưa mẫu tìm kiêms được chỉ định hay không. Show RegEx moduleTrong python, có một gói tích hợp có tên
RegEx trong pythonSau khi import module
Các hàm xử lý RegExModule
1. Hàm findall()In ra tất cả những đoạn phù hợp:
Hoặc nếu không tìm thấy kết quả nào phù hợp thì trả về một danh sách rỗng
2. Hàm search()Tìm kiếm khoảng trắng đầu tiên trong chuỗi:
Hoặc sẽ trả về None nếu không tìm thấy
3. Hàm split()Tách các từ trong câu:
Chúng ta có thể chỉ định số lần xuất hiện qua tham số
4. Hàm sub()Thay thế mọi khoảng trắng bằng số 9:
Hoặc có thể hạn chế số lần thay thế qua tham số
MetacharactersMetacharacters là những ký tự có ý nghĩa đặc biệt
Special SequencesSpecial Sequences là chuỗi đặc biệt và được bắt đầu bằng ký tự
SetsSets là tập hợp các ký tự bên trong dấu
Đối tượng MatchMatch là đối tượng chứa thông tin về tìm kiếm phù hợp và kết quả của chúng. Nếu không có tìm kiếm nào phù hợp thì sẽ trả về .string trả về chuỗi được truyền vào hàm .span() trả về một tuple chứa điểm bắt đầu và kết thúc của vị trí phù hợp .group() trả về phần chuỗi phù hợp In ra vị trị bắt đầu và kết thúc của lần xuất
hiện đầu tiên của từ bắt đầu bằng chữ
In ra chuỗi đã được truyền vào hàm:
In ra đoạn phù hợp với biểu thức trong chuỗi cho trước:
Tổng kếtRegEx thật sự rất mạnh mạnh mẽ và nó sẽ giúp các bạn xử lý được rất nhiều bài toán khó, phức tạp nếu áp dụng cách thông thường. Nhưng nó cũng thực sự khá rối rắm với nhưng người chưa tìm hiểu kỹ về nó. Hy vọng các bạn sẽ tìm được niềm vui khi sử dụng RegEx |