Hướng dẫn python split on regex - tách python trên regex

Hướng dẫn python split on regex - tách python trên regex

Nội dung chính

  • 1. Regex là gì?
  • 2. Regex trong Python.
  • 3. Sử dụng Regex với search(), match(), split()
  • 3.1 re.match()
  • 3.2 re.search()
  • 3.3 Một số flag hay dùng trong Regular Expression
  • 4. Kết Luận

Nội dung chính

  • 1. Regex là gì?
  • 2. Regex trong Python.
  • 3. Sử dụng Regex với search(), match(), split()
  • 3.1 re.match()
  • 3.2 re.search()
  • 3.3 Một số flag hay dùng trong Regular Expression
  • 4. Kết Luận

Đã đăng vào thg 11 27, 2017 9:57 SA 3 phút đọc 3 phút đọc

1. Regex là gì?

2. Regex trong Python.

2. Regex trong Python.

3. Sử dụng Regex với search(), match(), split()

import re

3. Sử dụng Regex với search(), match(), split()

3.1 re.match()

re.match(pattern, string, flags=0)

3.2 re.search()

3.3 Một số flag hay dùng trong Regular Expression

pattern : Đây là chuỗn cần so khớp.
string : Đây là chuỗi để tìm kiếm pattern cón tồn tại trong đó không.
flags : Bạn có thể xác định các flag khác nhau bởi sử dụng toán tử |. Các modifier này sẽ được liệt kê ở bảng bên dưới.

4. Kết Luận

>>> m = re.match(r"(?P\w+) (?P\w+)", "Malcolm Reynolds")
>>> m.group('first_name')
'Malcolm'
>>> m.group('last_name')
'Reynolds'
re.search(pattern, string, flags=0)

3.3 Một số flag hay dùng trong Regular Expression

4. Kết Luận

pattern: là chuỗi regular expression.
string: là chuỗi cần so khớp.
flags: là các kiểu so khớp mà bạn muốn thực hiện. Nếu để trống thì flags sẽ bằng 0.
>>> email = "[email protected]_thisger.net"
>>> m = re.search("remove_this", email)
>>> email[:m.start()] + email[m.end():]
'[email protected]'

Đã đăng vào thg 11 27, 2017 9:57 SA 3 phút đọc

re.split(pattern, string, maxsplit=0, flags=0)

4. Kết Luận

pattern: là chuỗi regular expression.
string: là chuỗi cần so khớp để loại bỏ pattern
maxsplit: số phần chia giới hạn. Trong quá trình split khi số phần đã đến maxspit thì dừng lại và trả về mảng gồm các phần chia trước đó và chuỗi còn lại.
flags: là các kiểu so khớp mà bạn muốn thực hiện. Nếu để trống thì flags sẽ bằng 0.
>>> re.split('[a-f]+', '0a3B9', flags=re.IGNORECASE)
['0', '3', '9']

3.3 Một số flag hay dùng trong Regular Expression

4. Kết Luận

4. Kết Luận

Đã đăng vào thg 11 27, 2017 9:57 SA 3 phút đọc

Regular expression (Regex) là một chuỗi miêu tả một bộ các chuỗi khác, theo những quy tắc cú pháp nhất định. Bạn cũng có thể gọi Regex là một ngôn ngữ. Và hầu như ngôn ngữ lập trình nào cũng hỗ trợ Regular expression.

Regular Expression trong Python được thể hiện qua module re, re Module cung cấp sự hỗ trợ đầy đủ các Regular Expression trong Python. Module này tạo Exception là re.error nếu xảy ra một lỗi trong khi biên dịch hoặc khi sử dụng một Regular Expression. Để sử dụng re việc đầu tiên bạn cần phải import module re vào chương trình, sử dụng với cú pháp như sau:



So khớp pattern với string với các flag tùy ý. Dưới đây là cú pháp cho hàm này.split() trong Python chia chuỗi theo delimeter đã cho (là space nếu không được cung cấp) và trả về danh sách các chuỗi con; nếu bạn cung cấp đối số num thì chia chuỗi thành num + 1 chuỗi con.


Chi tiết về tham số:

Hàm re.match trả về một đối tượng match nếu thành công và trả về None nếu thất bại. Chúng ta sử dụng hàm group(num) hoặc groups() của đối tượng match để lấy biểu thức đã được so khớp (kết nối).split() trong Python:

re.match(pattern, string, flags=0)
0

3.3 Một số flag hay dùng trong Regular Expression

  • 4. Kết Luận: Đây là bất kỳ phân chia chuỗi - delimeter nào, mặc định là khoảng trống.

  • Đã đăng vào thg 11 27, 2017 9:57 SA 3 phút đọc : Số chuỗi con num + 1 được tạo ra.


Regular expression (Regex) là một chuỗi miêu tả một bộ các chuỗi khác, theo những quy tắc cú pháp nhất định. Bạn cũng có thể gọi Regex là một ngôn ngữ. Và hầu như ngôn ngữ lập trình nào cũng hỗ trợ Regular expression.

re.match(pattern, string, flags=0)
1

Regular Expression trong Python được thể hiện qua module re, re Module cung cấp sự hỗ trợ đầy đủ các Regular Expression trong Python. Module này tạo Exception là re.error nếu xảy ra một lỗi trong khi biên dịch hoặc khi sử dụng một Regular Expression. Để sử dụng re việc đầu tiên bạn cần phải import module re vào chương trình, sử dụng với cú pháp như sau:

re.match(pattern, string, flags=0)
2