Python regex ký tự tiếng Anh chỉ

Đầu vào. test_list = ['Tốt. ????’, ‘??Geeks???’] Đầu ra. [] Giải trình. Cả hai đều chứa các ký tự không phải tiếng Anh. test_list = [“Gfg”, “Tốt nhất”] Đầu ra. [“Gfg”, “Tốt nhất”] Giải thích. Cả hai đều là từ tiếng Anh hợp lệ

Phương pháp số 1. Sử dụng regex + findall[] + hiểu danh sách

Trong phần này, chúng tôi tạo một biểu thức chính của unicodes và kiểm tra sự xuất hiện trong Danh sách chuỗi, trích xuất từng Chuỗi mà không có unicode bằng cách sử dụng findall[]

Python3




# Python3 code to demonstrate working of

# Remove Non-English characters Strings from List

________số 8

import

BuckyBarnes
0

 

BuckyBarnes
1

BuckyBarnes
2
BuckyBarnes
3
BuckyBarnes
4# Python3 code to demonstrate working of0# Python3 code to demonstrate working of1# Python3 code to demonstrate working of2# Python3 code to demonstrate working of1# Python3 code to demonstrate working of4# Python3 code to demonstrate working of1# Python3 code to demonstrate working of6# Python3 code to demonstrate working of7

Trong hướng dẫn này, chúng ta sẽ xem xét cách chỉ giữ lại các chữ cái [trích xuất bảng chữ cái] từ một chuỗi trong Python với sự trợ giúp của các ví dụ

Làm cách nào để chỉ trích xuất các bảng chữ cái từ một chuỗi trong Python?

[email protected]" # keep only letters res = "" for ch in s: if ch.isalpha[]: res += ch print[res]3 để chỉ giữ lại các ký tự trong một chuỗi

Hãy xem xét cả hai phương pháp với sự trợ giúp của các ví dụ –

Trích xuất bảng chữ cái từ một chuỗi bằng regex

Bạn có thể sử dụng biểu thức chính quy

# string with letters, numbers, and special characters
s = "[email protected]"
# keep only letters
res = ""
for ch in s:
    if ch.isalpha[]:
        res += ch
print[res]
4 để khớp với các ký tự không thuộc bảng chữ cái trong chuỗi và thay thế chúng bằng một chuỗi trống bằng hàm
# string with letters, numbers, and special characters
s = "[email protected]"
# keep only letters
res = ""
for ch in s:
    if ch.isalpha[]:
        res += ch
print[res]
5. Chuỗi kết quả sẽ chỉ chứa các chữ cái

Hãy xem một ví dụ

import re

# string with letters, numbers, and special characters
s = "[email protected]"
# keep only letters
res = re.sub[r'[^a-zA-Z]', '', s]
print[res]

đầu ra

BuckyBarnes

Bạn có thể thấy rằng chuỗi kết quả chỉ chứa các chữ cái

Sử dụng hàm chuỗi
# string with letters, numbers, and special characters
s = "[email protected]"
# keep only letters
res = ""
for ch in s:
    if ch.isalpha[]:
        res += ch
print[res]
3

Ngoài ra, bạn có thể sử dụng hàm chuỗi

# string with letters, numbers, and special characters
s = "[email protected]"
# keep only letters
res = ""
for ch in s:
    if ch.isalpha[]:
        res += ch
print[res]
3 để xóa các ký tự không thuộc bảng chữ cái khỏi chuỗi. Sử dụng các bước sau –

  1. Tạo một chuỗi trống để lưu trữ chuỗi kết quả của chúng tôi chỉ có các chữ cái
  2. Lặp lại qua từng ký tự trong chuỗi đã cho của chúng tôi
  3. Đối với mỗi ký tự, hãy kiểm tra xem đó có phải là bảng chữ cái hay không bằng cách sử dụng hàm chuỗi
    # string with letters, numbers, and special characters
    s = "[email protected]"
    # keep only letters
    res = ""
    for ch in s:
        if ch.isalpha[]:
            res += ch
    print[res]
    3. Nếu có, hãy thêm ký tự vào chuỗi kết quả của chúng tôi

Hãy xem một ví dụ

# string with letters, numbers, and special characters
s = "[email protected]"
# keep only letters
res = ""
for ch in s:
    if ch.isalpha[]:
        res += ch
print[res]

đầu ra

BuckyBarnes

Chuỗi kết quả chỉ chứa các chữ cái từ chuỗi ban đầu

Đoạn mã trên có thể được giảm xuống ít dòng hơn bằng cách sử dụng khả năng hiểu danh sách

# string with letters, numbers, and special characters
s = "[email protected]"
# keep only letters
res = "".join[[ch for ch in s if ch.isalpha[]]]
print[res]

đầu ra

BuckyBarnes

Chúng tôi nhận được kết quả tương tự như trên

Bạn cũng có thể quan tâm đến -

  • Python – Kiểm tra xem chuỗi chỉ chứa các chữ cái
  • Python – Xóa các ký tự không phải chữ và số khỏi chuỗi
  • Xóa chuỗi con khỏi chuỗi trong Python


Đăng ký nhận bản tin của chúng tôi để biết thêm thông tin và hướng dẫn.
Chúng tôi không gửi thư rác và bạn có thể chọn không tham gia bất kỳ lúc nào.


Tác giả

  • Piyush

    Piyush là một nhà khoa học dữ liệu đam mê sử dụng dữ liệu để hiểu mọi thứ tốt hơn và đưa ra quyết định sáng suốt. Trước đây, anh ấy từng là Nhà khoa học dữ liệu cho ZS và có bằng kỹ sư của IIT Roorkee. Sở thích của anh ấy bao gồm xem cricket, đọc sách và làm việc trong các dự án phụ

    Làm cách nào để chỉ kiểm tra bảng chữ cái trong regex?

    Regex có thể được sử dụng để kiểm tra một chuỗi cho bảng chữ cái. .
    lấy chuỗi
    Khớp chuỗi với Regex bằng cách sử dụng Match[]
    Trả về true được khớp

    \b trong regex Python là gì?

    Bên trong một phạm vi ký tự, \b đại diện cho ký tự xóa lùi , để tương thích với chuỗi ký tự của Python. Khớp với chuỗi trống, nhưng chỉ khi nó không ở đầu hoặc cuối của một từ.

    \W bao gồm những gì trong regex?

    Trong regex, ký tự meta chữ hoa biểu thị giá trị ngược của ký tự viết thường, ví dụ: \w cho ký tự Word và \W cho ký tự không .

Chủ Đề