Làm cách nào để xóa dấu chấm câu và số trong python?

Thông thường trong các nhiệm vụ phân tích dữ liệu, chúng tôi bắt gặp dữ liệu văn bản cần được xử lý để có thể lấy thông tin hữu ích từ dữ liệu. Trong quá trình xử lý văn bản, chúng tôi có thể phải trích xuất hoặc xóa một số văn bản khỏi dữ liệu để làm cho nó hữu ích hoặc chúng tôi cũng có thể cần thay thế một số ký hiệu và thuật ngữ bằng văn bản khác để trích xuất thông tin hữu ích. Trong bài viết này, chúng ta sẽ nghiên cứu về dấu chấm câu và sẽ xem xét các phương pháp để loại bỏ dấu chấm câu khỏi chuỗi python

Dấu chấm câu là gì?

Có một số ký hiệu trong ngữ pháp tiếng Anh bao gồm dấu phẩy, dấu gạch nối, dấu chấm hỏi, dấu gạch ngang, dấu chấm than, dấu hai chấm, dấu chấm phẩy, dấu ngoặc đơn, dấu ngoặc đơn, v.v. được gọi là dấu chấm câu. Chúng được sử dụng trong ngôn ngữ tiếng Anh cho các mục đích ngữ pháp nhưng khi chúng tôi thực hiện xử lý văn bản trong python, chúng tôi thường phải bỏ qua các dấu chấm câu khỏi chuỗi của mình. Bây giờ chúng ta sẽ xem các phương pháp khác nhau để xóa dấu chấm câu khỏi chuỗi trong Python

Xóa dấu chấm câu khỏi chuỗi bằng vòng lặp for

Trong phương thức này, đầu tiên chúng ta sẽ tạo một chuỗi python rỗng sẽ chứa chuỗi đầu ra. Sau đó, chúng tôi sẽ chỉ lặp qua từng ký tự của chuỗi python và kiểm tra xem đó có phải là dấu chấm câu hay không. Nếu ký tự sẽ là dấu chấm câu, chúng tôi sẽ để nó. Nếu không, chúng tôi sẽ đưa nó vào chuỗi đầu ra của mình bằng cách nối chuỗi

[email protected]#$%^&*_~ Input String is: Python.:F}or{Beg~inn;ers Output String is: PythonForBeginners1. Chúng tôi lặp qua chuỗi đầu vào

The punctuation marks are:
![]-[]{};:'"\, ./[email protected]#$%^&*_~
Input String is:
Python.:F}or{Beg~inn;ers
Output String is:
PythonForBeginners
2 bằng cách sử dụng vòng lặp for và sau đó chúng tôi kiểm tra xem ký tự có trong chuỗi dấu chấm câu hay không. Nếu không có, ký tự được bao gồm trong chuỗi đầu ra
The punctuation marks are:
![]-[]{};:'"\, ./[email protected]#$%^&*_~
Input String is:
Python.:F}or{Beg~inn;ers
Output String is:
PythonForBeginners
0


punctuation= '''![]-[]{};:'"\, ./[email protected]#$%^&*_~'''
print["The punctuation marks are:"]
print[punctuation]
myString= "Python.:F}or{Beg~inn;ers"
print["Input String is:"]
print[myString]
newString=""
for x in myString:
    if x not in punctuation:
        newString=newString+x
print["Output String is:"]
print[newString]

đầu ra

The punctuation marks are:
![]-[]{};:'"\, ./[email protected]#$%^&*_~
Input String is:
Python.:F}or{Beg~inn;ers
Output String is:
PythonForBeginners

Xóa dấu chấm câu khỏi chuỗi python bằng biểu thức chính quy

Chúng tôi cũng có thể xóa dấu chấm câu khỏi chuỗi trong python bằng cách sử dụng biểu thức chính quy. Đối với điều này, chúng tôi sẽ sử dụng mô-đun

The punctuation marks are:
![]-[]{};:'"\, ./[email protected]#$%^&*_~
Input String is:
Python.:F}or{Beg~inn;ers
Output String is:
PythonForBeginners
1 trong python cung cấp các hàm để xử lý chuỗi bằng biểu thức chính quy

Trong phương pháp này, chúng tôi sẽ thay thế từng ký tự không phải là ký tự chữ và số hoặc dấu cách bằng một chuỗi trống bằng cách sử dụng phương thức

The punctuation marks are:
![]-[]{};:'"\, ./[email protected]#$%^&*_~
Input String is:
Python.:F}or{Beg~inn;ers
Output String is:
PythonForBeginners
2  và do đó, tất cả dấu câu sẽ bị xóa

Cú pháp của phương thức

The punctuation marks are:
![]-[]{};:'"\, ./[email protected]#$%^&*_~
Input String is:
Python.:F}or{Beg~inn;ers
Output String is:
PythonForBeginners
3 là
The punctuation marks are:
![]-[]{};:'"\, ./[email protected]#$%^&*_~
Input String is:
Python.:F}or{Beg~inn;ers
Output String is:
PythonForBeginners
4 trong đó
The punctuation marks are:
![]-[]{};:'"\, ./[email protected]#$%^&*_~
Input String is:
Python.:F}or{Beg~inn;ers
Output String is:
PythonForBeginners
5 biểu thị mẫu ký tự sẽ được thay thế. Trong trường hợp của chúng tôi, chúng tôi sẽ cung cấp một mẫu biểu thị các ký tự không phải là ký tự chữ và số hoặc dấu cách.
The punctuation marks are:
![]-[]{};:'"\, ./[email protected]#$%^&*_~
Input String is:
Python.:F}or{Beg~inn;ers
Output String is:
PythonForBeginners
6 là mẫu cuối cùng mà các ký tự trong
The punctuation marks are:
![]-[]{};:'"\, ./[email protected]#$%^&*_~
Input String is:
Python.:F}or{Beg~inn;ers
Output String is:
PythonForBeginners
5 sẽ được thay thế. Trong trường hợp của chúng tôi,
The punctuation marks are:
![]-[]{};:'"\, ./[email protected]#$%^&*_~
Input String is:
Python.:F}or{Beg~inn;ers
Output String is:
PythonForBeginners
6 sẽ là chuỗi rỗng vì chúng tôi chỉ cần xóa dấu chấm câu khỏi chuỗi python của mình.
The punctuation marks are:
![]-[]{};:'"\, ./[email protected]#$%^&*_~
Input String is:
Python.:F}or{Beg~inn;ers
Output String is:
PythonForBeginners
9 là chuỗi cần được xử lý để loại bỏ dấu câu

Ví dụ


punctuation= '''![]-[]{};:'"\, ./[email protected]#$%^&*_~'''
print["The punctuation marks are:"]
print[punctuation]
myString= "Python.:F}or{Beg~inn;ers"
print["Input String is:"]
print[myString]
newString=""
for x in myString:
    if x not in punctuation:
        newString=newString+x
print["Output String is:"]
print[newString]
2

đầu ra


punctuation= '''![]-[]{};:'"\, ./[email protected]#$%^&*_~'''
print["The punctuation marks are:"]
print[punctuation]
myString= "Python.:F}or{Beg~inn;ers"
print["Input String is:"]
print[myString]
newString=""
for x in myString:
    if x not in punctuation:
        newString=newString+x
print["Output String is:"]
print[newString]
3

Xóa dấu chấm câu khỏi chuỗi python bằng phương thức thay thế []

Phương thức thay thế chuỗi Python [] lấy mẫu ban đầu và mẫu cuối cùng làm tham số khi được gọi trên một chuỗi và trả về một chuỗi kết quả trong đó các ký tự của mẫu ban đầu được thay thế bằng các ký tự trong mẫu cuối cùng

Chúng ta có thể sử dụng phương thức thay thế [] để xóa dấu chấm câu khỏi chuỗi python bằng cách thay thế từng dấu chấm câu bằng chuỗi trống. Chúng tôi sẽ lặp lại lần lượt toàn bộ dấu chấm câu, thay thế nó bằng một chuỗi trống trong chuỗi văn bản của chúng tôi

Cú pháp của phương thức


punctuation= '''![]-[]{};:'"\, ./[email protected]#$%^&*_~'''
print["The punctuation marks are:"]
print[punctuation]
myString= "Python.:F}or{Beg~inn;ers"
print["Input String is:"]
print[myString]
newString=""
for x in myString:
    if x not in punctuation:
        newString=newString+x
print["Output String is:"]
print[newString]
20 là

punctuation= '''![]-[]{};:'"\, ./[email protected]#$%^&*_~'''
print["The punctuation marks are:"]
print[punctuation]
myString= "Python.:F}or{Beg~inn;ers"
print["Input String is:"]
print[myString]
newString=""
for x in myString:
    if x not in punctuation:
        newString=newString+x
print["Output String is:"]
print[newString]
21 trong đó

punctuation= '''![]-[]{};:'"\, ./[email protected]#$%^&*_~'''
print["The punctuation marks are:"]
print[punctuation]
myString= "Python.:F}or{Beg~inn;ers"
print["Input String is:"]
print[myString]
newString=""
for x in myString:
    if x not in punctuation:
        newString=newString+x
print["Output String is:"]
print[newString]
22 là ký tự sẽ được thay thế bằng ký tự đã cho trong tham số

punctuation= '''![]-[]{};:'"\, ./[email protected]#$%^&*_~'''
print["The punctuation marks are:"]
print[punctuation]
myString= "Python.:F}or{Beg~inn;ers"
print["Input String is:"]
print[myString]
newString=""
for x in myString:
    if x not in punctuation:
        newString=newString+x
print["Output String is:"]
print[newString]
23. Trong trường hợp của chúng tôi,

punctuation= '''![]-[]{};:'"\, ./[email protected]#$%^&*_~'''
print["The punctuation marks are:"]
print[punctuation]
myString= "Python.:F}or{Beg~inn;ers"
print["Input String is:"]
print[myString]
newString=""
for x in myString:
    if x not in punctuation:
        newString=newString+x
print["Output String is:"]
print[newString]
22 sẽ chứa dấu chấm câu và

punctuation= '''![]-[]{};:'"\, ./[email protected]#$%^&*_~'''
print["The punctuation marks are:"]
print[punctuation]
myString= "Python.:F}or{Beg~inn;ers"
print["Input String is:"]
print[myString]
newString=""
for x in myString:
    if x not in punctuation:
        newString=newString+x
print["Output String is:"]
print[newString]
23 sẽ là một chuỗi rỗng

The punctuation marks are:
![]-[]{};:'"\, ./[email protected]#$%^&*_~
Input String is:
Python.:F}or{Beg~inn;ers
Output String is:
PythonForBeginners
0

đầu ra


punctuation= '''![]-[]{};:'"\, ./[email protected]#$%^&*_~'''
print["The punctuation marks are:"]
print[punctuation]
myString= "Python.:F}or{Beg~inn;ers"
print["Input String is:"]
print[myString]
newString=""
for x in myString:
    if x not in punctuation:
        newString=newString+x
print["Output String is:"]
print[newString]
3

Xóa dấu chấm câu khỏi chuỗi python bằng phương thức translate[]

Phương thức


punctuation= '''![]-[]{};:'"\, ./[email protected]#$%^&*_~'''
print["The punctuation marks are:"]
print[punctuation]
myString= "Python.:F}or{Beg~inn;ers"
print["Input String is:"]
print[myString]
newString=""
for x in myString:
    if x not in punctuation:
        newString=newString+x
print["Output String is:"]
print[newString]
26 thay thế các ký tự được chỉ định trong chuỗi đầu vào bằng các ký tự mới theo bảng dịch được cung cấp cho hàm dưới dạng tham số. Bảng dịch phải chứa ánh xạ ký tự nào phải được thay thế bằng ký tự nào. Nếu bảng không có ánh xạ cho bất kỳ ký tự nào, ký tự đó sẽ không được thay thế

Cú pháp của phương thức


punctuation= '''![]-[]{};:'"\, ./[email protected]#$%^&*_~'''
print["The punctuation marks are:"]
print[punctuation]
myString= "Python.:F}or{Beg~inn;ers"
print["Input String is:"]
print[myString]
newString=""
for x in myString:
    if x not in punctuation:
        newString=newString+x
print["Output String is:"]
print[newString]
26 là translate[

punctuation= '''![]-[]{};:'"\, ./[email protected]#$%^&*_~'''
print["The punctuation marks are:"]
print[punctuation]
myString= "Python.:F}or{Beg~inn;ers"
print["Input String is:"]
print[myString]
newString=""
for x in myString:
    if x not in punctuation:
        newString=newString+x
print["Output String is:"]
print[newString]
28] trong đó

punctuation= '''![]-[]{};:'"\, ./[email protected]#$%^&*_~'''
print["The punctuation marks are:"]
print[punctuation]
myString= "Python.:F}or{Beg~inn;ers"
print["Input String is:"]
print[myString]
newString=""
for x in myString:
    if x not in punctuation:
        newString=newString+x
print["Output String is:"]
print[newString]
28 sẽ là một từ điển python chứa ánh xạ các ký tự trong chuỗi đầu vào tới các ký tự mà chúng sẽ được thay thế

Để tạo bảng dịch, chúng ta có thể sử dụng phương thức


punctuation= '''![]-[]{};:'"\, ./[email protected]#$%^&*_~'''
print["The punctuation marks are:"]
print[punctuation]
myString= "Python.:F}or{Beg~inn;ers"
print["Input String is:"]
print[myString]
newString=""
for x in myString:
    if x not in punctuation:
        newString=newString+x
print["Output String is:"]
print[newString]
30. Phương thức này lấy các ký tự đầu tiên được thay thế, các ký tự cuối cùng và các ký tự bị xóa khỏi chuỗi ở dạng chuỗi làm đầu vào tùy chọn và trả về một từ điển python hoạt động như bảng dịch

Cú pháp của phương thức


punctuation= '''![]-[]{};:'"\, ./[email protected]#$%^&*_~'''
print["The punctuation marks are:"]
print[punctuation]
myString= "Python.:F}or{Beg~inn;ers"
print["Input String is:"]
print[myString]
newString=""
for x in myString:
    if x not in punctuation:
        newString=newString+x
print["Output String is:"]
print[newString]
30 là

punctuation= '''![]-[]{};:'"\, ./[email protected]#$%^&*_~'''
print["The punctuation marks are:"]
print[punctuation]
myString= "Python.:F}or{Beg~inn;ers"
print["Input String is:"]
print[myString]
newString=""
for x in myString:
    if x not in punctuation:
        newString=newString+x
print["Output String is:"]
print[newString]
32. Ở đây
The punctuation marks are:
![]-[]{};:'"\, ./[email protected]#$%^&*_~
Input String is:
Python.:F}or{Beg~inn;ers
Output String is:
PythonForBeginners
5 sẽ là một chuỗi chứa tất cả các ký tự cần thay thế.
The punctuation marks are:
![]-[]{};:'"\, ./[email protected]#$%^&*_~
Input String is:
Python.:F}or{Beg~inn;ers
Output String is:
PythonForBeginners
6 sẽ là một chuỗi chứa các ký tự mà các ký tự trong
The punctuation marks are:
![]-[]{};:'"\, ./[email protected]#$%^&*_~
Input String is:
Python.:F}or{Beg~inn;ers
Output String is:
PythonForBeginners
5 sẽ được thay thế. Ở đây độ dài của
The punctuation marks are:
![]-[]{};:'"\, ./[email protected]#$%^&*_~
Input String is:
Python.:F}or{Beg~inn;ers
Output String is:
PythonForBeginners
5 phải bằng độ dài của
The punctuation marks are:
![]-[]{};:'"\, ./[email protected]#$%^&*_~
Input String is:
Python.:F}or{Beg~inn;ers
Output String is:
PythonForBeginners
6.

punctuation= '''![]-[]{};:'"\, ./[email protected]#$%^&*_~'''
print["The punctuation marks are:"]
print[punctuation]
myString= "Python.:F}or{Beg~inn;ers"
print["Input String is:"]
print[myString]
newString=""
for x in myString:
    if x not in punctuation:
        newString=newString+x
print["Output String is:"]
print[newString]
38 là một chuỗi chứa các ký tự cần xóa khỏi văn bản nhập. Trong trường hợp của chúng tôi,
The punctuation marks are:
![]-[]{};:'"\, ./[email protected]#$%^&*_~
Input String is:
Python.:F}or{Beg~inn;ers
Output String is:
PythonForBeginners
5 và
The punctuation marks are:
![]-[]{};:'"\, ./[email protected]#$%^&*_~
Input String is:
Python.:F}or{Beg~inn;ers
Output String is:
PythonForBeginners
6 sẽ là chuỗi rỗng trong khi

punctuation= '''![]-[]{};:'"\, ./[email protected]#$%^&*_~'''
print["The punctuation marks are:"]
print[punctuation]
myString= "Python.:F}or{Beg~inn;ers"
print["Input String is:"]
print[myString]
newString=""
for x in myString:
    if x not in punctuation:
        newString=newString+x
print["Output String is:"]
print[newString]
38 sẽ là chuỗi chứa dấu chấm câu

Để tạo bảng dịch để loại bỏ dấu câu khỏi chuỗi python, chúng ta có thể để trống hai tham số đầu tiên của hàm


punctuation= '''![]-[]{};:'"\, ./[email protected]#$%^&*_~'''
print["The punctuation marks are:"]
print[punctuation]
myString= "Python.:F}or{Beg~inn;ers"
print["Input String is:"]
print[myString]
newString=""
for x in myString:
    if x not in punctuation:
        newString=newString+x
print["Output String is:"]
print[newString]
30 và đưa các dấu câu vào danh sách các ký tự cần loại trừ. Bằng cách này, tất cả các dấu chấm câu sẽ bị xóa và sẽ thu được chuỗi đầu ra

Ví dụ

The punctuation marks are:
![]-[]{};:'"\, ./[email protected]#$%^&*_~
Input String is:
Python.:F}or{Beg~inn;ers
Output String is:
PythonForBeginners
9

đầu ra


punctuation= '''![]-[]{};:'"\, ./[email protected]#$%^&*_~'''
print["The punctuation marks are:"]
print[punctuation]
myString= "Python.:F}or{Beg~inn;ers"
print["Input String is:"]
print[myString]
newString=""
for x in myString:
    if x not in punctuation:
        newString=newString+x
print["Output String is:"]
print[newString]
3

Phần kết luận

Trong bài viết này, chúng ta đã thấy cách xóa dấu chấm câu khỏi chuỗi trong python bằng cách sử dụng vòng lặp for, biểu thức chính quy và các phương thức chuỗi sẵn có như replace[] và translate[]. Hãy theo dõi để biết thêm các bài viết thông tin

Có liên quan

Đào tạo Python được đề xuất

Món ăn. Python 3 cho người mới bắt đầu

Hơn 15 giờ nội dung video với hướng dẫn có hướng dẫn cho người mới bắt đầu. Tìm hiểu cách tạo các ứng dụng trong thế giới thực và nắm vững kiến ​​thức cơ bản

Chủ Đề