Làm cách nào để xóa dấu chấm câu và số trong python?
Thông thường trong các nhiệm vụ phân tích dữ liệu, chúng tôi bắt gặp dữ liệu văn bản cần được xử lý để có thể lấy thông tin hữu ích từ dữ liệu. Trong quá trình xử lý văn bản, chúng tôi có thể phải trích xuất hoặc xóa một số văn bản khỏi dữ liệu để làm cho nó hữu ích hoặc chúng tôi cũng có thể cần thay thế một số ký hiệu và thuật ngữ bằng văn bản khác để trích xuất thông tin hữu ích. Trong bài viết này, chúng ta sẽ nghiên cứu về dấu chấm câu và sẽ xem xét các phương pháp để loại bỏ dấu chấm câu khỏi chuỗi python Show
Dấu chấm câu là gì?Có một số ký hiệu trong ngữ pháp tiếng Anh bao gồm dấu phẩy, dấu gạch nối, dấu chấm hỏi, dấu gạch ngang, dấu chấm than, dấu hai chấm, dấu chấm phẩy, dấu ngoặc đơn, dấu ngoặc đơn, v.v. được gọi là dấu chấm câu. Chúng được sử dụng trong ngôn ngữ tiếng Anh cho các mục đích ngữ pháp nhưng khi chúng tôi thực hiện xử lý văn bản trong python, chúng tôi thường phải bỏ qua các dấu chấm câu khỏi chuỗi của mình. Bây giờ chúng ta sẽ xem các phương pháp khác nhau để xóa dấu chấm câu khỏi chuỗi trong Python Xóa dấu chấm câu khỏi chuỗi bằng vòng lặp forTrong phương thức này, đầu tiên chúng ta sẽ tạo một chuỗi python rỗng sẽ chứa chuỗi đầu ra. Sau đó, chúng tôi sẽ chỉ lặp qua từng ký tự của chuỗi python và kiểm tra xem đó có phải là dấu chấm câu hay không. Nếu ký tự sẽ là dấu chấm câu, chúng tôi sẽ để nó. Nếu không, chúng tôi sẽ đưa nó vào chuỗi đầu ra của mình bằng cách nối chuỗi Ví dụ: Trong mã được cung cấp bên dưới, chúng tôi có mỗi dấu chấm câu được giữ trong một chuỗi có tên 1. Chúng tôi lặp qua chuỗi đầu vào 2 bằng cách sử dụng vòng lặp for và sau đó chúng tôi kiểm tra xem ký tự có trong chuỗi dấu chấm câu hay không. Nếu không có, ký tự được bao gồm trong chuỗi đầu ra 0
đầu ra
Xóa dấu chấm câu khỏi chuỗi python bằng biểu thức chính quyChúng tôi cũng có thể xóa dấu chấm câu khỏi chuỗi trong python bằng cách sử dụng biểu thức chính quy. Đối với điều này, chúng tôi sẽ sử dụng mô-đun 1 trong python cung cấp các hàm để xử lý chuỗi bằng biểu thức chính quyTrong phương pháp này, chúng tôi sẽ thay thế từng ký tự không phải là ký tự chữ và số hoặc dấu cách bằng một chuỗi trống bằng cách sử dụng phương thức 2 và do đó, tất cả dấu câu sẽ bị xóaCú pháp của phương thức 3 là 4 trong đó 5 biểu thị mẫu ký tự sẽ được thay thế. Trong trường hợp của chúng tôi, chúng tôi sẽ cung cấp một mẫu biểu thị các ký tự không phải là ký tự chữ và số hoặc dấu cách. 6 là mẫu cuối cùng mà các ký tự trong 5 sẽ được thay thế. Trong trường hợp của chúng tôi, 6 sẽ là chuỗi rỗng vì chúng tôi chỉ cần xóa dấu chấm câu khỏi chuỗi python của mình. 9 là chuỗi cần được xử lý để loại bỏ dấu câuVí dụ 2đầu ra 3Xóa dấu chấm câu khỏi chuỗi python bằng phương thức thay thế ()Phương thức thay thế chuỗi Python () lấy mẫu ban đầu và mẫu cuối cùng làm tham số khi được gọi trên một chuỗi và trả về một chuỗi kết quả trong đó các ký tự của mẫu ban đầu được thay thế bằng các ký tự trong mẫu cuối cùng Chúng ta có thể sử dụng phương thức thay thế () để xóa dấu chấm câu khỏi chuỗi python bằng cách thay thế từng dấu chấm câu bằng chuỗi trống. Chúng tôi sẽ lặp lại lần lượt toàn bộ dấu chấm câu, thay thế nó bằng một chuỗi trống trong chuỗi văn bản của chúng tôi Cú pháp của phương thức 20 là 21 trong đó 22 là ký tự sẽ được thay thế bằng ký tự đã cho trong tham số 23. Trong trường hợp của chúng tôi, 22 sẽ chứa dấu chấm câu và 23 sẽ là một chuỗi rỗng 0đầu ra 3Xóa dấu chấm câu khỏi chuỗi python bằng phương thức translate()Phương thức 26 thay thế các ký tự được chỉ định trong chuỗi đầu vào bằng các ký tự mới theo bảng dịch được cung cấp cho hàm dưới dạng tham số. Bảng dịch phải chứa ánh xạ ký tự nào phải được thay thế bằng ký tự nào. Nếu bảng không có ánh xạ cho bất kỳ ký tự nào, ký tự đó sẽ không được thay thếCú pháp của phương thức 26 là translate( 28) trong đó 28 sẽ là một từ điển python chứa ánh xạ các ký tự trong chuỗi đầu vào tới các ký tự mà chúng sẽ được thay thếĐể tạo bảng dịch, chúng ta có thể sử dụng phương thức 30. Phương thức này lấy các ký tự đầu tiên được thay thế, các ký tự cuối cùng và các ký tự bị xóa khỏi chuỗi ở dạng chuỗi làm đầu vào tùy chọn và trả về một từ điển python hoạt động như bảng dịchCú pháp của phương thức 30 là 32. Ở đây 5 sẽ là một chuỗi chứa tất cả các ký tự cần thay thế. 6 sẽ là một chuỗi chứa các ký tự mà các ký tự trong 5 sẽ được thay thế. Ở đây độ dài của 5 phải bằng độ dài của 6. 38 là một chuỗi chứa các ký tự cần xóa khỏi văn bản nhập. Trong trường hợp của chúng tôi, 5 và 6 sẽ là chuỗi rỗng trong khi 38 sẽ là chuỗi chứa dấu chấm câuĐể tạo bảng dịch để loại bỏ dấu câu khỏi chuỗi python, chúng ta có thể để trống hai tham số đầu tiên của hàm 30 và đưa các dấu câu vào danh sách các ký tự cần loại trừ. Bằng cách này, tất cả các dấu chấm câu sẽ bị xóa và sẽ thu được chuỗi đầu raVí dụ 9đầu ra 3Phần kết luậnTrong bài viết này, chúng ta đã thấy cách xóa dấu chấm câu khỏi chuỗi trong python bằng cách sử dụng vòng lặp for, biểu thức chính quy và các phương thức chuỗi sẵn có như replace() và translate(). Hãy theo dõi để biết thêm các bài viết thông tin Có liên quanĐào tạo Python được đề xuấtMón ăn. Python 3 cho người mới bắt đầu Hơn 15 giờ nội dung video với hướng dẫn có hướng dẫn cho người mới bắt đầu. Tìm hiểu cách tạo các ứng dụng trong thế giới thực và nắm vững kiến thức cơ bản |