Thực hành các phương thức chuỗi python
Có vẻ như các chuỗi không phải là thứ cần thành thạo đối với khoa học dữ liệu, nhưng với vô số dữ liệu định tính, phi cấu trúc có sẵn, việc đi sâu vào các chuỗi là vô cùng hữu ích Show Khi làm việc với dữ liệu phi cấu trúc, việc xác định các từ cụ thể hoặc các chuỗi con khác trong một chuỗi lớn hơn có thể thực sự hữu ích. Cách dễ nhất để làm điều này là sử dụng toán tử in Giả sử bạn đang làm việc với một danh sách, chuỗi hoặc cột khung dữ liệu và bạn muốn xác định xem một chuỗi con có tồn tại trong một chuỗi hay không Trong ví dụ dưới đây, bạn có một danh sách các khu vực khác nhau và muốn biết liệu chuỗi “Tây” có trong mỗi mục danh sách hay không Kiểm tra thành viên chuỗi. Nguồn. Nik Piepenbreier2. Làm phép thuật với F-StringChuỗi F đã được giới thiệu trong Python 3. 6 và họ không nhận đủ tín dụng Có một lý do tôi nói chúng là ma thuật. Họ
Nhưng chúng là gì? . Các biểu thức sau đó được thực thi trong thời gian chạy Để viết một chuỗi f, hãy đặt trước một chuỗi bằng 'f' Hãy xem một ví dụ Dây F thật tuyệt vời. Nguồn. Nik Piepenbreier3. Đảo ngược một chuỗi với [. -1]Các chuỗi có thể được đảo ngược (giống như các lần lặp khác), bằng cách cắt chuỗi. Để đảo ngược bất kỳ lần lặp nào, chỉ cần sử dụng [. -1] -1 hoạt động như một đối số bước, theo đó Python bắt đầu ở giá trị cuối cùng và tăng dần theo -1 Đảo ngược một chuỗi. Nguồn. Nik Piepenbreier4. Thay thế chuỗi con bằng. thay thế()Để thay thế các chuỗi con, bạn có thể sử dụng phương thức thay thế. Điều này hoạt động với bất kỳ loại chuỗi nào, kể cả một khoảng trắng đơn giản (vì Python không có các phương thức tích hợp để xóa khoảng trắng) Hãy xem một ví dụ Thay thế dây phụ. Nguồn. Nik Piepenbreier5. Lặp qua Chuỗi với Vòng lặp ForCác chuỗi Python là các đối tượng có thể lặp lại (giống như danh sách, bộ, v.v. ) Nếu bạn muốn trả về từng chữ cái của một chuỗi, bạn có thể viết Lặp qua chuỗi. Nguồn. Nik PiepenbreierĐể tìm hiểu thêm về các vòng lặp, hãy xem video của tôi bên dưới 6. Định dạng chuỗi với. phía trên(),. thấp hơn () và. Tiêu đề()Chuỗi Python có thể hơi kỳ quặc. Bạn có thể nhận cho mình một tệp trong tất cả các chữ hoa, tất cả các chữ thường, v.v. Và bạn có thể cần thực sự định dạng chúng để trình bày chúng sau này
Hãy xem những điều này trong hành động Định dạng vỏ chuỗi. Nguồn. Nik Piepenbreier7. Kiểm tra Palindromes và đảo chữ cáiKết hợp những gì bạn đã học cho đến nay, bạn có thể dễ dàng kiểm tra xem một chuỗi có phải là Palindrome hay không bằng cách sử dụng [. -1] lát Một từ hoặc cụm từ là một bảng màu nếu nó được đánh vần giống nhau về phía trước cũng như ngược lại Tương tự, bạn có thể trả về phiên bản đã sắp xếp của một chuỗi bằng cách sử dụng hàm đã sắp xếp. Nếu hai chuỗi được sắp xếp giống nhau, chúng là đảo chữ cái Kiểm tra palindromes. Nguồn. Nik PiepenbreierĐảo chữ là một từ hoặc cụm từ được hình thành bằng cách sắp xếp lại một từ khác. Nói tóm lại, hai từ là đảo chữ nếu chúng có cùng một chữ cái Nếu bạn muốn xem hai từ có phải là đảo chữ không, bạn có thể sắp xếp hai từ và xem chúng có giống nhau không Kiểm tra đảo chữ. Nguồn. Nik Piepenbreier8. Tách một chuỗi với. tách ra()Giả sử bạn được cung cấp một chuỗi chứa nhiều phần dữ liệu. Có thể hữu ích khi tách chuỗi này để phân tích các phần dữ liệu riêng lẻ Trong ví dụ bên dưới, một chuỗi chứa khu vực, họ của đại diện bán hàng cũng như số đơn đặt hàng Kiểu dữ liệu tôi gặp nhiều nhất là Chuỗi, ký hiệu là str trong Python. Python cung cấp hơn 30 hàm dựng sẵn ⚡️ để thao tác với các chuỗi và giúp cuộc sống của chúng ta dễ dàng hơn. Biết các chức năng này sẽ không chỉ tăng khả năng phân tích dữ liệu của bạn mà còn giữ cho mã của bạn đơn giản. Thông qua câu chuyện này, tôi sẽ hướng dẫn bạn 5 phương pháp thao tác với chuỗi cần biết và cũng chia sẻ một số mẹo khi di chuyển 💡 để làm việc với Chuỗi Những điểm chính rút ra từ câu chuyện này — 📌 Bạn sẽ thành thạo 5 phương pháp thao tác với chuỗi cần biết Chuỗi là kiểu dữ liệu phổ biến nhất trong tất cả các dự án của tôi. Biết các phương pháp thao tác chuỗi này, luôn giúp tôi tăng tốc độ phân tích của mình Trước khi đi xa hơn, hãy để tôi cho bạn biết định nghĩa đơn giản nhất về String
String là một dãy các ký tự. Và các ký tự có thể là bất kỳ thứ gì — số, bảng chữ cái, ký hiệu và khoảng trống 💡 Dấu ngoặc đơn hay dấu ngoặc kép? Các chuỗi đại diện cho văn bản trong dữ liệu và do đó có thể có độ dài bất kỳ. Một loạt các thao tác có thể được thực hiện trên các chuỗi như tìm một ký tự cụ thể trong một chuỗi, thay thế các từ trong văn bản, thay đổi trường hợp chẳng hạn như chữ thường - chữ hoa của chuỗi, tách chuỗi hoặc nối chúng để có được một Bắt đầu nào… Định dạng chuỗi() trong Python Đầu ra được định dạng có thể được tạo bằng phương thức format(). Nó cho phép sử dụng các trình giữ chỗ đơn giản để định dạng. Hầu hết thời gian, có một tình huống khi bạn cần định dạng một giá trị cụ thể và chèn nó vào chuỗi Dưới đây là trường hợp cổ điển của tình huống này, in một chuỗi đầu ra chứa một số số và từ từ phân tích dữ liệu của bạn. Trong trường hợp này, các số và từ được định dạng và chèn vào chuỗi đầu ra bằng phương thức format() Một trường hợp cổ điển của định dạng String() trong Python (Ảnh của Tác giả)Như thể hiện trong ví dụ trên, các biến được đề cập trong Bây giờ, hãy để tôi cho bạn biết cách bạn có thể sử dụng phương thức format() trong dự án phân tích của mình. Dưới đây là 4 cách để triển khai phương thức format() Đầu ra của tất cả các cách trên để triển khai phương thức format() đều giống nhau. Và bạn có thể kiểm tra nó trong hình dưới đây Bốn cách để triển khai phương thức String format() (Ảnh của Tác giả)Tuy nhiên, bạn đang tìm kiếm 💡 triển khai đơn giản hơn của định dạng()? Sau đó, bạn nên dùng f-Strings. Nó còn được gọi là chuỗi ký tự được định dạng. Các chuỗi f như vậy có một bảng chữ cái Hình ảnh đơn giản hóa của ví dụ trên là trong hình bên dưới f-Strings trong Python (Ảnh của Tác giả)Chuỗi thay thế() trong PythonTrong một dự án của tôi, khi khám phá dữ liệu đánh giá trên google, tôi muốn thay thế một số văn bản rác trong đánh giá bằng một chuỗi mặc định. Và tôi đã sử dụng Chuỗi trong Python là bất biến → do đó không thể thay đổi chuỗi gốc. Do đó, tất cả các phương thức tạo một bản sao của chuỗi, thực hiện một thao tác trên nó và trả về nó dưới dạng đầu ra Đây là cú pháp — Và điều này Đơn giản? Sau đó đến tham số thứ ba và tùy chọn của Đó là tất cả những gì bạn có thể làm với phương pháp Trong khi khám phá dữ liệu đánh giá trên google, tôi muốn kết hợp tên của nhà hàng, khu vực, thành phố và mã bưu chính để tạo thành một địa chỉ hoàn chỉnh dưới dạng một chuỗi. Phương pháp Cú pháp của phương thức này khá đơn giản. Như bạn có thể thấy ở đây, phương thức Có một cái nhìn khác về ví dụ dưới đây, Tham gia chuỗi () với một danh sách (Hình ảnh của Tác giả)Chà, mỗi chuỗi được xác định rõ ở đây và chỉ cần một danh sách các chuỗi được chuyển đến tuyệt vời Tất cả các cột gộp lại thành một, tôi có địa chỉ đầy đủ của nhà hàng. Trong mỗi hàng, tất cả các ô được nối với nhau bằng dấu phẩy và dấu cách làm dấu phân cách Trong ví dụ trên, bạn cũng có thể thấy một trường hợp kinh điển 💡 về cách viết mã thành nhiều dòng và cách sử dụng hàm lambda Tách chuỗi () trong PythonPhương thức Đề cập đến một dấu tách cũng là tùy chọn trong split(). Vì vậy, nếu bạn không đề cập đến bất kỳ dấu phân cách nào, dấu phân cách mặc định là Dấu cách và chuỗi sẽ được phân tách trên mỗi dấu cách. Là đầu ra, bạn sẽ nhận được một danh sách các chuỗi được phân tách Với nền tảng này, bạn có thể đã nghĩ về cú pháp. Thế là xong, Một ví dụ giải thích nó tốt hơn Tách chuỗi () (Hình ảnh của Tác giả)Hãy xem một ví dụ khác khi cả hai đối số tùy chọn được đề cập trong split() Tách chuỗi () với tất cả các tùy chọn (Hình ảnh của Tác giả)Như đã thấy trong hình trên, 2 lần tách được thực hiện trên Đối với dự án phân tích dữ liệu COVID-19, tôi đã tìm kiếm một trong những trang web phổ biến để thu thập tất cả dữ liệu. Và đúng như dự đoán, tôi có một số ký tự không mong muốn ở đầu và cuối tên của các quốc gia. Tôi đã xóa những ký tự không mong muốn này bằng cách sử dụng sợi dây. dải () đến để giải cứu tôi. 💡 strip() có thể được coi là trường hợp đặc biệt của split() được dùng riêng để loại bỏ các khoảng trống ở đầu và cuối chuỗi. sợi dây. dải () xóa các khoảng trống từ đầu cũng như cuối chuỗi Dải chuỗi () (Hình ảnh của Tác giả)Nhưng nếu bạn chỉ muốn xóa khoảng trắng ở đầu hoặc cuối chuỗi, thì một lần nữa, dải () có 2 kiểu con - Bạn vẫn có thể thử kết hợp split(), strip() và replace() để thực hiện nhiều phép biến đổi dữ liệu và nhận được kết quả mong muốn. thử nghiệm vui vẻ Hãy tìm kiếm một số từ, số cụ thể trong chuỗi đã cho bằng cách sử dụng phương pháp Khi tôi tự động hóa dự án phân tích dữ liệu đầu tiên của mình, tôi đã từng lấy một chuỗi làm đầu ra và tôi cần tìm vị trí của một từ cụ thể trong chuỗi đó. Đó là lần đầu tiên tôi sử dụng phương pháp Vì mục đích của phương pháp này là tìm kiếm một chuỗi con cụ thể trong chuỗi chính và trả về chỉ mục của nó, nên Hình trên giải thích rõ ràng phương thức Nhưng nếu chuỗi con không có trong chuỗi chính hoặc trong phạm vi vị trí bắt đầu và kết thúc nhất định thì sao? Đừng lo lắng. Xem hình bên dưới. 💡 Khi không tìm thấy chuỗi con (Hình ảnh của Tác giả)Python trả về -1 nếu không tìm thấy chuỗi con trong chuỗi chính đã cho Đó là tất cả. Tôi thấy 5 phương thức chuỗi này hữu ích nhất trong tất cả các dự án của mình. Nắm vững những điều này chắc chắn có thể tăng tốc độ phân tích dữ liệu của bạn
📌 Đã đến lúc cho hình ảnh duy nhất đó với hơn 30 phương thức chuỗi. Với một hình ảnh duy nhất, bạn có thể biết tất cả các phương thức chuỗi trong Python và có thể được sử dụng làm tài liệu tham khảo nhanh Tất cả các phương thức Chuỗi trong một hình ảnh (Hình ảnh của Tác giả)📌 Như bạn có thể thấy, đây là những ảnh chụp thực tế từ Jupyter-notebook của tôi 💡 Bạn muốn tìm hiểu thêm về sắp xếp dữ liệu?? Sắp xếp lại dữ liệu — Chuyển đổi từ thô sang sạchMột lời giải thích 3 từ đơn giảnhướng tới khoa học dữ liệu. com Mẩu chuyện dài, Thông qua câu chuyện của mình, tôi đã hướng dẫn bạn năm phương thức chuỗi phải biết. Nắm vững các phương pháp này, tôi đã thực hiện phân tích dữ liệu của mình nhanh hơn và đơn giản hơn, hy vọng nó cũng sẽ giúp ích cho bạn Như mọi khi, tôi sẵn sàng nhận phản hồi và biết các phương pháp khác để phân tích dữ liệu nhanh hơn mà bạn sử dụng cho các dự án của mình Chuỗi 5 phương thức là gì?Hãy đi sâu vào các phương thức chuỗi Java được sử dụng phổ biến nhất và hiểu cách hoạt động của chúng. . indexOf() Được sử dụng để tìm các ký tự và chuỗi con trong một chuỗi. . toCharArray() Được sử dụng để tạo một mảng ký tự mới từ chuỗi này. . charAt(). concat(). thay thế(). chuỗi con(). tách ra(). so với() Các phương pháp để làm việc với chuỗi trong Python là gì?Phương thức chuỗi Python Phương thức chuỗi Python là gì?Chuỗi là một dãy ký tự được đặt trong dấu ngoặc kép . Trong trang tham khảo này, bạn sẽ tìm thấy tất cả các phương thức mà một đối tượng chuỗi có thể gọi. Ví dụ: bạn có thể sử dụng phương thức nối () để nối hai chuỗi.
Có bao nhiêu phương thức trong chuỗi trong Python?Chuỗi Python có 47 phương thức. Đó gần như là nhiều phương thức chuỗi như có các hàm tích hợp sẵn trong Python. |