Thực hành các phương thức chuỗi python

Có vẻ như các chuỗi không phải là thứ cần thành thạo đối với khoa học dữ liệu, nhưng với vô số dữ liệu định tính, phi cấu trúc có sẵn, việc đi sâu vào các chuỗi là vô cùng hữu ích

1. Kiểm tra tư cách thành viên với 'in'

Khi làm việc với dữ liệu phi cấu trúc, việc xác định các từ cụ thể hoặc các chuỗi con khác trong một chuỗi lớn hơn có thể thực sự hữu ích. Cách dễ nhất để làm điều này là sử dụng toán tử in

Giả sử bạn đang làm việc với một danh sách, chuỗi hoặc cột khung dữ liệu và bạn muốn xác định xem một chuỗi con có tồn tại trong một chuỗi hay không

Trong ví dụ dưới đây, bạn có một danh sách các khu vực khác nhau và muốn biết liệu chuỗi “Tây” có trong mỗi mục danh sách hay không

Kiểm tra thành viên chuỗi. Nguồn. Nik Piepenbreier2. Làm phép thuật với F-String

Chuỗi F đã được giới thiệu trong Python 3. 6 và họ không nhận đủ tín dụng

Có một lý do tôi nói chúng là ma thuật. Họ

  • Cho phép linh hoạt hơn nhiều,
  • Dễ đọc hơn nhiều so với các phương pháp khác và
  • Thực hiện nhanh hơn nhiều

Nhưng chúng là gì? . Các biểu thức sau đó được thực thi trong thời gian chạy

Để viết một chuỗi f, hãy đặt trước một chuỗi bằng 'f'

Hãy xem một ví dụ

Dây F thật tuyệt vời. Nguồn. Nik Piepenbreier3. Đảo ngược một chuỗi với [. -1]

Các chuỗi có thể được đảo ngược (giống như các lần lặp khác), bằng cách cắt chuỗi. Để đảo ngược bất kỳ lần lặp nào, chỉ cần sử dụng [. -1]

-1 hoạt động như một đối số bước, theo đó Python bắt đầu ở giá trị cuối cùng và tăng dần theo -1

Đảo ngược một chuỗi. Nguồn. Nik Piepenbreier4. Thay thế chuỗi con bằng. thay thế()

Để thay thế các chuỗi con, bạn có thể sử dụng phương thức thay thế. Điều này hoạt động với bất kỳ loại chuỗi nào, kể cả một khoảng trắng đơn giản (vì Python không có các phương thức tích hợp để xóa khoảng trắng)

Hãy xem một ví dụ

Thay thế dây phụ. Nguồn. Nik Piepenbreier5. Lặp qua Chuỗi với Vòng lặp For

Các chuỗi Python là các đối tượng có thể lặp lại (giống như danh sách, bộ, v.v. )

Nếu bạn muốn trả về từng chữ cái của một chuỗi, bạn có thể viết

Lặp qua chuỗi. Nguồn. Nik Piepenbreier

Để tìm hiểu thêm về các vòng lặp, hãy xem video của tôi bên dưới

6. Định dạng chuỗi với. phía trên(),. thấp hơn () và. Tiêu đề()

Chuỗi Python có thể hơi kỳ quặc. Bạn có thể nhận cho mình một tệp trong tất cả các chữ hoa, tất cả các chữ thường, v.v. Và bạn có thể cần thực sự định dạng chúng để trình bày chúng sau này

  • upper() sẽ trả về một chuỗi có tất cả các ký tự viết hoa
  • Lower() sẽ trả về một chuỗi có tất cả các ký tự ở dạng chữ thường
  • title() sẽ viết hoa từng từ của một chuỗi

Hãy xem những điều này trong hành động

Định dạng vỏ chuỗi. Nguồn. Nik Piepenbreier7. Kiểm tra Palindromes và đảo chữ cái

Kết hợp những gì bạn đã học cho đến nay, bạn có thể dễ dàng kiểm tra xem một chuỗi có phải là Palindrome hay không bằng cách sử dụng [. -1] lát

Một từ hoặc cụm từ là một bảng màu nếu nó được đánh vần giống nhau về phía trước cũng như ngược lại

Tương tự, bạn có thể trả về phiên bản đã sắp xếp của một chuỗi bằng cách sử dụng hàm đã sắp xếp. Nếu hai chuỗi được sắp xếp giống nhau, chúng là đảo chữ cái

Kiểm tra palindromes. Nguồn. Nik Piepenbreier

Đảo chữ là một từ hoặc cụm từ được hình thành bằng cách sắp xếp lại một từ khác. Nói tóm lại, hai từ là đảo chữ nếu chúng có cùng một chữ cái

Nếu bạn muốn xem hai từ có phải là đảo chữ không, bạn có thể sắp xếp hai từ và xem chúng có giống nhau không

Kiểm tra đảo chữ. Nguồn. Nik Piepenbreier8. Tách một chuỗi với. tách ra()

Giả sử bạn được cung cấp một chuỗi chứa nhiều phần dữ liệu. Có thể hữu ích khi tách chuỗi này để phân tích các phần dữ liệu riêng lẻ

Trong ví dụ bên dưới, một chuỗi chứa khu vực, họ của đại diện bán hàng cũng như số đơn đặt hàng

Kiểu dữ liệu tôi gặp nhiều nhất là Chuỗi, ký hiệu là str trong Python. Python cung cấp hơn 30 hàm dựng sẵn ⚡️ để thao tác với các chuỗi và giúp cuộc sống của chúng ta dễ dàng hơn. Biết các chức năng này sẽ không chỉ tăng khả năng phân tích dữ liệu của bạn mà còn giữ cho mã của bạn đơn giản. Thông qua câu chuyện này, tôi sẽ hướng dẫn bạn 5 phương pháp thao tác với chuỗi cần biết và cũng chia sẻ một số mẹo khi di chuyển 💡 để làm việc với Chuỗi

Những điểm chính rút ra từ câu chuyện này —

📌 Bạn sẽ thành thạo 5 phương pháp thao tác với chuỗi cần biết
📌 Nhận giải thích bằng hình ảnh duy nhất về hơn 30 phương pháp với chuỗi
📌 Một Jupyter-

Chuỗi là kiểu dữ liệu phổ biến nhất trong tất cả các dự án của tôi. Biết các phương pháp thao tác chuỗi này, luôn giúp tôi tăng tốc độ phân tích của mình

Trước khi đi xa hơn, hãy để tôi cho bạn biết định nghĩa đơn giản nhất về String

“bất cứ thứ gì được đặt trong dấu ngoặc đơn hoặc dấu ngoặc kép đều là Chuỗi trong Python. ”

String là một dãy các ký tự. Và các ký tự có thể là bất kỳ thứ gì — số, bảng chữ cái, ký hiệu và khoảng trống

💡 Dấu ngoặc đơn hay dấu ngoặc kép?
Cả hai sẽ hoạt động giống hệt nhau khi không có ký tự dấu nháy đơn nào trong chuỗi. Hình ảnh này ở đây, giải thích kịch bản tốt hơn.

Dấu ngoặc đơn so với dấu ngoặc kép cho chuỗi trong Python (Hình ảnh của tác giả)

Các chuỗi đại diện cho văn bản trong dữ liệu và do đó có thể có độ dài bất kỳ. Một loạt các thao tác có thể được thực hiện trên các chuỗi như tìm một ký tự cụ thể trong một chuỗi, thay thế các từ trong văn bản, thay đổi trường hợp chẳng hạn như chữ thường - chữ hoa của chuỗi, tách chuỗi hoặc nối chúng để có được một

Bắt đầu nào…

Định dạng chuỗi() trong Python

Đầu ra được định dạng có thể được tạo bằng phương thức format(). Nó cho phép sử dụng các trình giữ chỗ đơn giản để định dạng. Hầu hết thời gian, có một tình huống khi bạn cần định dạng một giá trị cụ thể và chèn nó vào chuỗi

Dưới đây là trường hợp cổ điển của tình huống này, in một chuỗi đầu ra chứa một số số và từ từ phân tích dữ liệu của bạn. Trong trường hợp này, các số và từ được định dạng và chèn vào chuỗi đầu ra bằng phương thức format()

Một trường hợp cổ điển của định dạng String() trong Python (Ảnh của Tác giả)

Như thể hiện trong ví dụ trên, các biến được đề cập trong .format()(được đánh dấu bằng hình vuông màu xanh lá cây) chứa một số giá trị và các giá trị này sẽ được chèn vào phần giữ chỗ trong câu lệnh in để hoàn thành chuỗi đầu ra. Các trình giữ chỗ được biểu thị bằng dấu ngoặc nhọn {} trong Python

Bây giờ, hãy để tôi cho bạn biết cách bạn có thể sử dụng phương thức format() trong dự án phân tích của mình. Dưới đây là 4 cách để triển khai phương thức format()

Đầu ra của tất cả các cách trên để triển khai phương thức format() đều giống nhau. Và bạn có thể kiểm tra nó trong hình dưới đây

Bốn cách để triển khai phương thức String format() (Ảnh của Tác giả)

Tuy nhiên, bạn đang tìm kiếm 💡 triển khai đơn giản hơn của định dạng()?

Sau đó, bạn nên dùng f-Strings. Nó còn được gọi là chuỗi ký tự được định dạng. Các chuỗi f như vậy có một bảng chữ cái fở đầu chuỗi được định dạng và có nhiều trình giữ chỗ {}trong chuỗi. Có một cái nhìn dưới đây,

Hình ảnh đơn giản hóa của ví dụ trên là trong hình bên dưới

f-Strings trong Python (Ảnh của Tác giả)Chuỗi thay thế() trong Python

Trong một dự án của tôi, khi khám phá dữ liệu đánh giá trên google, tôi muốn thay thế một số văn bản rác trong đánh giá bằng một chuỗi mặc định. Và tôi đã sử dụng str.replace() để giữ cho mã của mình sạch sẽ

Chuỗi trong Python là bất biến → do đó không thể thay đổi chuỗi gốc. Do đó, tất cả các phương thức tạo một bản sao của chuỗi, thực hiện một thao tác trên nó và trả về nó dưới dạng đầu ra

Đây là cú pháp —
str.replace(old_substring, new_substring)

Và điều này str.replace() trả về bản sao của chuỗi ban đầu trong đó old_substring được thay thế cho new_subsstring của tôi. Hãy để tôi chỉ cho bạn điều này với một ví dụ

Chuỗi thay thế () trong Python (Hình ảnh của Tác giả)

Đơn giản?
Ồ chờ đã, bạn có để ý không? . Điều gì sẽ xảy ra nếu 💡 Tôi chỉ muốn thay đổi hai lần xuất hiện đầu tiên của old_substring trong chuỗi gốc?

Sau đó đến tham số thứ ba và tùy chọn của str.replace(). Nó chỉ định số lần bạn muốn thay thế old_substring bằng chuỗi mới

Chuỗi thay thế () bằng số đếm (Hình ảnh của Tác giả)

Đó là tất cả những gì bạn có thể làm với phương pháp replace() này

Tham gia chuỗi () trong Python

Trong khi khám phá dữ liệu đánh giá trên google, tôi muốn kết hợp tên của nhà hàng, khu vực, thành phố và mã bưu chính để tạo thành một địa chỉ hoàn chỉnh dưới dạng một chuỗi. Phương pháp f0 đã ở đó để giúp tôi. Nó nhanh chóng kết nối một chuỗi bên cạnh chuỗi kia để tạo thành một đầu ra mong đợi

Cú pháp của phương thức này khá đơn giản. f1

Tham gia chuỗi () (Hình ảnh của Tác giả)

Như bạn có thể thấy ở đây, phương thức f0 chấp nhận chính xác một đối số và nó phải lặp lại được, nghĩa là nó có thể là một chuỗi, một danh sách hoặc một bộ. Và dấu phân cách có thể là bất kỳ thứ gì như dấu phẩy, khoảng trống, dấu hai chấm hoặc thậm chí là một chuỗi khác

Có một cái nhìn khác về ví dụ dưới đây,

Tham gia chuỗi () với một danh sách (Hình ảnh của Tác giả)

Chà, mỗi chuỗi được xác định rõ ở đây và chỉ cần một danh sách các chuỗi được chuyển đến f0. Để tôi chỉ cho bạn, mọi thứ hoạt động như thế nào trong trường hợp DataFrame của gấu trúc. Đây là một ví dụ khác cho bạn,

Tham gia chuỗi () trong Pandas DataFrame

tuyệt vời

Tất cả các cột gộp lại thành một, tôi có địa chỉ đầy đủ của nhà hàng. Trong mỗi hàng, tất cả các ô được nối với nhau bằng dấu phẩy và dấu cách làm dấu phân cách

Trong ví dụ trên, bạn cũng có thể thấy một trường hợp kinh điển 💡 về cách viết mã thành nhiều dòng và cách sử dụng hàm lambda

Tách chuỗi () trong Python

Phương thức f4 hoạt động hoàn toàn ngược lại với phương thứcf0. Không giống như f0 , split() phân tách các chuỗi trên một dấu phân cách hoặc dấu phân cách được chỉ định

Đề cập đến một dấu tách cũng là tùy chọn trong split(). Vì vậy, nếu bạn không đề cập đến bất kỳ dấu phân cách nào, dấu phân cách mặc định là Dấu cách và chuỗi sẽ được phân tách trên mỗi dấu cách. Là đầu ra, bạn sẽ nhận được một danh sách các chuỗi được phân tách

Với nền tảng này, bạn có thể đã nghĩ về cú pháp. Thế là xong, f7
Như bạn có thể thấy trong cú pháp, split() cũng chấp nhận một đối số tùy chọn khác là số lần tách. Vì vậy, nếu điều này được đặt thành 1, điều đó có nghĩa là hai chuỗi riêng biệt sẽ được trả về.

Một ví dụ giải thích nó tốt hơn

Tách chuỗi () (Hình ảnh của Tác giả)

Hãy xem một ví dụ khác khi cả hai đối số tùy chọn được đề cập trong split()

Tách chuỗi () với tất cả các tùy chọn (Hình ảnh của Tác giả)

Như đã thấy trong hình trên, 2 lần tách được thực hiện trên f8. Lần phân tách thứ nhất được thực hiện vào lần xuất hiện đầu tiên của dấu tách f9 và lần phân tách thứ 2 được thực hiện vào lần xuất hiện thứ 2 của f9. Split() là một công cụ khá tiện dụng khi xử lý dữ liệu văn bản

Đối với dự án phân tích dữ liệu COVID-19, tôi đã tìm kiếm một trong những trang web phổ biến để thu thập tất cả dữ liệu. Và đúng như dự đoán, tôi có một số ký tự không mong muốn ở đầu và cuối tên của các quốc gia. Tôi đã xóa những ký tự không mong muốn này bằng cách sử dụng replace(), nhưng còn số lượng khoảng trắng ngẫu nhiên ở đầu và cuối chuỗi thì sao?

sợi dây. dải () đến để giải cứu tôi. 💡

strip() có thể được coi là trường hợp đặc biệt của split() được dùng riêng để loại bỏ các khoảng trống ở đầu và cuối chuỗi. sợi dây. dải () xóa các khoảng trống từ đầu cũng như cuối chuỗi

Dải chuỗi () (Hình ảnh của Tác giả)

Nhưng nếu bạn chỉ muốn xóa khoảng trắng ở đầu hoặc cuối chuỗi, thì một lần nữa, dải () có 2 kiểu con - {}2 và {}3

Các kiểu con chuỗi () (Hình ảnh của Tác giả)

Bạn vẫn có thể thử kết hợp split(), strip() và replace() để thực hiện nhiều phép biến đổi dữ liệu và nhận được kết quả mong muốn. thử nghiệm vui vẻ

Hãy tìm kiếm một số từ, số cụ thể trong chuỗi đã cho bằng cách sử dụng phương pháp {}4

Tìm chuỗi () trong Python

Khi tôi tự động hóa dự án phân tích dữ liệu đầu tiên của mình, tôi đã từng lấy một chuỗi làm đầu ra và tôi cần tìm vị trí của một từ cụ thể trong chuỗi đó. Đó là lần đầu tiên tôi sử dụng phương pháp {}4

Vì mục đích của phương pháp này là tìm kiếm một chuỗi con cụ thể trong chuỗi chính và trả về chỉ mục của nó, nên {}4 chấp nhận 1 đối số bắt buộc và 2 đối số tùy chọn. Nó đi kèm với cú pháp.
______27

Tìm chuỗi () (Hình ảnh của Tác giả)

Hình trên giải thích rõ ràng phương thức {}4 trả về chỉ số của lần xuất hiện đầu tiên của chuỗi con trong chuỗi chính

Nhưng nếu chuỗi con không có trong chuỗi chính hoặc trong phạm vi vị trí bắt đầu và kết thúc nhất định thì sao?

Đừng lo lắng. Xem hình bên dưới. 💡

Khi không tìm thấy chuỗi con (Hình ảnh của Tác giả)

Python trả về -1 nếu không tìm thấy chuỗi con trong chuỗi chính đã cho

Đó là tất cả. Tôi thấy 5 phương thức chuỗi này hữu ích nhất trong tất cả các dự án của mình. Nắm vững những điều này chắc chắn có thể tăng tốc độ phân tích dữ liệu của bạn

________ Một hình ảnh mạnh hơn lời nói ________

📌 Đã đến lúc cho hình ảnh duy nhất đó với hơn 30 phương thức chuỗi. Với một hình ảnh duy nhất, bạn có thể biết tất cả các phương thức chuỗi trong Python và có thể được sử dụng làm tài liệu tham khảo nhanh

Tất cả các phương thức Chuỗi trong một hình ảnh (Hình ảnh của Tác giả)

📌 Như bạn có thể thấy, đây là những ảnh chụp thực tế từ Jupyter-notebook của tôi

💡 Bạn muốn tìm hiểu thêm về sắp xếp dữ liệu??

Sắp xếp lại dữ liệu — Chuyển đổi từ thô sang sạch

Một lời giải thích 3 từ đơn giản

hướng tới khoa học dữ liệu. com

Mẩu chuyện dài,

Thông qua câu chuyện của mình, tôi đã hướng dẫn bạn năm phương thức chuỗi phải biết. Nắm vững các phương pháp này, tôi đã thực hiện phân tích dữ liệu của mình nhanh hơn và đơn giản hơn, hy vọng nó cũng sẽ giúp ích cho bạn

Như mọi khi, tôi sẵn sàng nhận phản hồi và biết các phương pháp khác để phân tích dữ liệu nhanh hơn mà bạn sử dụng cho các dự án của mình

Chuỗi 5 phương thức là gì?

Hãy đi sâu vào các phương thức chuỗi Java được sử dụng phổ biến nhất và hiểu cách hoạt động của chúng. .
indexOf() Được sử dụng để tìm các ký tự và chuỗi con trong một chuỗi. .
toCharArray() Được sử dụng để tạo một mảng ký tự mới từ chuỗi này. .
charAt().
concat().
thay thế().
chuỗi con().
tách ra().
so với()

Các phương pháp để làm việc với chuỗi trong Python là gì?

Phương thức chuỗi Python

Phương thức chuỗi Python là gì?

Chuỗi là một dãy ký tự được đặt trong dấu ngoặc kép . Trong trang tham khảo này, bạn sẽ tìm thấy tất cả các phương thức mà một đối tượng chuỗi có thể gọi. Ví dụ: bạn có thể sử dụng phương thức nối () để nối hai chuỗi.

Có bao nhiêu phương thức trong chuỗi trong Python?

Chuỗi Python có 47 phương thức. Đó gần như là nhiều phương thức chuỗi như có các hàm tích hợp sẵn trong Python.