Hướng dẫn dùng titlecase python python

Hàm isspace[] trong Python

Hàm isupper[] trong Python

Hàm istitle[] trong Python trả về true nếu chuỗi là ở dạng titlecase - ký tự đầu tiên của mỗi chữ trong chuỗi là chữ hoa, nếu không là false.

Nội dung chính

  • Cú pháp
  • Ví dụ hàm titlecase[] trong Python

Cú pháp

Cú pháp của istitle[] trong Python:

str.istitle[]


Ví dụ hàm titlecase[] trong Python

Ví dụ sau minh họa cách sử dụng của hàm istitle[] trong Python.

str1 = "Vi Du Ham Istitle[] Trong Python"
print [str1.istitle[]]
str1 = "vi du ham istitle[] trong python"
print [str1.istitle[]]

Chạy chương trình Python trên sẽ cho kết quả:

True
False

Hàm isspace[] trong Python

Hàm isupper[] trong Python

Summary: in this tutorial, you’ll learn how to use the Python string title[] method to convert a string to titlecase.

Introduction to the Python title[] method

The titlecase is a capitalization style used for titles so that the first letter of each word is uppercase and the remaining letters are lowercase. For example:

Python Title Case Tutorial

Code language: PHP [php]

The rules for the titlecase, however, are not universally standardized.

To make titlecased version of a string, you use the string title[] method. The title[] returns a copy of a string in the titlecase.

The title[] method converts the first character of each words to uppercase and the remaining characters in lowercase.

The following shows the syntax of the title[] method:

str.title[]

Code language: CSS [css]

Python title[] method example

The following example shows how to use the title[] method to return the titlecased version of a string:

name = 'john doe'.title[] print[name]

Code language: PHP [php]

Output:

John Doe

Python title[] method limitation

The title[] method defines a word as a group of consecutive letters.

This rule works in many contexts. However, it won’t work as you may expect if a string contains the apostrophes [‘] like contractions and possessives. For example:

s = "They're john's relatives.".title[] print[s]

Code language: PHP [php]

Output:

They'Re John'S Relatives.

Code language: JavaScript [javascript]

In this example, the string contains apostrophes ['] that act as word boundaries. The title[] method treats They're as two separate words.

To fix it, you need to define a function that uses a regular expression:

import re def titlecase[s]: return re.sub[ r"[A-Za-z]+['[A-Za-z]+]?", lambda word: word.group[0].capitalize[], s]

Code language: JavaScript [javascript]

And use the titlecase[] function:

s = "They're john's relatives." s = titlecase[s] print[s]

Code language: PHP [php]

Output:

They're John's Relatives.

Code language: JavaScript [javascript]

Now, it works as expected.

Summary

  • Use the Python string title[] method to returns the titlecased version of a string.

Did you find this tutorial helpful ?

Chuỗi [String] trong Python

String là một trong các kiểu phổ biến nhất trong Python. String trong Python là immutable. Chúng ta có thể tạo các chuỗi bằng cách bao một text trong một trích dẫn đơn hoặc trích dẫn kép. Python coi các lệnh trích dẫn đơn và kép là như nhau. Ví dụ:

var1 = 'Hello World!'

var2 = "Python Programming"

Truy cập các giá trị trong String

Python không hỗ trợ một kiểu chữ cái; chúng được coi như các chuỗi có độ dài là 1. Trong Python, String được lưu giữ dưới dạng các ký tự đơn trong vị trí ô nhớ liên tiếp nhau. Lợi thế của sử dụng String là nó có thể được truy cập từ cả hai hướng [tiến về trước forward hoặc ngược về sau backward].

Việc lập chỉ mục của cả hai hướng đều được cung cấp bởi sử dụng String trong Python:

  • Chỉ mục với hướng forward bắt đầu với 0,1,2,3,…
  • Chỉ mục với hướng backward bắt đầu với -1,-2,-3,…

Để truy cập các giá trị trong String, bạn sử dụng các dấu ngoặc vuông có chỉ mục ở bên trong. Ví dụ:

var1 = 'Hello World!'

var2 = "Python Programming"

print "var1[0]: ", var1[0]

print "var2[1:5]: ", var2[1:5]

Khi code trên được thực thi sẽ cho kết quả:

var1[0]:  H

var2[1:5]:  ytho

Cập nhật String trong Python

Bạn có thể cập nhật một chuỗi đang tồn tại bằng cách gán [hoặc tái gán] một biến cho string khác. Giá trị mới có thể liên quan hoặc khác hoàn toàn giá trị trước đó. Ví dụ:

var1 = 'Hello World!'

print "Chuoi hien tai la :- ", var1[:6] + 'Python'

Khi code trên được thực thi sẽ cho kết quả:

Chuoi hien tai la :-  Hello Python

Các ký tự thoát trong Python

Bảng dưới đây liệt kê danh sách các ký tự thoát hoặc không thể in được mà có thể được biểu diễn với dấu \.

Ký tự thoát - Biểu diễn trong hệ 16 - Miêu tả

\a - 0x07 - Bell hoặc alert

\b - 0x08 - Backspace

\cx - Control-x

\C-x  -  Control-x

\e - 0x1b - Escape

\f - 0x0c - Formfeed

\M-\C-x  -  Meta-Control-x

\n - 0x0a - Newline

\nnn - Notation trong hệ cơ số 8, ở đây n là trong dãy từ 0 tới 7

\r - 0x0d - Carriage return

\s - 0x20 - Space

\t - 0x09 - Tab

\v - 0x0b - Tab dọc

\x - Ký tự x

\xnn - Notation trong hệ thập lục phân, ở đây n là trong dãy từ 0.9, a.f, hoặc A.F

Các toán tử để thao tác với String trong Python

Có ba kiểu toán tử được hỗ trợ bởi String, đó là:

  • Toán tử cơ bản
  • Toán tử membership
  • Toán tử quan hệ

Các toán tử cơ bản để thao tác với String

Có hai loại toán tử cơ bản có thể được sử dụng với String, đó là toán tử nối chuỗi + và toán tử lặp chuỗi *.

Toán tử nối chuỗi + được sử dụng để nối hai chuỗi với nhau và tạo nên một chuỗi mới. Ví dụ:

>>> "hoang" + "nam"

Sẽ cho kết quả là:

'hoangnam'

>>>

Chú ý: Cả hai toán hạng được truyền cho phép nối chuỗi này phải cùng kiểu, nếu không sẽ tạo một lỗi. Ví dụ:

'abc' + 3

>>>

Sẽ tạo ra một lỗi là:

Traceback [most recent call last]:

  File "", line 1, in

    'abc' + 3

TypeError: cannot concatenate 'str' and 'int' objects

>>>

Toán tử lặp chuỗi * sử dụng hai tham số. Một tham số là giá trị nguyên và tham số khác là chuỗi. Toán tử lặp chuỗi này được sử dụng để lặp đi lặp lại một chuỗi một số lần nào đó. Ví dụ:

>>> 5*"Hoang"

Sẽ cho kết quả là:

'HoangHoangHoangHoangHoang'

Ghi chú: Bạn có thể sử dụng toán tử lặp chuỗi * này theo bất kỳ cách nào như int * string hoặc string * int. Cả hai tham số được truyền cho toán tử này phải không trong cùng một kiểu.

Các toán tử membership để thao tác với String

Toán tử in: trả về true nếu một ký tự là có mặt trong chuỗi đã cho, nếu không nó trả về false.

Toán tử not in: trả về true nếu một ký tự là không tồn tại trong chuỗi đã cho, nếu không nó trả về false.

Ví dụ:

>>> str1="javapoint"

>>> str2='sssit'

>>> str3="seomount"

>>> str4='java'

>>> st5="it"

>>> str6="seo"

>>> str4 in str1

True

>>> str5 in str2

>>> st5 in str2

True

>>> str6 in str3

True

>>> str4 not in str1

False

>>> str1 not in str4

True

Các toán tử quan hệ để thao tác với String

Tất cả các toán tử quan hệ [như , =, ==, !=, ] cũng có thể áp dụng cho các String. Các chuỗi được so sánh dựa trên giá trị ASCII hoặc Unicode. Ví dụ:

>>> "HOANG"=="HOANG"

True

>>> "afsha">='Afsha'

True

>>> "Z""z"

True

Giải thích: Giá trị ASCII của a là 97, b là 98 và c là 99, … Giá trị ASCII của A là 65, B là 66, của C là 67, … Sự so sánh giữa các chuỗi được thực hiện dựa trên giá trị ASCII.

Dấu chia chuỗi [] trong Python

Có nhiều cách để chia một chuỗi. Khi chuỗi có thể được truy cập hoặc được lập chỉ mục từ cả hai hướng forward và backward thì chuỗi cũng có thể được chia theo hai hướng này. Dưới đây là cú pháp của dấu chia chuỗi [] trong Python:

[chi_muc_bat_dau:chi_muc_ket_thuc]

hoac

[:chi_muc_ket_thuc]

hoac

[chi_muc_bat_dau:]

Chẳng hạn với cú pháp [chi_muc_bat_dau:chi_muc_ket_thuc], thì toán tử này sẽ trả về các ký tự nằm trong dãy chỉ mục đã cho.

Ví dụ:

>>> str="Nikhil"

>>> str[0:6]

'Nikhil'

>>> str[0:3]

'Nik'

>>> str[2:5]

'khi'

>>> str[:6]

'Nikhil'

>>> str[3:]

'hil'

Ghi chú: chi_muc_bat_dau trong String là inclusive, tức là bao gồm cả ký tự tại vị trí chỉ mục đó. Còn chi_muc_ket_thuc là exclusive, tức là không bao gồm ký tự tại chỉ mục đó.

Toán tử định dạng chuỗi trong Python

Một trong những đặc điểm hay nhất trong Python là toán tử định dạng chuỗi %. Toán tử này là duy nhất cho các String và được sử dụng với hàm print[]. Ví dụ:

print "Ten toi la %s va toi nang %d kg!" % ['Hoang', 71]

Khi code trên được thực thi sẽ cho kết quả:

Ten toi la Hoang va toi nang 71 kg!

Bảng dưới đây liệt kê danh sách đầy đủ các biểu tượng có thể được sử dụng với toán tử %:

Biểu tượng định dạng - Chuyển đổi

%c - Ký tự

%s - Chuyển đổi thành chuỗi thông qua hàm str[] trước khi định dạng

%i - Số nguyên thập phân có dấu

%d - Số nguyên thập phân có dấu

%u - Số nguyên thập phân không dấu

%o - Số nguyên hệ bát phân

%x - Số nguyên hệ thập lục phân [các chữ cái thường]

%X - Số nguyên hệ thập lục phân [các chữ cái hoa]

%e - Ký hiệu số mũ [với chữ thường 'e']

%E - Ký hiệu số mũ [với chữ hoa 'E']

%f - Số thực dấu chấm động

%g - Viết gọn của %f và %e

%G - Viết gọn của %f và %E

Trích dẫn tam [triple quote] trong Python

Trích dẫn tam trong Python cho phép các chuỗi có thể trải rộng trên nhiều dòng, bao gồm đúng nguyên văn của các newline [dòng mới], tab và bất kỳ ký tự đặc biệt nào khác. Bạn theo dõi đoạn code sau:

para_str = """day la mot chuoi day gom nhieu dong

va gom mot so ky tu khong in duoc chang han nhu

TAB [ \t ] chung se duoc hien thi dung nguyen van nhu the."""

print para_str

Khi code trên được thực thi, nó cho kết quả như dưới đây. Bạn chú ý cách mỗi ký tự đặc biệt đã được chuyển đổi thành dạng được in của nó.

day la mot chuoi day gom nhieu dong

va gom mot so ky tu khong in duoc chang han nhu

TAB [ \t ] chung se duoc hien thi dung nguyen van nhu the.

Các chuỗi thô [raw string] không coi dấu \ như là một ký tự đặc biệt. Mỗi ký tự bạn đặt vào trong một chuỗi thô sẽ tồn tại giống như cách bạn đã viết nó.

Để hiểu rõ vấn đề này, trước hết bạn theo dõi ví dụ:

print 'C:\\nowhere'

Khi code trên được thực thi sẽ cho kết quả:

C:\nowhere

Bây giờ sử dụng chuỗi thô. Chúng ta đã đặt biểu thức trong r'bieu_thuc' như sau:

print r'C:\\nowhere'

Khi code trên được thực thi sẽ cho kết quả:

C:\\nowhere

Chuỗi dạng Unicode trong Python

Các chuỗi thông thường trong Python được lưu trữ nội tại dưới dạng ASCII 8 bit, trong khi các chuỗi Unicode được lưu trữ dưới dạng Unicode 16 bit. Điều này cho phép để có một tập hợp các ký tự đa dạng hơn, bao gồm các ký tự đặc biệt từ hầu hết các ngôn ngữ trên thế giới. Bạn theo dõi ví dụ:

print u'Hello, world!'

Khi code trên được thực thi sẽ cho kết quả:

Hello, world!

Như bạn có thể thấy, các chuỗi dạng Unicode sử dụng tiền tố u, trong khi các chuỗi thô sử dụng tiền tố r.

Các phương thức và hàm đã xây dựng sẵn để xử lý chuỗi trong Python

Python cung cấp các phương thức đa dạng đã được xây dựng sẵn để thao tác với các chuỗi. Bảng dưới đây liệt kê các phương thức này. Bạn truy cập link để thấy ví dụ chi tiết.

1. capitalize[]
Viết hoa chữ cái đầu tiên của chuỗi

Cú pháp

Cú pháp của phương thức capitalize[] trong Python:

str.capitalize[]

Tham số

  • NA

Trả về giá trị

Trả về một bản sao của chuỗi với chữ cái đầu tiên được viết hoa.

Chương trình Python ví dụ

Ví dụ sau minh họa cách sử dụng của phương thức capitalize[] trong Python.

str = "vi du Python ve chuoi!!!";

print "str.capitalize[] : ", str.capitalize[]

Chạy chương trình Python trên sẽ cho kết quả:

str.capitalize[] :  Vi du python ve chuoi!!!

2. center[width, fillchar]
Trả về một chuỗi mới, trong đó chuỗi ban đầu đã được cho vào trung tâm và hai bên đó là các fillchar sao cho tổng số ký tự của chuỗi mới là width

Cú pháp

str.center[width[, fillchar]]

Tham số

  • width -- Đây là tổng độ dài của chuỗi.
  • fillchar -- Đây là ký tự cần điền vào.

Trả về giá trị

Trả về một chuỗi mới, trong đó chuỗi ban đầu đã được cho vào trung tâm và hai bên đó là các fillchar sao cho tổng số ký tự của chuỗi mới là width.

Chương trình Python ví dụ

Ví dụ sau minh họa cách sử dụng của center[] trong Python.

str = "vi du Python ve chuoi!!!";

print "str.center[40, 'a'] : ", str.center[40, 'a']

Kết quả là:

str.center[40, 'a'] :  aaaaaaaavi du Python ve chuoi!!!aaaaaaaa

3. count[str, beg= 0, end = len[string]]
Đếm xem chuỗi str này xuất hiện bao nhiêu lần trong chuỗi string hoặc chuỗi con của string nếu bạn cung cấp chỉ mục ban đầu start và chỉ mục kết thúc end

Cú pháp

str.count[sub, start= 0,end=len[string]]

Chi tiết về tham số:

  • sub -- Đây là chuỗi con để được tìm kiếm.
  • start -- Tìm kiếm bắt đầu từ chỉ mục này. Ký tự đầu tiên bắt đầu từ chỉ mục 0. Theo mặc định, bắt đầu tìm kiếm từ chỉ mục 0.
  • end -- Tìm kiếm kết thúc tại chỉ mục này. Theo mặc định, việc tìm kiếm kết thúc ở chỉ mục cuối cùng.

Trả về giá trị

Đếm xem chuỗi str này xuất hiện bao nhiêu lần trong chuỗi string hoặc chuỗi con của string nếu bạn cung cấp chỉ mục ban đầu start và chỉ mục kết thúc end

Chương trình Python ví dụ

str = "vi du Python ve chuoi!!!";

sub = "i";

print "str.count[sub, 4, 40] : ", str.count[sub, 4, 40]

sub = "vietjack";

print "str.count[sub] : ", str.count[sub]

Kết quả là:

str.count[sub, 4, 40] :  1

str.count[sub] :  0

4. decode[encoding='UTF-8',errors='strict']
Giải mã chuỗi bởi sử dụng encoding đã cho

Cú pháp

Str.decode[encoding='UTF-8',errors='strict']

Chi tiết về tham số:

  • encoding -- Đây là encodings để được sử dụng.
  • errors -- Tham số này có thể được cung cấp để thiết lập một trình xử lý lỗi khác. Mặc định cho lỗi là 'strict', nghĩa là các lỗi liên quan tới mã hóa sẽ tạo một UnicodeError. Một số giá trị khác là 'ignore', 'replace', 'xmlcharrefreplace', 'backslashreplace' ...

Trả về giá trị

Trả về chuỗi đã được giải mã.

Chương trình Python ví dụ

Str = "vi du Python ve chuoi!!!";

Str = Str.encode['base64','strict'];

print "Chuoi duoc ma hoa la: " + Str

print "Chuoi sau khi giai ma la: " + Str.decode['base64','strict']

Kết quả là:

Chuoi duoc ma hoa la: dmkgZHUgUHl0aG9uIHZlIGNodW9pISEh

Chuoi sau khi giai ma la: vi du Python ve chuoi!!!

5. encode[encoding='UTF-8',errors='strict']
Trả về phiên bản chuỗi đã được mã hóa của chuỗi ban đầu. Nếu có lỗi xảy ra, thì chương trình sẽ tạo một ValueError trừ khi các lỗi này được cung cấp với ignore hoặc replace

Cú pháp

str.encode[encoding='UTF-8',errors='strict']

Chi tiết về tham số:

  • encoding -- Đây là encodings để được sử dụng.
  • errors -- Tham số này có thể được cung cấp để thiết lập một trình xử lý lỗi khác. Mặc định cho lỗi là 'strict', nghĩa là các lỗi liên quan tới mã hóa sẽ tạo một UnicodeError. Một số giá trị khác là 'ignore', 'replace', 'xmlcharrefreplace', 'backslashreplace' ...

Trả về giá trị

Trả về phiên bản chuỗi đã được mã hóa của chuỗi ban đầu.

Chương trình Python ví dụ

str = "vi du Python ve chuoi!!!";

print "Ma hoa chuoi la: " + str.encode['base64','strict']

Kết quả là:

Ma hoa chuoi la: dmkgZHUgUHl0aG9uIHZlIGNodW9pISEh

6. endswith[suffix, beg=0, end=len[string]]
Xác định xem nếu chuỗi string hoặc chuỗi con đã cho của string [nếu bạn cung cấp chỉ mục bắt đầu beg và chỉ mục kết thúc end] kết thúc với hậu tố suffix thì trả về true, nếu không thì phương thức này trả về false

Cú pháp

str.endswith[suffix[, start[, end]]]

Chi tiết về tham số:

  • suffix -- Đây có thể là một chuỗi hoặc cũng có thể là một tuple của các tiền tố.
  • start -- Chỉ mục bắt đầu.
  • end -- Chỉ mục kết thúc.

Trả về giá trị

TRUE nếu chuỗi kết thúc với suffix đã cho, nếu không thì trả về FALSE.

Chương trình Python ví dụ

str = "vi du Python ve chuoi....ok!!!";

suffix = "ok!!!";

print str.endswith[suffix]

print str.endswith[suffix,20]

suffix = "is";

print str.endswith[suffix, 2, 4]

print str.endswith[suffix, 2, 6]

Kết quả là:

True

True

False

False

7. expandtabs[tabsize=8]
Mở rộng các tab trong chuỗi tới số khoảng trống đã cho; mặc định là 8 space cho mỗi tab nếu bạn không cung cấp tabsize

Cú pháp

str.expandtabs[tabsize=8]

Chi tiết về tham số:

  • tabsize -- Xác định số ký tự để được thay thế cho một ký tự tab '\t'.

Trả về giá trị

Trả về một bản sao của chuỗi với tab đã được mở rộng [chẳng hạn bởi cac khoảng trống].

Chương trình Python ví dụ

str = "vi du\tPython ve chuoi....ok!!!";

print "Chuoi ban dau: " + str

print "Chuoi voi tab mac dinh: " +  str.expandtabs[]

print "Chuoi voi tab mo rong: " +  str.expandtabs[12]

Kết quả là:

Chuoi ban dau: vi du   Python ve chuoi....ok!!!

Chuoi voi tab mac dinh: vi du   Python ve chuoi....ok!!!

Chuoi voi tab mo rong: vi du       Python ve chuoi....ok!!!

8. find[str, beg=0 end=len[string]]
Xác định xem chuỗi str có xuất hiện trong chuỗi string hoặc chuỗi con đã cho của string [nếu bạn cung cấp chỉ mục bắt đầu beg và chỉ mục kết thúc end], nếu xuất hiện thì trả về chỉ mục của str, còn không thì trả về -1

Cú pháp

str.find[str, beg=0 end=len[string]]

Chi tiết về tham số:

  • str -- Xác định chuỗi để được tìm kiếm.
  • beg -- Xác định chỉ mục bắt đầu, mặc định là 0.
  • end -- Xác định chỉ mục kết thúc, mặc định là bằng độ dài chuỗi.

Trả về giá trị

Trả về giá trị chỉ mục nếu được tìm thấy, nếu không thì trả về -1.

Chương trình Python ví dụ

str1 = "vi du Python ve chuoi....ok!!!";

str2 = "on";

print str1.find[str2]

print str1.find[str2, 10]

print str1.find[str2, 40]

Kết quả là:

10

10

-1

9. index[str, beg=0 end=len[string]]
Tương tự như find[], nhưng tạo ra một ngoại lệ nếu str là không được tìm thấy

Cú pháp

str.index[str, beg=0 end=len[string]]

Chi tiết về tham số:

  • str -- Xác định chuỗi để được tìm kiếm.
  • beg -- Xác định chỉ mục bắt đầu, mặc định là 0.
  • end -- Xác định chỉ mục kết thúc, mặc định là bằng độ dài chuỗi.

Trả về giá trị

Xác định xem chuỗi str có xuất hiện trong chuỗi string hoặc chuỗi con đã cho của string [nếu bạn cung cấp chỉ mục bắt đầu beg và chỉ mục kết thúc end], nếu xuất hiện thì trả về chỉ mục của str, nếu không tìm thấy thì trả về một.

Chương trình Python ví dụ

str1 = "vi du Python ve chuoi....ok!!!";

str2 = "on";

print str1.index[str2]

print str1.index[str2, 10]

print str1.index[str2, 40]

Kết quả là:

10

10

Traceback [most recent call last]:

  File "C:/Users/doannhg/PycharmProjects/test/test.py", line 10, in >module

Chủ Đề