Hướng dẫn how do you extract uppercase in python? - làm thế nào để bạn giải nén chữ hoa trong python?

hoặc sử dụng regex ... đây là một câu trả lời dễ dàng

import re
print ''.join(re.findall('[A-Z]+',my_string))

Chỉ để so sánh

In [6]: %timeit filter(str.isupper,my_list)
1000 loops, best of 3: 774 us per loop

In [7]: %timeit ''.join(re.findall('[A-Z]+',my_list))
1000 loops, best of 3: 563 us per loop

In [8]: %timeit re.sub('[^A-Z]', '', my_list)
1000 loops, best of 3: 869 us per loop

In [10]: %timeit ''.join(c for c in my_list if c.isupper())
1000 loops, best of 3: 1.05 ms per loop

Vì vậy, tham gia Plus Findall này là phương pháp nhanh nhất (trên mỗi thời gian IPYTHON %(Python 2.6)), sử dụng chuỗi giống hệt nhau 10000 ký tự

Chỉnh sửa: hoặc không: Or not

In [12]: %timeit  my_list.translate(None,string.ascii_lowercase)
10000 loops, best of 3: 51.6 us per loop

Trong bài đăng này, chúng tôi sẽ học cách trích xuất các từ chữ hoa trong chuỗi python với các ví dụ. Chúng tôi đã sử dụng biểu thức chính quy để trích xuất các từ vốn từ một chuỗi đã cho. Một biểu thức chính quy (hoặc re) chỉ định một tập hợp các chuỗi phù hợp với nó; Các hàm trong mô -đun này cho phép bạn kiểm tra xem một chuỗi cụ thể có khớp với biểu thức thông thường nhất định không. Chúng tôi sẽ bao gồm trích xuất các từ chữ hoa từ các danh sách trong Python, trích xuất các từ chữ ký số từ các chuỗi trong Python, chỉ trích xuất các chữ cái từ trên Thư từ chuỗi trong PythonWe have used Regular expression to extract capital words from a given string.” A regular expression (or RE) specifies a set of strings that matches it; the functions in this module let you check if a particular string matches a given regular expression”.We will cover extracting uppercase words from lists in Python, extracting alphanumeric uppercase words from strings in Python, Extract Only uppercase letters from strings in Python, Count uppercase letters from strings in Python


Trong ví dụ này, chúng tôi đã trích xuất tất cả các từ chữ hoa từ chuỗi python bằng cách sử dụng biểu thức chính quy. Trong trường hợp như vậy trước tiên, chúng tôi phải nhập mô -đun biểu thức chính quy trong chương trình của chúng tôi bằng cách sử dụng Nhập RE RE. Biểu thức chính quy như sau. Hàm re mô -đun findall () sẽ trả về từ phù hợp với mẫu đã cho.

  • [A-Z]: Nó trích xuất chữ in hoa giữa A-Z.
  • \ B: Bắt đầu từ

import re
strText = 'Welcome to DEVENUM.COM,LET FIND UPPER CASE STRING';
print(re.findall(r'\b[A-Z]+(?:\s+[A-Z]+)*\b', strText))

Đầu ra

['DEVENUM', 'COM', 'LET FIND UPPER CASE STRING']

2. Cách trích xuất các từ chữ hoa trong chuỗi python bằng regex


Trong ví dụ này, chúng tôi đang sử dụng biểu thức thông thường ‘[A-Z]+, để trích xuất chữ hoa và các từ trên từ một chuỗi. Hãy cho chúng tôi hiểu mã và đầu ra.

import re
myStr = "Welcome folks'S TO DEVENUM! HOW ARE YOU"
pattern =  '[A-Z]+'
print(re.findall(pattern, myStr))

Đầu ra

[' TO DEVENUM', ' HOW ARE YOU']

2. Cách trích xuất các từ chữ hoa trong chuỗi python bằng regex


Trong ví dụ này, chúng tôi đang sử dụng biểu thức thông thường ‘[A-Z]+, để trích xuất chữ hoa và các từ trên từ một chuỗi. Hãy cho chúng tôi hiểu mã và đầu ra.

import re
mylist = ['Welcome','to','DEVENUM','COM','LET', 'FIND','CASE']
for item in mylist: 
 print(re.findall(r'\b[A-Z]+(?:\s+[A-Z]+)*\b', item))

Đầu ra

[]
[]
['DEVENUM']
['COM']
['LET']
['FIND']
['CASE']

2. Cách trích xuất các từ chữ hoa trong chuỗi python bằng regex


Trong ví dụ này, chúng tôi đang sử dụng biểu thức thông thường ‘[A-Z]+, để trích xuất chữ hoa và các từ trên từ một chuỗi. Hãy cho chúng tôi hiểu mã và đầu ra.

import re
myStr = "Welcome D2'S TO D56EV ENUM! H69OW A89E Y20OU"
pattern =  '[A-Z0-9][A-Z0-9]+|\b[A-Z]*\b'
print(re.findall(pattern, myStr))

Đầu ra

In [6]: %timeit filter(str.isupper,my_list)
1000 loops, best of 3: 774 us per loop

In [7]: %timeit ''.join(re.findall('[A-Z]+',my_list))
1000 loops, best of 3: 563 us per loop

In [8]: %timeit re.sub('[^A-Z]', '', my_list)
1000 loops, best of 3: 869 us per loop

In [10]: %timeit ''.join(c for c in my_list if c.isupper())
1000 loops, best of 3: 1.05 ms per loop
0

2. Cách trích xuất các từ chữ hoa trong chuỗi python bằng regex


Trong ví dụ này, chúng tôi đang sử dụng biểu thức thông thường ‘[A-Z]+, để trích xuất chữ hoa và các từ trên từ một chuỗi. Hãy cho chúng tôi hiểu mã và đầu ra.

In [6]: %timeit filter(str.isupper,my_list)
1000 loops, best of 3: 774 us per loop

In [7]: %timeit ''.join(re.findall('[A-Z]+',my_list))
1000 loops, best of 3: 563 us per loop

In [8]: %timeit re.sub('[^A-Z]', '', my_list)
1000 loops, best of 3: 869 us per loop

In [10]: %timeit ''.join(c for c in my_list if c.isupper())
1000 loops, best of 3: 1.05 ms per loop
1

Đầu ra

In [6]: %timeit filter(str.isupper,my_list)
1000 loops, best of 3: 774 us per loop

In [7]: %timeit ''.join(re.findall('[A-Z]+',my_list))
1000 loops, best of 3: 563 us per loop

In [8]: %timeit re.sub('[^A-Z]', '', my_list)
1000 loops, best of 3: 869 us per loop

In [10]: %timeit ''.join(c for c in my_list if c.isupper())
1000 loops, best of 3: 1.05 ms per loop
2

2. Cách trích xuất các từ chữ hoa trong chuỗi python bằng regex


Trong ví dụ này, chúng tôi đang sử dụng biểu thức thông thường ‘[A-Z]+, để trích xuất chữ hoa và các từ trên từ một chuỗi. Hãy cho chúng tôi hiểu mã và đầu ra.

In [6]: %timeit filter(str.isupper,my_list)
1000 loops, best of 3: 774 us per loop

In [7]: %timeit ''.join(re.findall('[A-Z]+',my_list))
1000 loops, best of 3: 563 us per loop

In [8]: %timeit re.sub('[^A-Z]', '', my_list)
1000 loops, best of 3: 869 us per loop

In [10]: %timeit ''.join(c for c in my_list if c.isupper())
1000 loops, best of 3: 1.05 ms per loop
3

Đầu ra

In [6]: %timeit filter(str.isupper,my_list)
1000 loops, best of 3: 774 us per loop

In [7]: %timeit ''.join(re.findall('[A-Z]+',my_list))
1000 loops, best of 3: 563 us per loop

In [8]: %timeit re.sub('[^A-Z]', '', my_list)
1000 loops, best of 3: 869 us per loop

In [10]: %timeit ''.join(c for c in my_list if c.isupper())
1000 loops, best of 3: 1.05 ms per loop
4

2. Cách trích xuất các từ chữ hoa trong chuỗi python bằng regex

Trong ví dụ này, chúng tôi đang sử dụng biểu thức thông thường ‘[A-Z]+, để trích xuất chữ hoa và các từ trên từ một chuỗi. Hãy cho chúng tôi hiểu mã và đầu ra.