Khi không có dấu tách nào được chuyển đến phương thức str.split[]
, nó sẽ tách chuỗi đầu vào thành một hoặc nhiều ký tự khoảng trắng
Bước tiếp theo là sử dụng lớp set[]
để chuyển đổi danh sách các từ thành một đối tượng set
Lớp nhận một đối số tùy chọn có thể lặp lại và trả về một đối tượng set
mới với các phần tử được lấy từ đối tượng có thể lặp lại
Các đối tượng của tập hợp lưu trữ một bộ sưu tập các phần tử duy nhất không có thứ tự, do đó, việc chuyển đổi danh sách thành một ____14_______ sẽ loại bỏ tất cả các phần tử trùng lặp
Bước cuối cùng là sử dụng hàm len[]
để lấy số từ duy nhất
Hàm trả về chiều dài [số lượng mục] của một đối tượng
Đối số mà hàm nhận có thể là một chuỗi [một chuỗi, bộ dữ liệu, danh sách, phạm vi hoặc byte] hoặc một bộ sưu tập [từ điển, tập hợp hoặc tập hợp cố định]
Đếm các từ duy nhất trong một tệp văn bản trong Python
Để đếm các từ duy nhất trong một tệp văn bản
- Đọc nội dung của tệp thành một chuỗi và chia thành các từ
- Sử dụng lớp
set[]
để chuyển đổi danh sách thành đối tượngset
- Sử dụng hàm
len[]
để đếm các từ duy nhất trong tệp văn bản
Ví dụ trên giả định rằng bạn có một tệp có tên str.split[]
5 với các nội dung sau
one one
two two
three three
Chúng tôi đã mở tệp ở chế độ đọc và sử dụng phương pháp str.split[]
6 để đọc nội dung của nó thành một chuỗi
Bước tiếp theo là sử dụng phương thức str.split[]
để tách chuỗi thành một danh sách các từ
Phương thức tách chuỗi thành một danh sách các chuỗi con bằng dấu phân cách
Khi không có dấu tách nào được chuyển đến phương thức str.split[]
, nó sẽ tách chuỗi đầu vào thành một hoặc nhiều ký tự khoảng trắng
Chúng tôi đã sử dụng lớp set[]
để chuyển đổi danh sách thành đối tượng set
Lớp nhận một đối số tùy chọn có thể lặp lại và trả về một đối tượng set
mới với các phần tử được lấy từ đối tượng có thể lặp lại
Các đối tượng tập hợp là một tập hợp các phần tử duy nhất không có thứ tự, do đó, việc chuyển đổi danh sách thành một ____14_______ sẽ loại bỏ tất cả các phần tử trùng lặp
Bước cuối cùng là sử dụng hàm len[]
để lấy số từ duy nhất trong tệp
Hàm trả về chiều dài [số lượng mục] của một đối tượng
Đối số mà hàm nhận có thể là một chuỗi [một chuỗi, bộ dữ liệu, danh sách, phạm vi hoặc byte] hoặc một bộ sưu tập [từ điển, tập hợp hoặc tập hợp cố định]
Đếm số lượng từ duy nhất trong Chuỗi bằng vòng lặp for
Để đếm số từ duy nhất trong một chuỗi
- Khai báo một biến mới lưu danh sách rỗng
- Sử dụng phương pháp
str.split[]
để tách chuỗi thành danh sách các từ - Sử dụng vòng lặp
set[]
5 để lặp lại danh sách - Sử dụng phương pháp
set[]
6 để nối tất cả các từ duy nhất vào danh sách - Sử dụng hàm
len[]
để lấy độ dài của danh sách
Chúng tôi đã sử dụng phương pháp str.split[]
để chia chuỗi thành danh sách các từ và sử dụng vòng lặp set[]
5 để lặp lại danh sách
Trên mỗi lần lặp, chúng tôi sử dụng toán tử set
0 để kiểm tra xem phần tử không có trong danh sách hay không
Các bài kiểm tra tư cách thành viên. Ví dụ: set
1 ước tính thành set
2 nếu set
3 là thành viên của set
4, nếu không, nó ước tính thành set
5
Chuỗi là loại dữ liệu thiết yếu trong bất kỳ ngôn ngữ lập trình nào, kể cả python. Chúng ta cần thực hiện nhiều thao tác khác nhau hay còn gọi là tiền xử lý chuỗi như loại bỏ các khoảng trắng không cần thiết, đếm số từ trong chuỗi, biến chuỗi thành các trường hợp giống nhau [chữ hoa hoặc chữ thường]. Trong bài viết này, chúng ta sẽ tìm hiểu cách đếm từ trong một chuỗi trong python.
Chúng ta sẽ học cách đếm số từ trong một chuỗi. Ví dụ- Chúng tôi có một chuỗi-” Xin chào, đây là một chuỗi. ” Nó có năm từ. Ngoài ra, chúng ta sẽ học cách đếm tần suất của một từ cụ thể trong một chuỗi.
nội dung
Các cách khác nhau trong Python để đếm từ trong Chuỗi
- Đếm từ bằng cách sử dụng vòng lặp For-
- Sử dụng split[] để đếm từ trong một chuỗi
- Đếm tần suất của các từ trong một chuỗi bằng từ điển
- Đếm tần suất của các từ trong chuỗi Sử dụng Count[]
1. Đếm từ bằng cách sử dụng vòng lặp For-
Sử dụng vòng lặp for là cách tiếp cận ngây thơ để giải quyết vấn đề này. Chúng tôi đếm số khoảng cách giữa hai ký tự.
'Python is an interpreted, high-level, general-purpose programming language' has total words: 8'' Hi. My name is Ashwini ' has total words: 5def count_words[string]: # Removing the spaces from start and end string1=string.strip[] # Initializing the count from 1 because we there is no space at the last count=1 # Iterating through the string for i in string1: # If we encounter space, increment the count with 1. if i==" ": count+=1 return count string="Python is an interpreted, high-level, general-purpose programming language" print["'{}'".format[string],"has total words:",count_words[string]] string2=" Hi. My name is Ashwini " print["'{}'".format[string2],"has total words:",count_words[string2]]
2. Sử dụng split[] để đếm từ trong một chuỗi
Chúng ta có thể sử dụng hàm split[] để đếm từ trong chuỗi.
def word_count[string]: # Here we are removing the spaces from start and end, # and breaking every word whenever we encounter a space # and storing them in a list. The len of the list is the # total count of words. return[len[string.strip[].split[" "]]] string="Python is an interpreted, high-level, general-purpose programming language" print["'{}'".format[string],"has total words:",count_words[string]] string2=" Hi. My name is Ashwini " print["'{}'".format[string2],"has total words:",word_count[string2]]
Đầu ra-
''Python is an interpreted, high-level, general-purpose programming language' has total words: 8'' Hi. My name is Ashwini ' has total words: 5
3. Đếm tần suất của các từ trong Chuỗi bằng Python bằng Từ điển
def wordFrequency[string]: # converting the string into lowercase string=string.lower[] # Whenever we encounter a space, break the string string=string.split[" "] # Initializing a dictionary to store the frequency of words word_frequency={} # Iterating through the string for i in string: # If the word is already in the keys, increment its frequency if i in word_frequency: word_frequency[i]+=1 # It means that this is the first occurence of the word else: word_frequency[i]=1 return[word_frequency] string="Woodchuck How much wood would a woodchuck chuck if a woodchuck could chuck wood ?" print[wordFrequency[string]]
Đầu ra-
{'woodchuck': 3, 'how': 1, 'much': 1, 'wood': 2, 'would': 1, 'a': 2, 'chuck': 2, 'if': 1, 'could': 1, '?': 1}
4. Đếm tần suất của các từ trong chuỗi trong Python Sử dụng Count[]
Count[] có thể được sử dụng để đếm số lần một từ xuất hiện trong một chuỗi hoặc nói cách khác, nó được sử dụng để cho biết tần suất xuất hiện của một từ trong chuỗi. Chúng ta chỉ cần chuyển từ trong đối số.
def return_count[string,word]: string=string.lower[] # In string, what is the count that word occurs return string.count[word] string2="Peter Piper picked a peck of pickled peppers. How many pickled peppers did Peter Piper pick?" return_count[string2,'piper']
Đầu ra-
2
Nếu chúng ta muốn biết số lần mỗi từ xuất hiện, chúng ta có thể tạo một hàm cho điều đó.
________số 8_______
Đầu ra-
{['how', 1], ['would', 1], ['woodchuck', 3], ['a', 2], ['chuck', 2], ['could', 1], ['if', 1], ['?', 1], ['wood', 2], ['much', 1]}
Nếu chúng ta muốn biết một từ cụ thể xuất hiện bao nhiêu lần trong một chuỗi trong một khoảng thời gian, chúng ta có thể sử dụng các tham số bắt đầu và kết thúc của đếm[].
Ví dụ-
string="Can you can a can as a canner can can a can?" # if you want to take cases into account remove this line string=string.lower[] # between index=8 and 17, how many times the word 'can' occurs print[string.count["can",8,17]]
Đầu ra-
''Python is an interpreted, high-level, general-purpose programming language' has total words: 8'' Hi. My name is Ashwini ' has total words: 50
Phải đọc
- Cách chuyển chuỗi thành chữ thường trong
- Cách tính căn bậc hai
- Đầu vào của người dùng. Hàm nhập []. Đầu vào bàn phím
- Cuốn sách hay nhất để học Python
Phần kết luận
Trong thời đại hiện nay, dữ liệu rất quan trọng. Và khi thế giới Khoa học dữ liệu đang phát triển nhanh chóng và việc sử dụng python cũng vậy, tiền xử lý dữ liệu là rất quan trọng. Chúng ta cần đếm các từ trong một chuỗi trong python để xử lý trước dữ liệu văn bản và để làm được điều đó, các phương pháp đã thảo luận ở trên là rất quan trọng.