Python đếm từ trong danh sách chuỗi

Khi không có dấu tách nào được chuyển đến phương thức str.split[], nó sẽ tách chuỗi đầu vào thành một hoặc nhiều ký tự khoảng trắng

Bước tiếp theo là sử dụng lớp set[] để chuyển đổi danh sách các từ thành một đối tượng set

Lớp nhận một đối số tùy chọn có thể lặp lại và trả về một đối tượng set mới với các phần tử được lấy từ đối tượng có thể lặp lại

Các đối tượng của tập hợp lưu trữ một bộ sưu tập các phần tử duy nhất không có thứ tự, do đó, việc chuyển đổi danh sách thành một ____14_______ sẽ loại bỏ tất cả các phần tử trùng lặp

Bước cuối cùng là sử dụng hàm len[] để lấy số từ duy nhất

Hàm trả về chiều dài [số lượng mục] của một đối tượng

Đối số mà hàm nhận có thể là một chuỗi [một chuỗi, bộ dữ liệu, danh sách, phạm vi hoặc byte] hoặc một bộ sưu tập [từ điển, tập hợp hoặc tập hợp cố định]

Đếm các từ duy nhất trong một tệp văn bản trong Python

Để đếm các từ duy nhất trong một tệp văn bản

  1. Đọc nội dung của tệp thành một chuỗi và chia thành các từ
  2. Sử dụng lớp set[] để chuyển đổi danh sách thành đối tượng set
  3. Sử dụng hàm len[] để đếm các từ duy nhất trong tệp văn bản

Ví dụ trên giả định rằng bạn có một tệp có tên str.split[]5 với các nội dung sau

one one
two two
three three

Chúng tôi đã mở tệp ở chế độ đọc và sử dụng phương pháp str.split[]6 để đọc nội dung của nó thành một chuỗi

Bước tiếp theo là sử dụng phương thức str.split[] để tách chuỗi thành một danh sách các từ

Phương thức tách chuỗi thành một danh sách các chuỗi con bằng dấu phân cách

Khi không có dấu tách nào được chuyển đến phương thức str.split[], nó sẽ tách chuỗi đầu vào thành một hoặc nhiều ký tự khoảng trắng

Chúng tôi đã sử dụng lớp set[] để chuyển đổi danh sách thành đối tượng set

Lớp nhận một đối số tùy chọn có thể lặp lại và trả về một đối tượng set mới với các phần tử được lấy từ đối tượng có thể lặp lại

Các đối tượng tập hợp là một tập hợp các phần tử duy nhất không có thứ tự, do đó, việc chuyển đổi danh sách thành một ____14_______ sẽ loại bỏ tất cả các phần tử trùng lặp

Bước cuối cùng là sử dụng hàm len[] để lấy số từ duy nhất trong tệp

Hàm trả về chiều dài [số lượng mục] của một đối tượng

Đối số mà hàm nhận có thể là một chuỗi [một chuỗi, bộ dữ liệu, danh sách, phạm vi hoặc byte] hoặc một bộ sưu tập [từ điển, tập hợp hoặc tập hợp cố định]

Đếm số lượng từ duy nhất trong Chuỗi bằng vòng lặp for

Để đếm số từ duy nhất trong một chuỗi

  1. Khai báo một biến mới lưu danh sách rỗng
  2. Sử dụng phương pháp str.split[] để tách chuỗi thành danh sách các từ
  3. Sử dụng vòng lặp set[]5 để lặp lại danh sách
  4. Sử dụng phương pháp set[]6 để nối tất cả các từ duy nhất vào danh sách
  5. Sử dụng hàm len[] để lấy độ dài của danh sách

Chúng tôi đã sử dụng phương pháp str.split[] để chia chuỗi thành danh sách các từ và sử dụng vòng lặp set[]5 để lặp lại danh sách

Trên mỗi lần lặp, chúng tôi sử dụng toán tử set0 để kiểm tra xem phần tử không có trong danh sách hay không

Các bài kiểm tra tư cách thành viên. Ví dụ: set1 ước tính thành set2 nếu set3 là thành viên của set4, nếu không, nó ước tính thành set5

Chuỗi là loại dữ liệu thiết yếu trong bất kỳ ngôn ngữ lập trình nào, kể cả python. Chúng ta cần thực hiện nhiều thao tác khác nhau hay còn gọi là tiền xử lý chuỗi như loại bỏ các khoảng trắng không cần thiết, đếm số từ trong chuỗi, biến chuỗi thành các trường hợp giống nhau [chữ hoa hoặc chữ thường]. Trong bài viết này, chúng ta sẽ tìm hiểu cách đếm từ trong một chuỗi trong python.  

Chúng ta sẽ học cách đếm số từ trong một chuỗi. Ví dụ- Chúng tôi có một chuỗi-” Xin chào, đây là một chuỗi. ” Nó có năm từ. Ngoài ra, chúng ta sẽ học cách đếm tần suất của một từ cụ thể trong một chuỗi.  

nội dung

Các cách khác nhau trong Python để đếm từ trong Chuỗi

  • Đếm từ bằng cách sử dụng vòng lặp For-
  • Sử dụng split[] để đếm từ trong một chuỗi
  • Đếm tần suất của các từ trong một chuỗi bằng từ điển
  • Đếm tần suất của các từ trong chuỗi Sử dụng Count[]

1. Đếm từ bằng cách sử dụng vòng lặp For-

Sử dụng vòng lặp for là cách tiếp cận ngây thơ để giải quyết vấn đề này. Chúng tôi đếm số khoảng cách giữa hai ký tự.  

def count_words[string]:
    # Removing the spaces from start and end
    string1=string.strip[]
    # Initializing the count from 1 because we there is no space at the last 
    count=1
    # Iterating through the string
    for i in string1:
    # If we encounter space, increment the count with 1.
        if i==" ":
            count+=1
     
    return count

string="Python is an interpreted, high-level, general-purpose programming language"
print["'{}'".format[string],"has total words:",count_words[string]]
string2=" Hi. My name is Ashwini "
print["'{}'".format[string2],"has total words:",count_words[string2]]

'Python is an interpreted, high-level, general-purpose programming language' has total words: 8'' Hi. My name is Ashwini ' has total words: 5 

2. Sử dụng split[] để đếm từ trong một chuỗi

Chúng ta có thể sử dụng hàm split[] để đếm từ trong chuỗi.  

def word_count[string]:
    # Here we are removing the spaces from start and end,
    # and breaking every word whenever we encounter a space
    # and storing them in a list. The len of the list is the
    # total count of words.
    return[len[string.strip[].split[" "]]]

string="Python is an interpreted, high-level, general-purpose programming language"
print["'{}'".format[string],"has total words:",count_words[string]]
string2=" Hi. My name is Ashwini "
print["'{}'".format[string2],"has total words:",word_count[string2]]

Đầu ra-

''Python is an interpreted, high-level, general-purpose programming language' has total words: 8'' 
Hi. My name is Ashwini ' has total words: 5 

3. Đếm tần suất của các từ trong Chuỗi bằng Python bằng Từ điển

def wordFrequency[string]:
    # converting the string into lowercase
    string=string.lower[]
    # Whenever we encounter a space, break the string
    string=string.split[" "]
    # Initializing a dictionary to store the frequency of words
    word_frequency={}
    # Iterating through the string
    for i in string:
    
    # If the word is already in the keys, increment its frequency
        if i in word_frequency:
            word_frequency[i]+=1
            
    # It means that this is the first occurence of the word
        else:
            word_frequency[i]=1
    return[word_frequency]

string="Woodchuck How much wood would a woodchuck chuck if a woodchuck could chuck wood ?" 
print[wordFrequency[string]] 

Đầu ra-

{'woodchuck': 3, 'how': 1, 'much': 1, 'wood': 2, 'would': 1, 'a': 2, 'chuck': 2, 'if': 1, 'could': 1, '?': 1} 

4. Đếm tần suất của các từ trong chuỗi trong Python Sử dụng Count[]

Count[] có thể được sử dụng để đếm số lần một từ xuất hiện trong một chuỗi hoặc nói cách khác, nó được sử dụng để cho biết tần suất xuất hiện của một từ trong chuỗi. Chúng ta chỉ cần chuyển từ trong đối số.   

def return_count[string,word]:
    string=string.lower[] 
    # In string, what is the count that word occurs
    return string.count[word]

string2="Peter Piper picked a peck of pickled peppers. How many pickled peppers did Peter Piper pick?"
return_count[string2,'piper']

Đầu ra-

2

Nếu chúng ta muốn biết số lần mỗi từ xuất hiện, chúng ta có thể tạo một hàm cho điều đó.  

________số 8_______

Đầu ra-

{['how', 1], ['would', 1], ['woodchuck', 3], ['a', 2], ['chuck', 2], ['could', 1], ['if', 1], ['?', 1], ['wood', 2], ['much', 1]} 

Nếu chúng ta muốn biết một từ cụ thể xuất hiện bao nhiêu lần trong một chuỗi trong một khoảng thời gian, chúng ta có thể sử dụng các tham số bắt đầu và kết thúc của đếm[].  

Ví dụ-

string="Can you can a can as a canner can can a can?"
# if you want to take cases into account remove this line
string=string.lower[]
# between index=8 and 17, how many times the word 'can' occurs
print[string.count["can",8,17]]

Đầu ra-

''Python is an interpreted, high-level, general-purpose programming language' has total words: 8'' 
Hi. My name is Ashwini ' has total words: 5 
0

Phải đọc

  • Cách chuyển chuỗi thành chữ thường trong
  • Cách tính căn bậc hai
  • Đầu vào của người dùng. Hàm nhập []. Đầu vào bàn phím
  • Cuốn sách hay nhất để học Python

Phần kết luận

Trong thời đại hiện nay, dữ liệu rất quan trọng. Và khi thế giới Khoa học dữ liệu đang phát triển nhanh chóng và việc sử dụng python cũng vậy, tiền xử lý dữ liệu là rất quan trọng. Chúng ta cần đếm các từ trong một chuỗi trong python để xử lý trước dữ liệu văn bản và để làm được điều đó, các phương pháp đã thảo luận ở trên là rất quan trọng.  

Chủ Đề