Python đếm từ trong danh sách chuỗi
Khi không có dấu tách nào được chuyển đến phương thức Show
Bước tiếp theo là sử dụng lớp Lớp nhận một đối số tùy chọn có thể lặp lại và trả về một đối tượng Các đối tượng của tập hợp lưu trữ một bộ sưu tập các phần tử duy nhất không có thứ tự, do đó, việc chuyển đổi danh sách thành một ____14_______ sẽ loại bỏ tất cả các phần tử trùng lặp Bước cuối cùng là sử dụng hàm Hàm trả về chiều dài (số lượng mục) của một đối tượng Đối số mà hàm nhận có thể là một chuỗi (một chuỗi, bộ dữ liệu, danh sách, phạm vi hoặc byte) hoặc một bộ sưu tập (từ điển, tập hợp hoặc tập hợp cố định) Đếm các từ duy nhất trong một tệp văn bản trong PythonĐể đếm các từ duy nhất trong một tệp văn bản
Ví dụ trên giả định rằng bạn có một tệp có tên
Chúng tôi đã mở tệp ở chế độ đọc và sử dụng phương pháp Bước tiếp theo là sử dụng phương thức Phương thức tách chuỗi thành một danh sách các chuỗi con bằng dấu phân cách Khi không có dấu tách nào được chuyển đến phương thức Chúng tôi đã sử dụng lớp Lớp nhận một đối số tùy chọn có thể lặp lại và trả về một đối tượng Các đối tượng tập hợp là một tập hợp các phần tử duy nhất không có thứ tự, do đó, việc chuyển đổi danh sách thành một ____14_______ sẽ loại bỏ tất cả các phần tử trùng lặp Bước cuối cùng là sử dụng hàm Hàm trả về chiều dài (số lượng mục) của một đối tượng Đối số mà hàm nhận có thể là một chuỗi (một chuỗi, bộ dữ liệu, danh sách, phạm vi hoặc byte) hoặc một bộ sưu tập (từ điển, tập hợp hoặc tập hợp cố định) Đếm số lượng từ duy nhất trong Chuỗi bằng vòng lặp forĐể đếm số từ duy nhất trong một chuỗi
Chúng tôi đã sử dụng phương pháp Trên mỗi lần lặp, chúng tôi sử dụng toán tử Các bài kiểm tra tư cách thành viên. Ví dụ: Chuỗi là loại dữ liệu thiết yếu trong bất kỳ ngôn ngữ lập trình nào, kể cả python. Chúng ta cần thực hiện nhiều thao tác khác nhau hay còn gọi là tiền xử lý chuỗi như loại bỏ các khoảng trắng không cần thiết, đếm số từ trong chuỗi, biến chuỗi thành các trường hợp giống nhau (chữ hoa hoặc chữ thường). Trong bài viết này, chúng ta sẽ tìm hiểu cách đếm từ trong một chuỗi trong python. Chúng ta sẽ học cách đếm số từ trong một chuỗi. Ví dụ- Chúng tôi có một chuỗi-” Xin chào, đây là một chuỗi. ” Nó có năm từ. Ngoài ra, chúng ta sẽ học cách đếm tần suất của một từ cụ thể trong một chuỗi. nội dung Các cách khác nhau trong Python để đếm từ trong Chuỗi
1. Đếm từ bằng cách sử dụng vòng lặp For-Sử dụng vòng lặp for là cách tiếp cận ngây thơ để giải quyết vấn đề này. Chúng tôi đếm số khoảng cách giữa hai ký tự. def count_words(string): # Removing the spaces from start and end string1=string.strip() # Initializing the count from 1 because we there is no space at the last count=1 # Iterating through the string for i in string1: # If we encounter space, increment the count with 1. if i==" ": count+=1 return count string="Python is an interpreted, high-level, general-purpose programming language" print("'{}'".format(string),"has total words:",count_words(string)) string2=" Hi. My name is Ashwini " print("'{}'".format(string2),"has total words:",count_words(string2)) Đầu ra- ''Python is an interpreted, high-level, general-purpose programming language' has total words: 8'' Hi. My name is Ashwini ' has total words: 5 2. Sử dụng split() để đếm từ trong một chuỗiChúng ta có thể sử dụng hàm split() để đếm từ trong chuỗi. def word_count(string): # Here we are removing the spaces from start and end, # and breaking every word whenever we encounter a space # and storing them in a list. The len of the list is the # total count of words. return(len(string.strip().split(" "))) string="Python is an interpreted, high-level, general-purpose programming language" print("'{}'".format(string),"has total words:",count_words(string)) string2=" Hi. My name is Ashwini " print("'{}'".format(string2),"has total words:",word_count(string2)) Đầu ra- ''Python is an interpreted, high-level, general-purpose programming language' has total words: 8'' Hi. My name is Ashwini ' has total words: 5 3. Đếm tần suất của các từ trong Chuỗi bằng Python bằng Từ điểndef wordFrequency(string): # converting the string into lowercase string=string.lower() # Whenever we encounter a space, break the string string=string.split(" ") # Initializing a dictionary to store the frequency of words word_frequency={} # Iterating through the string for i in string: # If the word is already in the keys, increment its frequency if i in word_frequency: word_frequency[i]+=1 # It means that this is the first occurence of the word else: word_frequency[i]=1 return(word_frequency) string="Woodchuck How much wood would a woodchuck chuck if a woodchuck could chuck wood ?" print(wordFrequency(string)) Đầu ra- {'woodchuck': 3, 'how': 1, 'much': 1, 'wood': 2, 'would': 1, 'a': 2, 'chuck': 2, 'if': 1, 'could': 1, '?': 1} 4. Đếm tần suất của các từ trong chuỗi trong Python Sử dụng Count()Count() có thể được sử dụng để đếm số lần một từ xuất hiện trong một chuỗi hoặc nói cách khác, nó được sử dụng để cho biết tần suất xuất hiện của một từ trong chuỗi. Chúng ta chỉ cần chuyển từ trong đối số. def return_count(string,word): string=string.lower() # In string, what is the count that word occurs return string.count(word) string2="Peter Piper picked a peck of pickled peppers. How many pickled peppers did Peter Piper pick?" return_count(string2,'piper') Đầu ra- 2 Nếu chúng ta muốn biết số lần mỗi từ xuất hiện, chúng ta có thể tạo một hàm cho điều đó. ________số 8_______ Đầu ra- {('how', 1), ('would', 1), ('woodchuck', 3), ('a', 2), ('chuck', 2), ('could', 1), ('if', 1), ('?', 1), ('wood', 2), ('much', 1)} Nếu chúng ta muốn biết một từ cụ thể xuất hiện bao nhiêu lần trong một chuỗi trong một khoảng thời gian, chúng ta có thể sử dụng các tham số bắt đầu và kết thúc của đếm(). Ví dụ- string="Can you can a can as a canner can can a can?" # if you want to take cases into account remove this line string=string.lower() # between index=8 and 17, how many times the word 'can' occurs print(string.count("can",8,17)) Đầu ra- ''Python is an interpreted, high-level, general-purpose programming language' has total words: 8'' Hi. My name is Ashwini ' has total words: 50 Phải đọc
Phần kết luậnTrong thời đại hiện nay, dữ liệu rất quan trọng. Và khi thế giới Khoa học dữ liệu đang phát triển nhanh chóng và việc sử dụng python cũng vậy, tiền xử lý dữ liệu là rất quan trọng. Chúng ta cần đếm các từ trong một chuỗi trong python để xử lý trước dữ liệu văn bản và để làm được điều đó, các phương pháp đã thảo luận ở trên là rất quan trọng. |