Có bao nhiêu từ trong văn bản bằng Python?
Hàm phân tách ngắt chuỗi thành một danh sách có thể lặp lại với khoảng trắng dưới dạng dấu phân cách. nếu chức năng split() được sử dụng mà không chỉ định không gian dấu phân cách được phân bổ làm dấu phân cách mặc định Show
Thí dụBản thử trực tiếp test_string = "Tutorials point is a learning platform" #original string print ("The original string is : " + test_string) # using split() function res = len(test_string.split()) # total no of words print ("The number of words in string are : " + str(res)) đầu raThe original string is : Tutorials point is a learning platform The number of words in string are : 6 Cách tiếp cận 2 - Sử dụng mô-đun regexỞ đây hàm findall() được sử dụng để đếm số từ trong câu có sẵn trong mô-đun regex Ok đây là phiên bản của tôi để làm điều này. Tôi nhận thấy rằng bạn muốn đầu ra của mình là
Trường hợp Giới thiệu về không gian. Nếu bạn muốn xóa tất cả các khoảng trắng thừa, chỉ cần làm Chuỗi là loại dữ liệu thiết yếu trong bất kỳ ngôn ngữ lập trình nào, kể cả python. Chúng ta cần thực hiện nhiều thao tác khác nhau hay còn gọi là tiền xử lý chuỗi như loại bỏ các khoảng trắng không cần thiết, đếm số từ trong chuỗi, biến chuỗi thành các trường hợp giống nhau (chữ hoa hoặc chữ thường). Trong bài viết này, chúng ta sẽ tìm hiểu cách đếm từ trong một chuỗi trong python. Chúng ta sẽ học cách đếm số từ trong một chuỗi. Ví dụ- Chúng tôi có một chuỗi-” Xin chào, đây là một chuỗi. ” Nó có năm từ. Ngoài ra, chúng ta sẽ học cách đếm tần suất của một từ cụ thể trong một chuỗi. Có thể bạn quan tâmnội dung Các cách khác nhau trong Python để đếm từ trong Chuỗi
1. Đếm từ bằng cách sử dụng vòng lặp For-Sử dụng vòng lặp for là cách tiếp cận ngây thơ để giải quyết vấn đề này. Chúng tôi đếm số khoảng cách giữa hai ký tự. def count_words(string): # Removing the spaces from start and end string1=string.strip() # Initializing the count from 1 because we there is no space at the last count=1 # Iterating through the string for i in string1: # If we encounter space, increment the count with 1. if i==" ": count+=1 return count string="Python is an interpreted, high-level, general-purpose programming language" print("'{}'".format(string),"has total words:",count_words(string)) string2=" Hi. My name is Ashwini " print("'{}'".format(string2),"has total words:",count_words(string2)) Đầu ra- ''Python is an interpreted, high-level, general-purpose programming language' has total words: 8'' Hi. My name is Ashwini ' has total words: 5 2. Sử dụng split() để đếm từ trong một chuỗiChúng ta có thể sử dụng hàm split() để đếm từ trong chuỗi. def word_count(string): # Here we are removing the spaces from start and end, # and breaking every word whenever we encounter a space # and storing them in a list. The len of the list is the # total count of words. return(len(string.strip().split(" "))) string="Python is an interpreted, high-level, general-purpose programming language" print("'{}'".format(string),"has total words:",count_words(string)) string2=" Hi. My name is Ashwini " print("'{}'".format(string2),"has total words:",word_count(string2)) Đầu ra- ''Python is an interpreted, high-level, general-purpose programming language' has total words: 8'' Hi. My name is Ashwini ' has total words: 5 3. Đếm tần suất của các từ trong Chuỗi bằng Python bằng Từ điển________số 8_______ Đầu ra- {'woodchuck': 3, 'how': 1, 'much': 1, 'wood': 2, 'would': 1, 'a': 2, 'chuck': 2, 'if': 1, 'could': 1, '?': 1} 4. Đếm tần suất của các từ trong chuỗi trong Python Sử dụng Count()Count() có thể được sử dụng để đếm số lần một từ xuất hiện trong một chuỗi hoặc nói cách khác, nó được sử dụng để cho biết tần suất xuất hiện của một từ trong chuỗi. Chúng ta chỉ cần chuyển từ trong đối số. def return_count(string,word): string=string.lower() # In string, what is the count that word occurs return string.count(word) string2="Peter Piper picked a peck of pickled peppers. How many pickled peppers did Peter Piper pick?" return_count(string2,'piper') Đầu ra- 2 Nếu chúng ta muốn biết số lần mỗi từ xuất hiện, chúng ta có thể tạo một hàm cho điều đó. set1=set() string="Woodchuck How much wood would a woodchuck chuck if a woodchuck could chuck wood ?" string=string.lower() # splitting the string whenever we encounter a space string=string.split(" ") # iterate through list-string for i in string: # Storing the word and its frequency in the form of tuple in a set # Set is used to avoid repetition set1.add((i,string.count(i))) print(set1) Đầu ra- {('how', 1), ('would', 1), ('woodchuck', 3), ('a', 2), ('chuck', 2), ('could', 1), ('if', 1), ('?', 1), ('wood', 2), ('much', 1)} Nếu chúng ta muốn biết một từ cụ thể xuất hiện bao nhiêu lần trong một chuỗi trong một khoảng thời gian, chúng ta có thể sử dụng các tham số bắt đầu và kết thúc của đếm(). Ví dụ- string="Can you can a can as a canner can can a can?" # if you want to take cases into account remove this line string=string.lower() # between index=8 and 17, how many times the word 'can' occurs print(string.count("can",8,17)) Đầu ra- ''Python is an interpreted, high-level, general-purpose programming language' has total words: 8'' Hi. My name is Ashwini ' has total words: 50 Phải đọc
Phần kết luậnTrong thời đại hiện nay, dữ liệu rất quan trọng. Và khi thế giới Khoa học dữ liệu đang phát triển nhanh chóng và việc sử dụng python cũng vậy, tiền xử lý dữ liệu là rất quan trọng. Chúng ta cần đếm các từ trong một chuỗi trong python để xử lý trước dữ liệu văn bản và để làm được điều đó, các phương pháp đã thảo luận ở trên là rất quan trọng. |