Hướng dẫn text to speech python windows 10 - chuyển văn bản thành giọng nói python windows 10

Tôi đã thử Espeak nhưng không thành công và một số chức năng chỉ được hỗ trợ trong Python 2.

hỏi ngày 23 tháng 7 năm 2016 lúc 8:58Jul 23, 2016 at 8:58

Hướng dẫn text to speech python windows 10 - chuyển văn bản thành giọng nói python windows 10

Pratik Gandhipratik GandhiPratik Gandhi

1.3091 Huy hiệu vàng20 Huy hiệu bạc34 Huy hiệu đồng1 gold badge20 silver badges34 bronze badges

Để sử dụng ngoại tuyến trong Windows, hãy sử dụng SAPI trực tiếp.

Bạn có thể sử dụng spvoice.

import win32com.client
speaker = win32com.client.Dispatch("SAPI.SpVoice")
speaker.Speak("Jumpman Jumpman Jumpman Them boys up to something!")

Ekevoo

2.7641 Huy hiệu vàng23 Huy hiệu bạc35 Huy hiệu Đồng1 gold badge23 silver badges35 bronze badges

Đã trả lời ngày 2 tháng 7 năm 2017 lúc 22:40Jul 2, 2017 at 22:40

Bạn đã thử sử dụng Google Text-to-Speech thông qua GTTS chưa?

Cú pháp để sử dụng nó trong Python 3.x như sau:

from gtts import gTTS
my_tts = "Text you want to process"
tts = gTTS(text=my_tts, lang='en')
tts.save("Absolute/path/to/file.mp3")

Đây là repo GitHub của GTT.

Ekevoo

2.7641 Huy hiệu vàng23 Huy hiệu bạc35 Huy hiệu Đồng1 gold badge23 silver badges35 bronze badges

Đã trả lời ngày 2 tháng 7 năm 2017 lúc 22:40Jul 27, 2016 at 12:27

Hướng dẫn text to speech python windows 10 - chuyển văn bản thành giọng nói python windows 10

Bạn đã thử sử dụng Google Text-to-Speech thông qua GTTS chưa?sayan

Cú pháp để sử dụng nó trong Python 3.x như sau:17 silver badges33 bronze badges

4

Nếu bạn sử dụng Microsoft Windows 10, nó có một công cụ nói được bao gồm. Có thể cài đặt mô -đun Win32com, thì bạn có thể sử dụng mã này:

Đưa ra một chuỗi văn bản, nó sẽ nói các từ được viết bằng ngôn ngữ tiếng Anh. Quá trình này được gọi là văn bản thành lời nói (TTS).
This process is called Text To Speech (TTS).

Khóa học liên quan: Khóa học học máy hoàn chỉnh với Python The Complete Machine Learning Course with Python

Văn bản để nói

Văn bản pyttsx để nói

PYTSX là một trình bao bọc văn bản-xuống văn bản đa nền tảng. Nó sử dụng các công cụ phát biểu khác nhau dựa trên hệ điều hành của bạn:
It uses different speech engines based on your operating system:

NSSS - NSSpeechSynthesizer trên Mac OS X 10.5 và Highersapi5 - SAPI5 trên Windows XP, Windows Vista và (chưa được kiểm tra) Windows 7espeak - Espeak trên bất kỳ bản phân phối / nền tảng nào có thể lưu trữ thư viện được chia sẻ (ví dụ: Ubuntu / Fedora Linux) - NSSpeechSynthesizer on Mac OS X 10.5 and higher

sapi5 - SAPI5 on Windows XP, Windows Vista, and (untested) Windows 7

espeak - eSpeak on any distro / platform that can host the shared library (e.g., Ubuntu / Fedora Linux)

Cài đặt với PIP (sử dụng PyenV, PipenV hoặc Virtualenv):

sudo pip install pyttsx

Sau đó chạy mã ví dụ:

import pyttsx
engine = pyttsx.init()
engine.say('Good morning.')
engine.runAndWait()

GTTs văn bản để phát biểu

GTTS là một tiện ích mô -đun và dòng lệnh để lưu văn bản nói vào MP3.it sử dụng API văn bản Google cho bài phát biểu (TTS).
It uses the Google Text to Speech (TTS) API.

Nghe mẫu giọng nói dưới đây:

Khóa học liên quan: Khóa học học máy hoàn chỉnh với Python The Complete Machine Learning Course with Python

Văn bản để nói

Văn bản pyttsx để nói
Install with the python package tool (pip):

sudo pip install gTTS

PYTSX là một trình bao bọc văn bản-xuống văn bản đa nền tảng. Nó sử dụng các công cụ phát biểu khác nhau dựa trên hệ điều hành của bạn:

from gtts import gTTS
import os
tts = gTTS(text='Good morning', lang='en')
tts.save("good.mp3")
os.system("mpg321 good.mp3")

NSSS - NSSpeechSynthesizer trên Mac OS X 10.5 và Highersapi5 - SAPI5 trên Windows XP, Windows Vista và (chưa được kiểm tra) Windows 7espeak - Espeak trên bất kỳ bản phân phối / nền tảng nào có thể lưu trữ thư viện được chia sẻ (ví dụ: Ubuntu / Fedora Linux)

gtts-cli.py "Hello" -l 'en' -o hello.mp3

Cài đặt với PIP (sử dụng PyenV, PipenV hoặc Virtualenv):

Sau đó chạy mã ví dụ:

import speech
speech.say('Hola mundo', 'es_ES')

GTTs văn bản để phát biểu

import sound

r = sound.Recorder('audio.m4a')
r.record(3)

GTTS là một tiện ích mô -đun và dòng lệnh để lưu văn bản nói vào MP3.it sử dụng API văn bản Google cho bài phát biểu (TTS).

text = speech.recognize('audio.m4a', 'en')[0][0]  

Nghe mẫu giọng nói dưới đây:

Mô -đun này hỗ trợ nhiều ngôn ngữ và âm thanh rất tự nhiên.
Install the module win32com, then you can use this code:

from gtts import gTTS
my_tts = "Text you want to process"
tts = gTTS(text=my_tts, lang='en')
tts.save("Absolute/path/to/file.mp3")
0

InstallInstall với Công cụ Gói Python (PIP):

Thí dụ

Nếu bạn muốn kiểm tra nó trên dòng lệnh sử dụng:

iOS TTS và nhận dạng giọng nói

TTS trong Pythonista cho iOS:

from gtts import gTTS
my_tts = "Text you want to process"
tts = gTTS(text=my_tts, lang='en')
tts.save("Absolute/path/to/file.mp3")
1

Để ghi lại âm thanh:
we can write our code:

from gtts import gTTS
my_tts = "Text you want to process"
tts = gTTS(text=my_tts, lang='en')
tts.save("Absolute/path/to/file.mp3")
2

Để nhận ra nó là văn bản:

Microsoft Speech Engine