7 meilleurs outils de synthèse vocale open source
Dans ce guide, je couvrirai la meilleure technologie de synthèse vocale ou TTS Open Source que vous pouvez exécuter vous-même gratuitement.
Ce poste couvrira diverses technologies TTS à un niveau élevé. Je publierai des guides individuels pour chacun d’eux dans les prochains jours et les lierai ici.
Plongeons dedans.
Table des matières
Mozilla TTS
Mozilla TTS est une bibliothèque de synthèse vocale open source de Mozilla org, les fabricants de navigateurs populaires comme Mozilla, Firefox, etc.
C’est l’une des meilleures technologies d’IA de synthèse vocale open source disponibles à l’heure actuelle.
Vous pouvez l’utiliser prêt à l’emploi pour générer de la voix à partir du texte et l’utiliser pour vous entraîner sur de nouveaux échantillons de voix.
Tortue TTS
Tortoise est un programme de synthèse vocale qui a plusieurs voix et produit une prosodie et une intonation naturelles. Vous pouvez obtenir le code ici pour l’exécuter vous-même.
Mimic 3 par Mycroft AI
Mimic 3 est un moteur de synthèse vocale open source qui se concentre sur la confidentialité. Il produit un discours de haute qualité et peut fonctionner sans connexion Internet sur votre propre matériel. Un service cloud est en cours de développement pour les personnes qui souhaitent une option plus simple ou pour le matériel qui ne peut pas gérer les demandes de traitement.
Cuisinier TTS
Coqui TTS est un moteur TTS open source publié par Coqui. Ils ont à la fois des options gratuites, open source et payantes dans le cloud.
eSpeak AVEC synthèse vocale
L’ eSpeak NG est un synthétiseur de synthèse vocale open source compact pour Linux, Windows, Android et d’autres systèmes d’exploitation. Il prend en charge plus de 100 langues et accents. Il est basé sur le moteur eSpeak créé par Jonathan Duddington.
Larynx
Larynx est un système de synthèse vocale de bout en bout hors ligne qui dispose d’un total de 50 voix disponibles dans 9 langues différentes. Il est conçu pour fonctionner entièrement hors ligne et fournit une solution complète pour convertir du texte en parole.
Festival
Festival est un outil de synthèse vocale qui convertit le texte en parole via diverses API, notamment la ligne de commande, un interpréteur Scheme, une bibliothèque C++ et des interfaces Java et Emacs. Il prend en charge plusieurs langues, dont l’anglais et l’espagnol, et comprend des outils et de la documentation pour créer de nouvelles voix. Festival est écrit en C++ et utilise la bibliothèque Edinburgh Speech Tools, et il est fourni sous une licence X11 qui permet une utilisation commerciale et non commerciale.
Le Festival a été créé à l’Université d’Edimbourg.
PYTTSX3
Le pyttsx3 est un module python qui vous permet d’utiliser plusieurs moteurs TTS pour effectuer une synthèse vocale hors ligne en python.