IA audio , synthèse vocale

7 meilleurs outils de synthèse vocale open source

Dans ce guide, je couvrirai la meilleure technologie de synthèse vocale ou TTS Open Source que vous pouvez exécuter vous-même gratuitement.

Ce poste couvrira diverses technologies TTS à un niveau élevé. Je publierai des guides individuels pour chacun d’eux dans les prochains jours et les lierai ici.

Plongeons dedans.

Annonces

Mozilla TTS

Mozilla TTS est une bibliothèque de synthèse vocale open source de Mozilla org, les fabricants de navigateurs populaires comme Mozilla, Firefox, etc.

C’est l’une des meilleures technologies d’IA de synthèse vocale open source disponibles à l’heure actuelle.

Vous pouvez l’utiliser prêt à l’emploi pour générer de la voix à partir du texte et l’utiliser pour vous entraîner sur de nouveaux échantillons de voix.

Tortue TTS

Tortoise est un programme de synthèse vocale qui a plusieurs voix et produit une prosodie et une intonation naturelles. Vous pouvez obtenir le code ici pour l’exécuter vous-même.

Annonces

Mimic 3 par Mycroft AI

Mimic 3 est un moteur de synthèse vocale open source qui se concentre sur la confidentialité. Il produit un discours de haute qualité et peut fonctionner sans connexion Internet sur votre propre matériel. Un service cloud est en cours de développement pour les personnes qui souhaitent une option plus simple ou pour le matériel qui ne peut pas gérer les demandes de traitement.

Cuisinier TTS

Coqui TTS est un moteur TTS open source publié par Coqui. Ils ont à la fois des options gratuites, open source et payantes dans le cloud.

eSpeak AVEC synthèse vocale

L’ eSpeak NG est un synthétiseur de synthèse vocale open source compact pour Linux, Windows, Android et d’autres systèmes d’exploitation. Il prend en charge plus de 100 langues et accents. Il est basé sur le moteur eSpeak créé par Jonathan Duddington.

Larynx

Larynx est un système de synthèse vocale de bout en bout hors ligne qui dispose d’un total de 50 voix disponibles dans 9 langues différentes. Il est conçu pour fonctionner entièrement hors ligne et fournit une solution complète pour convertir du texte en parole.

Annonces

Festival

Festival est un outil de synthèse vocale qui convertit le texte en parole via diverses API, notamment la ligne de commande, un interpréteur Scheme, une bibliothèque C++ et des interfaces Java et Emacs. Il prend en charge plusieurs langues, dont l’anglais et l’espagnol, et comprend des outils et de la documentation pour créer de nouvelles voix. Festival est écrit en C++ et utilise la bibliothèque Edinburgh Speech Tools, et il est fourni sous une licence X11 qui permet une utilisation commerciale et non commerciale.

Le Festival a été créé à l’Université d’Edimbourg.

PYTTSX3

Le pyttsx3 est un module python qui vous permet d’utiliser plusieurs moteurs TTS pour effectuer une synthèse vocale hors ligne en python.

 

 

Retour en haut