Texte à résonance naturelle?

76

Je recherche des logiciels de synthèse vocale faciles à installer pour Ubuntu qui semblent naturels. J'ai installé Festival , Gespeaker , etc., mais rien ne semble très naturel. Tout est très synthétique et difficile à comprendre.

Des recommandations là-bas?

    
posée I Heart Ubuntu 20.07.2011 - 19:36
la source

13 réponses

18

Je crois qu'Ive a trouvé le meilleur logiciel TTS gratuitement en utilisant une extension Google Chrome appelée "SpeakIt". Cela ne fonctionne que dans le navigateur Chrome pour Ubuntu. Cela ne fonctionne pas avec le chrome pour une raison quelconque. SpeakIt est livré avec deux voix féminines qui semblent toutes deux très réalistes par rapport à tout ce qui existe ailleurs. Il y a au moins quatre hommes et plus; Les voix féminines sont répertoriées dans les extensions Chrome si vous effectuez une recherche sur Chrome Web Store à l'aide de "TTS" comme requête.

lien

Pour une utilisation sur un site Web. vous mettez en surbrillance le texte que vous voulez lire et faites un clic droit et "SpeakIt" ou cliquez sur l'icône SpeakIt ancrée dans la barre supérieure de Chrome.

Les utilisateurs de Firefox ont également deux options. Dans les addons de Firefox, faites une recherche sur TTS et vous devriez trouver "Click Speak" et "Text to Voice". Les voix ne sont pas aussi bonnes que les voix Chrome SpeakIt, mais sont définitivement utilisables.

L’extension SpeakIt utilise la technologie iSpeech et, pour un prix de 20 dollars par an, le site peut convertir du texte en fichiers audio MP3. Vous pouvez saisir du texte, des URL, des flux RSS, ainsi que des documents tels que TXT, DOC et PDF et les imprimer en MP3. Vous pouvez créer des podcasts, intégrer de l'audio, etc. Voici un lien ...

lien

et un échantillon de leur audio (ne sais pas combien de temps le lien durera) ...

lien

    
réponse donnée I Heart Ubuntu 27.01.2013 - 01:11
la source
45

SVOX pico2wave

En plus des autres réponses:

Un TTS très minimaliste, qui sonne mieux que espeak ou mbrola (à mon avis).

Quelques informations:
lien

Je ne comprends pas pourquoi pico2wave est, comparé à espeak ou mbrola, rarement discuté. C'est petit, mais ça sonne vraiment bien (naturel). Sans modification, vous entendrez une voix féminine au son naturel.

ET ... comparé à Mbrola, il reconnaît les Unités et le dit correctement!

Par exemple:

  • 2 ° C → deux degrés
  • 2m → deux mètres
  • 2kg → deux kilogrammes

Après l’installation, je l’utilise dans un script:

#!/bin/bash
pico2wave -l=de-DE -w=/tmp/test.wav ""
aplay /tmp/test.wav
rm /tmp/test.wav

Puis lancez-le avec le texte désiré:

<scriptname>.sh "hello world"

ou lisez le contenu d'un fichier entier:

<scriptname>.sh "$(cat <filename>)"

Tout cela pour avoir un TTS de travail léger et stable sur Ubuntu.

    
réponse donnée user85321 24.08.2012 - 17:12
la source
11

Simple Google ™ TTS

En raison de l'absence d'une meilleure alternative, j'ai écrit un script bash qui s'interface avec un script perl de Michal Fapso pour fournir TTS via Google Translate. De la description du projet:

  

L'intention est de fournir une interface facile à utiliser pour la sortie de synthèse vocale via le système de synthèse vocale de Google. Une option de secours utilisant pico2wave fournit automatiquement une synthèse TTS au cas où aucune connexion Internet ne serait trouvée.

     

En l’état, le wrapper prend en charge la lecture à partir de l’entrée standard, des fichiers texte et de la sélection X (texte en surbrillance).

Les principales fonctionnalités sont les suivantes:

  • Synthèse TTS en ligne via Google translate
  • Synthèse TTS hors ligne via pico2wave
  • prend en charge différentes langues
  • peut lire à partir de l'interface CLI, des fichiers texte et du texte en surbrillance
  • prend en charge la lecture du texte en surbrillance avec un formatage fixe (par exemple, des fichiers PDF)

L'installation et l'utilisation sont documentées sur la page du projet .

Je serais heureux si vous aviez essayé. Les rapports de bogues et tout autre commentaire sont les bienvenus!

    
réponse donnée Glutanimate 23.08.2014 - 21:18
la source
8

J'ai semblé haut et bas pour le texte à parler pour Ubuntu qui est de haute qualité. Il n'y en a pas. Mes cordes vocales étant paralysées, j'avais besoin de TTS pour ajouter des instructions vocales à mes vidéos Ubuntu . Vous pouvez obtenir des logiciels de synthèse vocale Linux de qualité commerciale: lien . J'ai fini par acheter Natural Reader pour Windows (ne fonctionne pas sous Ubuntu sous Wine) pour 40 $. Peut-être que plus tard je vais avoir celui de Linux.

J'espère que ça aide.

    
réponse donnée Joe Steiger 20.07.2011 - 19:57
la source
6

J'ai effectué des recherches sur le texte qui retentit le mieux et se règle facilement sur les voix. Vous trouverez ci-dessous une liste de ce que je pensais être les 5 meilleurs produits par ordre de qualité sonore. La plupart des sites Web associés à ces produits ont une démo interactive qui vous permettra de faire votre propre détermination.

  1. NeoSpeech
  2. iVona
  3. Acapela
  4. voix AT & amp; Natural
  5. Voix de CereProc
réponse donnée Jim 24.04.2012 - 17:35
la source
6

Pico et espeak sont amusants et faciles à se mettre au travail, mais ils ne sont pas si bons que ça. Les voix par défaut du Festival ne sont pas très bonnes. Cependant, Festival est un système de discours basé sur des schémas, dans lequel un certain nombre de chercheurs ont construit de meilleures voix de plug-in. Vous pouvez facilement surpasser la qualité de pico2wave sur Ubuntu, car l’une de ces voix est disponible sous forme de package prêt à l’emploi.

Pour que le Festival sonne de manière naturelle, voici ce qu’il faut faire:

sudo apt-get install festival
sudo apt-get install festvox-us-slt-hts
festival -i
festival> (voice_cmu_us_slt_arctic_hts) 
festival> (SayText "Don't hate me, I'm just doing my job!")

Vous pouvez le faire depuis la ligne de commande en utilisant -b (ou --batch ) et en mettant chaque commande entre guillemets simples:

festival -b '(voice_cmu_us_slt_arctic_hts)' \
    '(SayText "The temperature is 22 degrees centigrade and there is a slight breeze from the west.")'

Vous pouvez obtenir d’autres très bonnes voix du référentiel Nitech, mais leur installation est difficile et les chemins par défaut ont été modifiés pour que les références de noms de fichiers inclus dans le système puissent être modifiées manuellement. p>     

réponse donnée Jon Watte 25.04.2017 - 21:31
la source
5

Combinez les outils SVOX (pico) avec LibreOffice:

Les outils SVOX (pico) sont faciles à installer et apportent des voix de qualité dans Ubuntu. Installez-le:

sudo apt-get install libttspico0 libttspico-utils libttspico-data

Vous pouvez utiliser LibreOffice en combinaison avec les outils SVOX (pico) en installant l’extension "Read Text" et vous obtenez une "interface graphique" pour cet excellent logiciel TTS:

Configurer les options d’extension de lecture de texte avec Outils - Modules complémentaires - Sélection de lecture. ... Utilisez / usr / bin / python comme programme externe. Sélectionnez une option de ligne de commande qui inclut le jeton (PICO_READ_TEXT_PY) , vous souhaiterez peut-être expérimenter certains d'entre eux.

Maintenant, il suffit de sélectionner du texte dans LO Writer, Calc, Impress ou Draw et de cliquer sur l'icône ajoutée en tant que barre d'outils (un visage heureux avec un ballon).

    
réponse donnée leoperbo 15.12.2013 - 01:48
la source
4

Je trouve les voix de Nitech HTS sur le festival très naturelles et réconfortantes par rapport aux autres voix que j'ai entendues. Voir ce lien sur la configuration de Nitech et d’autres sons avec festival. Je n'ai pas trouvé de bonne interface graphique que je puisse utiliser pour configurer ces voix, mais leur configuration via festival.scm fonctionne toujours. Cet article est très ancien et vous voudrez peut-être trouver le répertoire d'installation réel en utilisant Commande "localiser festival"

    
réponse donnée razor 09.11.2011 - 14:56
la source
4

Voici ce que j'ai fait pour avoir un discours purement naturel pour les fichiers PDF et autres fichiers texte (les autres solutions ne sont pas naturelles ou ce ne sont que des services payants). C'est en fait un travail sur l'utilisation du chrome ou du chrome, mais cela fonctionne rapidement et facilement.

  1. Installez l'extension SpeakIt! sur votre chrome ou chrome.
  2. Installez PDF Viewer si vous utilisez du chrome (le chrome contient déjà un pdf) viewer gratuitement) et cochez la case "Autoriser en navigation privée" et "Autoriser l'accès aux URL des fichiers" dans les paramètres d'extensions de chrome.
  3. Glissez et déposez votre pdf dans un navigateur.
  4. Maintenant, mettez du texte en surbrillance et faites un clic droit et sélectionnez SpeakIt! de sorte que vous pouvez écouter de la synthèse vocale naturelle pure.

Il existe également des moyens d’ouvrir d’autres fichiers comme .doc et .txt en chrome et de faire de même. Il existe d'autres extensions pour le chrome qui visualisent les fichiers pdf, vérifiez si cela vous convient mieux. En outre, vous pouvez télécharger toutes sortes de textes dans Google Drive et utiliser SpeakIt! pour le lire pour vous. Une autre extension appelée «Speak text» fonctionne de la même manière et a un discours naturel.

    
réponse donnée Pooya Sanooei 12.12.2013 - 02:54
la source
2

lorsque vous recherchez un meilleur moteur tts à utiliser avec le nouveau mode narratif firefox 49 , j'ai trouvé pico tts (svox) - mon moteur TTS préféré.

sudo apt install espeak libttspico0 libttspico-data libttspico-utils

Comment changer le système de synthèse vocale par défaut du système?

Les gens de arch linux m'ont amené sur le bon chemin ( lien ):

Décommentez le module que vous aimez et définissez-le par défaut dans les paramètres du répartiteur de parole:

#> vim /etc/speech-dispatcher/speechd.conf

[...]
# -----OUTPUT MODULES CONFIGURATION-----
# Each AddModule line loads an output module.
#AddModule "espeak"       "sd_espeak"   "espeak.conf"
AddModule "pico-generic"  "sd_generic"   "pico-generic.conf"

[...]
#DefaultModule espeak
DefaultModule pico-generic

Redémarrez le démon:

#> sudo systemctl restart speech-dispatcher.service

MAIS, lorsque Firefox redémarre, rien ne se passe. Selon le lien ci-dessus (le forum arch post # 10 et # 16) fonctionne avec festival (n'a pas essayé), mais le répartiteur de parole pour pico n'énumère pas les voix disponibles. Il ne fonctionnera pas.

Toute idée serait très appréciée; -)

    
réponse donnée apos 14.11.2016 - 23:55
la source
1

Mon programme de synthèse vocale préféré s'appelle Magic English, mais comme Natural Reader mentionné par Joe Steiger, il s’agit d’un programme Windows et je ne suis pas sûr qu’il fonctionne sous Wine.

AT & T Natural Voices est disponible en ligne sous forme de démonstration, mais il s'agit plutôt d'une autour d'une solution ...

    
réponse donnée Chris Granger 20.07.2011 - 21:10
la source
0

Pour cela, je développe Intelligent Speaker - extension pour Google Chrome. Il peut lire des pages même sans sélection (lorsque la rétention de texte est correcte).

    
réponse donnée Vitaly Zdanevich 16.09.2017 - 20:02
la source
0

Google TTS

Pico, mbrola, cmu, festival, flite, tous SUCK en 2017 (ils étaient incroyables dans les années 90). AT & T natural speech (ce qui est fantastique) n'est pas linux compat et ce n'est pas gratuit, donc nous utilisons Google

git clone https://github.com/Glutanimate/simple-google-tts.git
sudo apt install xsel libnotify-bin libttspico0 libttspico-utils libttspico-data libwww-perl libwww-mechanize-perl libhtml-tree-perl so$
cd simple-google-tts
sudo ln -s 'pwd'/simple_google_tts /usr/local/bin
simple_google_tts en "Text to speech is now installed"
cd -
    
réponse donnée Jonathan 29.11.2017 - 06:32
la source

Lire d'autres questions sur les étiquettes