Java: visão geral dos motores de fala [fechado]

Question

Java: visão geral dos motores de fala [fechado]

Estou agora à procura de um framework Java Text to Speech (TTS). Durante as minhas investigações, encontrei vários frameworks JSAPI1. 0-(parcialmente) - compatíveis listados na página de implementações JSAPI , bem como um par de frameworks TTS Java que não parecem seguir as especificações JSAPI (Mary, Say-It-Now ([3]). Também notei que atualmente não existe nenhuma implementação de referência para JSAPI.

Os testes que fiz para o FreeTTS (o primeiro listado na página jsapi impls) mostram que está longe de ler palavras simples e óbvias (exemplos: ABC, quadro negro). Estão actualmente em curso outros testes.

e aqui vai a Pergunta (6, na verdade):

que frameworks não-Java com ligações Java estão lá na cena?

agradeço antecipadamente os seus comentários e sugestões.

47

java text-to-speech

Author: Patrick W. McMahon, 2008-09-27

Source

9 answers

O Google Translate tem uma api secreta do tts: https://translate.google.com/translate_tts?ie=utf-8&tl=en&q=Hello%20World

14

Author: nvrandow, 2014-07-19 15:27:01

Já usei a Mary antes e fiquei muito impressionado com a qualidade das vozes. Infelizmente, não usei nenhum dos outros.

6

Author: , 2008-09-27 10:58:04

Na verdade, não há grande escolha.

eSpeak, qucik e simple, usado pelo Google Translate
mbrola

Java Puro:

FreeTTS, que código foi portado do Festival, e depois foi de fonte aberta e o desenvolvimento foi interrompido. Os MaryTTS são mais poderosos e a produção parece pronta.

Também há outros programas proprietários tipo:

Vocalizador De Nuance

Se o seu software for apenas Windows, pode usar a API Microsoft Speech.

6

Author: stokito, 2016-03-16 09:25:38

Usei as vozes naturais da AT & T que fornecem ganchos JSAPI e MS SAPI. Ele fornece vozes de excelente qualidade, um bom dicionário de fala "geral", muitos controles sobre a pronúncia, e várias línguas. É um pouco caro, mas funciona muito bem.

Usei-o para ler telemetria de sensores importantes para os controladores numa aplicação de sensores móveis. Não tivemos queixas sobre a qualidade da voz. Tinha cerca de 75% de exatidão fora da caixa com termos científicos e um muito maior (talvez 90%+) com um diálogo normal. Nós conseguimos até cerca de 99+% de precisão usando markups (a maioria dos erros foram em termos científicos com combinações de fonemas incomuns). Foi um pouco difícil para o processador (estávamos rodando em uma máquina equivalente Pentium-III e estava empurrando CPU de pico de 50% a 75%). Isto usa um motor de fala nativo (compatível com Windows, Linux e Mac) com uma interface Java. Há uma grande variedade de vozes e línguas...

5

Author: James Schek, 2008-09-29 19:30:42

Usei o FreeTTS mas tive um grande problema em conseguir que as vozes do MBrola funcionassem no meu MacbookPro. Consegui que o MBrola voices funcionasse no Windows (dolorosamente) e no Linux. Não tive sorte a carregar outros pacotes de voz no FreeTTS, o que é uma pena porque as vozes fornecidas são uma OMI horrível. Fora disso eu tive um pouco de sucesso com Cloudgarden também, mas que só funciona em janelas AFAIK. Eu estaria interessado em ouvir outros sucessos / falhas com motores de voz como este tipo de trabalho é particular complicar. Também estou a brincar com a Esfinge 4. Eu apenas puxei para baixo JVXML (que parece ser baseado na Esfinge 4) ontem à noite, mas não conseguiu fazê-lo correr por alguma razão estranha.

1

Author: Cliff, 2009-04-10 13:32:55

Eu contribuí para a mary. Eu sinto que tem potencial se alguém mais inteligente do que eu separou as vozes do HMM para fora do núcleo (essas vozes não precisam de grandes conjuntos de dados e som ok). Também estou a tentar fazer um sistema de eventos ao freetts para enviar eventos quando diz uma palavra. Eu tive sucesso, mas está quebrado no linux agora. (provavelmente por causa de um erro de temporizador).

1

Author: i30817, 2010-02-27 14:19:20

Muito obrigado a todos, o truque está na fonte do FreeTTS. Brevemente: se estiver sendo executado como java -jar freetts.jar some-more-args-here, ele significa palavras menores do que quando está sendo executado de uma maneira de bin/servidor.jar e bin / cliente.frasco.

1

Author: DiaWorD, 2015-04-27 11:53:21

Achei pouco confortável com MarryTTS tem várias línguas e voz clara para entender.

To convert speech to text, the better option is sphinx4-5prealpha . Eu dou um polegar, porque ele tem ajustável, flexibilidade e modificável reconhecedor e gramática.

0

Author: Sushant, 2017-11-27 03:49:39

score 18 · Accepted Answer

Na verdade, tive muita sorte com o FreeTTS.

18

Author: pfranza, 2008-09-27 11:36:42