text-to-speech (italiano), era Re: [Soci SLIP] Arduino: robottino parlante

loredana llcfree a gmail.com
Mar 14 Feb 2012 19:18:44 CET


On 2/14/12, Alessandro Pasotti <apasotti a gmail.com> wrote:

> Il 14 febbraio 2012 18:15, loredana <llcfree a gmail.com> ha scritto:
>> Molto bello e molto utile. Mette in evidenza il problema del
>> text-to-speech in italiano a costi umani, di cui si parlava un po'
>> di tempo fa qui in lista e a cui non ho ancora trovato una soluzione
>> ragionevole (libera, funzionante e a costi umani).

> Sono un po' di anni che non ci guardo pił, ma quando a suo tempo (5
> anni fa) feci qualche prova, la soluzione festival + voci italiane
> IRST (di Piero Cosi, mi pare ) non era assolutamente malvagia.
>
> D'accordo che non era al livello di loquendo ma per moltissime
> applicazioni era tutto sommato soddisfacente, e completamente open
> source (nonchč SW libero), magari in questi anni hanno fatto
> progressi, l'hai provato di recente?

Lo avevo provato quando lo hai segnalato tempo fa, ma non ne ero
venuta a capo. Il problema essenziale rimane quello della voce, e
mbrola non e' una soluzione del tutto felice, per via delle
restrizioni sull'uso.

In piu', festival e' davvero un baraccone pesantuccio per i tempi
nostri, fatti di cellulari e netbooks. Quello del text-to-speech,
generalizzato, e' un problema che si pone soprattutto in mobilita'.

Pero' val la pena di tornarci su', perche' queste cose, libere o quasi
libere, evolvono in fretta, se non muoiono di troppa giovinezza e
spesso chi va piano va sano e va lontano (poteva mancare il proverbio?
:) Prima o poi ci si accorgera' che non e' affatto un problema di
nicchia, per ipovedenti o ciechi e allora si faranno le corse a chi
trova buone soluzioni prima.

Un po' di storia, per i pulcini:

Raman (cieco da quando aveva 14 anni e inventore di emacspeak) ora
lavora per google, dopo essere passato per digital, adobe e ibm
research lab.

La sua tesi di PhD, intitolata Audio System For Technical Readings
(AsTeR) ha vinto il premio ACM Doctoral Dissertation nel 1994 ed e da
quella tesi che e' nato emacspeak. Nulla di cio' gli sarebbe stato
possibile senza LaTeX e senza emacs.

E' molto probabile che sara' google a stupirci, ancora una volta,
anche in questo settore. Perche' arriva da molto lontano e vede piu'
in la' di tanti concorrenti, rimasti ancorati a vecchi schemi. Questa
non e' un'apologia di google, e' solo una constatazione di fatto, e
Raman e' una garanzia di successo (percio' non mi accusate di mancanza
di coerenza, per piacere :)

Loredana




Maggiori informazioni sulla lista Soci