Sintesi vocale

(7/09/2005: ultimo aggiornamento)

La sintesi vocale è una tecnologia che permette di riprodurre tramite i circuiti audio di un computer, per mezzo di una voce sintetizzata elettronicamente, un testo che compaia sullo schermo permettendo così di ascoltare ciò che si legge. A partire dalla prima versione sono stati sviluppati diversi algoritmi di sintesi con diversa qualità e per molte lingue.

Il software di sintesi vocale di un PC utilizza normalmente la scheda sonora (oppure un apparato collegato al PC, piu' costoso) in dotazione e si interfaccia (o dovrebbe interfacciarsi) con tutti i sistemi operativi più moderni e con molti dei più comuni programmi di editing testuale o di altro tipo. Il suo utilizzo può prevedere anche un dispositivo cuffia-microfono per una maggiore fedelta'.

La sintesi vocale, a differenza del Braille che però permette anche di redigere testi ed ha maggior potenzialità, si caratterizza per una maggior facilità d'uso e immediatezza per la lettura di testi sul computer.

I prodotti software però, anche quando svolgono egregiamente la loro funzione, richiedono all'utente la padronanza del funzionamento del PC, poichè il loro compito è, per l'appunto, solo leggere ciò che appare sullo schermo restando al cieco il difficile compito di muoversi in un ambiente colmo di simboli visivi.

Infatti i sistemi operativi successivi ai vecchi DOS o UNIX, (ambienti in cui apparivano sullo schermo una larga prevalenza di parole o frasi leggibili, generalmente disposte sequenzialmente) sono stati progettati in chiave grafica, prendendo spunto da alcuni sistemi operativi a prevalente base grafica (tipo il LOGO con la sua TARTARUGA, predecessore del MOUSE) concepiti per bambini che non sapevano ancora leggere.

Infatti i sistemi operativi basati su icone e finestre, per cui la parola scritta è stata sostituita da un simbolo visivo (icona) e per inviare un comando si utilizza quasi esclusivamente il mouse, un puntatore che fa muovere sullo schermo una freccia che va posizionata esattamente sopra al simbolo visivo o alla parola che rappresenta il comando, appaiono inizialmente più immediati e facili da usare. Anche se poi per impostare un comando, che con i sistemi operativi su base testo avrebbe richiesto una riga di testo, sono necessarie dieci schermate.

In definitiva, nonostante i miglioramenti introdotti, Windows, il sistema operativo attualmente di gran lunga più diffuso al mondo, e gli altri concepiti su base icone, restano direttamente accessibili con parecchia difficoltà ad un Non Vedente, soprattutto agli inizi, poichè resta comunque orientato ad una logica di funzionamento visiva che privilegia la coordinazione fra occhio e mano.

Anche i linguaggi per la creazione di pagine Internet (HTML, ecc.) si sono evoluti nell'ottica di fornire pagine graficamente sempre più complesse, con finestre, box, font diversi, figure, ecc.ecc. Questa scelta, oltre a comportare la trasmissione di un flusso enorme di dati a rigore superflui, oltre a rendere indispensabile l'acquisto di hardware sempre più potente per contenere le stesse informazioni, oltre a confondere le idee al lettore (solo i siti migliori dispongono di un vero indice, oggi chiamato struttura del sito), rende anche difficile la lettura delle pagine ai non vedenti.

Sono però per fortuna apparsi programmi software che si pongono come interfaccia fra l'utente cieco e il sistema operativo: in pratica il Cieco ascolta comodi menù di solo testo e invia i comandi al programma usando la tastiera; è quindi il programma stesso che si incarica di tradurre queste scelte in comandi per il Windows che poi li esegue. La logica con cui il programma effettua le scelte non può essere unica (almeno finché i ciechi non ne proporranno una), e quindi esistono svariati software di questo tipo.

La maggior parte degli screen reader (la famiglia dei software cui si collega la sintesi vocale per permettere l'ascolto di un testo senza doverlo leggere) è a pagamento, sviluppato da società che distribuiscono i loro prodotti nei negozi o via Internet.

Tra essi citiamo:

Emacspeak:
è il primo package integrato che permette a utenti ciechi di interagire efficientemente con sistemi Unix attraverso la sintesi vocale integrato con IBM ViaVoice SDK. Scaricabile gratuitamente da :
Emacspeak
Emacspeak Ibm

Festival:
è il sistema di sintesi vocale multilingua per Unix sviluppato dal Centre for Speech Technology Research, University of Edinburgh. Più che uno screen reader, è un ambiente di sviluppo per realizzare screen reader.
Festival

Fondazione Ezio Galiano
La Fondazione Ezio Galiano, da anni attiva per la diffusione di una cultura dell'accesso e dell'utilizzo del personal ai nonvedenti, contiene delle pagine relative alla sintesi vocale e a programmi correlati. Galiano ha effettuato i test per il perfezionamento del programma di gestione della prima sintesi vocale con fonemi in italiano per personal computer (Difon) del CNR. Sulla home page (al 20 aprile 2005) consiglia Winguido.
Fondazione Ezio Galiano

Hal
La Audiologic presenta Hal per Windows, un programma di esplorazione schermo che permette l' accesso all'ambiente Windows. Nel programma è integrata la sintesi vocale Orpheus multilingue ed è utilizzabile anche la sintesi vocale Actor ®, in italiano. Il programma può inviare ad un eventuale display braille. Per muoversi all'interno dello schermo, invece del mouse si usa una serie di comandi, situati sul tastierino numerico della tastiera.
Hal per Windows

JAWS
Freedom Scientific produce il programma JAWS® for Windows che permette di riconoscere testi dai maggiori programmi del momento e da Internet leggendo direttamente il testo dallo schermo e traducendolo per la scheda audio. Il programma può inoltre interfacciarsi con dispositivi Braille ed include un tutorial.
JA W S

Jupiter:
è un software di sintesi vocale che rende Linux accessibile agli utenti ciechi. Permette lettura dei log della sessione interattiva, feedback audio del testo visualizzato sullo schermo, comandi vocali modificabili, interfaccia modulare tra il kernel ed il package di lettura vocale.
Jupiter

Windows-eyes
GW Micro produce un altro software della famiglia screen reader, ossia il programma Window-Eyes giunto alla versione 4.21. Progettato per l'ambiente Windows fino alla versione XP, lo screen reader in questione si interfaccia con dispositivi Braille e fornisce un'ampia gamma di funzioni.
Distribuzione Wind o w-Eyes

Winguido
Sul sito dell'ingegnere Guido Ruggeri è invece scaricabile gratuitamente una serie di programmi da lui creati appositamente concepiti per essere usati da non vedenti, cioè da persone che ricevono informazioni dal computer non dallo schermo ma tramite altri dispositivi ausiliari, che possono essere sintetizzatori di voce oppure display Braille.
www.winguido.it

Loquendo
Voice Systems distribuisce il software Loquendo Actor TTS®, una sintesi vocale software di ultima generazione prodotta da Loquendo (Centro di Ricerca Gruppo Telecom Italia). Utilizzata con uno screen reader, permette di vocalizzare ed esplorare ciò che appare sullo schermo di un Personal Computer in ambiente Windows. Il programma punta sulla qualità della voce.
Loquendo

(a.p.)

Cerca nel sito
 

Canali Radio di Pubblica Utilità - Filodiffusione (5 Canale Auditorium - 4 Canale) - Isoradio - CCISS - Tecnologie

La Filodiffusione: Presentazione - Piccola storia - Struttura - Indirizzi - Persone - Tecnica - Abbonarsi - Novità
Come ascoltarci: Telefono, Satellite, Internet, Dab, Fm
Accessibilità: Comandi vocali - Sintesi vocale - Faq