PDA

Visualizza versione completa : Esecuzione SHoUT speech recognition toolkit



mila
20-09-11, 12: 28
Ciao a tutti..
mi servirebbe una mano per poter far partire un applicazione su ubuntu..il nome di questa applicazione è SHoUT
SHoUT speech recognition toolkit (http://shout-toolkit.sourceforge.net/index.html)
Purtroppo dopo aver letto tesi e manuale del programmatore, non sono riuscito a capire come fare per creare dei file necessari all'avvio dell'esecuzione.
Praticamente una volta fatto partire l'eseguibile(parte!!), mi dice che necessita di un file audio con determinate caratteristiche,che penso di essere in grado di creare..e dopo di che vuole altri tre files..un file meta dati,un file dizionario e un file modello acustico.
Ma la difficoltà di questi tre files, è che devono essere in formato shout da quello che ho capito, ed il formato shout dovrebbe essere il seguente, come riportato sul manuale

* SPEAKER [label] [VTLN factor] [begin time] [length] <NA> <NA> [SPK ID] <NA> [<s> <s> followed by a word based transcription]

dove

* label - is the identifier of the file.
* VTLN factor - is the factor calculated by shout_vtln used for VTLN.
* begin time - begin time of the audio segment
* length - length of the segment
* <NA> - Not applicable (for compatibility with NIST RTTM files).
* SPK ID - label of the segment (can be SPEECH/SIL or SPK ID).
Allego dei file..
Vi prego aiutatemi!!!!!!!!! Grazie a tutti.

Andy86
20-09-11, 15: 19
:bai

Sinceramente quel software non mi sembra molto completo... o per lo meno non è per utenti normali... :m:
Da quel che si legge il file per il dizionario te lo devi creare da solo -> click (http://shout-toolkit.sourceforge.net/use_case_dct_lm.html), e non mi sembra una cosa normale. :boh

Se stai cercando un software user-friendly per il riconoscimento vocale, ti consiglio di dare un occhiata a questo -> click (http://sourceforge.net/projects/speech2text/).

mila
20-09-11, 16: 11
:bai Andy e grazie per avermi risposto..
purtroppo,non per mia scelta, sono costretto a far girare questo benedetto shout...(colpa del prof!),e quindi non posso servirmi di altri software e poi leggendo la tua risposta,confermo quello che hai scritto.
Ma il mio problema era proprio nel reperire questi file..:boh
Ho trovato dei file dizionari, ma non quelli specificati nel manuale..dove mi dice che questi file dizionari devono essere composti da testo più relativa pronuncia!:triste

Ancora grazie :bai