Category: Audio

Hidden Markov Models, cos’è e perchè viene utilizzato

Le tecniche basate su Hidden Markov Models (HMM) rappresentano una tecnica che sta ottenendo buoni risultati sia per il riconoscimento di testi scritti che per il riconoscimento del parlato ed i suoi fonemi. Modello di Markov nascosto, prende il nome dal suo ideatore, ed in particolare la parola “nascosto” indica che per un osservatore qualsiasi [...]

martedì giugno 5th, 2012 in Audio, Informatica | No Comments »

Dynamic Time Warping, l’algoritmo per uniformare i suoni

Ogni ogni frase, ogni parola ma anche ogni singola lettera possono essere pronunciati in maniera diversa da persona a persona. In particolare persone diverse possono impiegare tempi diversi per pronunciare lo stesso fonema. Queste differenze rappresentano un forte ostacolo per i processi di riconoscimento del parlato, non è possibile confrontare direttamente segnali audio.

lunedì giugno 4th, 2012 in Audio, Informatica | No Comments »

Classificazione dei segnali audio

Essere in grado di catalogare i vari file audio è un passo molto utile per la ricerca di informazioni all’interno di un file audio. La principale suddivisione dei suoni che viene utilizzata è quella di dividere i suoni in due grandi categorie: la Musica ed il Parlato. Ovviamente, la suddivisione in due sole categorie dei [...]

sabato giugno 2nd, 2012 in Audio, Informatica, Musica | 1 Comment »

Tecniche di identificazione dello Speaker

Uno dei grandi problemi per il riconoscimento vocale sono le differenti caratteristiche che variano da persona a persona come il tono di voce, l’accento, la velocità con cui si emettono determinati fonemi, ecc. E’ di fondamentale importanza saper distiguere queste caratteristiche in modo da ottenere una migliore elaborazione dei suoni che possono essere usati nei [...]

giovedì maggio 31st, 2012 in Audio, Informatica, Telefonia | No Comments »

Il riconoscimento dei file audio, Automatic Speech Recognition

Una delle frontiere dell’informatica moderna è quello di poter permettere a chiunque di cercare una qualsiasi parola, una frase o un intero testo all’interno di un file audio. L’approccio fondamentale che viene utilizzato per l’indicizzazione ed il recupero del parlato è basato sulla conversione dei segnali audio vocali in testo su cui successivamente applicare tecniche [...]

martedì maggio 29th, 2012 in Audio, Informatica | No Comments »

Spettrogramma, l’intensità alle varie frequenze

Uno spettrogramma è la rappresentazione di un suono attraverso l’utilizzo di un grafico. La necessità di utilizzato uno spettrogramma è dovuta dal limite dello spettro che non evidenzia i momenti in cui si verificano le variazioni di frequenza. Lo spettrogramma rappresenta un segnale che mostra la relazione tra 3 variabili che caratterizzano qualsiasi suono: Frequenza [...]

giovedì maggio 24th, 2012 in Audio, Informatica, Musica | No Comments »

Il Time Domain per la rappresentazione di un segnale audio

Se si vuole rappresentare un segnale audio attraverso un grafico il primo tipo di rappresentazione che sicuramente verrebbe in mente a chiunqueè la rappresentazione del Time Domain. Questo tipo di rappresentazione mostra come l’ampiezza del segnale audio varia nel tempo, dove il silenzio è rappresentato dallo zero. I valori del segnale possono essere positivi o [...]

giovedì maggio 24th, 2012 in Audio, Informatica, Musica | No Comments »