Il riconoscimento dei segnali audio

Per qualsiasi persona è molto semplice distinguere tra differenti tipi di audio (voce, musica, rumori, ecc.), differenti velocità di esecuzione (lento, svelto, ecc.), differenti toni (felice, arrabbiato, triste, ecc.), così come risulta abbastanza semplice determinare la similitudine tra differenti file audio. Per un computer non è lo stesso… un computer non è in grado di poter supportare query come “cercare un brano audio simile a quello che ho appena ascoltato (query per esempio).

Inoltre uno dei grandi problemi per il riconoscimento dei file audio nasce dalla mancanza di uno standard di memorizzazione, esistono moltissimi tipi di file audio ognuno con diverse frequenze di campionamento, ampiezze ed altre caratteristiche che comportano grandi problematiche per il loro confronto. E’ necessario utilizzare delle tecniche di retrieving.

Il riconoscimento dei segnali audio

Esempio di segnale audio.

Un primo metodo di classificazione dei segnali audio avviene con un primo livello di distinzione: Parlato; Musica; Rumori. In base a questa classificazione vengono effettuati differenti studi, ad esempio per lo studio del parlato si provvede a convertire il file audio in testo (Speech Recognition) su cui si potrà poi effettuare una query di testo (tramite un IR).

I segnali audio vengono rappresentati in differenti modi:

  1. Nel dominio temporale attraverso la rappresentazione come un segnale di ampiezza variabile nel tempo;
  2. Nel dominio delle frequenze attraverso una rappresentazione Frequenza/Magnitudine

Ogni tipo di rappresentazione è utile per l’estrazione di determinate caratteristiche, oltre a determinare caratteristiche soggettive come il timbro di voce.

Photo Credit WikimediaCommons.

Pubblicato in Audio, Informatica, Sistemi Informativi Taggato con: , , , , , ,

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

*