Classificazione dei segnali audio

Essere in grado di catalogare i vari file audio è un passo molto utile per la ricerca di informazioni all’interno di un file audio. La principale suddivisione dei suoni che viene utilizzata è quella di dividere i suoni in due grandi categorie: la Musica ed il Parlato.

Ovviamente, la suddivisione in due sole categorie dei suoni rappresenta un tipo di classificazione molto generica. E’ possibile raffinare questa classificazione in vari modi: se la voce è maschile o femminile, se si tratta di suoni alti o bassi e tanto altro. Ecco una tabella che racchiude le principali caratteristiche/differenze nei segnali audio:

Caratteristiche Parlato Musica
Larghezza di Banda 0-7 kHz 0-20 kHz
Centroide Spettrale Basso Alto
Quantità di silenzio Alto Basso
Frequenza di passaggio per Zero Molto variabile Meno variabile
Ritmo regolare No Si

I principali metodi di classificazione audio sono:

  1. Classificazione Step-by-Step (passo passo). Ogni caratteristica audio viene valutata singolarmente per poter determinare se si tratta di un brano musicale o di parlato. Ogni caratteristica viene vista come una sorta di criterio di selezione grazie alla quale è possibile stabilire la tipologia di un determinato audio. E’ possibile costruire un vero e proprio algoritmo grazie al quale avremo la possibilità di determinare se un file audio contiene della musica o del parlato.

    Classificazione dei segnali audio

    Il primo filtro dell’algoritmo valuta la posizione del centroide, se il valore supera una determinata soglia allora si presume che si tratti di un brano musicale. Successivamente si valuta la quantità di silenzio, se c’è poco silenzio allora si tratta di un file musicale. Infine si valuta la frequenza di cambiamento del segno del segnale d’ampiezza, se questo non è variabile allora si tratta di Musica, in alternativa di parlato.

  2. Classificazione basata su caratteristiche vettoriali. Vengono presi i valori di un insieme di caratteristiche del suono che andranno a formare un vettore di componenti che verrà confrontato tramite distanza Euclidea con un altro vettore di caratteristiche che rappresenta il vettore di riferimento di ciascuna classe di pezzi audio.

/strong

Pubblicato in Audio, Informatica, Musica Taggato con: , , , , , , , , , , ,
One comment on “Classificazione dei segnali audio
  1. Hari scrive:

    quando ho parlato + musica insieme come faccio? Ad esempio nella sponsorizzazione di un cd alla radio.
    C’è il parlato e di sottofondo il cd

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

*