Classificazione dei segnali audio
Ovviamente, la suddivisione in due sole categorie dei suoni rappresenta un tipo di classificazione molto generica. E’ possibile raffinare questa classificazione in vari modi: se la voce è maschile o femminile, se si tratta di suoni alti o bassi e tanto altro. Ecco una tabella che racchiude le principali caratteristiche/differenze nei segnali audio:
| Caratteristiche | Parlato | Musica |
| Larghezza di Banda | 0-7 kHz | 0-20 kHz |
| Centroide Spettrale | Basso | Alto |
| Quantità di silenzio | Alto | Basso |
| Frequenza di passaggio per Zero | Molto variabile | Meno variabile |
| Ritmo regolare | No | Si |
I principali metodi di classificazione audio sono:
- Classificazione Step-by-Step (passo passo). Ogni caratteristica audio viene valutata singolarmente per poter determinare se si tratta di un brano musicale o di parlato. Ogni caratteristica viene vista come una sorta di criterio di selezione grazie alla quale è possibile stabilire la tipologia di un determinato audio. E’ possibile costruire un vero e proprio algoritmo grazie al quale avremo la possibilità di determinare se un file audio contiene della musica o del parlato.

Il primo filtro dell’algoritmo valuta la posizione del centroide, se il valore supera una determinata soglia allora si presume che si tratti di un brano musicale. Successivamente si valuta la quantità di silenzio, se c’è poco silenzio allora si tratta di un file musicale. Infine si valuta la frequenza di cambiamento del segno del segnale d’ampiezza, se questo non è variabile allora si tratta di Musica, in alternativa di parlato.
- Classificazione basata su caratteristiche vettoriali. Vengono presi i valori di un insieme di caratteristiche del suono che andranno a formare un vettore di componenti che verrà confrontato tramite distanza Euclidea con un altro vettore di caratteristiche che rappresenta il vettore di riferimento di ciascuna classe di pezzi audio.
Articoli che potrebbero interessarti:
- Il riconoscimento dei segnali audio Per qualsiasi persona è molto semplice distinguere tra differenti tipi di audio (voce, musica, rumori, ecc.), differenti velocità di esecuzione...
- I segnali audio rappresentati nel dominio delle Frequenze Dalla rappresentazione di un segnale audio nel Time Domain, deriva un altro tipo di rappresentazione, quella nel Dominio delle Frequenze....
- Il Time Domain per la rappresentazione di un segnale audio Se si vuole rappresentare un segnale audio attraverso un grafico il primo tipo di rappresentazione che sicuramente verrebbe in mente...
- Il riconoscimento dei file audio, Automatic Speech Recognition Una delle frontiere dell’informatica moderna è quello di poter permettere a chiunque di cercare una qualsiasi parola, una frase o...
- AoA Audio Extractor per estrarre l’audio dai video AoA Audio Extractor è una potente applicazione audio che offre differenti strumenti software per la manipolazione dei file audio. Contiene...
1 Comment to “Classificazione dei segnali audio”
RSS feed dei commenti a questo articolo. TrackBack URI


By Hari, 10 agosto 2012 @ 11:56
quando ho parlato + musica insieme come faccio? Ad esempio nella sponsorizzazione di un cd alla radio.
C’è il parlato e di sottofondo il cd