Indicizzazione e ricerca dei file audio

Teniche di indicizzazione dei file audio: Feature e Toni

L’indicizzazione dei brani musicali è fondamentale per quei programmi che consentono di ricercare un brano musicale mentre lo si sta ascoltando. Siti come Midomì o applicazioni come Shazam, sfruttano l’indicizzazione dei file audio per identificare i brani musicali. Per poter far ciò bisogna preventivamente indicizzare i file musicali, esistono due metodi:

  1. Feature, il brano viene suddiviso in frame e ogni frame viene rappresentato da un
    vettore di caratteristiche (feature). Ad esempio, un possibile vettore di feature potrebbe essere costituito da: volume, tono, centroide spettrale, bandwidth e armonicità. Il vettore di feature viene utilizzato per il calcolo della similarità con altri brani tramite i loro vettori di feature;
  2. Tono, un brano musicale viene suddiviso in sequenze di toni (la frequenza fondamentale del suono). I brani vengono classificati secondo una scala di riferimento oppure tramite una sequenza di U per Up (su), D per Down (giù) e S per Similar (simile). Classificando i brani con i toni si ottengono buone prestazioni solo se ogni suono è intervallato da una pausa, altrimenti l’identificazione dei suoni risulta molto complessa.

Un esempio di un’onda audio nel tempo:

Onda audio, Indicizzazione e ricerca dei file audio

Un file audio spesso è parte di un oggetto multimediale composito (ad esempio un video, un film, ecc.) dove vi sono delle forti relazioni temporali tra video ed audio. Questa relazione tra file audio e file video possono essere facilmente sfruttate sia per migliorare l’indicizzazione che la comprensione del contenuto dei file.

Photo Credit: Wiki Commons

Pubblicato in Audio, Musica, Sistemi Informativi Taggato con: , , , ,

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

*