Hidden Markov Models, cos’è e perchè viene utilizzato

Le tecniche basate su Hidden Markov Models (HMM) rappresentano una tecnica che sta ottenendo buoni risultati sia per il riconoscimento di testi scritti che per il riconoscimento del parlato ed i suoi fonemi. Modello di Markov nascosto, prende il nome dal suo ideatore, ed in particolare la parola “nascosto” indica che per un osservatore qualsiasi non è visibile la sequenza di stati interni ma solo la sequenza di output dei simboli. Read more »

Dynamic Time Warping, l’algoritmo per uniformare i suoni

Ogni ogni frase, ogni parola ma anche ogni singola lettera possono essere pronunciati in maniera diversa da persona a persona. In particolare persone diverse possono impiegare tempi diversi per pronunciare lo stesso fonema. Queste differenze rappresentano un forte ostacolo per i processi di riconoscimento del parlato, non è possibile confrontare direttamente segnali audio. Read more »

Classificazione dei segnali audio

Essere in grado di catalogare i vari file audio è un passo molto utile per la ricerca di informazioni all’interno di un file audio. La principale suddivisione dei suoni che viene utilizzata è quella di dividere i suoni in due grandi categorie: la Musica ed il Parlato.

Ovviamente, la suddivisione in due sole categorie dei suoni rappresenta un tipo di classificazione molto generica. E’ possibile raffinare questa classificazione in vari modi: se la voce è maschile o femminile, se si tratta di suoni alti o bassi e tanto altro. Ecco una tabella che racchiude le principali caratteristiche/differenze nei segnali audio: Read more »

Gli Inverted File per l’indicizzazione dei file di testo

Uno dei nodi cruciali per l’indicizzazione dei file di testo è la scelta della struttura in cui memorizzare le informazioni. Esistono tante strutture come i Flat file, gli Inverted files, i Signature files, gli alberi e i grafi.

Un file invertito. Tra le strutture che si possono utilizzare spiccano gli Inverted files, una struttura molto particolare e largamente usata da molti motori di ricerca. Si tratta di un semplice file in cui sono contenute poche informazioni, per l’esattezza un inverted file contiene un insieme di righe di testo, in cui ogni riga contiene: Read more »