Audio

I Watermark e le tecniche di watermarking

Un watermark può essere fragile, robusto, insivibile, cieco… Con il termine Watermarking si intende l’inclusione di informazioni all’interno dei file multimediali che possono essere usate per attestare l’origine e la provenienza dei file. La tecnica del watermarking non alterna il corretto funzionamento dei file, immagini o video ma li “marchia” in modo da poterne sempre …

I Watermark e le tecniche di watermarking Leggi altro »

L’audio e le sue tecniche di compressione

Compressione dei file audio: Companding e Predictive Coding L’audio è generato da variazioni di pressione dell’aria i cui descrittori fondamentali del suono sono l’Ampiezza e la Frequenza che variano nel tempo. L’essere umano non è in grado di udire qualsiasi suono, in particolare è in grado di usare solo i suoni nell’intervallo tra 20 e …

L’audio e le sue tecniche di compressione Leggi altro »

Indicizzazione e ricerca dei file audio

Teniche di indicizzazione dei file audio: Feature e Toni L’indicizzazione dei brani musicali è fondamentale per quei programmi che consentono di ricercare un brano musicale mentre lo si sta ascoltando. Siti come Midomì o applicazioni come Shazam, sfruttano l’indicizzazione dei file audio per identificare i brani musicali. Per poter far ciò bisogna preventivamente indicizzare i …

Indicizzazione e ricerca dei file audio Leggi altro »

Hidden Markov Models, cos’è e perchè viene utilizzato

Le tecniche basate su Hidden Markov Models (HMM) rappresentano una tecnica che sta ottenendo buoni risultati sia per il riconoscimento di testi scritti che per il riconoscimento del parlato ed i suoi fonemi. Modello di Markov nascosto, prende il nome dal suo ideatore, ed in particolare la parola “nascosto” indica che per un osservatore qualsiasi …

Hidden Markov Models, cos’è e perchè viene utilizzato Leggi altro »

Dynamic Time Warping, l’algoritmo per uniformare i suoni

Ogni ogni frase, ogni parola ma anche ogni singola lettera possono essere pronunciati in maniera diversa da persona a persona. In particolare persone diverse possono impiegare tempi diversi per pronunciare lo stesso fonema. Queste differenze rappresentano un forte ostacolo per i processi di riconoscimento del parlato, non è possibile confrontare direttamente segnali audio.

Tecniche di identificazione dello Speaker

Uno dei grandi problemi per il riconoscimento vocale sono le differenti caratteristiche che variano da persona a persona come il tono di voce, l’accento, la velocità con cui si emettono determinati fonemi, ecc. E’ di fondamentale importanza saper distiguere queste caratteristiche in modo da ottenere una migliore elaborazione dei suoni che possono essere usati nei …

Tecniche di identificazione dello Speaker Leggi altro »