ANN, le Reti Neurali Artificiali

Le reti ANN sono tra le tecniche più avventuristiche nel campo dell’audio. Sono largamente impiegate per il riconoscimento delle tracce attraverso la simulazione dei processi cognitivi, ed in particolare l’apprendimento del cervello umano.

Acronimo di Artificial Neural Networks, una rete ANN simula una rete interconnessa con vari link e ognuno con uno specifico peso. La particolarità di questi reti è la loro struttura, le reti ANN utilizzano un grande numero di elementi di calcolo, i cosiddetti PE, Processing Elements, molto semplici e interconnessi tra di loro. E’ costituita da due fasi:

  1. Training (addestramento): i vettori caratteristici ottenuti durante il training di parlato servono per valutare i pesi dei link della rete;
  2. Recognition: l’ANN seleziona il fonema più verosimile a quello cercato basandosi sulle caratteristiche dei vettori creati nella fase di Training.

Ogni PE della rete implementa una semplice funzione matematica di tipo non lineare e rappresenta un NEURONE (unità elementare del cervello). Le connessioni tra i vari elementi rappresentano le SINAPSI (strutture nervose di collegamento tra neuroni).

ANN, le Reti Neurali Artificiali

Ogni connessione (sinapsi) è caratterizzata da un PESO detto w compreso tra [-1..1]. Il peso rappresenta quanto il neurone che invia il segnale influenza il neurone destinatario della connessione. I pesi inizialmente vengono assegnati in maniera random, in modo che durante l’esecuzione l’insieme dei pesi rappresenta la “conoscenza” detenuta dalla rete.
Attraverso la variazione dei pesi delle sinapsi secondo determinati criteri è possibile addestrare la rete ad implementare un determinato compito.

I neuroni sono in genere organizzati in tre livelli:

  1. Livello di input;
  2. Livelli nascosti;
  3. Livello di output.

In genere le connessioni sono stabilite tra neuroni appartenenti a livelli differenti e non dello stesso livello.

ANN, le Reti Neurali Artificiali

Ogni singolo neurone della rete (PE) effettua una somma pesata, detta INTEGRAZIONE, degli input dalle connessioni con gli altri neuroni. L’input pesato viene poi valutato da una funzione detta di TRASFORMAZIONE che determina l’output del singolo PE. Normalmente le funzioni di trasformazione sono funzioni molto semplici e non lineari (FUNZIONI SOGLIA).

Le funzioni di trasformazione hanno il compito di restituire l’output in relazione all’input totale ricevuto sul neurone. Si utilizzano delle funzioni a soglia che danno luogo ad un’attivazione del neurone solo nel caso in cui l’input su tale neurone superi una soglia pre-determinata. Questo simula il comportamento dei neuroni reali i quali reagiscono solo se stimolati sopra una determinata soglia. Le funzioni di trasformazione più usate sono la funzione lineare, la funzione gradino, le funzioni sigmoidee e quella semi-lineare. In genere le connessioni sono stabilite tra neuroni appartenenti a livelli differenti e non dello stesso livello.

Photo Credit Ethan Hein, lednichenkoolga.

Pubblicato in Audio, Informatica, Sistemi Informativi Taggato con: , , , , , , , , , ,

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

*