MIRS, il sistema utilizzato dai moderni motori di ricerca

MIRS, il sistema utilizzato dai moderni motori di ricerca

MIRS, acronimo di Multimedia Indexing and Retrival System, è il sistema utilizzato dai moderni motori di ricerca per indicizzare e recuperare i file multimediali. Questi particolari tipi di file sono qui file che tutti noi utilizziamo ogni giorno, dai semplici file di testo fino ai file audio sul nostro ipod, passando dai file video e dalle immagini.

L’architettura dei sistemi MIRS è basato sul concetto di client/server, in cui esiste uno o più server che offrono servizi ai vari client che ne richiedono l’utilizzo. Questi sistemi sono modulari, possono essere suddivisi in cinque livelli: interfaccia utente, estrattore di caratteristiche, gestore della comunicazione (client), gestore della comunicazione (server), motore di indicizzazione e ricerca, gestore della memorizzazione.

Le due operazioni più comuni sono l’inserimento e il recupero, entrambe hanno un funzionamento molto simile. Per l’inserimento di un file multimediale il sistema funziona nel seguente modo:

  1. L’utente inserisce il file specificando il tipo di input (microfono, videocamera, CD, ecc.);
  2. I contenuti del file vengono estratti automaticamente o semiautomaticamente;
  3. Le caratteristiche appena estratte vengono inviate, insieme a gli oggetti multimediali originari, ai server grazie al Gestore della comunicazione del Client;
  4. Il Gestore della comunicazione del Server del server riceve gli oggetti, li organizza e li invia al blocco successivo;
  5. Viene effettuata l’indicizzazione delle informazioni;
  6. Le informazioni estratte e gli oggetti originali vengono memorizzate all’interno del nostro sistema.

Durante l’operazione di recupero il sistema funziona in maniera quasi speculare:

  1. L’utente esegue la query per recuperare un elemento (non necessariamente presente) e la sottopone al sistema;
  2. Vengono estratte le caratteristiche della query;
  3. Il Gestore della comunicazione del Client raccoglie le informazioni estratte e le invia al motore di indicizzazione e ricerca;
  4. Il server riceve le informazioni e le smista al sistema;
  5. Il motore cerca l’elemento all’interno del sistema e restituisce l’elemento che meglio si adatta alla query;
  6. L’elemento viene recuperato e viene effettuato il processo inverso, la destinazione dell’oggetto è l’interfaccia di visualizzazione.

L’interfaccia utente di un MIRS deve fornire degli strumenti semplici per permettere di inserire gli oggetti nel database, strumenti che consentono di fornire query efficaci ed in base alle esigenze di ricerca, presentare i risultati in maniera efficiente ed infine essere user-friendly.

Dato che a differenza dei database tradizionali, i file multimediali hanno forma e struttura diversa, la loro memorizzazione è complessa. E’ compito del MIRS organizzare e gestire questi file, permettere l’inserimento di dati multimediali semplici e complessi e gestire l’estrazioni degli attributi per il processo di indicizzazione. Le query efficaci che possono essere inviate al sistema possono essere di due tipi:

  1. multiformi, l’utente può inserirle utilizzando modi differenti e differenti tipi di media;
  2. incerte, se l’utente sa cosa vuole ma non sa descriverlo e riconosce il risultato corretto solo quando lo vede.

Di conseguenza l’interfaccia utente ha bisogno di diverse caratteristiche per le diverse fasi di interazione.

Di particolare interesse per gli amanti dei sistemi informativi multimediali sono il processo di estrazione delle feature (come per le immagini), di indicizzazione e della garanzia sul QoS che il sistema deve garantire.

Pubblicato in Informatica, Internet, Motori di Ricerca, Sistemi Informativi Taggato con: , , , ,

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

*