Tecniche di indicizzazione per le immagini

Indicizzare e recuperare le immagini è un campo molto importante dell’informatica, molte aziende (Google in primis) hanno investito molto risorse in questo campo. L’indicizzazione e la ricerca delle immagini può avvenire con quattro diversi metodi:

  1. Memorizzazione di attributi strutturati;
  2. Riconoscimento degli oggetti;
  3. Annotazioni libere;
  4. Estrazione di feature di basso livello.

Memorizzazione di attributi strutturati

La tecnica di indicizzazione delle immagini basata sulla memorizzazione di attributi strutturati salva determinate informazioni in un database per ogni immagine che bisogna indicizzare. Le informazioni che verranno memorizzate ed usate per nelle ricerche sono:

  1. Nome_file;
  2. Categoria;
  3. Data creazione;
  4. Soggetto;
  5. Autore;
  6. ecc.

La tecnica di indicizzazione basata sulla memorizzazione di attributi strutturati ha molti limiti, tra questi vi è il problema che gli attributi possono non descrivere in maniera completa le immagini e che le query sono limitate ai soli attributi memorizzati.

Riconoscimento degli oggetti

Riconoscimento degli oggetti

La strategia che utilizza il riconoscimento degli oggetti per indicizzare le immagini rappresenta una delle tecniche più sofisticate per l’estrazione di feature. Gli algoritmi per il riconoscimento degli oggetti sono estremamente sofisticati e richiedono molte risorse. Esempi di applicazioni basate sul riconoscimento degli oggetti sono i software di computer vision, OCR, ecc.

Riconoscimento degli oggetti

Annotazioni libere

Le immagini possono essere catalogate con delle note, dette annotazioni, ad esempio con una descrizione dell’immagine che verrà utilizzata durante le ricerche. Questa strategia non è molto efficiente poiché il testo viene scritto da un essere umano e difficilmente sarà il più completo possibile. Il testo potrebbe essere soggettivo o potrebbe avere dei sinonimi che complicheranno la ricerca del sistema a cui dovrà essere affiancato un dizionario dei sinonimi.

Estrazione di feature di basso livello

La tecnica più avanzata per l’indicizzazione delle immagini, insieme al riconoscimento degli oggetti, è l’ estrazione di feature di basso livello da un’immagine. Questa tecnica è basata sul contenuto dell’immagine (content-based) e può prendere in considerazione caratteristiche intrinseche dell’immagine come il colore, la forma e la texture.

Gli algoritmi basati sull’analisi del colore calcolano l’istogramma di colore di ogni immagine e utilizzeranno l’istogramma calcolato come identificativo dell’immagine per il confronto con altre immagini. Gli istogrammi di colore non risolvono tutti i problemi, ad esempio cambiando il contrasto o la luminosità di un’immagine, l’istogramma calcolato sarà diverso da quello precedentemente calcolato. Questo discorso si può applicare anche sui colori che vengono utilizzati nella stessa immagine. Soluzioni che puntano a risolvere i problemi più comuni per ll’indicizzazione e ricerca delle immagini sono gli Istogrammi cumulativi e gli istogrammi pesati percettivamente (PWH, Percentually Weighted Histogram).

Esistono anche altre tecniche che puntano all’estrazione di feature di basso livello delle immagini e sono le strategie che basano il proprio funzionamento sulla forma degli oggetti. Queste tecniche suddividono l’immagine in tanti piccoli oggetti ottenendo così una rappresentazione unica ed indipendente da eventuali traslazioni, rotazioni o scale. Un altro tipo di tecnica per estrarre informazione di basso livello è l’analisi della texture che analizzano l’immagine alla ricerca nell’immagine di granularità, contrasto, direzione dominante della texture, regolarità, ecc.

Photo Credit: WithFriendship e Image e Vision Computing Group

Pubblicato in Immagini, Sistemi Informativi Taggato con: , , , ,

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

*