Curse of Dimensionality

Si tratta di una “Maledizione” che capita quando abbiamo a che fare con la dimensionalità di uno spazio. Il termine fu coniato da Bellman per focalizzare l’attenzione sui problemi che si generano quando il volume dei dati aumenta esponenzialmente. Se consideriamo una linea di lunghezza 1 come un insieme di punti a distanza 0.01, abbiamo 100 punti.

  • Con 6 dimensioni avremo 10\textsuperscript{12} punti
  • Con 11 dimensioni avremo 10\textsuperscript{22} punti che corrispondono al numero di stelle stimate nell’universo.

La rappresentazione a spazi elevati, dunque, sarà sparsa e, per ogni coppia di punti, la loro distanza sarà verososimilmente uguale.

Bibliografia
Mining of Massive Datasets

Rispondi

Inserisci i tuoi dati qui sotto o clicca su un'icona per effettuare l'accesso:

Logo di WordPress.com

Stai commentando usando il tuo account WordPress.com. Chiudi sessione /  Modifica )

Google photo

Stai commentando usando il tuo account Google. Chiudi sessione /  Modifica )

Foto Twitter

Stai commentando usando il tuo account Twitter. Chiudi sessione /  Modifica )

Foto di Facebook

Stai commentando usando il tuo account Facebook. Chiudi sessione /  Modifica )

Connessione a %s...

%d blogger hanno fatto clic su Mi Piace per questo: