Politecnico di Torino: Aree Web personali / Personal ......5 Informazione digitale 10 TeraByte...

25
1 la memoria nella rete Prof. Marco Mezzalama Torino, 4 maggio 2011

Transcript of Politecnico di Torino: Aree Web personali / Personal ......5 Informazione digitale 10 TeraByte...

Page 1: Politecnico di Torino: Aree Web personali / Personal ......5 Informazione digitale 10 TeraByte 10.000 GB Libri contenuti nella Biblioteca del congresso degli Stati Uniti 10 PetaByte

1

la memoria nella rete

Prof. Marco Mezzalama Torino, 4 maggio 2011

Page 2: Politecnico di Torino: Aree Web personali / Personal ......5 Informazione digitale 10 TeraByte 10.000 GB Libri contenuti nella Biblioteca del congresso degli Stati Uniti 10 PetaByte

2

Gli attributi della memoria

• Capacità• Accessibilità (leggibilità)• Permanenza

• Il cervello umano:10^13 numero sinapsi (10 Tera)

Page 3: Politecnico di Torino: Aree Web personali / Personal ......5 Informazione digitale 10 TeraByte 10.000 GB Libri contenuti nella Biblioteca del congresso degli Stati Uniti 10 PetaByte

3

Le fasi storiche della memoria

• Tradizione orale

• Scrittura (codifica alfabetica)

• La rivoluzione informatica e la rete

Page 4: Politecnico di Torino: Aree Web personali / Personal ......5 Informazione digitale 10 TeraByte 10.000 GB Libri contenuti nella Biblioteca del congresso degli Stati Uniti 10 PetaByte

4

Oggi milioni di persone interagiscono in un mondo di conoscenze e servizi attraverso un unico sistema di trasporto, la rete internet, realizzando una formidabile living network, in cui vive la nostra memoria personale e collettiva

Oggi milioni di persone interagiscono in un mondo di conoscenze e servizi attraverso un unico sistema di trasporto, la rete internet, realizzando una formidabile living network, in cui vive la nostra memoria personale e collettiva

Page 5: Politecnico di Torino: Aree Web personali / Personal ......5 Informazione digitale 10 TeraByte 10.000 GB Libri contenuti nella Biblioteca del congresso degli Stati Uniti 10 PetaByte

5

Informazione digitale

10 TeraByte10.000 GB

Libri contenuti nellaBiblioteca del congressodegli Stati Uniti

10 PetaByte10.000 TB

Intero contenuto del web

Page 6: Politecnico di Torino: Aree Web personali / Personal ......5 Informazione digitale 10 TeraByte 10.000 GB Libri contenuti nella Biblioteca del congresso degli Stati Uniti 10 PetaByte

6

Cosa è un Peta byte?

• 20 milioni di armadi pieni di libri

• 13 anni di trasmissioni HD – TV

• 10 miliardi di foto su Facebook

50 PetaByte l’insieme delle opere scritte dall’uomo da quando apprese a scrivere

Page 7: Politecnico di Torino: Aree Web personali / Personal ......5 Informazione digitale 10 TeraByte 10.000 GB Libri contenuti nella Biblioteca del congresso degli Stati Uniti 10 PetaByte

7

Informazione digitale

10 PetaByte10.000 TB

Intero contenuto del web

10.000.000.000.000.000

Pari a 5.000 miliardi di pagine

Page 8: Politecnico di Torino: Aree Web personali / Personal ......5 Informazione digitale 10 TeraByte 10.000 GB Libri contenuti nella Biblioteca del congresso degli Stati Uniti 10 PetaByte

8

I vantaggi della Memoria (informatica)

• Capacità di immagazzinare– Tecnologie hw a supporto della

memorizzazione

• Capacità di elaborare– Potenza di calcolo MFlops

• Capacità di trasferire informazione– Tecnologie di trasmissione a breve e

grande distanza (PAN, LAN, WAN)

Page 9: Politecnico di Torino: Aree Web personali / Personal ......5 Informazione digitale 10 TeraByte 10.000 GB Libri contenuti nella Biblioteca del congresso degli Stati Uniti 10 PetaByte

9

La potenza del silicio

• Oggi i chip standard di memoria DRAM contengono 1000 Mbit (256M x 4)

• Samsung ha già in prima produzione chip da 4 Gbit (DRAM DDR3), cioè su una singola piastrina dispongo di 16 GByte

Page 10: Politecnico di Torino: Aree Web personali / Personal ......5 Informazione digitale 10 TeraByte 10.000 GB Libri contenuti nella Biblioteca del congresso degli Stati Uniti 10 PetaByte

10

La potenza del silicio

• Memory stick: introdotte nel 1999 da Sony con capacità pari a 128MB, oggi sono disponibili con capacità 16GB

Page 11: Politecnico di Torino: Aree Web personali / Personal ......5 Informazione digitale 10 TeraByte 10.000 GB Libri contenuti nella Biblioteca del congresso degli Stati Uniti 10 PetaByte

11

La potenza del silicio

• 16 GByte corrispondono a:– 1 album fotografico con un milione di

fotografie a colori in formato jpeg– 1 libro da 8 milioni di pagine– Il nostro DNA

Page 12: Politecnico di Torino: Aree Web personali / Personal ......5 Informazione digitale 10 TeraByte 10.000 GB Libri contenuti nella Biblioteca del congresso degli Stati Uniti 10 PetaByte

12

La potenza del silicio

• Tra 10 anni su un singolo chip potremo memorizzare circa 30 Gbit e su una piastrina 120 GByte

• Sulla memoria RAM del computer tutti i libri delle biblioteche universitarie

• Su un iPod tutte le nostre analisi mediche

Page 13: Politecnico di Torino: Aree Web personali / Personal ......5 Informazione digitale 10 TeraByte 10.000 GB Libri contenuti nella Biblioteca del congresso degli Stati Uniti 10 PetaByte

13

Hard disk

• Nel 2007 Hitachi ha introdotto il primo disco rigido da 1TB (1000 GB)

• 10 anni fa un Giga byte di spazio di memoria di massa costava circa 250€, oggi 1€

• Tra 5 anni sarà disponibile un disco rigido da 1-2 Peta byte, a circa 400€

Page 14: Politecnico di Torino: Aree Web personali / Personal ......5 Informazione digitale 10 TeraByte 10.000 GB Libri contenuti nella Biblioteca del congresso degli Stati Uniti 10 PetaByte

14

I vantaggi della Memoria (informatica)

• Capacità di elaborare informazione

Page 15: Politecnico di Torino: Aree Web personali / Personal ......5 Informazione digitale 10 TeraByte 10.000 GB Libri contenuti nella Biblioteca del congresso degli Stati Uniti 10 PetaByte

15

Supercomputer november 2011

Tianhe 1A

Supercomputer center in TianjinCHINA

Potenza:2566 TFlops (2.5 petaflop/s)

(2.500.000.000.000.000 moltiplicazioni secondo)

Page 16: Politecnico di Torino: Aree Web personali / Personal ......5 Informazione digitale 10 TeraByte 10.000 GB Libri contenuti nella Biblioteca del congresso degli Stati Uniti 10 PetaByte

16

I problemi della Memoria (informatica)

• Capacità di reperire informazione– Tecnologie sw di organizzazione e

reperimento

Google è in grado di elaborare 1 PB ogni 6 ore!Google è in grado di elaborare 1 PB ogni 6 ore!

Page 17: Politecnico di Torino: Aree Web personali / Personal ......5 Informazione digitale 10 TeraByte 10.000 GB Libri contenuti nella Biblioteca del congresso degli Stati Uniti 10 PetaByte

17

Motori di ricerca

• Search engine: un po’ di storia….

• ARCHIE 1990• LYCOS 1994• ALTAVISTA 1995• GOOGLE 1998

Page 18: Politecnico di Torino: Aree Web personali / Personal ......5 Informazione digitale 10 TeraByte 10.000 GB Libri contenuti nella Biblioteca del congresso degli Stati Uniti 10 PetaByte

L'ANALISI LESSICALE

CANE

GATTO

TOPO

Page 19: Politecnico di Torino: Aree Web personali / Personal ......5 Informazione digitale 10 TeraByte 10.000 GB Libri contenuti nella Biblioteca del congresso degli Stati Uniti 10 PetaByte

L'ANALISI SINTATTICA

Page 20: Politecnico di Torino: Aree Web personali / Personal ......5 Informazione digitale 10 TeraByte 10.000 GB Libri contenuti nella Biblioteca del congresso degli Stati Uniti 10 PetaByte

L'ANALISI SEMANTICA

Page 21: Politecnico di Torino: Aree Web personali / Personal ......5 Informazione digitale 10 TeraByte 10.000 GB Libri contenuti nella Biblioteca del congresso degli Stati Uniti 10 PetaByte

21

Motori di ricerca

• I motori di ricerca si basano su speciali programmi, detti Internet o web bots (da robots) che ad una velocità migliaia di volte maggiore di quella umana “navigano” le pagine dei siti web attraverso i link ipertestuali, creando elenchi indicizzati

• Tipici sono i web spider

Page 22: Politecnico di Torino: Aree Web personali / Personal ......5 Informazione digitale 10 TeraByte 10.000 GB Libri contenuti nella Biblioteca del congresso degli Stati Uniti 10 PetaByte

22

Strutturare i documenti

Che caos un documentoNON strutturato!

Page 23: Politecnico di Torino: Aree Web personali / Personal ......5 Informazione digitale 10 TeraByte 10.000 GB Libri contenuti nella Biblioteca del congresso degli Stati Uniti 10 PetaByte

23

Semantic Web• “The Semantic Web is a web of data”.

• Ci sono moltissimi dati utilizzati da noi tutti i giorni che non fanno parte del web. Gli estratti conto che vedo collegandomi al sito della mia banca. Le fotografie del mio album sul mio pc. Gli appuntamenti della mia agenda elettronica.

• Come li collego, li ricerco ?

• Il problema è che questi dati sono controllati da applicazioni e non sono accessibili mediante i protocolli internet (http, www) o strutturari secondo i linguaggi del web.

Page 24: Politecnico di Torino: Aree Web personali / Personal ......5 Informazione digitale 10 TeraByte 10.000 GB Libri contenuti nella Biblioteca del congresso degli Stati Uniti 10 PetaByte

24

Semantic Web

• Web second generation– Web 3.0

• “Conceptual structuring of the Web in an explicit machine-readable way” (Tim Berners-Lee)

• In other words…

…let the machine do most of the work!!!

http://www.w3.org/2001/sw/

Page 25: Politecnico di Torino: Aree Web personali / Personal ......5 Informazione digitale 10 TeraByte 10.000 GB Libri contenuti nella Biblioteca del congresso degli Stati Uniti 10 PetaByte

25

L’evoluzione tecnologica ha determinato la necessità di strumenti tecnologici sempre più sofisticati per

accedere all’informazione