Hashbot.com - Acquisizione e Validazione

9
 Hashbot.com - Acquisizione e Validazione Scientifica dei Documenti Web Gianni Amato Working Capital Catania 29 Aprile 2009 Università di Catania

Transcript of Hashbot.com - Acquisizione e Validazione

Page 1: Hashbot.com - Acquisizione e Validazione

   

Hashbot.com - Acquisizione e Validazione Scientifica dei Documenti Web

Gianni Amato

Working Capital Catania

29 Aprile 2009

Università di Catania

Page 2: Hashbot.com - Acquisizione e Validazione

   

Hashbot.com – Flow Chart

Page 3: Hashbot.com - Acquisizione e Validazione

   

Hashbot.com – Home Page

Page 4: Hashbot.com - Acquisizione e Validazione

   

Acquire – Il processo di acquisizione

Url Indirizzo esatto del documento web, esempio:

http://www.webpage.com/image.jpg http://www.webpage.com/page.html

User Agent Presentarsi al server remoto come un qualsiasi browser. 

Il contenuto del documento acquisito potrebbe cambiare in funzione dello user agent ricevuto dal server e processato dal linguaggio di scripting che crea il documento.

Page 5: Hashbot.com - Acquisizione e Validazione

   

Status – Fine del processo di acquisizione

Header:  la risposta del server alla richiesta di hashbot

From IP: l'indirizzo IP dell'utente che ha richiesto il processo di acquisizione

URL: il collegamento al documento acquisito.

Date: data di acquisizione

Time: ora di acquisizione 

Hash File:  i codici hash MD5 e SHA1 del file acquisito. Ovvero l'impronta digitale univoca del file calcolata su due algoritmi.

Hash Header: i codici hash MD5 e SHA1 delle informazioni di header salvate in apposito file.

File Type: il tipo di documento scaricato dal processo di acquisizione.

CODE: codice alfanumerico creato da hashbot che deve considerarsi come ID univoco del processo di acquisizione.

MD5: il calcolo dell'impronta digitale del file in base all'algoritmo MD5.

SHA1:  il calcolo dell'impronta digitale del file in base all'algoritmo SHA1.

Page 6: Hashbot.com - Acquisizione e Validazione

   

Download – Contenuto dell'archivio ZIP

<keycode>­code.txt file di testo contenente le informazioni di validazione ed i dati relativi al processo di acquisizione. Quindi le 

sottosezioni “Validate Info” e “File Info” della sezione Status.

<keycode>­headers.txt file di testo contenente la risposta di header del server remoto. Quindi la sottosezione “Headers Info” della 

sezione Status.

<keycode>.<ext> il file scaricato dal processo di acquisizione. Questo verrà rinominato con il codice alfanumerico 

identificativo del processo di acquisizione e manterrà la sua estenzione se riconosciuta dal hashbot. Nel caso in cui il tipo di file non viene riconosciuto sarà usata l'estensione arbitraria unk.

Al fine di mantenere valido nel tempo il processo di acquisizione è importante che nessun file dell'archivio compresso – e quindi l'archivio stesso – subiscano modifiche di ogni genere.

Page 7: Hashbot.com - Acquisizione e Validazione

   

Validate – Il processo di validazione

Il file <keycode>­code.txt contiene le informazioni necessarie per la validazione

Code codice alfanumerico di cui al rigo tre del file 

<keycode>­code.txt

Hash File HASH del file acquisito. MD5 o SHA1 indistintamente. 

Righe 4 e 5 del file <keycode>­code.txt

Page 8: Hashbot.com - Acquisizione e Validazione

   

Status – Le informazioni di validazione

Le informazioni riportate sono la prova che hashtbot è stato usato precedentemente per acquisire il documento di cui si sta richiedendo la validazione.

Tutte le informazioni di validazione mostrate da hashbot devono corrispondere a quanto riportato nella sezione “Download Info” del file <keycode>­code.txt.

Page 9: Hashbot.com - Acquisizione e Validazione

   

Conclusioni – $AUTHORS

Hashbot.Com is developed and loved by Gianni Amato and Davide Baglieri.

...è un servizio gratuito, che non richiede registrazione, rilasiato as is.

Gianni Amato http://www.gianniamato.it

http://www.securityside.it

Davide Baglieri http://www.davidonzo.com

http://www.digitalside.it