OSINT su siti web

40
OSINT su si* web – Paolo Dal Checco OSINT su si* web Paolo Dal Checco Seminario IISFA/CeFIRST Roma, Campo dei Fiori 12 dicembre 2014

Transcript of OSINT su siti web

Page 1: OSINT su siti web

OSINT  su  si*  web  –  Paolo  Dal  Checco  

OSINT  su  si*  web    

Paolo  Dal  Checco      

Seminario  IISFA/CeFIRST  Roma,  Campo  dei  Fiori  12  dicembre  2014  

Page 2: OSINT su siti web

OSINT  su  si*  web  –  Paolo  Dal  Checco  

-­‐  Ph.D.  in  Informa.ca  su  sicurezza  e  cri4ografia  -­‐  Consulente  Informa.co  Forense  per  Procure,  Tribunali,  

Aziende,  Avvoca.  e  Priva.  -­‐  Co-­‐.tolare  “Digital  Forensics  Bureau”  -­‐  Tra  i  fondatori  della  DEFT  Associa.on  e  dell’Osservatorio  

Nazionale  sull’Informa.ca  Forense  -­‐  Socio  IISFA,  CLUSIT,  AIP  

Chi  sono  

Page 3: OSINT su siti web

OSINT  su  si*  web  –  Paolo  Dal  Checco  

Motori  di  ricerca  

Page 4: OSINT su siti web

OSINT  su  si*  web  –  Paolo  Dal  Checco  

Google  Advanced  Operators  

h"p://www.googleguide.com/advanced_operators.html    

La  differenza  tra  saper  usare  Google  search  e  saperlo  usare  bene    

Page 5: OSINT su siti web

OSINT  su  si*  web  –  Paolo  Dal  Checco  

Google  Advanced  Operators  Operators   Descrip.on  

site:   Restrict  results  to  only  one  domain,  or  server  

inurl:/allinurl:   All  terms  must  appear  in  URL  

in*tle:/allin*tle:   All  terms  must  appear  in  *tle  

cache:   Display  Google’s  cache  of  a  page  

ext:/filetype:   Return  files  with  a  given  extension/file  type  

info:   Convenient  way  to  get  to  other  informa*on  about  a  page  

link:   Find  pages  that  link  to  the  given  page  

inanchor:   Page  is  linked  to  by  someone  using  the  term  

Page 6: OSINT su siti web

OSINT  su  si*  web  –  Paolo  Dal  Checco  

Google  Advanced  Operators  Operators   Descrip.on  

source:   In  Google  News,  rescr*cts  results  to  source  

insubject:   Restrict  ar*cles  in  Google  Groups  to  those  that  contain  the  terms  you  specify  

Intext:   The  query  intext:term  restricts  results  to  documents  containing  term  in  the  text.  

cache:   Display  Google’s  cache  of  a  page  

related:   The  query  related:URL  will  list  web  pages  that  are  similar  to  the  web  page  you  specify.  

Page 7: OSINT su siti web

OSINT  su  si*  web  –  Paolo  Dal  Checco  

Altri  Operatori  Operators   Descrip.on  

-­‐   Inverse  search  operator  (hide  results)  

~   synonyms    

[#]..[#]   Number  range  

*   Wildcard  to  put  something  between  something  when  searching  with  “quotes”  

+   Used  to  force  stop  words  

OR     Boolean  operator,  must  be  uppercase  

|   Same  as  OR  

Page 8: OSINT su siti web

OSINT  su  si*  web  –  Paolo  Dal  Checco  

BeAer  safe  than  sorry  

•  Può  essere  conveniente  rimanere  anonimi  –  TOR,  Torbrowser  (entrambi  possono  anonimizzare  anche  applicazioni)  

–  TAILS,  JonDonym,  VPS  private  –  Non  aprire  documen*  se  non  in  TAILS.  

•  Per  ricevere  sms:  servizi  di  receive-­‐sms-­‐online  (free/pay)  •  Per  ricevere  email:  email  temporanee  (mailinator.com,  

yopmail.com,  no  10minutemail)  oppure  webmail  dietro  TOR  (es.  safe-­‐mail.net,  mail15.com,  inbox.lv,  OpenMailBox.org)  

Page 9: OSINT su siti web

OSINT  su  si*  web  –  Paolo  Dal  Checco  

Chi  dicono  di  essere?  

•  Whois  •  Whois  storico  (DomainTools,  who.is)  •  Reverse  Whois  (YouGetSignal)  •  Altri  domini  con  estensione  diversa  (domize)  •  Relazioni  tra  domini  e  owner  (DomainTools)  oppure  –  google  "site:whois.domaintools.com  "dal  checco””  o  “registrant  "dal  checco””  

–  whoisology.com,  whoismind,  comnetcomber.com  •  Maltego  e  transform  

Page 10: OSINT su siti web

OSINT  su  si*  web  –  Paolo  Dal  Checco  

Domini  e  DNS  

•  Verificare  se  sul  dominio  ci  sono  domini  di  terzo  livello  (es  kp,  webmail,  etc...)  usando  tool  come  Knock.py  del  buon  Gianni  Amato,  SubRoute  o  DNSenum  

•  Verifico  server  MX  (ricordare  che  non  necessariamente  è  lo  stesso  del  dominio)  

•  Whois  degli  MX  

Page 11: OSINT su siti web

OSINT  su  si*  web  –  Paolo  Dal  Checco  

DomainTools  

•  Uno  dei  pochi  servizi  spesso  indispensabili  per  Open  Source  Intelligence  su  si*  web  

•  A  pagamento  (trial  per  7  giorni…)  •  Diversi  servizi  aqvi  da  anni  che  fanno  crawling  di  si*,  whois,  dns,  hos*ng,  MX,  etc…  

•  Archivio  storico  più  preciso  e  datato  (1997)  •  Who.is  con*ene  una  piccola  parte,  free  

Page 12: OSINT su siti web

OSINT  su  si*  web  –  Paolo  Dal  Checco  

DomainTools  

Page 13: OSINT su siti web

OSINT  su  si*  web  –  Paolo  Dal  Checco  

Domini  e  DNS  

Page 14: OSINT su siti web

OSINT  su  si*  web  –  Paolo  Dal  Checco  

Indirizzi  IP  

•  Verifico  se  aqvo  server  sulla  443  (ssl)  e  scarico  cer*ficato  

•  Trovo  IP  storici  e  verifico  se  sono  ancora  aqvi  weberver  sulla  80  e  sulla  443  –  Se  ci  sono,  visualizzo  e/o  scarico  sito  vecchio  

•  Verificare  su  spamhaus  se  l'IP  è  stato  coinvolto  in  aqvità  di  spam/frode  

•  Verificare  se  l'IP  ricavato  dal  dig  ha  un  reverse  dns  (dig  -­‐x  xxx.xxx.xxx.xxx)  

Page 15: OSINT su siti web

OSINT  su  si*  web  –  Paolo  Dal  Checco  

Indirizzi  IP  

Page 16: OSINT su siti web

OSINT  su  si*  web  –  Paolo  Dal  Checco  

Contenu*  

•  Cerco  testo  sul  sito  su  Google,  tra  virgolexe,  per  vedere  da  dove  è  copiato  o  dove  è  riprodoxo  (spesso  vengono  riciclate  frasi)  

•  Uso  si*  come  copyscape.com  o  siteliner.com  •  Se  vengono  cita*  nomi  di  aziende  o  marchi,  posso  cercare  su  marchi/breveq.  

•  Se  si  trova  P.IVA  verificare  su  agenzia  delle  entrate  (potrebbero  averla  copiata)  

Page 17: OSINT su siti web

OSINT  su  si*  web  –  Paolo  Dal  Checco  

Contenu*  Nascos*  

•  Scaricare  intero  sito  con  wget  (o  torify  wget)  •  wget  -­‐-­‐no-­‐check-­‐cer*ficate  -­‐e  robots=off  -­‐o  log.txt  -­‐w  7  -­‐-­‐random-­‐wait  -­‐vv  -­‐S  -­‐r  -­‐N  -­‐l  inf  -­‐-­‐no-­‐remove-­‐lis*ng  -­‐-­‐preserve-­‐permissions  -­‐np  -­‐E  -­‐k  -­‐K  -­‐p  -­‐-­‐user-­‐agent="Mozilla/5.0  (compa*ble;  bingbot/2.0;  +hxp://www.bing.com/bingbot.htm)"  hxp://www.website.com/subdir  

•  Scaricare  risulta*  di  ricerca  google  su  “site:”  (con  plugin  o  con  scraper)  e  scaricarli  con  wget  –i  list.txt  

•  Esamino  robots.txt,  spesso  con*ene  cose  interessan*…  

Page 18: OSINT su siti web

OSINT  su  si*  web  –  Paolo  Dal  Checco  

Contenu*  Rimossi  o  modifica*  

•  Web  Archive  (da*  rimossi)  •  RSS  (Feed2Mail,  ChangeDetec*on,  Versionista,  VisualPing)  

•  Google/Bing  Cache  •  Snapshots/DomainTools  

Page 19: OSINT su siti web

OSINT  su  si*  web  –  Paolo  Dal  Checco  

Carving  

•  “Carving”  su  un  sito  web?  :-­‐)  •  Cerco  email,  url  non  linkate  o  commen*  (grep  "<-­‐-­‐-­‐”)  che  contengano  informazioni  rilevan*  

•  Idea  :  Bulk  Extractor  su  copia  wget  per  estrarre  email,  domini,  url,  carte  di  credito,  numeri  di  telefono,  indirizzi  IP,  etc…  

Page 20: OSINT su siti web

OSINT  su  si*  web  –  Paolo  Dal  Checco  

The  Harvester  •  hxps://code.google.com/p/theharvester  •  Raccoglie  email,  soxodomini,  host,  nomi  degli  impiega*,  

porte  aperte,  banner  dei  servizi  tramite  differen*  fon*  pubbliche  come  motori  di  ricerca,  chiavi  PGP,  Shodan,  etc…  

Page 21: OSINT su siti web

OSINT  su  si*  web  –  Paolo  Dal  Checco  

Server  

•  Leggo  negli  header  HTTP  il  *po  di  server  (web-­‐sniffer.org)  

•  Provo  a  caricare  una  pagina  volutamente  errata,  spesso  nei  messaggi  di  errore  si  trovano  info  sul  path  locale  del  server  (con  username…)  

•  Shodan  

Page 22: OSINT su siti web

OSINT  su  si*  web  –  Paolo  Dal  Checco  

Link  

•  Verifico  link  in  entrata  e  uscita  (www.opensiteexplorer.org)  e  cerco  eventuali  relazioni  

•  Xenu  Link  Sleuth  (anche  anchor,  date,  *tle,  etc..  Comprese  le  immagini)  

•  Seo  Powersuite  Link  Analysis  

Page 23: OSINT su siti web

OSINT  su  si*  web  –  Paolo  Dal  Checco  

Datazione  

•  Data  res*tuita  dall’header  HTTP  •  Eventuali  date  presen*  nella  pagina  (commen*,  data  dei  post,  etc…)  

•  Web  Archive  (axenzione  a  robots.txt)  •  Snapshots/DomainTools  •  Date  nell’header  HTTP  res*tuito  dalle  immagini  •  Metada*  nelle  immagini  

Page 24: OSINT su siti web

OSINT  su  si*  web  –  Paolo  Dal  Checco  

Social  Network  

•  Cerco  se  esiste  pagina  su  facebook  o  profilo  linkedin  che  cita  il  sito  – site:www.facebook.com  www.difob.it  -­‐inurl:DiFoB  

– site:www.facebook.com  difob    

Page 25: OSINT su siti web

OSINT  su  si*  web  –  Paolo  Dal  Checco  

Analy*cs/Adsense    •  Cerco  tag  di  Google  Analy*cs/AdSense  e  lo  u*lizzo  per  cercare  altri  si*  monitora*  dallo  stesso  utente  (spyonweb.com,  sameid.net,  ewhois.com,  reverseinternet.com)  

•  Cerco  altri  tag  come  histats  &  Co.  anche  se  più  difficili  da  correlare  

Page 26: OSINT su siti web

OSINT  su  si*  web  –  Paolo  Dal  Checco  

Metada*  

•  Foca  (ora  free:  elevenpaths.com/labstools/foca)  •  Metagoofil  per  scaricare  pdf,  doc,  xls,  ppt,  etc...  e  anche  MAC  Address  dalle  pagine  di  un  sito  

•  EXIF  delle  foto  •  Se  presen*  sul  sito,  verifico  contenuto  delle  chiavi  PGP  (gpg  -­‐-­‐with-­‐fingerprint  key.asc)  

•  Indirizzi  Skype?  Skype  Resolver.  

Page 27: OSINT su siti web

OSINT  su  si*  web  –  Paolo  Dal  Checco  

Skype  Resolver  •  Se  conosciamo  l’ID  skype  di  una  persona…  possiamo  risalire  all’IP  (anche  due  IP)!  –  hxp://resolveme.org/  –  hxp://iskyperesolve.com/  

•  Talvolta  vale  anche  l’inverso,  da  IP  a  Skype  •  Disponibile  anche  versione  offline  (Skype  Deobfuscated  con  log)  ma  axenzione  al  ban  

•  Funziona  solo  se  l’utente  non  flaggato  l’enforcement  di  privacy  sull’IP  nella  

Page 28: OSINT su siti web

OSINT  su  si*  web  –  Paolo  Dal  Checco  

Page 29: OSINT su siti web

OSINT  su  si*  web  –  Paolo  Dal  Checco  

Immagini  

•  Cerco  le  immagini  presen*  sul  sito  su  Google  Images  (comodo  con  Chrome,  tasto  destro  o  ‘s’+right  key)  o  TinEye  

•  Verifico  il  nome  file  delle  immagini  (nella  URL)  ed  eventuali  tag  ALT/TITLE  e  verifico  se  usa*  altrove  

•  Con  exikool  o  simili  verifico  da*  EXIF  (es.  autore,  GPS  loca*on,  seriale  fotocamera)  e  cerco  altrove  

•  Se  le  trovate  su  FB,  dovreste  poter  risalire  al  profilo  

Page 30: OSINT su siti web

OSINT  su  si*  web  –  Paolo  Dal  Checco  

Dalle  foto  FB  al  profilo  

Page 31: OSINT su siti web

OSINT  su  si*  web  –  Paolo  Dal  Checco  

Dalle  foto  FB  al  profilo  •  Fino  al  2013  

•  Oggi:  hxps://github.com/guelfoweb/�id  

Page 32: OSINT su siti web

OSINT  su  si*  web  –  Paolo  Dal  Checco  

Dalle  foto  FB  al  profilo  

Page 33: OSINT su siti web

OSINT  su  si*  web  –  Paolo  Dal  Checco  

CMS  Wordpress  

•  Plugin  installa*  (hxp://whatwpthemeisthat.com/)  •  Template  installato  (wpthemedetector.com)  

–  /wp-­‐content/themes/kallyas/screenshot.png  –  /wp-­‐content/themes/kallyas/style.css  

•  Esamino  i  da*  del  template  (autore,  nome,  etc…  che  posso  cercare  su  web)  

•  Verifico  se  è  stato  usato  su  altri  si*  o  social  (namechk.com,  knowem.com)  

•  Verifico  i  vecchi  template  con  Web  Archive  

Page 34: OSINT su siti web

OSINT  su  si*  web  –  Paolo  Dal  Checco  

Bitcoin  

•  Se  sono  indica*  bitcoin  address  li  cerco  su  google  o  seguo  la  blockchain  e  poi  cerco  su  Google  gli  indirizzi  da  cui  arrivano  i  soldi  o  cui  vengono  trasferi*  (es.  per  torrentlocker  si  ricava  un  mixing  service  usato  anche  per  altre  truffe)  

•  E’  anche  possibile  usare  espressione  regolare  da  aggiungere  a  Bulk  Extractor.  

Page 35: OSINT su siti web

OSINT  su  si*  web  –  Paolo  Dal  Checco  

Email  •  Verifica  di  esistenza  di  indirizzi  email:  – SMTP  (telnet  su  25,  EHLO,  MAIL  FROM,  RCPT  TO,  DATA)  

– Se  risponde  “250  Ok”  il  des*natario  esiste.  Esiste  davvero?  J  

– Verify-­‐email.org  

Page 36: OSINT su siti web

OSINT  su  si*  web  –  Paolo  Dal  Checco  

Tracciare  il  miAente  di  una  email  •  Cerco  l’ul*mo  “Received  From…  by…”  nell’header  RFC  822  –  Received:  from  (93.33.240.153)  by  webmailv*n.alice.it;  Wed,  28  May  2014  19:44:26  +0200  

•  Dall’IP  si  può  risalire  alla  rete  e  spesso  geolocalizzarla  •  Axenzione  che  gli  spammer  spesso  aggiungono  dei  campi  per  ingannare  

•  Cercare  eventuali  field  “X-­‐Sender”,  “X-­‐Sender-­‐IP”  •  Gmail  e  diverse  webmail  non  inserisce  l’IP  del  mixente  né  nei  “received  from”  né  negli  X-­‐Header  

•  Altri  provider  sì  

Page 37: OSINT su siti web

OSINT  su  si*  web  –  Paolo  Dal  Checco  

Email  

•  Facebook  (se  non  compare,  almeno  provo  a  vedere  se  è  stato  registrato  profilo  con  quell'account)  

•  Rappor*ve  •  Cerco  su  domaintools  domini  registra*  axualmente  o  in  passato  a  quell'indirizzo  (uso  trucco  di  site:domaintools.com  username  oppure  “registrant  username”  o  whoismind.com,  netcomber.com)  

Page 38: OSINT su siti web

OSINT  su  si*  web  –  Paolo  Dal  Checco  

Page 39: OSINT su siti web

OSINT  su  si*  web  –  Paolo  Dal  Checco  

Email  

•  Recupero  password  •  Verifico  se  lo  user  è  stato  usato  su  altri  si*  o  social  (namechk.com,  knowem.com)  

•  Maltego  e  transform  •  Se  trovate  account  twixer,  usate  Maltego  o  Creepy  per  geoloca*on  

•  Provo  con  si*  che  indicano  i  profili  su  web/social  come  lullar.com  

•  Ricerche  avanzate  su  FB  

Page 40: OSINT su siti web

OSINT  su  si*  web  –  Paolo  Dal  Checco  

Grazie!  

[email protected]/[email protected]  Paolo  dal  Checco