La rappresentazione delle informazioni

Post on 14-Jan-2017

114 views 0 download

Transcript of La rappresentazione delle informazioni

Insegnamento di Informatica – a.a. 2016-17

La rappresentazione delle informazioni

INSEGNAMENTO DI INFORMATICA – A.A. 2016-17

Francesco Ciclosi

Macerata, AA. 2016-2017

Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati

© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code

Insegnamento di Informatica – a.a. 2016-17

La comunicazione tra uomo e macchina

Affinché gli esseri umani possano interagire con

gli elaboratori è necessario operare una traduzione

tra i differenti linguaggi utilizzati da entrambi

Gli elaboratori utilizzano un codice semplice e

disambiguo (il linguaggio binario)

Gli esseri umani utilizzano un codice complesso e

ambiguo

Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati

© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code

Insegnamento di Informatica – a.a. 2016-17

Avviene una conversione delle informazioni

scambiate con l’elaboratore

In tale processo si utilizzano le tabelle dei codici

La comunicazione uomo-macchina

può avvenire con successo se e solo se

Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati

© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code

Insegnamento di Informatica – a.a. 2016-17

La rappresentazione delle informazioni

Le informazioni possono essere codificate come

pattern di bit

Esistono metodologie differenti per codificare:

• Testo

• Numeri

• Immagini

• Suono

Insegnamento di Informatica – a.a. 2016-17

Rappresentazione del testo

Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati

© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code

Insegnamento di Informatica – a.a. 2016-17

Il carattere

È un’unità minima di informazione

Corrisponde a un grafema, o a un simbolo, della

forma scritta di una lingua naturale

Esempi di carattere sono:

• lettere

• numeri

• segni di interpunzione

• caratteri di controllo (es: carriage return, line feed)

Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati

© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code

Insegnamento di Informatica – a.a. 2016-17

Rappresentazione del testo

Le informazioni testuali sono rappresentate

tramite un codice che assegna a ogni carattere un

pattern univoco di bit

Esistono vari codici di questo tipo e non tutti i

dispositivi li sanno interpretare

Per risolvere i problemi di standardizzazione

l’ANSI ha adottato il codice ASCII

Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati

© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code

Insegnamento di Informatica – a.a. 2016-17

ASCII

ASCII (American Standard Code for Information

Interchange) è un codice per la codifica dei caratteri

Lo standard è stato pubblicato da ANSI nel 1968

Il sistema originario US-ASCII codificava i caratteri

a 7 bit e è ora standard ISO (ISO/IEC 646)

Nei PC si usa la versione extended ASCII che

utilizza 8 bit per la codifica

Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati

© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code

Insegnamento di Informatica – a.a. 2016-17

La codifica US-ASCII

Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati

© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code

Insegnamento di Informatica – a.a. 2016-17

ASCII esteso Utilizza l’ottavo bit di ogni byte per rappresentare

altri 128 caratteri aggiuntivi

Ciò ha prodotto notevoli problemi di compatibilità

dovuti anche all’utilizzo di estensioni proprietarie

ISO ha rilasciato uno standard (ISO 8859)

contenente un’estensione a 8 bit del set ASCII

• ISO 8859-1 (Latin1): caratteri lingue Europa Occidentale

• ISO 8859-2: caratteri linguaggi Europa Orientale

• ISO 8859-5: caratteri cirillici

Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati

© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code

Insegnamento di Informatica – a.a. 2016-17

La codifica Latin1

Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati

© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code

Insegnamento di Informatica – a.a. 2016-17

Un esempio di codifica ASCII

B U O N

0100 0010 0101 0101 0100 1111 0100 1110

G I O R N O

0100 0111 0100 1001 0100 1111 0101 0010 0100 1110 0100 1111

Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati

© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code

Insegnamento di Informatica – a.a. 2016-17

Criticità di ASCII

Anche nella versione estesa è troppo ridotto per

ospitare gli alfabeti di alcune lingue

• Come a esempio quelle asiatiche

Poiché un documento può utilizzare un solo

standard, nello stesso documento non sono

supportate lingue appartenenti a gruppi

linguistici differenti

Per ovviare a tali criticità nasce UNICODE

Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati

© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code

Insegnamento di Informatica – a.a. 2016-17

Lo standard Unicode

Assegna un numero univoco ad ogni carattere usato

per la scrittura di testi, in maniera indipendente

• dalla lingua

• dalla piattaforma informatica

• dal programma utilizzato

È compilato e aggiornato dall’Unicode Consortium che

opera per garantire l’interoperabilità nel trattamento

informatico di testi in lingue diverse

Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati

© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code

Insegnamento di Informatica – a.a. 2016-17

Unicode + UTF-8

Se il set di caratteri Unicode è combinato con lo

standard Unicode Transformation Format 8-bit

(UTF-8):

• I caratteri ASCII originali sono rappresentati con 8 bit

• I caratteri di altre lingue (come cinese, giapponese e

ebraico) sono rappresentati con 16 bit

• Sono disponibili pattern a 24 e 32 bit per rappresentare

altri simboli insoliti e per future espansioni

Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati

© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code

Insegnamento di Informatica – a.a. 2016-17

Differenza tra file di testo Un file di testo è un file composto da una lunga

sequenza di simboli codificati in ASCII o Unicode

Esistono file di testo semplici

• Manipolati da editor di testo (come Blocco Note)

• Che contengono solo una codifica carattere per carattere

Esistono file di testo più elaborati

• Manipolati dai word processor (come Microsoft Word)

• Contengono oltre alla codifica carattere per carattere,

molti codici proprietari rappresentanti la formattazione

Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati

© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code

Insegnamento di Informatica – a.a. 2016-17

Esempio di differenze tra file di testo

Insegnamento di Informatica – a.a. 2016-17

Rappresentazione dei valori numerici

Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati

© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code

Insegnamento di Informatica – a.a. 2016-17

Alcune problematiche di rappresentazione

Se i dati da registrare sono solo numerici,

rappresentarli come caratteri non è efficiente

• Utilizzando un byte per simbolo, la rappresentazione di

un numero in ASCII richiede sempre un byte

In tal caso utilizzeremo la notazione binaria

• ASCII: 1 byte 10 numeri | 2 byte 100 numeri

• Binario: 1 byte 256 numeri | 2 byte 65536 numeri

Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati

© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code

Insegnamento di Informatica – a.a. 2016-17

La notazione binaria

Nella notazione binaria i numeri sono

rappresentati utilizzando solo le cifre: 0, 1

Nella notazione decimale i numeri sono

rappresentati utilizzando le cifre: 0, 1, 2, 3, 4, 5,

6, 7, 8, 9

Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati

© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code

Insegnamento di Informatica – a.a. 2016-17

1

0

1

0

1

0

0

1

1

0

1

0

0

1

1

0

1

0

1

1

1

1

0

0

0 1 0

1

1

1 10

9

8

7

6

5

4

3

2

1

0

Nu

meri

decim

ali

Nu

meri

bin

ari

Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati

© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code

Insegnamento di Informatica – a.a. 2016-17

Tecniche di memorizzazione numerica

I numeri interi sono memorizzati utilizzando il

sistema della notazione in complemento a due

• Consente di rappresentare sia i numeri negativi che

quelli positivi

I numeri che presentano una parte frazionaria

sono memorizzati utilizzando la notazione in

virgola mobile

Insegnamento di Informatica – a.a. 2016-17

La rappresentazione delle immagini

Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati

© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code

Insegnamento di Informatica – a.a. 2016-17

L’immagine come insieme di puntini

L’immagine può essere descritta come una

collezione di punti

Ogni punto è detto pixel (picture element)

Una collezione di pixel codificati viene

denominata bitmap (mappa di bit)

Stampanti e monitor operano con il concetto di

pixel

Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati

© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code

Insegnamento di Informatica – a.a. 2016-17

La codifica di un pixel

Per rappresentare un pixel serve un numero di

bit variabile con la quantità di informazione

presente

• Immagine in b/n (fax) 1 bit

• Immagine a toni di grigio (255) 1 byte

• Immagine a colori in true color (circa 16 milioni di

colori) 3 byte

Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati

© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code

Insegnamento di Informatica – a.a. 2016-17

La codifica di un’immagine a colori

Ci sono due differenti approcci per codificare ciascun

pixel:

• RGB

o Ogni pixel è rappresentato come combinazione di 3 colori

(rosso, verde, blu)

o Per rappresentare ogni colore si utilizza un byte

• Luminosità + colore

o La luminosità (o luminanza) è la quantità di luce bianca nel pixel

o La crominanza blu/rossa è, rispettivamente, la differenza tra la

luminanza e la quantità di luce blu/rossa

Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati

© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code

Insegnamento di Informatica – a.a. 2016-17

Problematiche delle bitmap

L’immagine non è

ingrandibile se non

aumentando la

dimensione dei singoli

pixel che la

compongono

Il risultato ottenuto è

un’immagine sgranata

Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati

© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code

Insegnamento di Informatica – a.a. 2016-17

La rappresentazione vettoriale

Consiste nel descrivere l’immagine come

insieme di strutture geometriche codificabili

utilizzando tecniche di geometria analitica

Il dispositivo che visualizzerà l’immagine potrà

scegliere come rappresentare le strutture

geometriche

• Non sarà quindi richiesta la riproduzione di un

pattern di pixel particolare

Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati

© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code

Insegnamento di Informatica – a.a. 2016-17

I font bitmap Sono un particolare tipo di font che prevede la

memorizzazione dei caratteri come matrice di punti

Utilizzano le mappe di bit

Occupano una grossa porzione di memoria

Sono usati nelle stampanti

Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati

© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code

Insegnamento di Informatica – a.a. 2016-17

I font scalabili Sono memorizzati come

una serie di formule che

descrivono la struttura dei

caratteri

Sono ridimensionabili

Occupano poco spazio in

memoria

In sede di stampa sono

convertiti in mappa di bit

(rasterizzazione)

Insegnamento di Informatica – a.a. 2016-17

La rappresentazione dei suoni

Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati

© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code

Insegnamento di Informatica – a.a. 2016-17

Segnale analogico

È molto sensibile alle

interferenze

Può assumere infiniti

stati

Presenta di fatto una

minore risoluzione

∞ stati possibili

Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati

© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code

Insegnamento di Informatica – a.a. 2016-17

Segnale digitale

Poco sensibile alle interferenze

Può assumere due soli stati: 0 e 1

Presenta una maggiore risoluzione

2 soli stati

possibili

Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati

© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code

Insegnamento di Informatica – a.a. 2016-17

Digitale vs analogico: interferenze I segnali digitali sono più resistenti alle

interferenze di quelli analogici

• È più semplice riconoscere tra due soli stati anche in

base al «principio di prossimità»

Segnale digitale «pulito»

Segnale analogico «pulito»

Segnale digitale con interferenze

Segnale analogico con interferenze

Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati

© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code

Insegnamento di Informatica – a.a. 2016-17

Segnale continuo

È una grandezza fisica variabile nel tempo in

modo continuo

Non è funzione di una variabile discreta

Il valore della grandezza può essere misurato in

qualsiasi istante

Può essere studiato sia nel dominio del tempo

che in quello della frequenza

Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati

© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code

Insegnamento di Informatica – a.a. 2016-17

Segnale discreto: definizione

È una successione di valori di una grandezza in

corrispondenza di una serie di valori discreti nel

tempo

È una funzione con valori forniti in

corrispondenza a una serie di tempi scelti nel

dominio dei numeri interi

Ciascun valore della successione è chiamato

campionamento

Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati

© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code

Insegnamento di Informatica – a.a. 2016-17

Segnale discreto: campionamento

Non è in funzione di una variabile continua

ma è ottenuto campionando un valore continuo

Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati

© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code

Insegnamento di Informatica – a.a. 2016-17

«Risoluzione» di un segnale

A parità di durata, la quantità di informazione

trasportata da un segnale continuo è maggiore

rispetto a quella trasportata da un segnale discreto

Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati

© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code

Insegnamento di Informatica – a.a. 2016-17

Segnale digitale

Un segnale digitale è un segnale discreto che può

assumere soltanto valori appartenenti ad un

insieme discreto

È ottenuto campionando un segnale analogico

(continuo)

Ha una determinata frequenza di campionamento

• Durata dell’intervallo temporale uniforme in

corrispondenza del quale si misurano i valori della

serie

Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati

© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code

Insegnamento di Informatica – a.a. 2016-17

La codifica classica delle informazioni audio

Per codificare delle informazioni audio si

procede:

1. campionamento dell’ampiezza dell’onda sonora a

intervalli regolari

2. Registrazione delle serie di valori numerici ottenuti

Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati

© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code

Insegnamento di Informatica – a.a. 2016-17

Alcuni esempi

Conversazione telefonica

• 8000 campioni al secondo

• Si effettua una codifica ogni otto millesimi di secondo

CD audio

• 44100 campioni al secondo

• I dati sono ottenuti sono rappresentati con 16 o 32 bit

(stereo)

• Ogni secondo di musica richiede più di un milione di bit

Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati

© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code

Insegnamento di Informatica – a.a. 2016-17

MIDI: un’altra forma di codifica audio

Il MIDI (Musical Instrument Digital Interface) è un

sistema di codifica più economico

Non prevede la codifica del suono

Prevede la codifica delle istruzioni necessarie per

produrre la musica su di un sintetizzatore

La qualità dell’esecuzione del brano dipende dal

sintetizzatore utilizzato per la riproduzione

Il numero di bit necessario per la codifica è ridotto

Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati

© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code

Insegnamento di Informatica – a.a. 2016-17

I miei contatti

linkedin

http://it.linkedin.com/pub/francesco-ciclosi/62/680/a06/

facebook

https://www.facebook.com/francesco.ciclosi

twitter

@francyciclosi

www

http://docenti.unimc.it/f.ciclosi

http://www.francescociclosi.it