5' Incontro ISKO Italia Venezia : 1 aprile 2011 Maria Taverniti Erika Pasceri 1 URT – Sistemi di...

Post on 02-May-2015

216 views 2 download

Transcript of 5' Incontro ISKO Italia Venezia : 1 aprile 2011 Maria Taverniti Erika Pasceri 1 URT – Sistemi di...

5' Incontro ISKO ItaliaVenezia : 1 aprile 2011

Maria Taverniti

Erika Pasceri

1

URT – Sistemi di indicizzazione e classificazione

Attività di Progetto Laboratorio di

documentazione

• Gestione della conoscenza, di informazione e documenti– Definizione di metodologie e costruzione di sistemi di organizzazione e

di accesso alla conoscenza/informazione• Basi di conoscenza, Thesauri, Sistemi di indicizzazione e di

classificazione automatica, …

Presentazione L@bdocLaboratorio di documentazione

(1996) e Centro di Eccellenza in

Gestione della Conoscenza(2002)

URT (Unità di Ricerca presso Terzi) del CNR – Sistemi di

indicizzazione e classificazione(2007)

2

ProgettiFSE

Fascicolo Sanitario Elettronico

Thesaurus efficienza energetica e applicazione fonti rinnovabili agli usi finali civili

Standard per la

formalizzazione della

conoscenza

L’informatizzazione degli

uffici giudiziari: il fascicolo del PM

CL.Au.D.IoCLassificazione

Automatica DI dOcumenti

15248

Realizzazione di un prototipo software, con strumenti open source, per la classificazione automatica di documenti all’interno di un sistema di Document Management

Sistema di protocollo informatico

Integrazione nei prodotti presenti nelle PA

Rassegna stampa Barilla Group

CL.Au.D.Io (2008)

Obiettivo Soluzione

4

Thesaurus efficienza energetica

(2010) Obiettivi Metodologia

5

Obiettivi◦ Prevalenza di conoscenza tacita◦ Scarsa formalizzazione del

know-how◦ Pochi esperti di dominio

Progetti◦ Laboratorio Sperimentale di

artigianato e Design (L.R. 15 Marzo 2002 n.15) Artigianato Orafo

◦ Sviluppo dei saperi artigiani tradizionali e integrazione dei sistemi produttivi in Marocco e in Italia Artigianato tessile

Formalizzazione della conoscenza

(2007)

6

L’informatizzazione degli uffici giudiziari:

Fascicolo del PM(2009)

CNR

7

Avvio del Progetto•Finanziamento all’interno del “Programma Calabria per il Potenziamento delle misure di Sicurezza”;

Soggetti coinvolti e motivazioni•Procura della Repubblica con elevato carico di lavoro; •Organico non proporzionato al carico;•Situazione logistica non ottimale:

•Elevati volumi documentali e informativi;•Elevato numero di attori/produttori della documentazione e scarsastandardizzazione

Partner IndustrialeGruppo Abramo Soluzione

Avvio (Convenzione del 08/05/2009)

• Task A7.3– Definizione di modelli

ontologici e vocabolari a supporto del FSE

• Deliverable D9– Versione italiana di un

linguaggio medico interoperabile e di una tassonomia di classificazione

FSE

8

Continuazione (Convenzione del 17/12/2010)

• WP 3 - Realizzazione network interregionale per l’interoperabilità delle soluzioni territoriali di FSE

• Attività 3.3 - Definizione delle specifiche, progettazione e sviluppo di metodologie e componenti software per la codifica univoca degli assistiti

Linguaggio medico/thesaurus italiano di refertazione

5' Incontro ISKO Italia, Venezia, 1 aprile 2011

9

Knowledge Organization biomedica e standard di rappresentazione

Piano e-government 2012 Piano e-government 2012 Ministero per la Pubblica amministrazione e l’innovazione: Ministero per la Pubblica amministrazione e l’innovazione:

Consiglio Nazionale delle Ricerche

Progetto “Infrastruttura tecnologica del Fascicolo Sanitario Elettronico”

Il Fascicolo Sanitario Elettronico

• Semplificare e digitalizzare i servizi elementari (prescrizioni, certificati di malattia digitali, sistemi di prenotazione online)

• Creare le infrastrutture per un’erogazione di servizi sanitari vicini alle esigenze dei cittadini (fascicolo sanitario elettronico e innovazione delle aziende sanitarie)

10

Il nostro obiettivo

1. Linguaggio

medico/thesaurus italiano

di refertazione

2. Codifica italiana standardizzata

deirisultati degli

esamidi laboratorio

Definizione di modelli ontologici e vocabolari a supporto del Fascicolo

Sanitario Elettronico

11

1.Linguaggio medico/thesaurus italiano di refertazione

12

Regole Tecniche

ICD-9 CM(International Classification

of Diseases 9th Revision - Clinical Modification)

LOINC(Logical Observation Identifiers

Names and Codes)

Diagnosi

Esami dilaboratorio

13

Perché aggiornare ICD9-CM2007:Un campione di test

Tab.1: * Corrispondenze ottenute mediante verifica automatica e manuale

Sovrapposizioni AOBO / ICD9-CM  Numero

Sovrapposizioni% Lessico contenuta in ICD9

AOBO (Codificato)

5054 90,54% *

AOBO (Libere) 278 0,92%**

** Corrispondenze ottenute mediante verifica automatica

Totale termini ICD9-CM : 16037

Totale termini AOBO (codificati) : 5486

Totale termini AOBO (liberi): 30379

14

Sovrapposizioni AOCS / ICD9-CM  Numero

Sovrapposizioni% Lessico contenuta in ICD9

AOCS(Libere)

64 5,91%

Perché aggiornare ICD9-CM2007: un secondo campione di test

Tab.2: Corrispondenze ottenute mediante verifica manuale

Totale termini AOCS: 1082

Totale termini MMG: 3420

Tab.3: Corrispondenze ottenute mediante verifica automatica

Sovrapposizioni MMG CS / ICD9-CM  Numero

Sovrapposizioni% Lessico contenuta in ICD9

MMG* 108 3,15%

* Campione estratto dai database di Medici di Medicina Generale 15

Gli esempi: Termini non presenti in ICD9-CM2007

* Ipoema e Ifema sono sinonimi, manca la gestione delle variabili

** Obesità, manca termine singolo

16

Obiettivo : Creazione di un Lessico/Thesaurus di destinazione

convenzionalmente definito ‘ICD9-CM Plus’

ICD9-CM

L 1

.

.

.L10

+ =ICD9-CM Plus

Verso ICD9-CM Plus

17

Lo Strumento

V.I.L.M.A.

Vocabolari Italiani Lessici di Medicina e sAnità

18

VM: il termine del corpus viene relazionato al termine di ICD9-CM Plus come variante morfologica, ma non inserito;

UF: il termine del corpus viene inserito come sinonimo o quasi sinonimo del termine di ICD9-CM Plus;

BT: il termine del corpus viene inserito come termine sovraordinato del termine ICD9-CM Plus;

NT: il termine del corpus viene inserito come termine subordinato del termine di ICD9-CM Plus;

RT: il termine del corpus viene inserito come termine correlato al termine di ICD9-CM Plus (vedi anche…);

Inserisci in ICD9-CM Plus: inserisce il termine del corpus come termine principale all’interno di ICD9-CM Plus senza relazionarlo.

Definizione delle relazioni

19

Per inclusione: seleziona tutti i termini del ICD9-CM Plus che contengono la parola, in qualunque posizione;

Per prefisso: contiene l’elenco di tutti i prefissi medico-sanitari e cerca, all’interno del ICD9-CM Plus, tutti i termini che iniziano per il prefisso selezionato. (Es. iper-, ipo-, ecc.);

Per suffisso: contiene l’elenco di tutti i suffissi medico-sanitari e cerca, all’interno del ICD9-CM Plus, tutti i termini che terminano per il suffisso selezionato. (Es. –ite, -osi, ecc.).

La ricerca dei termini

Permette di filtrare i termini in ICD9-CM Plus da confrontare:

20

ICD9-CM2007 Plus

Sovrapposizioni AOBO / ICD9-CM Plus  Numero

Sovrapposizioni% Lessico contenuta in ICD9 Plus

AOBO (Codificato)

5918 93,46%* (90,54%)

AOBO (Libere)

863 2,84%** (0,92%)

•Totale termini di ICD9-CM Plus : 60241

•Totale termini AOBO (codificati) : 5486

•Totale termini AOBO (liberi): 30379

Tab.4: * Corrispondenze ottenute mediante verifica automatica e manuale

** Corrispondenze ottenute mediante verifica automatica

21

Tab.5: Corrispondenze ottenute mediante verifica automatica

Sovrapposizioni MMG CS / ICD9-CM Plus

NumeroSovrapposizioni

% Lessico contenuta in ICD9 Plus

MMG* 518 15,14% (5,91%)

* Campione estratto dai database di Medici di Medicina Generale

Sovrapposizioni AOCS / ICD9-CM Plus  Numero

Sovrapposizioni% Lessico contenuta in ICD9

AOCS(Libere)

342 31,61% (3,15%)

Tab.6: Corrispondenze ottenute mediante verifica manuale

•Totale termini AOCS: 1082•Totale termini MMG: 3420

ICD9-CM2007 Plus

22

I MMG usano un linguaggio italiano nativo totalmente disallineato rispetto alla codifica ICD9-CM;

La traduzione italiana di ICD9-CM non è allineata al lessico di dominio corrente;

La codifica è, di fatto, una forzatura;

ICD9 – CM:

Possibili soluzioni:1. Revisione e contestualizzazione della traduzione;

2. Obbligatoria gestione delle relazioni.

23

2. Codifica italiana standardizzata dei risultati degli esami di laboratorio

Indianapolis, IN

24

«The purpose of LOINC® is to facilitate the exchange and pooling of clinical results for clinical care, outcomes management, and research by providing a set of universal codes and names to identify laboratory and other clinical observations»

[Fonte: <http://loinc.org/>]

LOINC

25

LOINC - URT

26

www.labdoc.it

LOINC: ?•Facilita lo scambio e la condivisione dei dati clinici provenienti dai laboratori fra i diversi operatori del settore biomedico;

• La banca dati LOINC fornisce un insieme di nomi universali e codici ID per l’identificazione dei risultati di test clinici e di laboratorio

• Ogni record del database LOINC è identificato da un codice numerico e da un formal name, costituito da 6 parti:

1. Component2. Property3. Time aspect4. System5. Scale type6. Method type

27

LOINC: La traduzione

28

LOINC: La traduzione (2)

29

LOINC ITALIAN TOOL

30

Loinc Italian Tool: Il nostro obiettivo • Realizzazione di un ambiente software

condiviso per la mappatura delle analisi

effettuate da ogni laboratorio italiano verso il

rispettivo nomenclatore tariffario

regionale e verso lo standard LOINCCreare un modello

di riferimento per

gli operatori del

settore

esportabile anche nelle altre regioni italiane

31

Il problema della mappatura I laboratori italiani codificano le analisi svolte autonomamente,

identificandole con un codice ad uso interno e associandole ai

codici del nomenclatore/tariffario regionale di afferenza.

Ad un singolo codice regionale possono corrispondere

più analisi del laboratorio (1:N)

La singola analisi comprende più voci del tariffario (N:1)

N:N ad ogni codice regionale possono corrispondere più codici interni e viceversa

ASSOCIAZIONE TARIFFARIO

32

Il problema della mappatura LOINC

Ogni laboratorio mappa secondo le proprie esigenze senza

tener conto dei criteri utilizzati dagli altri.

Questo porta ad una forte eterogeneità della codifica

italiana.

Se la stessa analisi fatta daLaboratorio diversi viene mappata rispetto a codici

LOINC differenti

(N:N) -> Errato

ASSOCIAZIONE LOINC

Ad un singolo codice interno del generico laboratoriopossono corrispondere più codici LOINC [(1:N) localmente]

Se la stessa analisi fatta daLaboratorio diversi viene mappata rispetto a codici

LOINC uguali

(1:N) -> Esatto

33

L’interfaccia

LOGIN Laboratoristi

CNR

Comitato scientifico

34

L’interfaccia : Gestione delle analisi Navigare all’interno del proprio catalogo analisi Caricare nuove analisi

35

Dove si ricerca il codice LOINC?

LOINC

LOINC ENG LOINC ITA CUMUL Altre assoc.

V. 2.30 V. 0.1 Parte italiana Di tutti i laboratori

36

L’interfaccia: Mappatura verso un codice LOINC Creare associazioni (N codici LOINC : N analisi di laboratorio) con il

LOINC, visualizzando: Le mappature fatte dagli altri utenti verso un generico codice

LOINC I dettagli di ogni termine LOINC

in inglese in italiano (se presente) nella traduzione cumul (se presente)

Elenco analisi del laboratorio X

Codici LOINC

Dettagli LOINC

37

URT (CS) – Molinette (TO)

Azienda Ospedaliera Universitaria Molinette,Torino

(dott.ssa Claudia Bessone)

Obiettivo:

Consentire la condivisione e lo scambio di informazioni tra istituzioni ed

organizzazioni che cooperano alla realizzazione di una codifica italiana

standardizzata degli esami di laboratorio basata su LOINC.

38

Grazie per l’attenzione!

www.labdoc.it

erika.pasceri@unical.itmaria.taverniti@unical.it

5' Incontro ISKO Italia, Venezia, 1 aprile 2011

URT – Sistemi di indicizzazione e classificazione