Stefano Penge - Open labor, opendata for visible and trasparent European job market

OpenData for visible and transparent European job market

L'interesse di OpenLabor

● Sperimentazione di un modello globale di relazione tra PA, cittadini e imprese

● Livello europeo● Aspetti linguistici e multilinguistici● Utilizzo metadati per migliorare efficienza● Partecipazione degli utenti al miglioramento

Come nasce OpenLabor?● OpenLabor (opendata + labor) vuole rendere visibili e accessibili i dati

delle offerte di lavoro, sia provenienti dagli enti pubblici che dai soggetti privati, moltiplicandone il valore attraverso i tipici meccanismi dei social networks.

● Nasce all'interno di due progetti europei CIP PSP/ICT: – CitySDK http://www.citysdk.eu/

– Commons4EU http://commonsforeurope.net/

di cui Lynx è partner insieme a Provincia di Roma, Amsterdam, Barcellona, Helsinki, Manchester, Istanbul e altri

● L'app per Android è scaricabile da Google Play

http://www.citysdk.eu/

http://commonsforeurope.net/

Cosa fa?OpenLabor è una piattaforma opensource che: ● preleva i dati aperti sulle offerte di lavoro della Provincia di Roma● preleva i dati aperti sulle occasioni di formazione professionale

pubblica e privata● li rende ricercabili attraverso l'uso della tassonomia ISTAT CP2011

e della rete semantica MultiWordnet● Li filtra sulla base del profilo degli utenti e li segnala in modo “push”

attraverso una app per Android● li offre attraverso API RESTful a sviluppatori o imprese● fornisce alla PA statistiche e report in tempo reale su offerta,

domanda e corrispondenza tra le due

Qual è il problema?

● Lingua: il lessico delle offerte di lavoro è complesso:

– “parrucchiere, acconciatore, barbiere, estetista, tosatore”● Standard: sulle professioni non ne esiste uno Europeo e anche

in Italia ce ne sono due (ISFOL e ISTAT).

● Motivazione: l'utente non sa esattamente cosa cercare e se non ottiene un match esatto si demotiva

● Coerenza: le offerte di lavoro non sono codificate allo stesso modo delle opportunità formative perché il processo di inserimento non è controllato

Open Data:Jobs

PublicWeb App

Indexing, refining

Open Data:Companies

Mobile App

API

User profilingsearch, matching

Editing, updating

ReservedWeb App

Localauthorities

Developers

Final users

Companies

Open Data:Training

DB

DB

Lo schema generale del progetto:

ISTATCP2011

Wordnet

Users' Curricula

Open Data:Jobs

PublicWeb App

Indexing

Open Data:Companies

Mobile App

API

User profilingsearch, matching

Editing, updating

ReservedWeb App

Localauthorities

Developers

Final users

Companies

Open Data:Training DB

DB

La sezione linguistica

ISTATCP2011

Wordnet

ISTATCP2011:

professioni e compiti

WordNet

Bag of features

Classifier

Indexing

I prossimi passi 1

● A regime, la novità e la forza del sistema sta nella triangolazione tra profilo dell'utente, offerte di lavoro e occasioni di formazione.

● L'applicazione prova a trovare la corrispondenza tra i vertici di questo triangolo.

● I dati sono incrociati con i profili utenti per segnalare la formazione necessaria per colmare il gap di competenze che impedisce all'utente di soddisfare le offerte di lavoro

● Le offerte possono essere commentate e segnalate dagli utenti attraverso la loro rete sociale

I prossimi passi 2

● Usare il feedback degli utenti per affinare gli algoritmi di apprendimento, ricerca e match

● Estensione dell'ontologia ISTAT (es. nuovi mestieri digitali)

● Sperimentazione con ontologie di altri Paesi Europei / in altre lingue

● Utilizzo di altre reti semantiche (Babelnet, Conceptnet)

● Standardizzazione LOD●

Dettagli tecnici

● Acquisizione e storage– La tassonomia ISTAT è stato importata e riversata in un DB MySQL

● Categorizzatori– Dalle descrizioni testuali dei lavori (6.700 voci) e dei compiti (17.100 voci) della tassonomia ISTAT vengono

estratte, usando la libreria NLTK, le features linguistiche: significati delle parole, parti del discorso (POS), radici morfologiche (stem), coppie di stem.

– Questi insiemi di features sono usati come informazioni linguistiche di base per far apprendere un classificatore (Maximum Entropy classifier con algoritmo Generalized Iterative Scaling) che riconosca le frasi usate nelle descrizioni delle offerte di lavoro e formazione

● Ricerca– allo stesso modo i testi inseriti dall'utente per la ricerca vengono trasformate in bag of features– la corrispondenza tra ricerche/descrizioni e categorie di lavori ISTAT viene individuata dal classificatore

– i risultati della classificazione vengono pesati sulla base delle features che corrispondono alla ricerca data

● Match – Per estendere i risultati delle ricerche e del match verranno utilizzati algoritmi di misura della distanza tra

concetti e tra significati nelle tassonomie di dominio (ISTAT) e linguistica (Multi Wordnet)

+ Info

Lynx è una VSE nata come spinoff dell'Università di Roma Tre nel 1995. Si occupa da sempre di tecnologie digitali ed educazione; dal 2000 aderisce al modello OpenSource e rilascia tutti i propri software sotto GPL. E' parte della Rete Italiana OpenSource.● http://www.lynxlab.com/

Informazioni più dettagliate sul progetto e sull'app per android sono disponibili qui:● http://www.lynxlab.com/it/openlabor-android-app.html● https://play.google.com/store/apps/details?id=it.lynx.openlabor

http://www.lynxlab.com/

http://www.lynxlab.com/it/openlabor-android-app.html

https://play.google.com/store/apps/details?id=it.lynx.openlabor

Stefano Penge - Open labor, opendata for visible and trasparent European job market

Documents

Transcript of Stefano Penge - Open labor, opendata for visible and trasparent European job market