eClean™ è un innovativo servizio di consulenza erogato da E-Artspace per individuare e correggere le inconsistenze e le incompletezze contenute nei documenti e nei database (Data Cleansing e Information Federation).
Per effettuare queste attività utilizziamo gli strumenti semantici che abbiamo sviluppato nei nostri laboratori, integrati con le più avanzate tecnologie disponibili.
Il processo che seguiamo (patent pending) si articola nei seguenti passi:
- Identifichiamo le fonti dati oggetto del nostro intervento.
- Formalizziamo la semantica dei dati in essi contenuti attraverso ontologie pubbliche (ad esempio ITSMO) o progettate specificatamente.
- Mappiamo i dati annotandoli con i termini delle ontologie utilizzando le tecnologie disponibili nel Semantic Web.
- Utilizzando strumenti come il Business Ontology ToolKit (BOTK) sviluppiamo gli agenti semantici in grado di evidenziare le incongruenze tra i dati in forma tabellare.
- Correggiamo gli errori utilizzando strumenti come Google Refine o agenti software specificatamente progettati.
Il nostro approccio ha questi vantaggi distintivi:
il processo, dopo la prima iterazione, produce un vero Data Cleansing Framework che consente la riesecuzione automatica delle operazioni di ripulitura dei dati, abbattendo il costo di manutenzione ed aumentando significativamente il ROI
i dati trattati sono disponibili ad un ampio insieme di tool che traggono beneficio dal tagging semantico ( browser, search engine, etc).
molti tool utilizzati nell'erogazione del servizio sono rilasciati con licenza open-source e rimangono disponibili anche dopo l'intervento.
Alcuni tipici ambiti di applicazione:
- Cataloghi prodotti e servizi
- Product Data Management systems
- Customer Base
- Quality Recordings
- Classificazione incident reports, difetti