Workshop di Disseminazione
Tema ICT: "Digital Asset Management"
"Indicizzazione di contenuti audiovisuali mediante riconoscimento dei volti e degli speaker"
Aula Magna Ingegneria. Via Marengo, Cagliari
Mercoledì 13 Maggio 2015 -- 15:00 - 18:00
Abstract. Gli asset digitali vanno assumendo un ruolo sempre più pervasivo in tutte le economie moderne. La crescita delle industrie creative e il proliferare dell'user-generated content guidano la necessità di disporre di soluzioni per la gestione di grosse collezioni di contenuti digitali attraverso il loro intero ciclo di vita. Il workshop, partendo da una panoramica delle principali problematiche relative alla catalogazione delle collezioni digitali, descriverà algoritmi e tecniche utilizzabili per l'indicizzazione automatica dei contenuti, attraverso il riconoscimento dei volti e degli speaker. Inoltre verranno presentate le soluzioni sviluppate dal CRS4 nell'ambito del progetto "ACTIVE: Archiving & Classification Tools for the Intelligent Video Ecosystem", finalizzato alla realizzazione di una piattaforma open-source di catalogazione intelligente mirata a valorizzare le collezioni digitali di imprese che operano nell'industria dei contenuti, finanziato dal Programma di Sardegna Ricerche "Azioni Cluster Top-Down" a valere su fondi POR Sardegna FESR 2007/2013 - ASSE VI COMPETITIVITÀ Linea di attività 6.1.1.A "Promozione e sostegno all'attività di RSI dei Poli di Innovazione e dei progetti strategici".
- Maurizio Agelli - Strumenti e metodologie per la catalogazione dei contenuti audiovisuali (15:00) - L'intervento introdurrà gli argomenti trattati nel workshop, descrivendo in modo conciso le principali criticità relative alla gestione e alla catalogazione delle collezioni audiovisuali, con riferimento alle diverse esigenze di scenari applicativi reali. Inoltre si accennerà alle esperienze e ai risultati ottenuti dal CRS4 nell'ambito del Digital Asset Management e si introdurrà il progetto ACTIVE, orientato alla creazione di una piattaforma open-source per la gestione delle collezioni digitali, espandibile ed adattabile sulla base delle esigenze specifiche dei possibili workflow.
- Maurizio Pintus - Algoritmi e tecniche di face detection / tracking / recognition (15:20) - Verranno presentati alcuni strumenti visuali per l'indicizzazione dei contenuti orientata alla ricerca di persone. In particolare, verrano descritti in dettaglio l'algoritmo di Viola & Jones per la face detection, l'algoritmo Continuously Adaptive Mean Shift (CAMSHIFT) per il face tracking e i metodi basati sui Local Binary Pattern (LBP) per la face recognition. Sarà illustrato inoltre l'utilizzo di informazioni testuali e relative all'abbigliamento per migliorare il riconoscimento, insieme ai risultati sperimentali ottenuti.
- Felice Colucci - Algoritmi e tecniche di speaker recognition (16:00) - L'intervento illustrerà le caratteristiche peculiari di un sistema di riconoscimento automatico del parlatore (ASR), con particolare enfasi sulle tecniche e sugli algoritmi utilizzati. Saranno presentati inoltre i concetti fondamentali (estrazione delle feature e modellizzazione del parlatore) e l'architettura di un sistema di ASR, insieme ai risultati sperimentali ottenuti.
- Alessandro Sassu, Nicola Corona, Federico Santamaria - La piattaforma ACTIVE (16:30) - L'intervento descriverà la piattaforma open-source ACTIVE che fornisce un insieme di strumenti per la gestione delle collezioni audiovisuali e per l'indicizzazione automatica dei contenuti, attraverso il riconoscimento di volti e speaker. La piattaforma può essere inoltre facilmente estesa mediante un sistema di plug-in, in modo da coprire le diverse necessità dei possibili scenari di utilizzo. L'intervento sarà strutturato in tre parti: funzionalità, architettura e tecniche di processing concorrente utilizzate per l'elaborazione dei contenuti audiovisuali.
Parole chiave: face detection, face tracking, face recognition, automatic speaker recognition, diarization, shot detection, metadata, digital asset management, digital preservation, catalogazione, ingestion, multi-processing, tagging, video summarizer, feature extraction, knowledge management, creative industries.
Schede di approfondimento
Progetti recenti:
Tecnologie abilitanti:
Bibliografia ed Eventi scientifici:
Materiali post-evento
- Video
- Presentazioni
- M. Agelli, M. Pintus, F. Colucci, A. Sassu, N. Corona, F. Santamaria [Slideshare, canale CRS4]
- Questionario di valutazione dell'apprendimento (risposte esatte: b, b, c, a, a, b, b, c, c, c)