1-R&D (lundi 7 et mardi 8 décembre)

Titre

Retours d'expériences sur les Métiers de l'innovation et de la Valorisation

Résumé

Dans ce séminaire, nous faisons intervenir un certain nombre de professionnels qui vont parler et témoigner de la diversité des métiers dans le monde de l'innovation et de la R&D : chercheurs ou ingénieurs de recherche, dans le privé ou le secteur public, administrateurs, gestionnaires ou directeurs de l'innovation et/ou de la R&D, spécialistes du transfert et de la valorisation, spécialistes du support à la création de start-ups (structures d'incubation par exemple) et directeur de start-ups, experts en montage de projet de recherche collaboratifs, etc. Le séminaire est organisé en sessions d'une demi-journée au cours desquels nous faisons en sorte que plusieurs témoignages se succèdent sur chacune des grandes familles de métiers évoquées ci-dessus.

2-Data-Publica (mercredi 9 décembre)

Titre

Extractions de données du web

Résumé

Data-Publica (www.data-publica.com)

Créée en juillet 2011, Data Publica est un des premiers acteurs historiques de l’open data en France. Après 4 années à concevoir des jeux de données à la demande, Data Publica développe et commercialise C-Radar (www.c-radar.com) qui utilise les technologies big data (crawling, scraping, machine learning, clustering, etc.) pour offrir de multiples fonctionnalités : moteur de recherche d’entreprises, fiche d’activité d’entreprises avec contacts commerciaux, détection de nouveaux prospects, scoring de prospects existants, segmentation automatique d’ensemble d’entreprises (clients, prospects, marché) ou encore identification de marché.

Description du séminaire :

Le web ouvert est le plus grand producteur de données du monde. Les messages des réseaux sociaux, les sites webs, les articles de journaux, les blogs, les annonces légales... toutes ces données sont produites au quotidien par les entreprises, les individus, les administrations de tous pays. C'est une mine d'or d'exploitation a priori pour les métiers autour de l'extraction de connaissance (mining) mais cela nécessite de maîtriser de nombreux concepts.

Cet atelier permet de présenter de bout-en-bout comment faire un système permettant de collecter ce que l'on souhaite du web avec des exemples code en main. Nous explorerons les différents métiers impliqués et verrons les spécificités de chacun. Nous aborderons comment gérer les nombreuses limites : technique (passage à l'échelle, distribution de calcul), complexité (hétérogénéité et nettoyage de données), scientifique (méthodes d'analyses), éthique (respect de la vie privée), administrative (propriété intellectuelle).

Quelques mots clés de référence pour finir : scraping, crawling, webmining, textmining, big data, data flow, nosql, database, open data, data science, privacy.