Compte-rendu intermédiaire CONTINT ISICIL ANR-08-I3S

De $1

 

Projet ANR-08-CORD-011

ISICIL

Programme CONTINT 2008

A     Identification. 1

B     Livrables et jalons2

C     Rapport d’avancement sur la période concernée2

C.1      Description des travaux effectués2

C.2      Résultats marquants (si applicable)2

C.3      Réunions du consortium (si applicable)2

C.4      Commentaires libres2

D    Impact du projet depuis le début3

D.1     Indicateurs d’impact3

D.2     Liste des publications et communications4

D.3     Liste des éléments de valorisation. 4

D.4     Personnels recrutés en CDD (hors stagiaires)4

D.5     État financier5

E     Annexes éventuelles5

 

 

Ce document est à remplir par le coordinateur en collaboration avec les partenaires du projet L’ensemble des partenaires doit avoir une copie de la version transmise à l’ANR.

 

 Ce modèle doit être utilisé uniquement pour le(s) compte(s)-rendu(s) intermédiaire(s) défini(s) dans les actes attributifs de financement, hors rapport T0+6 pour lequel il existe un modèle spécifique. Il existe également un modèle spécifique au compte-rendu final.

A     Identification

Acronyme du projet

ISICIL

Titre du projet

Information Semantic Integration through Communities of Intelligence onLine

Coordinateur du projet (société/organisme)

Gandon Fabien, INRIA Sophia Antipolis

Date de début du projet

Date de fin du projet

03/02/2009

03/12/2012

Site web du projet, le cas échéant

http://isicil.inria.fr/

 

Rédacteur de ce rapport     

Civilité, prénom, nom

Dr. Fabien Gandon

Téléphone

+33 (0)4 92 38 77 88

Adresse électronique

Fabien.Gandon@inria.fr

Date de rédaction

17/05/2010

Période  faisant l’objet du rapport d’activité

T0 – T0+16

 

B     Livrables et jalons

Quand le projet en comporte, reproduire ici le tableau des jalons et livrables fourni au début du projet. Mentionner l’ensemble des livrables, y compris les éventuels livrables abandonnés, et ceux non prévus dans la liste initiale.

 

État *

Titre

Nature (jalon, rapport, logiciel, prototype, données, …)

Partenaires (souligner le responsable)

Commentaires

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

*Préciser : « Livré le… » ; « Prévu le… » ; « Reprévu le… » ; « Abandonné » ;

 

 

 

 

 

 

 

 

 

 

 

 

 

C     Rapport d’avancement sur la période concernée

C.1    Description des travaux effectués

Maximum 1 à 2 pages. Travaux et résultats obtenus pendant la période concernée, conformité de l’avancement des travaux avec le plan initialement prévu. Prévision de travaux pour la (les) prochaine(s) période(s). Difficultés éventuelles rencontrées et solutions de remplacement envisagées ex : impasse technique, abandon d’un sous traitant, maîtrise des délais, maîtrise des budgets. Faut-il revoir le contenu du projet ? Faut-il revoir le calendrier du projet ?

C.1.1   Travaux effectués par le partenaire I3S

Tâches 1.1 (Scenario Analysis report) et 1.3 (State of the art of Business Intelligence applications)

I3S a contribué -en tant que coordinateur de cette tâche- à définir quel est le processus de veille (formel et non formel) mis en œuvre par les usagers impliqués, en particulier par  le réseau de veille(ur)s. L’étude a permis de caractériser les collectifs étudiés (FT, Ademe), en se basant sur une approche qualitative à base d’entretiens et de questionnaires. Ce travail est présenté dans le livrable :  « BI state of the art » de Juin 2009.

 

Tâche 3 : (Social Management of Shared representations). I3S est impliqué avec l’INRIA dans l’ensemble de cette tâche. I3S a participé à l’état de l’art sur les réseaux sociaux, et sur le rapprochement entre folksonomies et ontologies. Par ailleurs, des modèles et des algorithmes ont été établis pour représenter les réseaux sociaux et procéder à leur analyse (notamment à la détection de communautés). Ces modèles et algorithmes ont été testés sur un réseau de 10k utilisateurs issu d’un vrai réseau social et ont fait l’objet de nombreuses publications INRIA/I3S. Concernant la sémantique des folksonomies, un modèle de représentation du « tagging » a été développé qui supporte les contradictions sémantiques entre utilisateurs. Ce modèle permet cependant d’exploiter l’expertise des usagers. Des prototypes ont été développés, notamment un serveur de tag et un outil de recherche à base de tags permettant d’exprimer des points de vue. Ce travail a fait l’objet de plusieurs publications INRIA/I3S.

 

Tâche 4  (end-users’ tools). I3S est coordinateur de cette tâche. Il s’agit ici de concevoir et mettre en œuvre un wiki sémantique, un serveur de ressources (métadonnées) pour l’ensemble des applications ISICIL, un outil de « web scraping », un système de gestion des droits d’accès aux documents et ressources, etc.

 

Module de Web Scrapping

 

Le web scraping consiste à effectuer une copie locale d’un document web ou d’une partie d’un document web, afin de l’archiver, de le partager, de le commenter, de l’annoter. Par exemple, un site dont la page d’accueil change quotidiennement (la une du monde.fr).,Oon peut copier une partie de la page, entrer une description, tagguer ce bout de document et l’envoyer vers une « base de données des documents scrappés », pour ensuite partager ce document avec la communauté ISICIL.

I3S a développé une extension firefox permettant d’effectuer l’opération de scrapping sur un document ou sur une partie du document. Lors de cette opération, il est possible d’ajouter une description au document et de le tagguer. Cette extension génère également les métadonnées RDF décrivant ce document, la date du scrap, l’auteur, etc. Les fichiers nécessaires au scrap sont ensuite assemblés dans une archive et envoyés à un web service développé au sein du wiki sémantique (voir section suivante), ce dernier faisant office de « base de données des documents scrappés », sa nature de « wiki » en faisant un support idéal pour le partage des documents (versionning, insertion du document scrappé dans une page wiki pour ajouter des commentaires, le retagguer, ajouter un titre, etc.). Plus de détails dans la partie « wiki sémantique ».


 

 

Serveur de ressources

 

Le serveur de ressources gère l’ensemble des métadonnées RDFs des documents produits par les applications ISICIL (notamment par le wiki sémantique, par le module de web scrapping). Basé sur le framework ISICL, il propose un ensemble de web services permettant d’effectuer les opérations de manipulation des métadonnées : insertion, recherche, suppression, modification. Pour le moment, il gère l’ensemble des métadonnées décrivant les pages du wiki sémantique et des documents scrappés.

 

SweetWiki version 3 devient Sweet DekiWiki sémantique

 

SweetWiki a été un des premiers wikis sémantiques completcomplètement articulé autours des technologies du web sémantique. Il est encore utilisé par des organisations académiques et industrielles (voir http://robubox.com par exemple). Au cours des six premiers mois du projet ISICIL, nous avons mené une réfléxionréflexion sur ce que devait être la prochaine version de ce logiciel et avons fait un bilan de ses points forts/points faibles. Les principaux défauts de SweetWiki concernaient son éditeur WYSIWYG vieillissant (basé sur l’éditeur open source Kupu), le manque de fonctionnalités « industrielles » notamment vis-à-vis de la sécurité, de la sa gestion centralisée des documents et des métadonnées. Par ailleurs, Lle projet ISICIL propose une architecture de services, certains des services ISICIL fournissant des fonctionnalités qui étaient sont présentes redondantes avec celles dans de SweetWiki (service d’authentification, de gestion des profils utilisateurs, de tagging, de gestion des métadonnées de toutes les applications ISICIL, etc.) Il est apparu qu’adapter SweetWiki à cette nouvelle architecture aurait demandé une profonde re-conception du wiki. Avec l’accord des partenaires du projets, nous avons décidé de partir d’un wiki « industriel »et open source (Mindtouch Deki, voir mindtouch.com) et de le sémantiser en développant les modules manquants, inspirés de ceux développés dans SweetWiki, et de le développer pour en faire une plateforme d’intégration de services. Ainsi, nous nous focalisonspouvons nous focaliser sur les aspects sémantiques et intégration de services, tout en bénéficiant du fait que Mindtouch Deki est un logiciel stable et réputé, bénéficiant avecd’une large communauté d’utilisateurs.

 

Le travail effectué sur Mindtouch Deki est le suivant :

  • Définition d’une ontologied’un modèle de métadonnées RDF pour décrire les modèles de documents (réutilisation d’ontologies existantes + définition d’une extension pour l’ontologieSIOC Types afin de décrire les « documents dans les documents »),
  • Ecriture d’un module de sauvegarde des documents du wiki, afin de générer lors de la modification/sauvegarde d’un document les annotations RDF correspondantes, et les envoyer vers le serveur de ressources,
  • Ecriture d’un module permettant d’injecter des métadonnées lors de la phase de rendu d’un document (injection RDFa possible), ce module envoie une requête au serveur de ressources, récupère les métadonnées correspondantes et les injecte dans la page au moment du rendu.
  • Ecriture d’un web service REST intégré au wiki permettant de récupérer des documents « web scrappés » par l’extension firefox de scrapping, de les stocker dans la base de données du wiki, d’extraire les métadonnées RDF correspondant au « scrap » et de les sotocker dans le serveur de ressources.
  • Ecriture d’un plugin pour Mindtouch Deki permettant d’inclure dans une page du wiki, un document scrappé, avec plusieurs modes de visualisation : preview (une imagette, la description, date, version, auteur, et un bouton permettant de downloader le document), vue complète sous forme d’une iframe incluse dans une page du wiki. Ce plugin insère une vue dans une page qui reste éditable, commentable, tagguable. Ceci permet de définir des « vues augmentées » d’un document scrappé, de le partager, de le versionner, etc.
  • Ecriture d’un module « portails des documents scrappés » dans Midtouch Deki, permettant de naviguer parmisparmi les documents scrappés.

 

Développement d’une ontologie pour la gestion des droits d’accès aux ressources d’ISICIL

 

I3S a développé l’ontologie AMO (Access Management Ontology). Cette ontologie qui consiste(1) en un ensemble de classes et propriétés permettant d’annoter les ressourcesdont il s’agit de contrôler l’accès et (2) en une base de règles d’inférence modélisantla stratégie de gestion des droits à mettre en œuvre. Appliquées sur la based’annotations des ressources, ces règles permettent de gérer leur accès selonune stratégie donnée. Cette modélisation à base de règles garantit ainsi l’adaptabilité de l’ontologieà différentes stratégies de gestion des droits d’accès (une stratégie basée sur des rôles comme dans les systèmes de gestion de fichiers, ou bien basée sur des tags/users/groupes comme dans Facebook, ou encore basée sur la notion de public/privé/semi-privé comme dans Mindtouch Deki, etc), Cette ontologie n’est pas encore déployée dans l’ensemble des modules ISICIL, cependant nous avons illustréet validé son utilisation sur les documents du projet ISICIL produitspar le wiki sémantique. Elle fait l’objet de deux publications.

 

C.2    Résultats marquants (si applicable)

En deux lignes. Cet élément pourrait donner lieu à communication, après accord du coordinateur du projet.Wiki sémantique, module de web scraping et serveur de ressources fonctionnels, bien que toujours en développement. L’ontologie AMO a été testée et validée.

 

C.3    Réunions du consortium (si applicable)

 

Date

Lieu

Partenaires présents

Thème de la réunion

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

C.4    Commentaires libres

Commentaire du coordinateur

Commentaire général à l’appréciation du coordinateur, sur l’état d’avancement du projet, les interactions entre les différents partenaires…

 

 

Commentaire des autres partenaires

Éventuellement, commentaires libres des autres partenaires

 

 

Question(s) posée(s) à l’ANR

Éventuellement, question(s) posée(s) à l’ANR…

 

D     Impact du projet depuis le début

Ce rapport rassemble des éléments cumulés depuis le début du projet qui seront suivis tout au long de l’avancée du projet et repris dans son bilan.

D.1    Indicateurs d’impact

Nombre de publications et de communications (à détailler en D.2)

Comptabiliser séparément les actions monopartenaires, impliquant un seul partenaire, et les actions multipartenaires  résultant d’un travail en commun.

Attention : éviter une inflation artificielle des publications, mentionner uniquement celles qui résultent directement du projet (postérieures à son démarrage, et qui citent le soutien de l’ANR et la référence du projet).

 

 

 

Publications multipartenaires

Publications monopartenaires

International

 

Revues à comité de lecture

 

 

Ouvrages ou chapitres d’ouvrage

 

 

Communications (conférence)

5+1 soumis conf intern.

3 Workshops

 

France

 

Revues à comité de lecture

 

 

Ouvrages ou chapitres d’ouvrage

1 + 1 to appear

1 à paraitre

Communications (conférence)

2

1

Actions de diffusion

Articles vulgarisation

 

 

 

Conférences vulgarisation

 

 

Autres

 

 

 

 

Autres valorisations scientifiques (à détailler en D.3)

Ce tableau dénombre et liste les brevets nationaux et internationaux, licences, et autres éléments de propriété intellectuelle consécutifs au projet, du savoir faire, des retombées diverses en précisant les partenariats éventuels. Voir en particulier celles annoncées dans l’annexe technique).

 

 

Nombre, années et commentaires

(valorisations avérées ou probables)

Brevets internationaux obtenus

 

Brevet internationaux en cours d’obtention

 

Brevets nationaux obtenus

 

 

Brevet nationaux en cours d’obtention

 

Licences d’exploitation (obtention / cession)

 

Créations d’entreprises ou essaimage

 

Nouveaux projets collaboratifs

 

Colloques scientifiques

 

 

Autres (préciser)

 

 

 

D.2    Liste des publications et communications

Répertorier les publications résultant des travaux effectués dans le cadre du projet. On suivra les catégories du premier tableau de la section Erreur ! Source du renvoi introuvable. en suivant les normes éditoriales habituelles. En ce qui concerne les conférences, on spécifiera les conférences invitées.

 

Conférences internationales

§  Guillaume Ereteo, Fabien Gandon, and Michel Buffa, SemLP: Semantic Community Detection in Folksonomies, submitted to Conference IEEE Web Intelligence 2010, August 31 - September 3, 2010,York University, Toronto, Canada. Submitted.

§  Freddy Limpens, Fabien Gandon and Michel Buffa, Helping Online Communities to Semantically Enrich Folksonomies, Web Science Conference, April, 2010, Raleigh, NC, USA.

§  Guillaume Erétéo, Michel Buffa, Fabien Gandon, and Olivier Corby, Analysis of a real online social network using semantic Web frameworks. Accepted as full paper at the ISWC 2009 Conference, November 2009, Washington USA.

§  Freddy Limpens, Fabien Gandon, and Michel Buffa, Collaborative Semantic Structuring of Folksonomies, Conference IEEE Web Intelligence 2009, Milan September 15-18.

§  Fabien Gandon, Talel Abdessalem, Michel Buffa and Al., ISICIL: Information Semantic Integration through Communities of Intelligence online, 10th IFIP Working Conference on VIRTUAL ENTERPRISES, Thessaloniki, GREECE, 7-9 October 2009

§  Guillaume Erétéo, Fabien Gandon, Michel Buffa and Olivier Corby. Semantic Social Network Analysis. In Proc. Web Science WebSci'09, Athens, Greece, March 2009.

Chapitres de livre

§  Michel Buffa, et Catherine Faron-Zucker, Ontology-Based Access Rights Management, book chapter in “Advances in Knowledge Discovery and Management Vol. 2 (AKDM-2)”, Series “Studies in Computational Intelligence,” Springer, November 2010, Editors: F. Guillet, G. Ritschard, D. Zighed, H. Briand and R. Gras. To appear.

§  Freddy Limpens, Fabien Gandon and Michel Buffa, , Handbook: "Introduction to the Web Semantic:Concepts, Technologies and Applications", edited by Gabriel Fung(Arizona State University, USA), IConcept Press Ltd., chapter Empowering social tagging practices with semantics. To appear.

§  Guillaume Erétéo, Michel Buffa, Olivier Corby, Fabien Gandon, Mylène Leitzelman, Freddy Limpens, and Peter Sander. Handbook of Research on Methods and Techniques for Studying Virtual Communities, chapter Semantic Social Network Analysis, a Concrete Case. IGI Global 2009.

Conférences nationales

  • Michel Buffa, Catherine Faron-Zucker, Gestion sémantique des droits d'accès au contenu de sites web: l'ontologie AMO, soumis à la 10ème Conférence Internationale Francophone "Extraction et Gestion des Connaissances" EGC’10, Hammamet, Tunisie, 26-29 Janvier 2010.
  • Freddy Limpens, Fabien Gandon, and Michel Buffa. Sémantique des folksonomies: structuration collaborative et assistée. In Proc. Ingénierie des Connaissances IC'09, Hammamet, Tunisia, June 2009.
  • Freddy Limpens, Fabien Gandon, Michel Buffa, Rapprocher les ontologies et les folksonomies pour la gestion des connaissances partagées : un état de l'art, Proc. 19èmes Journées Francophones d'Ingénierie des Connaissances, IC'08, June 18-20, Loria, Nancy, France.
  • Buffa & Gandon, Wikis et Web Sémantique, Conference IC 2007, p49-60 Grenoble.

Posters

  • Mylène Leitzelman, Guillaume Erétéo, Patrick Grohan, Frédéric Herledan, Michel Buffa, and Fabien Gandon. De l'utilité d'un outil de veille d'entreprise de seconde génération. In Poster at Ingénierie des Connaissances IC'09, Hammamet, Tunisia, June

 

Workshops

§  Guillaume Erétéo, Michel Buffa, Fabien Gandon, Mylène Leitzelman, and Freddy Limpens. Leveraging Social Data with Semantics, In W3C Workshop on the Future of Social Networking, Barcelona, Spain, 2009

§  Guillaume Erétéo, Michel Buffa, Fabien Gandon, Patrick Grohan , Mylène Leitzelman, Peter Sander, A State of the Art on Social Network Analysis and its Applications on a Semantic Web, Proc. SDoW2008 (Social Data on the Web), Workshop held at the 7th International Semantic Web Conference, Karlsruhe, October 2008.

§  Freddy Limpens, Fabien Gandon, and Michel Buffa, Bridging Ontologies and Folksonomies to Leverage Knowledge Sharing on the Social Web: a Brief Survey, in Proc. 1st International Workshop on Social Software Engineering and Applications (SoSEA), L'Aquila (IT), 15th September, 2008

 

D.3    Liste des éléments de valorisation

La liste des éléments de valorisation inventorie les retombées (autres que les publications) décomptées dans le deuxième tableau de la section Erreur ! Source du renvoi introuvable.. On détaillera notamment :

-          brevets nationaux et internationaux, licences, et autres éléments de propriété intellectuelle consécutifs au projet.

-          logiciels et tout autre prototype

-          actions de normalisation

-          lancement de produit ou service, nouveau projet, contrat,…

-          le développement d’un nouveau partenariat,

-          la création d’une plate-forme à la disposition d’une communauté

-          création d’entreprise, essaimage, levées de fonds

-          autres (ouverture internationale,..)

Elle en précise les partenariats éventuels. Dans le cas où des livrables ont été spécifiés dans l’annexe technique, on présentera ici un bilan de leur fourniture.

 

D.4    Personnels recrutés en CDD (hors stagiaires)

Ce tableau dresse le bilan du projet en termes de recrutement de personnels non permanents sur CDD ou assimilé. Renseigner une ligne par personne embauchée sur le projet quand l’embauche a été financée partiellement ou en totalité par l’aide de l’ANR et quand la contribution au projet a été d’une durée au moins égale à 3 mois, tous contrats confondus, l’aide de l’ANR pouvant ne représenter qu’une partie de la rémunération de la personne sur la durée de sa participation au projet.

Les stagiaires bénéficiant d’une convention de stage avec un établissement d’enseignement ne doivent pas être mentionnés.

 

Des données complémentaires sur le devenir professionnel des personnes concernées seront demandées à la fin du projet. Elles pourront faire l’objet d’un suivi  jusqu’à 5 ans après la fin du projet.

 

Identification

Avant le recrutement sur le projet

Recrutement sur le projet

Nom et prénom

Sexe

H/F

Adresse email (1)

Date des dernières nouvelles

Dernier diplôme obtenu au moment du recrutement

Lieu d'études (France, UE, hors UE)

Expérience prof. antérieure (ans)

Partenaire ayant embauché la personne

Poste dans le projet (2)

 

Date de recrutement

Durée  missions (mois) (3)

Mylène Leitzelman

F

leitzelm@enst.fr

 

Thèse

France

10

I3S

Post-doctorat

5/01/09

12

Guillaume Husson

H

Guillaume.husson@i3s.unice.fr

 

Master 2 informatique

France

1

I3S

Ingénieur d’étude

12/09

24

Clément Fossati

H

Fossati.clement@gmail.com

 

Master 2 Miage

France

0

I3S

Stagiaire

03/2009

6

Pavel Arapov

H

pavel.arapov@gmail.com

 

Master 2 Miage

Russie/France

0

I3S

Stagiaire

03/2010

6

 

Aide pour le remplissage

(1) Adresse email : indiquer une adresse email la plus pérenne possible

(2) Poste dans le projet : post-doc, doctorant, ingénieur ou niveau ingénieur, technicien, vacataire, autre (préciser)

(3) Durée missions : indiquer en mois la durée totale des missions (y compris celles non financées par l’ANR) effectuées  ou prévues sur le projet

 

Les informations personnelles recueillies feront l’objet d’un traitement de données informatisées pour les seuls besoins de l’étude anonymisée sur le devenir professionnel des personnes recrutées sur les projets ANR. Elles ne feront l’objet d’aucune cession et seront conservées par l'ANR pendant une durée maximale de 5 ans après la fin du projet concerné. Conformément à la loi n° 78-17 du 6 janvier 1978 modifiée, relative à l'Informatique, aux Fichiers et aux Libertés, les personnes concernées disposent d'un droit d'accès, de rectification et de suppression des données personnelles les concernant. Les personnes concernées seront informées directement de ce droit lorsque leurs coordonnées sont renseignées. Elles peuvent exercer ce droit en s'adressant l'ANR (http://www.agence-nationale-recherche.fr/Contact).

 

D.5    État financier

Donner un état indicatif de la consommation des crédits par les partenaires. Indiquer la conformité par rapport aux prévisions et expliquer les écarts significatifs éventuels.

 

Nom du partenaire

Crédits

consommés

(en %)

Commentaire éventuel

  I3S

 

Tout le budget salaire a été consommé (ou du moins en comptant les mois de salaire à venir des personnes embauchées en ce moment), tout le budget matériel a été consommé, le budget « missions » a été consommé conformément au plan prévu lors de la soumission du projet, il reste 6357euros pour les missions restantes, soit à peu près 1/3 de la somme totale.