Pages Menu
TwitterRssFacebook
Categories Menu

Posted by on 29, Août 2011 in Autour du mail, Messagerie | 0 comments

NextMail ’11 (22 août 2011) : ce qu’il s’est dit

NextMail ’11 (22 août 2011) : ce qu’il s’est dit

Le 22 août s’est tenue à l’université de Lyon 1 l’édition 2011 du workshop NextMail, qui a réuni des professionnels de la messagerie dans le but d’explorer les nouveaux axes d’évolution de la communication électronique et plus particulièrement de l’email.

Organisé par Romain Vuillemot (LIRIS, Université de Lyon), Gaëlle Recourcé (KWAGA) et Philippe Gilbert (Alinto), cet évènement a permis aux participants d’échanger en théorie comme en pratique au travers de démonstrations de leur travail respectif : analyse sémantique, statistiques et extraction d’informations étaient à l’honneur lors du workshop.

Consultez les slides sur le site officiel du Workshop NextMail’11

Ian Smith: Dr StrangeMail: How I Learned To Stop Worrying And Love Email

Au cours de son intervention, Ian Smith partage son expérience avec la messagerie électronique, faisant part de ses échecs et observations en évoquant trois points principaux.

  • Le fait que l’email est trop sensible pour y implanter des opérations invisibles : les gens ont tendance à échanger beaucoup d’informations confidentielles et sensibles par email, ce qui rend très dangereuse toute opération invisible, par exemple un serveur qui intercepterait un message dans le but de le traduire.
  • Il réfute la thèse de la « surcharge de l’email », qu’il considère comme une légende urbaine, amenant l’idée que le problème vient du manque d’efficacité dans la manière qu’ont les gens de traiter leurs messages.
  • Il établit que tenter de changer le comportement des utilisateurs de la messagerie est inutile, car impossible : les gens ont trop d’habitudes.

Malgré les barrières auxquelles il s’est heurté, le keynote présenté par Ian Smith cherche toutefois à redonner aux développeurs et chercheurs la motivation d’innover, en leur évitant toutefois de perdre du temps sur des choses impossibles comme lui juge en avoir perdu.

Nicolas Guillaume: Next Generation Mail: Towards a Personal Social CRM

Nicolas Guillaume de la société QuestionableMail pense quant à lui que l’email est un réseau social implicite. Il rapproche les problèmes de surchage rencontrés sur les boites mail avec ceux des réseaux sociaux, expliquant toutefois que ces derniers disposent d’algorithmes mettant en avant le contenu « important ».

Il fait le point sur les solutions proposées à l’heure actuelle par des fournisseurs tels que Gmail, comme la Priority Inbox, qu’il juge inadaptées : il est facile de rater un message tant le système n’est pas parfait. Plutôt que d’implémenter des changements profonds dans l’affichage et la gestion des messages, que Nicolas Guillaume pense être impossible, il faudrait selon lui garder l’organisation chronologique des messages mais adopter une approche similaire à celle des outils de CRM : tous les messages doivent être traités, mais pas de la même façon. Les messages importants seraient ainsi mis en avant, sans que les messages moins importants soient évincés. Le focus doit être mis sur le « relationship management », utilisant le côté social inhérent à l’email pour améliorer son efficacité.

Antoine Zimmermann: Leveraging the Linked Data Principles for Electronic Communications

Le projet présenté par Antoine Zimmermann met quant à lui à l’oeuvre le RDF, une norme W3C spécifiée en 2004. ainsi que SPARQL, un autre langage standard de requêtes conçu pour le RDF.

Tirant parti des métadonnées, ce projet a pour but d’utiliser les URI pour définir les données contenues dans nos messages comme des éléments identifiables : tweets, adresses email, auteur, dates et heures, sujets et bien d’autres. Mais cela ne s’arrête pas là : les données sont également mises en relations les unes avec les autres au moyen de opérateurs booléens ou de restrictions cardinales, créant des catégories pour les classer.

Grâce à SPARQL, on facilite la recherche et l’intéraction avec les messages en pouvant chercher par exemple uniquement les messages à caractère privé, ne traitant que d’un sujet en particulier, contiennent des liens d’un certain type, etc. Parce que les classifications sont totalement illimitées, on peut même imaginer de chercher des messages concernant des évènements ayant lieu à un endroit précis, des messages instantanés, des accords.

Tout cela permet également l’intégration des réseaux sociaux ou d’autres applications, comme les calendriers, les outils collaboratifs, de programmation, carnet d’adresses (voir poste de travail sémantique).

Cela soulève toutefois certaines problématiques :

  • Les nouvelles formes de spam pouvant en faire usage
  • L’intégration dans une interface simple et une logique d’utilisation
  • L’hétérogénéité inhérente à la variété des outils et des vocabulaires sur le web
  • L’interprétation hasardeuse de la syntaxe et du vocabulaire humains

Vincent Verdot: « Scribee Experimentation – Early statistics on email conversations »

Vincent Verdot, de Bell Labs, a quant à lui présenté Scribee, un projet qui établit de nombreuses statistiques sur la messagerie dans le but d’étudier le comportement des utilisateurs et leur productivité dans un contexte de surcharge d’emails. L’objectif avoué est de permettre aux utilisateurs de gérer « un million de conversations » en maximisant leur productivité.

Se concentrant sur les conversations, Scribee lie les messages entre eux s’ils partagent certaines caractéristiques : participants, sujet, date et heure, etc.

Bien qu’il ne soit pas encore achevé, ce projet a déjà fourni des informations intéressantes qui pourraient être utilisées avantageusement lors de la conception d’applications et d’interfaces liées à la messagerie.

La recherche a été conduite au sein même de Bell Labs, avec 158 participants tous familiers avec les ordinateurs et les services de messagerie. Indolore, le projet ne requiérait aucune installation mais seulement de mettre en copie une boite automatisée (scribee@bell-labs) dans les champs Destinataire habituels. Cela n’avait aucun effet sur la réception du message par le destinataire réel. Le stockage desdits messages était anonyme, et un tri drastique a été effectué pour ne garder que l’important, à savoir 600 messages répartis dans 300 conversations. Parmi les résultats, on trouve par exemple que 39% des données récoltées sont des données redondantes, et que 12% ne sont que des en-têtes. Au fur et à mesure que la conversation progresse, la partie importante représente de moins en moins : au 5ème message, Scribee a trouvé que seules 15% des données étaient utiles.

Sur les 300 conversations recueillies, 125 ne contenaient qu’un seul message et 20% ne concernaient que deux utilisateurs.

Pour parfaire l’échantillon statistiques, les concepteurs de Scribee souhaitent l’implémenter sur un plus gros réseau ainsi que dans un client de messagerie : la structure actuelle, en opt-in, n’est pas la plus représentative tant elle requiert que les utilisateurs se soumettent d’eux-mêmes à l’enquête. Un projet intéressant donc, mais qui gagnerait à être mis en place sur une échelle plus conséquente.

Jérôme Mulsant: « Tomorrow’s email: DLM 3.0 Project’ vision for the future of email in enterprises »

Jérôme Mulsant, de la société Alinto, a lui présenté le projet DLM 3.0. Co-financé par la DGCIS, celui-ci se concentre sur 3 directions principales :

  • Combattre la surcharge sur la messagerie : bien que discutable, elle reste un obstacle majeur à la productivité.
  • Partager à travers l’email : il est vu comme un outil personnel et confidentiel, mais peut-on encourager les utilisateurs à collaborer par ce biais ?
  • L’email en tant que base de données d’information : aider les utilisateurs à trouver des informations passées (« je sais que c’est quelque part dans mes mails … mais où? »), à en extraire des informations importantes en plein vol (rendez-vous, contacts, etc).

Combattre la surcharge

Pour cela, DLM se concentre sur plusieurs innovations : d’abord, un système de filtrage avancé qui établit automatiquement des priorités, par exemple faire la différence entre un nouveau contact client (=important) et un « bacn » (=un message sollicité par l’utilisateur, mais rarement lu immédiatement, comme une newsletter).

Ensuite, en créant une sorte de « digest » des informations contenues dans les messages.

Enfin, une « page d’accueil » de la messagerie qui rassemblerait les informations importantes, agrémenté d’un système de notifications intelligentes.

Partager grâce à l’email

Cette partie du projet est clairement orientée vers les entreprises : on y trouve notamment une fonction qui encourage le stockage en ligne des pièces jointes plutôt qu’un envoi de boîte-à-boîte, permettant 1) un partage plus aisé avec d’autres correspondants et 2) le partage de pièces plus volumineuses. Également présent, des outils « sociaux » visant par exemple à détecter des contacts potentiels à partir de mentions dans le corps du message ou des signatures.

DLM implémente également des flux partagés, qui se traduisent par des boîtes de réception partagées : utile par exemple pour une équipe.

L’email en tant que BDD

Ici, on trouve une présentation adaptée à l’email en tant qu’outil de recherche, mais surtout les fonctions d’auto-extraction. Adresses postales comme email, numéros de téléphones, noms, contacts, tout est analysé et répertorié pour faciliter autant que possible la synthèse. DLM propose également des outils permettant de grouper plusieurs messages pour les associer en fonction de leur objet.

Michal Laclavik: « Email Social Network Extraction & Search »

Michal Laclavik, chercheur à l’Institute of Informatics SAS de Bratislava, a présenté ce qui consiste en l’exploitation des informations et des connaissances dans les messages sous forme de réseau social. Elle sépare le paysage en plusieurs entités, comme les Personnes, les Organisations, les Lieux ou les Contacts. Elle forme des arbres sémantiques et des graphiques en fonction des intéractions entre les utilisateurs et les entités.

Il appuie notamment sur le fait que bien que de tels réseaux existent déjà (par exemple Xobni), ceux-ci appartiennent et sont gérés par des tierces parties. Cela peut se montrer problématique tant au niveau du contrôle que de la confidentialité. En intégrant cela dans les solutions de messagerie existantes, les entreprises conservent leur main-mise.

Les études que lui et son équipe ont menées ont révélé différents types d’objets identifiables dans les messages courants : les organisations (nom, numéro de SIRET), les gens (nom, fonction), les contacts (n° de téléphone, adresse email, site internet), les adresses (code postal, rue, numéro, immeuble), les produits (nom, module, composants), les documents (factures, commandes, devis), etc.

Ces données sont traitées grâce à une utilisation intelligente de celles-ci : plan Google Maps pour les adresses, système de paiement pour les commandes et factures, recherche Google et autant de possibilités.

Utilisant par exemple l’archive des emails du scandale Enron comme base de test, l’outil développé dispose d’une interface graphique qui permet de chercher et trier les messages selon les éléments qu’ils contiennent. À partir du réseau établi, on est en mesure de définir selon la probabilité la plus haute le numéro de téléphone ou l’adresse d’une personne assez simplement. Le taux de réussite se situe entre 50 et 90% de probabilité absolue, et de 80 à 95 % de probabilité très haute. La précision diffère toutefois selon la langue.

Les évolutions futures prévues par Michal Laclavik incluent notamment une prise en compte de la topologie des graphiques établis ou un algorithme plus rapide.

Suman Yelati: « Novel approach for tagging of discourse segments in help-desk emails »

Suman Yelati, de l’International Institute of IT de Hyderabad (Inde), a lui présenté une nouvelle approche d’analyse syntaxique dans les messages des services de support. Motivé par un gros volume de messages reçus dans le cadre du service clients et de la redondance de certaines requêtes, lui et son équipe se sont demandés dans quelle mesure il serait possible d’automatiser cela.

Pour ce faire, il est nécessaire d’identifier les éléments des messages à partir de la structure typique de celui-ci :

  • Éléments de base (background) : je suis le gestionnaire de A à la société B.
  • Motivation : nous désirions nous servir des ressources C mais nous ne pouvons y accéder depuis notre domaine D.
  • Élaboration : y a-t-il une manière dont nous pourrions accéder à C via D.
  • Demande : le cas échant, comment ?

Une fois le système mis en place, l’université a analysé ses propres mails pour vérifier sa précision. Il est apparu que la réussite était variable : bien que 99% des coordonnées et 93%% des salutations aient été identifiées correctement, 49% des descriptions des problèmes ont été identifiées comme des informations de base. Cela est notamment dû au fait que la structure des messages n’est pas toujours identique.

Dans le futur, l’équipe souhaite affiner ses stratégies d’analyse/filtrage et ajouter des possibilités de structure.

Projections

De par les origines et backgrounds variés des intervenants comme du public, ce workshop aura permis aux participants d’échanger sur leur vision de l’email de demain.

Une idée semble toutefois être la base des développements : la sémantique. Analyse syntaxique, utilisations des métadonnées, communication avec d’autres services et logiciels sont autant d’éléments que l’on retrouvera très certainement dans la messagerie du futur. En espérant que les participants soient encore plus nombreux lors de la prochaine édition …

http://www.google.com/url?sa=t&source=web&cd=1&ved=0CBUQFjAA&url=http%3A%2F%2Fwww.kwaga.com%2F&ei=B6xbTu-pNc71sgaH-c3NCg&usg=AFQjCNFcVeMiziHIm3KIyt9xyhGN02s29w&sig2=LJdvlzlTImfFopknu24BuA

Post a Reply

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *