Interviews de dirigeants

Stockage & traitement : dans la marmite « big data » d’InfoVista

InfoVista_Philippe_Ozanian_Apax_Partners2InfoVista est le leader mondial des solutions logicielles pour la gestion de la performance des réseaux de télécommunication. Depuis plus de 10 ans, la société travaille sur la question du traitement des données. Les conclusions de Philippe Ozanian, PDG d’InfoVista.

 

Le big data dans l’ADN d’InfoVista

« Le big data est inscrit dans notre ADN, on est tombé dans la marmite quand on était petit » plaisante Philippe Ozanian. En effet, de par sa mission même d’optimisation des réseaux de télécommunication, InfoVista est amenée à traiter quotidiennement un volume considérable de données. « En 10 ans, poussés par l’explosion volumétrique des datas de nos clients comme China Mobile, nous avons fait de la puissance du traitement des données une de nos priorités ». Le crédo d’InfoVista ? Faire en sorte que les réseaux fonctionnent parfaitement malgré l’afflux de plus en plus massif des datas.

 

La donnée ne vaut rien, seules comptent les corrélations

Mais de quelles données parle-t-on à travers le terme si galvaudé de « big data » ? Philippe Ozanian en différentie deux types : les données structurées et les données non structurées. Les premières sont celles dont l’ensemble des valeurs possibles est déterminé et connu à l’avance. Par exemple, une base de données rassemblant les résultats d’une enquête d’opinion : âge, sexe, géographie etc. Les secondes sont à priori impossibles à catégoriser, comme des réponses textuelles à un questionnaire de satisfaction client.

Mais la donnée brute n’est pas suffisante. « La donnée, qu’elle soit structurée ou non, ne représente rien en tant que telle ». Le PDG d’InfoVista entend par là que seules les corrélations dégagées de l’exploitation des données sont intéressantes. Pour cela, il prend l’exemple d’un sac de 30 balles de tennis. « Savoir qu’un sac contient 30 balles n’a aucun intérêt. Par contre, savoir que 15 balles sont usées et que ces 15 balles ont toutes un diamètre de 6,35 cm permet de faire une corrélation entre la taille de la balle et son facteur d’usure. C’est cette corrélation qui vaut de l’or pour l’entreprise ». Philippe Ozanian précise enfin que toutes les données ne sont pas corrélables. Une catégorisation de celles-ci est alors nécessaire pour identifier les datas exploitables et celles non exploitables. « Aujourd’hui, seules 5% des données totales mondiales sont utilisées ».

 

La question du stockage et du traitement des données

Une fois les données utiles repérées, il faut les stocker. InfoVista utilise principalement Hadoop, une base de données d’insertion massive utilisée pour traiter de très fortes volumétries de données. Ensuite, il convient de leur donner du sens. C’est là qu’interviennent les data scientists, ou spécialistes de la donnée, qui créent les algorithmes pertinents. InfoVista bataille pour recruter les meilleurs. La société travaille également avec un des leaders du secteur, Oracle, sur les toutes dernières technologies de segmentation verticale (charding) et horizontale. La première consisterait à ranger une bibliothèque par thématique (science, géographie etc.). La seconde, par ordre alphabétique. « Les télécoms ne veulent plus être seulement un tuyau par lequel circule la donnée, mais souhaitent à présent en capturer la valeur. Nous les accompagnons dans cette démarche en nous appuyant sur les toutes dernières technologies de big data ».

 

Une course à l’innovation

« Une course à l’innovation est à l’œuvre autour du big data. Il y a une vraie bataille actuellement, avec des acteurs comme Google et Facebook très en avance, et des acteurs historiques comme Oracle et IBM qui font tout pour les rattraper ». De son côté, InfoVista n’hésite aujourd’hui pas à racheter des sociétés spécialistes des datas. Philippe Ozanian cite trois acquisitions récentes externes : Mentum au Canada, Axeo en Malaise et Ipanema Tech en France. Mais l’innovation se fait aussi à l’intérieur de l’entreprise : « afin d’encourager l’innovation en interne, nous organisons également des journées de l’innovation où les développeurs « posent le crayon » pour inventer les technologies de demain ».

La marmite big data d’InfoVista n’a pas fini de bouillir…