A l’heure des comptes, l’Open Source commercial n’est pas toujours la meilleure solution.
Une nouvelle rubrique fait son apparition sur Le Grand BI : Le DSI Mystère. C’est le témoignage d’un responsable informatique sur son expérience BI. Un témoignage où ni son nom ni le nom de sa société n’apparait pour que les langues se délient.
Notre premier DSI mystère est responsable des opérations dans une start-up. Comme beaucoup de jeunes sociétés, celle-ci a démarré son activité avec des solutions Open Source. Linux, MySQL, PHP sont au cœur de son SI. Or dans son activité, la publication d’annonces, notre responsable des opérations doit intégrer au quotidien de plus en plus de fichiers des plus divers, l’ETL est au cœur de l’activité de la société. Notre responsable va évaluer les offres Open Source Commerciales et les logiciels traditionnels et contrairement aux idées reçues, il va opter pour Informatica, un ETL commercial réputé onéreux. Une solution qu’il juge au final moins couteuse que l’alternative Open Source Talend.
« Avec notre ETL Open Source gratuit, il nous fallait de 3 semaines à 1 mois de travail pour intégrer un nouveau flux de données » déplore-t-il « nous devions couramment développer en Java ou bien en script php lorsqu’il fallait consommer des Web Service ». Bref, le responsable se devait d’industrialiser au plus vite ses flux ETL, d’autant que la start-up, créée en 2008, doit maintenant passer à la dimension Européenne. Une multiplication des formats de données exotiques se profile à l’horizon : « La direction voulait s’ouvrir à l’Europe. Or pour nous, plus de partenaires, c’était clairement plus de maintenance ». Car la startup n’est pas en position d’imposer des formats de données unifiés à ses partenaires (une douzaine à ce jour). De fait, elle se voit contrainte d’attaquer les Web Services mis à disposition par certains (pas l’idéal pour des traitements de masse) ou bien de manipuler des fichiers de toutes sortes et intégrer des formats de données très divers, avec des fichiers parfois truffés d’erreurs de saisie (lorsque celle-ci est effectuée par les internautes eux-mêmes).
Le nombre de flux est amené à exploser rapidement
D’autre part, si les volumétries en jeu ne sont pas colossales (10 Go chargés en base de données chaque nuit), ce volume est amené à exploser à l’avenir alors que le nombre de partenariats passés par la startup s’accroît. Ainsi, le nombre d’annonces publiées, 120.000 actuellement, doit doubler d’ici à la fin de l’année.
Autant d’éléments qui vont amener notre responsable à chercher un ETL de classe entreprise pour assurer la croissance de l’entreprise sans devoir multiplier les embauches pour faire face à l’afflux de données à traiter. « Nous ne pouvions clairement plus continuer sur une solution Open Source gratuite, il nous fallait une solution supportée par un éditeur » explique le responsable qui va confronter tant les solutions traditionnelles qu’Open Source commerciales. Celui-ci s’est notamment appuyé sur un benchmark des ETL disponibles et contre toutes attentes au vu de la culture Open Source de la société il va privilégier la piste Informatica à Talend. « Informatica est le plus apte car il offre une multiconnectivité de base » s’explique le responsable qui a en outre apprécié le retour rapide de l’éditeur qu’il n’a pas retrouvé chez son concurrent Open Source. Un choix difficile pour la jeune société car l’investissement est conséquent. Le prix catalogue de la plate-forme Informatica est de 40000 euros. Un prix que sont prêts à payer les grands comptes, les clients traditionnels d’Informatica, mais difficile à avaler pour une startup Internet. Dans le cas qui nous occupe, le projet ETL ne représente pas moins de 20% du budget informatique de la société ! Le responsable des opérations s’explique : « Le choix d’Informatica nous coute nettement moins cher que l’Open Source. L’investissement initial est conséquent, c’est vrai mais en coût de maintenance opérationnelle cette solution nous revient bien moins cher que son concurrent Open Source. Passé l’amortissement des licences nous gagnons de l’argent ».
Ce que le client perd en devant s’acquitter des licences, il le gagne ici dans la maturité du logiciel comme le souligne notre responsable : « Nous avons été agréablement surpris par la solution, notamment ses outils très intuitifs. C’est notamment le cas pour le traitement des Web Services qui est automatisé ». La migration vers l’ETL Informatica est en cours : « pour un investissement de l’ordre de 35 jours/hommes, nous avons refait 80% de ce que nous avions développé jusque là » se félicite-t-il. Il espère boucler sa migration mi-décembre soit 3 mois après l’acquisition des licences Informatica.









Le DSI « mystère » de XXXXX [NDLR: j'ai retiré le nom de la société cité par Yves de Montcheuil pour protéger l'anonymat de mon DSI mystère], Informatica le ressert à toutes les sauces… XXXXXXXX. Le plus intéressant, c’est de voir à quel point Informatica est désespéré de regagner les parts de marché qu’ils perdent, en cassant leurs prix à ce point.Talend ne gagne pas 100% des deals contre Informatica, comme XXXXXX le prouve. Mais on en gagne beaucoup plus qu’on en perd…
Tout besoin a sa solution.J’ai souvent vu des proc stoc et/ou des dev Java, .Net , SSIS, Powerbuilder (??!!?? ) qui font très bien l’affaire. Pas besoin d’Informatica , ni de Talend d’ailleurs.Le titre de l’article par contre je le trouve TRES tendentieux. Si l’on a 1 cas particulier sur 1000 ou Talend est plus cher qu’Informatica, c’est pas une règle , mais justement la fameuse exception qui…confirme la règle.Bonne..euh..continuation
La comparaison n’est pas valable : il y a d’abord la découverte de Talend et des flux à faire, apparement sans formation, puis l’utilisation d’Informatica avec cette fois-ci formation (obligatoire) et de plus reengenering des flux déjà faits. Et on sait tous qu’une fois un développement fait, on pense le refaire en 3x moins de temps ! C’est un peu l’inconvénient marketing de l’open source : c’est disponible, c’est gratuit, il y a de la doc en ligne et des forums, alors beaucoup croient qu’ils vont y arriver tous seuls. Mais ils n’y arrivent pas et critiquent ensuite le logiciel, à tort.Ce n’est pas parce que le logiciel est gratuit que ce n’est pas un investissement, et donc que ca ne nécessite pas une démarche professionnelle : formation, POC, pilote, …Maintenant, Informatica est un bon ETL avec des fonctionnalités avancées probablement différentiatrices par rapport à Talend, mais je ne crois pas qu’il soit nativement plus performant sur de simples transformations de données.
Votre « DSI mystère » a été cité avec son nom et sa société dans un autre article, de quel anonymat parlez-vous?
Je trouve que cet article est contre efficient pour informatica. Un peu comme si ils devaient faire de la pub et solder leur produit à 40k pour parvenir à lutter contre Talend.Un mauvais article en fait, qui casse l’Open Source qui se cherche un modèle économique favorisant son développement industriel, sur de mauvais arguments et dévalorise les éditeurs classiques en les montrant à l’agonie.A chaque client ses problématiques et contraintes à mettre en face du bon produit adapté et efficace. Je pense que si les clients étaient moins concentrés sur leurs processus achats et plus impliqués sur leur fonctionnel nous n’aurions pas ce genre de débats stériles. Mais comme aujourd’hui seul les budgets comptes et que ni les SSII, ni les éditeurs ne peuvent plus tirer les clients vers le haut en faisant vraiment du conseil, nous assistons à ce genre de réglements de comptes moisis par buz anonymes interposés. LAMENTABLE !
Il y a longtemps que tout le monde sait (ou devrait savoir) que le coût des licences ne représente qu’un élément parmi d’autres du prix de revient d’un projet, et ne doit pas être le critère principal de choix d’un logiciel libre. Cela dit, je subodore une certaine dose de naïveté dans ce témoignage. À en croire notre DSI mystère, l’intégration d’un nouveau flux de données, qui coûte entre trois semaines et un mois de développement avec Talend, serait pour ainsi dire gratuit avec Informatica. Je crains qu’il ne s’expose à quelques surprises dans les prochains mois. La gamme Informatica est excellente dans sa catégorie, mais elle ne comporte de générateur auto-magique de règles de filtrage et de conversion, et ne dispense pas d’une procédure de configuration de chaque connecteur. La prise en charge de chaque nouveau flux, quel que soit l’outil, représente entre quelques heures et… quelques mois ! La partie ETL reste, dans la plupart des projets de BI, le plus gros générateur de développements spécifiques et de dérives imprévues, et ce n’est pas en payant une licence très cher qu’on s’affranchit de cette réalité.Notre DSI reste sur le terrain des hypothèses non vérifiées à propos de la montée en charge future. Les volumes vont exploser et on semble considérer que, avec Informatica, ce sera gratuit ou pas loin. Cela mériterait quelques éclaircissements, surtout quand on sait que l’ETL de Talend est un générateur alors qu’Informatica est un moteur. Les performances de Talend (à l’exécution) sont en réalité celles du code généré sur le serveur (ou la ferme de serveurs, avec l’option MPx). Avec Informatica, c’est du code Informatica qui exécute les traitements, et qui doit être déployé en production (et ce déploiement n’est pas moins coûteux qu’un autre).Indépendamment des tarifs comparés entre Talend et Informatica, il existe un autre élément différenciateur. Avec le premier, on a les moyens de se renseigner et d’évaluer l’outil avant de passer à la caisse. Avec le second, il faut payer d’abord et voir ensuite, ce qui signifie que la compétence (que je salue au passage) des ingénieurs commerciaux et avant-vente de l’éditeur compte autant dans les décisions d’achat, sinon plus, que les retours d’expérience. C’est pourquoi l’avis d’un DSI mystère qui aurait une expérience comparative d’un an ou deux me convaincrait plus que celui de quelqu’un qui est encore tout frétillant de sa récente décision. Mais c’est peut-être une vue de l’esprit, car je vois mal un DSI venir proclamer « j’ai remplacé Talend par un ETL plus cher et ça n’a pas apporté grand chose ». Autant il est facile, à propos d’un logiciel libre, de dire « j’ai essayé et finalement ça ne convenait pas », autant il est politiquement délicat d’avouer « j’ai acheté un logiciel propriétaire et je me suis planté ». C’est pourquoi les retours d’expérience négatifs de logiciels non libres demeurent quasiment invisibles dans les media, les DSI devenant généralement (prudence oblige) les alliés de leurs fournisseurs.
Informatica est un ETL qui a énormément de points positifs. Il me semble cependant qu’il soit ici mal comparé à Talend, dans un contexte un peu différent.Je rejoins donc totalement Badr Chentouf sur le point « on sait tous qu’une fois un développement fait, on pense le refaire en 3x moins de temps ! »Tout projet ETL d’envergure sur un nouvel outil demande un investissement qui a un coup, quelque soit l’outil. Privilégier l’open-source est privilégier une philosophie et faire des économies sur certains points, ce n’est pas avoir la possibilité de tout faire tout seul dans son coin avec juste un Google.J’espère finalement que le choix de l’outil a fait sur les fonctionnalités.Cela soulève néanmoins le problème de disponibilité de ressources qualifiées sur l’open-source : à 40k les licences, il y avait moyen de s’offrir une bonne formation et une aide au développement ! Cette solution a t-elle été envisagée ?Enfin, remarques sur l’article : le point de l’anonymat, est ce uniquement pour attirer le chaland ?Cette rubrique a t-elle pour but de devenir le « Gala » du décisionnel français ? Voila qui fait rêver…Thomas MalbauxCogoobihttp://www.cogoobi.com
Plusieurs points.
« L’anonymat : Le responsable en question m’a bien fait comprendre qu’il
ne voulait pas être au centre d’un affrontement Talend/Informatica. »Marrant, pourtant il a accepté d’être cité ici:http://www.lemagit.fr/article/etl-qualite-opensource-informatica-talend-open-source-rachats-mdm-diard-cep/4813/1/informatica-voit-dela-extraction-donnees-pour-repousser-menace-open-source/Et au fait, qui êtes-vous, « LeGrandBI »?
Je vous retourne le compliment : très marrant de vous voir vous et votre sympathique investisseur Marc Brandsma de Chausson Finance repositionner systématiquement le débat sur la forme pour éviter à tout pris d’évoquer le fond. Tant que vous resterez sur ce plan je ne perdrai plus mon temps à vous répondre, c’est totalement stérile et sans intérêt. D’autant plus que, personnellement, je trouve l’aventure Talend passionnante et votre offre produit extrêmement intéressante. Mais c’est pas une raison pour censurer une entreprise qui n’est pas d’accord (c’est bien ce que vous demandez, non ?)
Qui parle de censure? C’est vous qui avez censuré mon premier commentaire! Qui parle de dénonciation? Resavacs est libre de choisir qui ils souhaitent comme fournisseur d’ETL. Et s’ils préfèrent Informatica, ils ont certainement leurs raisons, et je leur souhaite de réussir leur projet. Qui parle de complot? Je ne pense pas qu’Informatica fasse des bidouilles dans ce genre. Ce sont des pros, que je respecte même si nous sommes concurrents.
Ce que je ne comprend pas, et qui m’a poussé à régir, c’est ce « mystère » bidon alors qu’Informatica utilise ce client comme référence « à visage ouvert ».
Je n’ai pas de temps à perdre à essayer de deviner qui vous êtes. Restez caché derrière votre blog anonyme. Mais vous seriez plus crédible à visage ouvert.
Bonsoir,Je trouve que ce thème de DSI mystère est bien choisi car il crée le débat !@Yves de Montcheuil: l’identité de l’auteur du blog, un réel intérêt? Je trouve au contraire que les posts sont plutôt objectifs, ne pensez-vous pas?
Ah voila un bon débat bien stérile sur un excellentissime blog. Merci LeGrandBI et surtout continue ce travail (et les jolis dessins).Je pense, outre les petites amabilités, qu’on devrait se pencher sur les éléments clefs du débat. D’abord Informatica est désormais vendu comme une plateforme de data intégration et offre bien plus qu’un ETL. J’ai eu la chance de discuter avec cette société et il est clair qu’ils font tous pour intégrer tous leurs outils et pour offrir une expérience utilisateur maximale.Donc, l’usage d’informatica peut aider à améliorer les temps de développements et réduire les couts de code spécifique. Rien de bien extraordinaire, tout le monde aurait pu le dire. Enfin, Informatica a changé son modèle de prix pour pousser la vente de la plateforme, plutôt que chaque élément. Il est donc possible que pour certains clients, les couts ne soient plus prohibitifs.Talend est une plateforme performante mais encore en évolution. Ce qu’elle offre en ouverture, qualité et flexibilité, elle ne l’offre pas toujours en facilité d’usage. Par contre, elle adopte un modèle ou tout le monde peut participer et qui offre un prix d’entrée de 0. Si vous regardez à quelle vitesse Talend a produit un outil d’une telle qualité, je crois que cela demande du respect …Voila mon conseil: « Toujours tester les deux plateformes, pour votre besoin particulier, sur vos données avec vos volumes et sur votre réseau. Puis négocier tarifs et maintenance (faites le tous les ans). Et faites votre choix.Mais surtout, n’oubliez pas que l’ETL c’est fini … On parle intégration de données maintenant (ce n’est plus le même domaine …).