Les vraies performances des ETL en question

Commercial ou Open Source ? Manapps vient de publier une mise à jour d’un benchmark très contesté sur les performances de 5 ETL. Fin 2008, une première volée de test avait clairement placé l’ETL Open Source édité par Talend en tête devant les ETL d’IBM, celui de Pentaho et surtout d’Informatica. Le leader mondial de l’ETL se voyait assassiné dans les tests, ce qui allait déclencher un torrent de réactions sur le Web. Certains soulignaient la faiblesse des volumétries mises en jeu dans le test, la légèreté de la plate-forme et la proximité entre les testeurs de Manapps et le staff Talend, tous deux parisiens…
Une nouvelle version de ce test vient d’être mise en ligne par le cabinet de consulting, avec une méthodologie revue. Avec à la clef des performances nettement modifiées, en particulier pour Power Center, l’ETL Informatica. Et vu les écarts de mesures entre les deux versions du rapport, il y avait effectivement un problème dans le document initial. Pour apaiser les passions autour de son bench et sauver la face par rapport à ce revirement, Manapps précise sur son site Web que la version initiale du benchmark reprise partout sur le web n’était qu’une version de travail indûment publiée sur le Web… Admettons. Voici ce qui ressort de la version « officielle » publiée sur le site de Manapps.
L’étude « nouvelle formule » évalue les performances d’IBM Datastage Server 7.5, de Datastage PX 7.5, de Talend Open Studio 2.4.1, d’Informatica 8.1.1 et de Pentaho Data Integrator 3.0.0. Le bench porte sur 11 tests différents, de complexité croissante avec des volumétries de données identiques au premier test et malheuresement en gardant un simple PC de bureau sous xp comme machine de test.
Là où la première version du dossier donnait seulement les durées d’exécution, la version actuelle du document attribue des notes en fonction des résultats obtenus pour établir une hiérarchie synthétique. Et à ce petit jeu c’est… Informatica qui s’en tire le mieux. L’américain obtient désormais la meilleure note globale, devant Talend, les deux ETL IBM (Datastage PX devance Datastage server) et enfin Pentaho qui clôt le classement.
D’un test à l’autre les résultats apparaissent comme homogènes. L’ETL Pentaho (Kettle) voit ses résultats beaucoup moins linéaires alors que les volumétries augmentent. Certains tests n’ont pu être menés sur ce logiciel Open Source. IBM Datastage Server présente sur certain tests des performances décevantes, notamment sur des faibles volumétries (sur les tests 10 et 11). Talend, grand vainqueur de la version préliminaire du rapport dont cette fois céder la première place à l’ETL Informatica qui le devance nettement sur certains tests (7 et 8 notamment).

Si, au final, le test sert Informatica, qui est le numéro 1 mondial de l’ETL et qui délivre ici l’outil le plus efficace des 5 offres étudiées, le constat est plus mitigé pour le clan Open Source. Pentaho a souffert lors du test. De son côté Talend peut se satisfaire de ses résultats : il rivalise avec le leader de son marché et devance les solutions d’IBM. Toutefois les supporters d’Informatica souligneront une nouvelle fois la modestie de la plate-forme de test. Talend rivalise certes, mais sur un Pc de bureau… qu’en serait-il sur de puissantes machines multi-processeurs ou sur des configuration plus complexes avec plusieurs machines en ligne. La question reste encore ouverte.
Le benchmark peut être téléchargé gratuitement sur le site du cabinet de consulting.

 Manapps, rubrique benchmark

Article liés

Ce contenu a été publié dans Benchmark, Etude, avec comme mot(s)-clef(s) , , , , , . Vous pouvez le mettre en favoris avec ce permalien.

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

*


*

Vous pouvez utiliser ces balises et attributs HTML : <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>