InfoSphere
Streams, un ovni au catalogue IBM. Après le on-demand, le Saas, le BPO, le grid, le cloud voici maintenant le Stream Computing… Les plans de restructuration des éditeurs ne semblent pas rogner les ailes de leurs marketeurs. Avec à la clef un service en ligne proposé par IBM : System S. En gros, on envoie sur les serveurs d’IBM des giga octets de données, IBM exécute sur ces machines les algorithmes les plus fous… et vous livre le résultat. L’application la plus évidente de ce service, c’est le calcul scientifique comme l’attestent les exemples de clients qui ont pu mettre à profit System S. Néanmoins des applications « entreprise » sont possibles et IBM a choisi de commercialiser cette technologie sous forme de produit. Cet ovni, entre ETL, solution de CEP ou solution de calcul haute performance, c’est InfoSphere Streams.
Depuis 6 ans maintenant IBM Research propose un service de calcul en ligne aux instituts de recherche, aux universités. Un service répondant au doux sobriquet de « System S ». L’université d’Uppsala et l’institut suédois de physique spatiale sont clients pour analyser des données venues de l’espace… des flux de données 3D qui peuvent atteindre les 6 Gigaoctets à la seconde…
Autre application de System S, radicalement différente, l’institut de technologie d’Ontario qui prétend aider les médecins à détecter les naissances de prématurés avec plus de 24h d’avance : les futures mères sont connectées ( !) à System S, lequel reçoit en temps réel et en continu un flux de données contenant sa fréquence cardiaque, sa respiration. Les algorithmes moulinés par System S annoncent l’arrivée du prématuré. En remplaçant ces flux par des données telles que des cours de bourse, les transactions d’un site de eCommerce, les remontées de caisse de supermarchés, les données des machines sur une chaine de production et les applications de System S en entreprise semblent nombreuses. D’où le packaging produit proposé par IBM au sein de sa gamme InfoSphere.
Dans ce package on retrouve le runtime évidemment mais aussi un IDE sous Eclipse pour mettre en place les flux d’alimentation. Grande originalité de l’offre, la façon de coder les traitements. Point de Java, point de C/C++ ou encore moins de Fortran mais SPADE (Stream Processing Application Declarative Engine). Comme son nom l’indique, il s’agit d’un langage de haut niveau dans lequel on va décrire les traitements à appliquer sur les flux de données au moyen d’opérateur standard ou d’opérateur défini par l’utilisateur. En gros on définit une sorte de graphe d’opéraion élémentaires à appliquer, un peu comme on le fait en data mining. Sauf qu’avec InfoSphere Streams, c’est non seulement sur des données binaires qu’on va le faire, mais aussi sur des événements, des flux son, vidéo ou, pourquoi pas, HTML.
En parallèle au lancement du logiciel InfoSphere Sreams, IBM annonçait la mise en place du service pour l’Europe. Le data center IBM de Dublin se voitbombardé « IBM European Stream Computing Center ». Gesticulation de la comm d’IBM qui fait du neuf avec du vieux, ou vraie nouvelle catégorie de middleware, à vous les entreprises de le dire !








