La
compression de données comme moyen de réduction des coûts, tel est l’argument marketing choisit par IBM pour pousser en avant la nouvelle version de InfoSphere Warehouse, son offre de data warehouse à base de DB2. Voila une attitude bien défensive de la part d’IBM face à la déferlante des annonces relatives au stockage en colonnes. Un comble alors que l’américain dispose de cette technologie avec SolidDB. Sa base « in-memory » reste donc (pour l’instant) reléguée au rôle de cache ou bien de solution de niche pour le temps réel. SolidDB pas prêt à jouer dans la cour des grands ? En tout cas IBM joue clairementla prudence et préfère généraliser la compression de donnée dans InfoSphere Warehouse 9.7 pour palier à l’un des défauts du modèle relationnel face au stockage en colonne : la volumétrie des données stockées.
Les chiffres clamés par IBM et ses « gentils » clients beta-testeurs sont impressionnants : un taux de compression de 83% constaté par Michael Henson de la SunTrust Bank, le moteur d’InfoSphere Warehouse, DB2 9.7 semble se montrer efficace. Il faut dire qu’IBM use et abuse de la compression de données pour donner le change aux bases en colonnes. La toute dernière version zippe (c’est une variante de l’algorithme Lempel-Ziv qui est implémentée) non seulement les données disque, les données en mémoire, les tables temporaiares, les index, les objets « large » y compris de type XML.

Outre cette optimisation à outrance du volume de stockage, IBM annonce des gains faramineux en terme de charge d’administration. Une partition connue depuis Oracle 10g à moins que ce soit 9i ? D’autre part, IBM annonce avoir soigné le stockage de l’XML (désormais en natif) et optimisé son traitement. Requetage sur du XML, compression (décidément!). Pas sur que DB2 fasse ici beaucoup mieux que SQL Server… Autre point où IBM entretient une certaine avance sur les « gros » du SGBDr, le Data Mining qui bénéficie de nouveaux assistants de type Wizard, de modèles pour déployer de l’ »Information as a service »… Enfin, IBM a amélioré le volet cube OLAP introduit dans InfoSphere Warehouse 9.5: Cubing Services for OLAP. Là encore c’est l’outillage autour des cubes qui est amélioré afin de créer, manipuler, exporter les cubes, avec les assistants qui vont bien.
Bref, IBM pousse le modèle relationnel dans ses derniers retranchements. Un dernier pas en avant avant le grand saut ?









bonsoir,
je voudrais savoir s’il est possible d’évaluer la taille de blocs mémoire utilisé lors de l’execution d’une requete dans un entrepot de données xml natif?
pour une base de données relationnelles ce sera (le nombre de lignes * nombre de colonnes )