La société Pentaho [3] fournit depuis 2005-2006 une suite d'outils dédiés à l'informatique décisionnelle. Cette suite contient notamment deux logiciels développés en langage java :
Kettle, développé sous une licence LGPL, est un outil ETL pour intégrer des données provenant de sources hétérogènes vers un entrepôt de données (voir "Section 1.3.1"). Kettle manipule les types de données classiques SQL (entiers, chaînes de caractères, etc.) ;
Mondrian, sous licence CPL, est un serveur OLAP, il permet de traiter des requêtes multidimensionnelles sur un entrepôt de données. Il propose une extension du langage de requêtes multidimensionnelles MDX (Multi-Dimensional eXpressions) et permet d'interroger via des connexions JDBC (Java Database Connectivity) des bases multidimensionnelles implémentées suivant une structure ROLAP.
![]() | |
[en ligne] LGPL : Gnu Lesser General Public License (consulté le 26 mai 2009). [en ligne] CPL : IBM Common Public License (consulté le 26 mai 2009). |
La suite de logiciels de Pentaho est actuellement une référence pour les produits voués au géodécisionnel : tableaux de bords, datamining, SOLAP. Les deux sous-sections suivantes présentent quelques projets Open Source liés à SOLAP en les répartissant suivant deux groupes, cette répartition étant relativement arbitraire car de forts liens existent entre ces différents projets.
Le groupe de recherche GeoSOA [4] (dirigé par Thierry Badard à l'Université de Laval Québec) développe actuellement deux logiciels à partir respectivement de Kettle et Mondrian :
GeoKettle : un outil ETL supportant les données spatiales (sous licence LGPL, comme Kettle) ;
GeoMondrian : un serveur OLAP spatial (sous licence CPL, comme Mondrian).
GeoKettle est donc l'extension de Kettle pour optimiser la gestion des données géospatiales.
Un objectif de GeoKettle est de supporter à terme les différents formats de données géospatiales hétérogènes fournis par les principaux SIG : fichiers constructeurs (.MIF/MID
pour MapInfo ;
.shp
pour ArcInfo), fichiers au format XML (GML Geography Markup Language, KML Keyhole Markup Language) et bases de données spatiales. PostGIS, Oracle Spatial et MySql
sont ainsi supportés depuis la version 3.1.0 du 3 novembre 2008.
Entre autres évolutions, la version 3.1.0 de GeoKettle définit un nouveau type de champ pour transformer et charger les données géospatiales dans un entrepôt de données spatiales : le type Geometry
.
Ce type d'objet est directement implémenté en se basant sur l'API (Application Programming Interface) JTS (Java Topology Suite [5]).
L'intégration de cet API contribue à une amélioration significative des performances de l'outil et permet également l'utilisation efficace de fonctions topologiques (intersection, égalité, inclusion, chevauchement, "touche", etc).
En outre, cette distribution permet la lecture des fichiers Shapefiles du SIG ArcView. GeoKettle interprète les champs numériques représentant les coordonnées en tant qu'objets du type Geometry
.
Le support en lecture seule de ces Shapefiles est réalisé grâce au projet Open Source GeoTools
[6].
Le support en écriture de ce format (ainsi que des formats MapInfo TAB, GML) est prévu pour la prochaine distribution dont une présentation était prévue pour le 15-16 mai 2009 [19].
Une petite démonstration de l'outil en action est d'ores et déjà disponible en ligne (voir annexe Sélection de liens utiles).
GeoMondrian est l'extension du serveur OLAP Mondrian pour la gestion des dimensions géométriques. Les objectifs de GeoMondrian sont :
d'implémenter nativement sur Mondrian un type de données "MDX géospatial", permettant ainsi : d'uniformiser la manipulation des données géographiques en s'affranchissant de la base de données spatiales utilisées ; de développer des extensions pour faciliter les analyses et les fonctions d'agrégation spatiales ;
de finaliser une solution géodécisionnelle complète avec le développement d'un client Web tableau de bord combinant tableaux croisés, diagrammes et affichages cartographiques.
GeoMondrian devrait donc devenir le premier serveur SOLAP Open Source manipulant nativement les requêtes multidimensionnelles spatiales. Une vidéo démonstration en ligne (voir l'annexe Sélection de liens utiles) permet de voir GeoMondrian en action à travers un prototype de tableau de bord analytique spatial. On peut espérer la sortie prochaine d'un outil SOLAP basé sur GeoMondrian : Spatialytics. Initialement développé dans le cadre d'un projet Google Summer of Code (2008), Spatialytics fait actuellement l'objet de recherches au sein du groupe de recherche GeoSOA. Spatialytics est le composant client pour visualiser les données SOLAP, il utilise OpenLayers comme module cartographique. Spatialytics et GeoMondrian feront l'objet de démonstrations lors de leur présentation à FOSS4G 2009 (Free and Open Source Software for Geospatial, du 20 au 23 octobre 2009 à Sydney [en ligne] http://2009.foss4g.org/ (consulté le 20 mai 2009).
GeoBI (GeoSpatial Business Intelligence) est "un" projet Open Source soutenu par la société INOVA [7]. Comme son nom le suggère, l'objectif de GeoBI est de réunir les deux mondes des SIG et de l'informatique décisionnelle. INOVA concentre son attention sur les technologies java et les standards de l'OGC® (WMS, etc.), les produits d'intégration géodécisionnelle (Pentaho, GeoKettele, GeoMondrian) et les produits des SIG Web OpenLayers, Mapfish et Geoserver.
Le projet GeoBI se compose actuellement de trois modules : GeOLAP (pour la visualisation de résultats d'analyses multidimensionnelles sur une carte via le Web), GeoReport (génération de rapports, diagrammes et indicateurs sur cartes, via Web) et GeoETL (outil ETL) [20].
Le module GeOLAP hérite d'un prototype développé en 2008 par CampToCamp [8]. Ce prototype peut se classer dans la catégorie du "SIG-dominant", les efforts ayant été volontairement ciblés sur les capacités cartographiques de la solution, mais l'utilisateur dispose de fonctions pour forer et remonter parmi une hiérarchie spatiale (une dimension région). Plusieurs mesures sont disponibles (des indicateurs socio-démographiques), elles sont représentées sur la carte par des symboles cliquables renvoyant sur un diagramme camembert (Figure 2.2) pour visualiser plus précisément les données numériques. Ce prototype constitue une base pour GeOLAP, il a permis d'identifier des besoins et de transférer une partie des technologies employées pour de plus ambitieux résultats. Ceux-ci nécessitent notamment la possibilité d'intégration d'objets géométriques à tous les niveaux de hiérarchies des dimensions de la base multidimensionnelle, et la capacité pour le serveur (S)OLAP de les récupérer et les renvoyer au client (d'où la collaboration avec GeoMondrian).
Figure 2.2. Interface du prototype de CampToCamp
L'utilisateur choisit une région et un indicateur. Les mesures sont représentées sur la carte par des symboles cliquables pour afficher des camemberts. Source : [20].
Quant au module GeoReport, il propose la génération de cartes thématiques choroplèthes ou valuées par des symboles de proportionnalité permettant l'affichage d'analyses alphanumériques provenant du monde décisionnel. Il permet d'afficher ensuite des diagrammes en camembert en cliquant directement sur des symboles représentés sur la carte. GeoReport et Spatialytics vont être prochainement (dans le cadre du Google Summer of Code 2009) intégrés dans une application unique.
Figure 2.3. Interface GeoReport
Carte satellite affichant des points de différentes couleurs suivant les ventes. Source : [20].
[3] Pentaho Open Source business intelligence [en ligne] http://www.pentaho.com (consulté le 15 mai 2009).
[4] GeoSOA [en ligne] http://geosoa.scg.ulaval.ca/ (consulté le 15 mai 2009).
[5] JTS Topology Suite [en ligne] http://www.vividsolutions.com/jts/jtshome.htm (consulté le 15 mai 2009).
[6] GeoTools The Open Source Java GIS toolkit http://geotools.codehaus.org (consulté le 20 mai 2009).
[7] Inova open solutions [en ligne] http://www.inovaos.it/ (consulté le 20 mai 2009).
[8] CampToCamp Open Source basecamp [en ligne] http://www.camptocamp.com/ (consulté le 20 mai 2009).