Le concept OLAP répond aux besoins analytiques en s'appuyant sur une conception multidimensionnelle des bases de données, il s'oppose sur ce point aux SGBD dits transactionnels sur lesquels reposent les systèmes d'information géographique. Les bases de données multidimensionnelles OLAP ne permettent cependant pas la gestion des données géométriques et la représentation cartographique des données. Le concept SOLAP vient donc combiner les deux approches SIG et OLAP (Figure 1.5) en permettant d'intégrer les données géographiques aux bases de données multidimensionnelles :
Figure 1.5. Positionnement des outils vis à vis de l'information
Position relative des différents outils selon la nature de l'information et ses niveaux d'agrégation. Source : [12]
SOLAP ne vise pas à remplacer les SIG, qu'ils soient Web ou en application de bureau, il propose des fonctions supplémentaires en supportant la structure multidimensionnelle. Les deux outils SIG et SOLAP se distinguent essentiellement par la convivialité, la vitesse d'exécution des requêtes et le niveau de détails qu'ils supportent nativement. Quant au bénéfice de SOLAP sur l'OLAP traditionnel, il repose notamment sur la possibilité d'agrégations sur des données spatiales. Un système SOLAP permet de gérer trois types de dimensions spatiales (Figure 1.6) :
descriptive : les membres de la dimension ont une référence spatiale textuelle (nom de lieu par exemple). Note : cette dimension est la seule pouvant être gérée par des outils OLAP classiques ;
géométrique : à tous les niveaux des hiérarchies d'une dimension, les membres ont une composante géométrique référencée dans l'espace ;
mixte : combinaison des deux premières, certains membres comportent une composante géométrique, d'autres une référence spatiale nominale seulement.
Figure 1.6. Représentations des dimensions spatiales gérées par SOLAP
Le Canada est représenté ici par des hiérarchies basées sur des dimensions spatiales, de gauche à droite : descriptive, géométrique et mixte. Source : à partir de [13]
A partir de l'intégration de ces dimensions spatiales dans la base multidimensionnelle, SOLAP va permettre deux types de mesures :
Une mesure spatiale correspondant à un ensemble de coordonnées : intersection ou union d'une sélection de plusieurs formes géométriques parmi plusieurs dimensions choisies. Par exemple, une mesure spatiale peut consister à déterminer les polygones agrégés résultats d'intersections entre une combinaison de positions d'une dimension "végétation" et d'une dimension "géologie". Ces opérations peuvent nécessiter de stocker dans la base multidimensionnelle des pointeurs vers des structures géométriques externes (dans une autre structure ou un logiciel).
Une mesure topologique : distance, surface ou "nombre de voisins". Les dimensions spatiales peuvent être organisées de façon à proposer les résultats de ces opérations topologiques suivant des hiérarchies : par exemple une opération d'adjacence pourra être décomposé en deux sous-niveaux, "adjacence par plusieurs points", "adjacence par un point".
Les outils SOLAP représentent donc une nouvelle famille d'outils, conçus comme des applications clients (Web ou bureau) exploitant les cubes de données (détaillées et agrégées) construits à partir des entrepôts de données spatiales. L'architecture d'un système SOLAP s'articule de façon analogue à celle d'un système OLAP, suivant trois tiers, comme représentés sur la Figure 1.7.
Figure 1.7. Possibilités d'architecture SOLAP
Le tiers "Architecture corporative" correspond à la base multidimensionnelle. Le tiers "système opérationnel" au concept OLTP. Source : à partir de [4]
En plus des diagrammes et tableaux alphanumériques disponibles nativement dans le système OLAP, le système SOLAP va donc permettre à l'utilisateur une nouvelle représentation des données sous la forme de carte(s). Grâce à l'intégration des dimensions spatiales, l'utilisateur dispose des opérateurs OLAP pour interagir avec ces données, par des simples clics de souris : forage, remontage (Figure 1.8), forage latéral (Figure 1.9), pivot (Figure 1.10).
Figure 1.8. Les opérateurs de forage et remontage sur des dimensions spatiales
En deux clics, l'utilisateur passe d'un niveau général à un niveau local (en rouge, drill-down), ou inversement (en bleu, roll-up). Source : à partir de [12].
Figure 1.9. L'opérateur de forage latéral sur une dimension temporelle
L'utilisateur navigue ici parmi les membres d'un même niveau (drill-across). Source : [12].
Figure 1.10. L'opérateur de pivot sur des dimensions spatio-temporelles
L'utilisateur "pivote" ici les lignes et colonnes du tableau de données spatio-temporelles. La représentation cartographique est modifiée en conséquence. Source : à partir de [15].
Le Tableau 1.2 résume les principales différences entre l'approche transactionnelle dite OLTP (On-Line Transaction Processing) des SIG et l'approche SOLAP, en considérant les usagers visés, les processus, le type et l'architecture des données [13] et [4].
Critère | OLTP-SIG | SOLAP |
---|---|---|
Type d'usage | Niveau opérationnel | Niveau décisionnel |
Pré-requis | Connaissance d'un langage de requête (et du modèle de données) et des fonctions SIG | Etre à l'aise dans la navigation de type hyper-lien |
Apprentissage | Jours | Heures |
Construction des requêtes | Hétérogène : SQL et fonctions SIG | Homogène : clics de souris |
Temps d'exécution des requêtes | Variable : dépend de la complexité, du nombre de tables mises en jeu dans les jointures | Stable : peu importe la complexité grâce à la structure multidimensionnelle |
Exploration des données | Discontinue (hétérogénéité SQL-fonctions SIG + temps d'exécution) | Continue grâce aux opérateurs de forage et du temps d'exécution |
Priorité | sécurité et intégrité des données | analyse et exploration des données |
Optimisé sur | le rapport espace de stockage sur quantité de données. | le temps de réponse aux requêtes |
Finesse des données | Détaillées | Détaillées et agrégées |
Temporalité | Uni-époque | Multi-époque |
Technologies | Relationnelle | Relationnelle ou multidimensionnelle |
Architecture | Bases de données normalisées, pas de redondance | Redondance des données encouragée pour des gains de performance |
Volume de données | Espace minimisé par la structure normalisée | Grand volume engendré par le stockage des agrégations |
Source de données | Acquisition de données | Intégration sous la forme d'un entrepôt ou marché de données |
Gestion de l'historique | Par la mise à jour des occurrences | Par l'ajout de nouvelles données (historique conservé) |
Mise à jour | fréquente (transactions) | contrôlée (données pré-agrégées en mode lecture) |