Gestion des données
La gestion des données dans SEI est la stratégie et les outils utilisés pour accéder, organiser et rapporter les données à travers divers systèmes et environnements. Que vous travailliez avec un seul ERP, consolidiez plusieurs systèmes d'entreprise, connectiez des données hébergées dans le cloud, ou analysiez des enregistrements transactionnels à fort volume, SEI fournit des méthodes éprouvées pour garantir performance, scalabilité et facilité d'utilisation dans chaque scénario de rapport.
Cette section sert de guide pour choisir la bonne approche de gestion des données, en associant des scénarios opérationnels courants aux outils et configurations qui leur correspondent.
Outils de gestion des données
| Outil | Description |
|---|---|
| DataSync | Le système d'entrepôt de données et le moteur ETL de SEI utilisé pour la réplication, la consolidation, la jointure et la transformation. Idéal pour les données cloud, le déchargement d'ERP et la préparation de jeux de données pour l'analyse. |
| Data Model Designer | Concevez, organisez et gérez les structures qui définissent votre modèle de données intégré. Vous permet de combiner et de relier des données provenant de plusieurs sources, en les façonnant pour le reporting ou l'analyse OLAP. |
| OLAP Manager | Construisez et gérez des cubes OLAP pour le traitement analytique haute performance. Essentiel pour les grands ensembles de données (> 5M de lignes) et les besoins de reporting multi-dimensionnels complexes. |
En combinant ces outils, vous pouvez mettre en œuvre l'architecture adéquate pour votre environnement de reporting et d'analyse :
- DataSync pour copier et préparer des données de manière sécurisée.
- Data Model Designer pour structurer et intégrer.
- OLAP Manager pour optimiser la vitesse et la scalabilité à grande échelle.
Scénarios
Cette section décrit les scénarios courants de gestion des données — de l'optimisation des performances ERP à l'intégration multi-sources — et montre quelle combinaison d'outils (DataSync et/ou OLAP Manager) fournit les meilleurs résultats.
Lorsque vous choisissez un scénario, vérifiez si votre ensemble de données dépasse 5 millions de lignes. Ce seuil détermine si les cubes OLAP sont recommandés pour la vitesse et la scalabilité. De plus, pour des scénarios multi-sources ou complexes, vérifiez si une transformation des données est nécessaire pour réconcilier des structures ou identifiants incompatibles.
Source de données unique
Utilisez ce scénario lorsque le reporting repose sur un seul système source tel qu'un ERP unique. C'est idéal pour des besoins de reporting simples avec peu de maintenance.
Vous devez évaluer la taille de l'ensemble de données et les exigences de performance pour choisir la configuration appropriée. Si l'ensemble de données est inférieur à 5 millions de lignes, l'accès ERP en temps réel est généralement suffisant, et aucun outil supplémentaire n'est nécessaire. S'il dépasse 5 millions de lignes, implémentez des cubes OLAP pour améliorer la performance des requêtes et réduire la charge sur l'ERP.
| Scénario | Volume | Accès aux données | DataSync | OLAP |
|---|---|---|---|---|
| Petit volume | < 5M lignes | Temps réel | Non | Non |
| Grand volume | > 5M lignes | Temps réel | Non | Oui |
Défis de performance ERP
Utilisez ce scénario lorsque le reporting ou l'accès aux données ralentit votre système ERP. C'est utile pour maintenir la réactivité de l'ERP pendant des charges de reporting lourdes.
Vous devez répliquer les données ERP dans un environnement séparé en utilisant DataSync pour décharger les requêtes. Pour des ensembles de données inférieurs à 5 millions de lignes, la réplication par DataSync est généralement suffisante pour maintenir la vitesse et la stabilité. Au-delà de 5 millions de lignes, combinez DataSync avec des cubes OLAP pour améliorer encore la performance des requêtes et réduire le temps de traitement.
| Scénario | Volume | Accès aux données | DataSync | OLAP |
|---|---|---|---|---|
| Petit volume | < 5M lignes | Près du temps réel | Oui | Non |
| Grand volume | > 5M lignes | Près du temps réel | Oui | Oui |
Données cloud
Utilisez ce scénario lorsque le reporting utilise des données provenant de sources hébergées dans le cloud telles que des applications SaaS ou des ERP cloud. C'est le meilleur choix pour des environnements où la performance locale et la scalabilité sont requises pour l'analyse.
Vous devez toujours répliquer les données cloud dans un environnement local en utilisant DataSync, car l'analyse directe en temps réel n'est pas possible. Pour moins de 5 millions de lignes, la réplication par DataSync offre une vitesse suffisante. Pour des ensembles de données plus importants, associez DataSync à des cubes OLAP pour des requêtes plus rapides et une scalabilité accrue.
| Sc énario | Volume | Accès aux données | DataSync | OLAP |
|---|---|---|---|---|
| Petit volume | < 5M lignes | Près du temps réel | Oui | Non |
| Grand volume | > 5M lignes | Près du temps réel | Oui | Oui |
Sources de données multiples
Utilisez ce scénario lorsque le reporting utilise des données provenant de deux systèmes différents ou plus. C'est idéal pour les organisations ayant besoin d'un reporting par source indépendante ou d'une vue historique unifiée.
Vous devez d'abord déterminer si les sources sont compatibles (par exemple, deux SQL Server ou Oracle) ou différentes (par exemple, SQL Server et un ERP cloud).
- Pour des sources compatibles sans fusion nécessaire, des cubes OLAP peuvent être appliqués directement pour la vitesse.
- Pour des types de sources différents, utilisez DataSync pour répliquer et consolider les données avant d'appliquer des cubes OLAP.
- Pour une vue historique unifiée, fusionnez les sources dans DataSync, transformez les structures et identifiants si nécessaire, et ajoutez des cubes OLAP si l'ensemble de données combiné dépasse 5 millions de lignes.
| Scénario | Type de source | Objectif | DataSync | OLAP | Transformation |
|---|---|---|---|---|---|
| Reporting indépendant | Compatible | Pas de fusion | Non | Oui | Non |
| Reporting indépendant | Différent | Pas de fusion | Oui | Oui | Non |
| Reporting historique unifié | Tout | Fusion et unification | Oui | Oui | Oui |
Besoins de transformation
Utilisez ce scénario lorsque les ensembles de données provenant de systèmes différents nécessitent une réconciliation en raison d'identifiants ou de formats incompatibles. C'est le meilleur choix pour des reporting complexes où des structures de données cohérentes sont nécessaires avant l'analyse.
Vous devez utiliser DataSync comme plateforme de mise en scène et de transformation pour nettoyer et standardiser les données. La transformation est obligatoire dans ces cas. Si l'ensemble de données résultant dépasse 5 millions de lignes après transformation, des cubes OLAP doivent être mis en œuvre pour maintenir la vitesse et la scalabilité.
| Scénario | DataSync | OLAP | Transformation |
|---|---|---|---|
| Joins complexes / IDs incompatibles | Non | Oui (si grand volume) | Oui |
Consolidation de plusieurs bases de données
Utilisez ce scénario lorsque vous combinez plusieurs bases de données en une vue de reporting unifiée. C'est idéal pour les organisations nécessitant une analyse centralisée des données stockées à travers des bases de données séparées tout en maintenant la cohérence et la performance.
Vous devez utiliser DataSync pour consolider toutes les sources de données dans un environnement de mise en scène avant l'analyse. Évitez de lier directement via des vues SQL pour des ensembles de données volumineux, car cela peut entraîner des problèmes de performance significatifs. Si l'ensemble de données consolidé dépasse 5 millions de lignes, ajoutez des cubes OLAP pour améliorer la vitesse des requêtes et la scalabilité.
| Scénario | Volume | Accès aux données | DataSync | OLAP |
|---|---|---|---|---|
| Petit volume | < 5M lignes | Près du temps réel | Oui | Non |
| Grand volume | > 5M lignes | Près du temps réel | Oui | Oui |