Aller au contenu principal

Connecteur de source MongoDB

Le connecteur de source MongoDB dans DataSync vous permet de récupérer des données à partir d'instances MongoDB pour les charger ou les synchroniser dans votre entrepôt de données. Après avoir créé toutes les connexions sources requises, configurez votre source de destination pour compléter la configuration de la connexion.

important

L'extraction de consolidation n'est actuellement pas disponible pour les connexions sources MongoDB.

Créer une connexion source dans DataSync

  1. Connectez-vous à DataSync.
  2. Depuis l'écran d'accueil, sélectionnez Connexions.
  3. À côté de Connexions sources, cliquez sur Nouveau.
  4. Sélectionnez MongoDB.
  5. Dans le panneau Propriétés de connexion, saisissez les propriétés de connexion.
  6. (Optionnel) Dans le panneau Propriétés de connexion supplémentaires, sélectionnez Ajouter une propriété et saisissez les paramètres pour chaque propriété.
  7. Dans le panneau Paramètres avancés, configurez les paramètres, y compris le Type de suivi et d'autres valeurs selon vos besoins.
  8. Cliquez sur Sauvegarder.

important

Pour les propriétés qui contiennent des tableaux, la précision inférée peut être sous-estimée. Cela peut entraîner des erreurs de troncation lors de l'extraction. Recommandation : Définissez la précision sur MAX pour ces colonnes dans votre table de destination afin d'éviter les échecs.

Paramètres

Propriétés de connexion

ParamètreDescription
DescriptionNom unique pour la connexion. Exemple : MongoDB.
ServeurNom d'hôte ou adresse IP du serveur MongoDB.
Exemple : mongodb.example.com
PortNuméro de port du serveur. Par défaut : 27017.
Base de donnéesNom de la base de données MongoDB à laquelle se connecter. Exemple : SalesData.
Mode d'authentificationMéthode d'authentification pour la base de données :
  • Basique – Authentification par défi-réponse avec un nom d'utilisateur et un mot de passe stockés dans la base de données MongoDB.
  • NoAuth – Aucune authentification.
Nom d'utilisateurNom d'utilisateur du compte stocké dans la base de données MongoDB Exemple : mongoUser.
Mot de passeMot de passe associé au nom d'utilisateur.
Base de données d'authentificationNom de la base de données utilisée pour l'authentification, si différente de la base de données spécifiée dans Base de données.
Exemple : admin
Aplatir les objetsOption pour convertir les propriétés d'objets imbriqués en colonnes séparées. Si désactivé, les objets sont retournés sous forme de chaînes JSON.
Utiliser SSL/TLSParamètre de chiffrement pour sécuriser la connexion avec SSL/TLS. Nécessite un certificat SSL.
Accepte les certificats de serveur invalidesOption pour accepter tous les certificats du serveur lors de l'utilisation de SSL/TLS. Non recommandé en raison des risques de sécurité.
Profondeur de scan des lignesNombre de lignes analysées dans la collection pour inférer le schéma. Une valeur plus élevée génère un schéma plus exact mais peut réduire les performances. Par défaut : 1000.
Verbosité
  • 1 – Journaliser les requêtes, le nombre de lignes, le début/fin de l'exécution, les erreurs.
  • 2 – Inclut le niveau 1 plus les requêtes de cache, les en-têtes HTTP.
  • 3 – Inclut le niveau 2 plus les corps de requête/réponse.
  • 4 – Inclut le niveau 3 plus les communications de niveau transport.
  • 5 – Inclut le niveau 4 plus toutes les commandes d'interface.
Activer le poolingOption de mise en commun des connexions pour les performances.
Délai d'inactivité du poolTemps d'inactivité maximal pour les connexions avant de les retourner au pool, en secondes.
Taille maximale du poolNombre maximal de connexions autorisées dans le pool.
Temps d'attente du poolTemps d'attente maximal pour l'allocation de connexions avant qu'une erreur ne soit générée, en secondes.

Exemple d'aplatissement des objets

Considérez le document de vente suivant :

{
"orderId": 10592,
"customer": { "id": 456, "name": "Acme Corp" },
"shipping": { "city": "New York", "state": "NY" }
}
  • Si Aplatir les objets est activé, le document apparaît comme :

    Nom de colonneType de donnéesValeur d'exemple
    orderIdEntier10592
    customer.idEntier456
    customer.nameChaîneAcme Corp
    shipping.cityChaîneNew York
    shipping.stateChaîneNY
  • Si Aplatir les objets est désactivé, les propriétés imbriquées restent à l'intérieur de JSON :

    {"city": "New York", "state": "NY"}

Propriétés de connexion supplémentaires

Propriétés de chaîne de connexion supplémentaires non spécifiées dans le panneau Propriétés de connexion. Pour chaque propriété ajoutée, vous pouvez choisir Visible ou Chiffré. La sélection de Chiffré masque la valeur de l'interface et la stocke chiffrée au backend, comme lors de la définition des mots de passe.

ParamètreDescription
PropriétéPropriété de chaîne de connexion qui définit l'action ou le comportement. Exemple : ReadOnly
ValeurValeur de la propriété. Exemple : True
TypeVisibilité de la propriété : Visible ou Chiffré.

Paramètres avancés

Les paramètres avancés contrôlent comment le connecteur MongoDB suit les changements, gère la configuration régionale et horaire, et traite les lots de données lors de l'extraction. Ces options permettent un ajustement fin pour les performances et l'exactitude, et doivent être configurées en fonction de votre environnement système et de vos exigences opérationnelles.

ParamètreDescription
Type de suiviMéthode de suivi des changements : Aucun ou Date.
RégionParamètre régional pour le connecteur, si nécessaire pour votre configuration.
Fuseau horaireFuseau horaire correspondant au serveur d'application MongoDB.
Décalage horaireDécalage de rafraîchissement en secondes pour compenser les problèmes de timing dans la sélection des enregistrements. La valeur minimale est 0 ; la maximum est 3600 secondes.
Taille de lotQuantité d'enregistrements traités dans chaque lot lors de l'extraction. Des tailles de lot plus grandes augmentent l'utilisation de la mémoire mais peuvent améliorer les performances jusqu'à un certain point. La valeur par défaut est 2000 et le maximum ne doit pas dépasser 10000 enregistrements. Ajustez en fonction de la vitesse de votre réseau et des performances du disque ; dans la plupart des cas, la valeur par défaut (2000) fonctionne le mieux.

Exemple