digna 2026.01 Étend la validation des données d'entreprise à l'intérieur de la base de données
24 mars 2026
|
5
minute de lecture

La version 2026.01 est l'expansion la plus significative de l'architecture de validation des données digna depuis le lancement du module. Cette version étend ce que les règles de validation peuvent couvrir, comment elles sont appliquées, et comment la plateforme se connecte à des environnements d'entreprise complexes et multi-sources. Les ajouts principaux sont les vérifications d'unicité multi-colonnes et la validation d'intégrité référentielle. Mais la version introduit également des changements à la modélisation des sources de données, la gestion des connexions aux bases de données à travers les projets, et le comportement de la détection des anomalies dans des contextes commerciaux spécifiques. Chacune de ces questions est importante en pratique.
Cet article passe en revue ce qui est nouveau et pour qui il est conçu.
Pourquoi la Validation Traditionnelle à Colonne Unique est Insuffisante
La plupart des plateformes de qualité des données appliquent une validation au niveau de la colonne unique. Vérifiez qu'une valeur n'est pas nulle. Vérifiez qu'elle se situe dans une plage. Vérifiez qu'elle correspond à un format. Ces vérifications sont importantes. Elles sont également insuffisantes pour les types d'échecs de qualité des données qui compromettent véritablement les rapports d'entreprise et la conformités réglementaires.
Les modes de défaillance qui causent le plus de dommages en production sont relationnels. Un enregistrement de transaction référant à un identifiant client qui n'existe plus dans le maître. Une ligne de commande dont le code produit est unique isolément mais dupliqué dans une commande spécifique, violant la clé composée. Une exposition financière dont la référence de contrepartie ne correspond à rien dans la liste approuvée. Aucun d'eux n'enclenche une vérification à colonne unique. Tous produisent des corruptions en aval qui sont coûteuses à tracer et difficiles à expliquer à un auditeur.
La version 2026.01 ajoute les capacités de validation qui traitent directement ces modes de défaillance.
Vérifications d'Unicité Multi-Colonnes : Validation des Clés Composées Commerciales
De nombreuses entités commerciales réelles sont définies par des combinaisons d'attributs, pas des identifiants uniques. Une ligne de commande est unique dans une commande lorsque la combinaison d'ID de commande et de numéro de ligne est distincte. Une position financière est unique lorsque le compte, l'instrument et la date ensemble sont uniques.
digna 2026.01 introduit des vérifications d'unicité à travers des ensembles de colonnes configurables. La vérification évalue si la combinaison des colonnes sélectionnées contient des doublons, identifiant les cas où des clés commerciales composées sont violées. Cela se fait entièrement dans la base de données source par inspection basée sur SQL, sans exporter de données ni créer de couches de traitement supplémentaires.
L'impact pratique pour les équipes de qualité des données et de gouvernance est la capacité de détecter des entités commerciales en double qui passeraient autrement toutes les vérifications à colonne individuelle sans problème. Pour les entrepôts de données où les dimensions changeant lentement ou les chargements incrémentaux sont courants, les violations de clé composée sont une source fréquente de corruption silencieuse des données que la validation à colonne unique ne détecte jamais.
Vérifications d'Intégrité Référentielle : Application des Relations à Travers les Sources de Données
Le second ajout majeur de validation est la vérification d'intégrité référentielle à travers les sources de données. Cette vérification valide que les valeurs de clés étrangères dans une source de données source existent dans une source de données cible référencée, détectant les enregistrements orphelins et les relations rompues avant qu'ils ne se propagent dans les pipelines en aval d'analyses et de rapports.
Ce qui rend cela pratiquement utile à l'échelle d'entreprise, c'est la portée qu'il soutient. Les vérifications d'intégrité référentielle dans digna 2026.01 fonctionnent à travers différentes tables et vues, différents schémas au sein de la même base de données, et différentes connexions de bases de données au sein du même projet. La vérification n'est pas limitée aux relations au sein d'un seul schéma ou d'un seul entrepôt. Une entreprise qui détient des données maîtres clients dans un système et des enregistrements de transactions dans un autre peut valider la relation référentielle entre eux sans reproduire les données dans un environnement commun.
Cela soutient directement les exigences de qualité des données qui comptent le plus dans les industries réglementées : maintenir l'intégrité de l'entrepôt de données, valider les relations de données maîtres, soutenir le reporting réglementaire, et assurer que les systèmes de BI et d'analyses consomment des données structurellement saines.
La documentation technique complète pour les deux nouvelles capacités de validation est disponible dans les notes de version digna 2026.01.
Sources de Données Logiques et Connexions Globales : Simplifier les Environnements Complexes
Au-delà des ajouts de validation, la version 2026.01 introduit des changements sur la façon dont digna modélise les sources de données et gère les connexions aux bases de données, qui ont des implications directes pour les équipes opérant dans des environnements de données d'entreprise hétérogènes.
Les sources de données dans 2026.01 représentent maintenant une couche logique au sein d'un projet plutôt qu'un mappage direct à une table physique. Chaque source de données logique peut être soutenue par une table de base de données, une vue de base de données ou une instruction SQL personnalisée. Cela découple la logique d'inspection et de validation de la structure de stockage physique, ce qui est important lorsque les schémas évoluent, lorsque les règles de validation doivent s'appliquer à des ensembles de données dérivés, ou lorsque la même entité commerciale est représentée dans plusieurs emplacements physiques.
Les connexions de bases de données sont maintenant configurées à un niveau global et peuvent être réutilisées dans tous les projets. Auparavant, les équipes gérant plusieurs projets dans plusieurs environnements de bases de données devaient configurer les connexions séparément pour chaque projet. Les connexions globales éliminent cette duplication, réduisent la surcharge de configuration et assurent que les paramètres de connectivité sont cohérents sur toute la plateforme. Les projets peuvent désormais également référencer plusieurs connexions sources simultanément, soutenant des architectures d'entreprise réalistes où les données résident dans plusieurs entrepôts ou bases de données opérationnelles.
Conditions de Pertinence des Anomalies, Notifications par Module et Export CSV
Trois fonctionnalités supplémentaires dans cette version répondent à des points de douleur opérationnels spécifiques que les utilisateurs ont signalés de manière cohérente.
La Condition de Pertinence des Anomalies permet aux équipes de définir une condition qui contrôle si digna Data Anomalies évalue le statut d'anomalie pour un ensemble de données donné. Les statistiques sont toujours calculées. Mais si la condition définie n'est pas remplie, par exemple si le nombre d'enregistrements est inférieur à un seuil qui rend la détection d'anomalies statistiquement significative, la plateforme ne fait pas apparaître un statut d'anomalie vert, jaune ou rouge pour cet ensemble de données. Cela empêche le bruit des alertes provenant des ensembles de données de faible volume ou transitoires et assure que l'évaluation d'anomalies n'est appliquée que dans des contextes où elle est significative sur le plan opérationnel.
La configuration des notifications par module permet aux équipes de définir un comportement d'alerte indépendant pour chaque module digna. Une équipe d'ingénierie des données responsable de la ponctualité des pipelines peut recevoir des notifications indépendamment d'une équipe de gouvernance concentrée sur les échecs de validation. Les alertes peuvent être ajustées à la criticité de la sortie de chaque module sans appliquer une politique de notification unique à l'ensemble de la plateforme.
Les résultats d'inspection peuvent désormais être exportés sous forme de fichiers CSV, avec une valeur pratique directe pour les équipes qui ont besoin d'incorporer les résultats de validation de digna dans les flux de travail d'audit, les rapports externes ou l'analyse en aval en dehors de la plateforme.
Pour Qui Cette Version est Conçue
Ingénieurs de Données bénéficient de la modélisation logique des sources de données qui découple la logique d'inspection du schéma physique, et de connexions globales qui éliminent la configuration redondante à travers les projets.
Équipes de Qualité des Données et de Governance gagnent la couverture de validation relationnelle : l'unicité des clés composées et l'intégrité référentielle nécessaire pour appliquer les règles structurelles qui comptent pour le reporting réglementaire et la gestion des données maîtres.
Équipes d'Analytique et BI reçoivent des entrées plus propres et structurellement saines des systèmes de données en amont, avec des résultats d'inspection exportables qui alimentent directement les flux de travail d'audit et de reporting.
Propriétaires de la Plateforme et de l'Infrastructure bénéficient de la réduction de la complexité de configuration grâce aux connexions globales et aux sources de données logiques, et du contrôle de notifications par module qui adapte l'alerte à la structure de l'équipe plutôt que d'appliquer une politique unique dans tous les contextes.
La version 2026.01 est disponible maintenant. Le journal complet des changements, y compris les détails techniques sur toutes les nouvelles fonctionnalités et la référence CLI mise à jour, se trouve à docs.digna.ai/changelog/Release_202601.
Prêt à voir 2026.01 dans votre environnement?
Les vérifications d'unicité multi-colonnes, la validation d'intégrité référentielle et l'architecture in-database qui garde vos données là où elles appartiennent. Réservez une présentation personnalisée avec l'équipe digna pour voir les nouvelles capacités de validation sur votre propre environnement de données.



