Qualité des données

Traitement des données du sondeur multifaisceaux

La mise en œuvre des technologies d'acquisition et de traitement des données produisent des volumes considérables de données. Il est extrêmement important de mettre en place de bonnes pratiques de gestion des données, afin de décrire comment les données ont été acquises et traitées. Cette notion de qualité est de nos jours incontournable dès qu'il s'agit d'assurer l'interopérabilité et la traçabilité des données, d'autant que les notions de qualité et de niveau de validation ne sont pas « universelles » et peuvent varier d'un projet à un autre selon le type d'exploitation de ces données.

D'une manière générale, les métadonnées ou "données à propos des données" permettent de compiler toutes les informations nécessaires et indispensables au bon usage des données. Ces métadonnées interviennent à 3 niveaux :

  1. Le premier permettant d'apparaître à l'inventaire des données disponibles (au sein de Catalogue de données comme Sextant) ;
  2. Le deuxième permettant aux utilisateurs potentiels de connaître le propriétaire des données, où les trouver et comment les obtenir (faisant apparaître le cas échéant des conventions d'utilisation...) ;
  3. Enfin le troisième niveau permettant aux utilisateurs d'estimer la qualité et l'adéquation de la ressource avant d'y accéder (objectifs, résolution, qualité, limites d'utilisation ...).

Dès qu'on applique une chaîne de traitement sur des données, il est essentiel d'enregistrer les configurations précises définies à chaque étape du processus. Il sera alors possible de reproduire cette chaîne de traitement sur un autre jeu de données disponible sur un autre site ou à une date ultérieure. Mais surtout, il faut bien comprendre que les données ont une vie propre au-delà de la production de cartes : elles aboutissent à différents endroits (organismes, bases de données, portails Web) et peuvent servir à d’autres études. Il est important que toutes les métadonnées (pertinentes) accompagnent les données dans leur périple d’une étape et d’un endroit à l’autre.

Des données sans métadonnées associées sont inutilisables.

INSPIRE

Depuis plusieurs années, les producteurs de données sont de plus en plus sensibles à la nécessité de compléter les métadonnées selon les normes internationales, et en tenant compte des réglementations européennes, plus spécifiquement la directive INSPIRE (Infrastructure for Spatial Information in the European Community).

Au-delà des dispositifs décrits ci-dessus qui visent à garantir le bon fonctionnement des systèmes de gestion de données et de leur accessibilité aux utilisateurs, l’accent est également mis sur la qualité des données bancarisées, en relation étroite avec les équipes scientifiques qui coordonnent les observations en mer, et en accord avec les grands programmes internationaux (ARGO, IODE/COI, etc.).

Ce contrôle qualité a pour but de fiabiliser les données délivrées aux utilisateurs, mais également de permettre des échanges de données cohérentes et comparables au niveau européen et international.