Amélioration des bases de données dans la recherche scientifique

Les bases de données sont essentielles pour la gestion et la compréhension des écosystèmes marins. A l’égard de l’augmentation du nombre de données recueillies et de leur automatisation, les bases de données s’organisent de manière opérationnelle pour permettre :

  • la réception et la transmission des données en routine (ce qui implique que l’observatoire ait été préalablement identifié et convenablement décrit),
  • L’assemblage et le traitement des données,
  • La standardisation des informations acquises et bancarisées, rendant comparables des données collectées de manière indépendante (différentes sources) et permettant ainsi la constitution d’états de référence cohérents,
  • Le contrôle qualité des données, compte tenu des processus de validation d’étiquetage associés à l’ effort de bancarisation (en accord avec les normes, programmes et instances internationales),
  • De contrôler et assurer des retours rapides vers les équipes ayant déployés les capteurs et vers les équipes utilisatrices,
  • De diffuser les données en « temps réel »
Systèmes d'informations
Systèmes d'informations

Pour arriver à une compréhension globale et approfondie de l’environnement marin, il faut prendre en compte plusieurs facteurs. Cette intégration plus grande se conçoit en termes :

  • D’espace géographique (région, plateau continental, bassin),
  • D’échelles temporelles (analyse de la variabilité à long terme),
  • D’interdisciplinarité (approche écosystémique).

Ces approches nécessitent la constitution de grands ensembles de données cohérents, de qualité établie et d’un niveau de traitement suffisant pour une utilisation directe par des équipes multidisciplinaires (suppression des artefacts d’observation). Ce travail est donc réalisé par les centres de données, dont le SISMER.

Il convient ensuite de superviser en continu l’ensemble des infrastructures techniques supportant tout cet ensemble. En effet, la plus courte des interruptions de service sera détectée par l’internaute. Un portail en ligne, de diffusion de données marines, qui n’est pas accessible en continu est très rapidement considéré comme peu fiable et donc rapidement décrié. 

L’enjeu est donc de pouvoir assurer un service de qualité en continu mais également d’améliorer les moyens informatiques, matériels et logiciels sur lesquels reposent le traitement des données et leur stockage (indispensable pour accélérer la disponibilité des données traitées).