Collecter les données en assurant leur pérennisation

L'intérêt principal de centraliser les données d'océanographie dans un centre de données est de ne pas perdre ces données. En effet, cette perte est d’autant plus grave pour les données qui concernent le milieu marin pour essentiellement deux raisons.

D’abord, parce que l’acquisition des données marines est particulièrement coûteuse : les campagnes scientifiques sur les navires océanographiques ou l’utilisation de satellites représentent des budgets considérables. Au total, les moyens mis en œuvre pour la bancarisation des données représentent moins de 2% (source enquête MRAG) de l’effort d’observation de l’Institut (y compris les moyens navals).

Perte données

    

Sans un archivage pérenne, 30 % des données acquises sont perdues dans un délai de 10 ans après leur collecte. C'est la notion de « patrimoine immatériel ».

    

La deuxième raison est une contrainte liée à la variabilité de l’environnement marin. En effet, les données marines ne sont pas reproductibles. Il est impossible de remonter dans le temps pour acquérir les paramètres physiques de la colonne d’eau d’un endroit précis du globe à l’instant « t ». Contrairement à des données obtenues suite à des expériences en laboratoire, les données marines ne peuvent être obtenues qu’une seule fois.

Les données marines sont toujours plus volumineuses et variées, il faut S’adapter aux nouveaux systèmes d’observation.

Pour la collecte des données il existe deux circuits différents : la collecte automatique et la collecte manuelle.

Collecte automatique

Métiers - Services Opérationnels

La collecte automatique représente ce qui arrive directement au SISMER sans intervention humaine dans le service. Les flux d'arrivée de ces données se font le plus souvent par mail, par dépôt sur disque réseau, etc. Cela concerne notamment les observatoires automatisés (satellites, flotteurs ARGO, etc.), différents flux de données en halieutique, les données navires, etc.

La collecte automatique permet d'assurer un suivi opérationnel (monitoring et reporting) de certaines de ces données.

Les données de CTD et TSG transmises en temps réel sont en basse résolution.

Vignette Métier Gestionnaire données

Collecte manuelle

Si une majorité des données arrivent au SISMER de manière régulière et automatique, ce n'est pas le cas pour toutes les données. Il arrive qu'il faille aller récupérer des données sur d'autres systèmes (ex : Météo-France, etc.), relancer des scientifiques pour obtenir leurs données (Banque de physique, campagnes en mer, etc.).

Les données de CTD et TSG transmises en temps différé ont une meilleure résolution.

Données en entrée de certains systèmes d’informations

Certains systèmes d'informations, comme le CDOCO par exemple, nécessitent des données supplémentaires pour effectuer divers traitements.

  • données de forçage (CDOCO)

Conditions aux limites : Prévisions et ré-analyses (Mercator), Champs de houle (WW3/REFDIF, SHOM)

Conditions initiales : Climatologies (Levitus, Golfe de Gascogne, Medar/Medatlas), Sorties (Mercator)

Interface Air/Mer : Vents et flux thermiques (Météo-France, NCEP, MM5), Vents spatiaux (CERSAT), Flux spatiaux (SAF/OCEAN)

Apports d’eau douce : Débits des fleuves (SPDIREN/COLIANE, IAV, CNR), Pluviométrie (Météo-France)

  • données de références

Bathymétrie (CDOCO)

Vocabulaires (SIH, SeaDataNet)