Jeux de données

Une des spécificités de l’IPSL est liée au fait que l’IPSL est à la fois « producteur de données » et « consommateur » de données.  Le groupe ESPRI a donc pour objectif de mettre à disposition de la communauté IPSL des données produites par les chercheurs de l’IPSL mais aussi issues d’autres centres de données ou des centres opérationnels; ceci dans une approche multi-sources (multi-modèles, multicapteurs, combinaison observations sol/satellite, combinaison modèles/données satellites,….). Il ne s’agit en aucun cas d’une simple duplication de l’archivage de données existant ailleurs : la valeur ajoutée des données mises à disposition par l’IPSL réside dans cet aspect multi-sources, ainsi que dans la normalisation des formats (NetCDF), la mise à disposition d’outils d’extraction et de visualisation, et la mise à disposition de ressources de calcul proches des données qui permettent des développements sans rapatriement de données.

On trouve donc une grande diversité de données sur le mésocentre IPSL:

  • données d’observation (satellite, données sol, ballon, ..): IASI, données géostationnaires, CALIPSO, GOSAT, Megha-Tropiques, SIRTA, NDACC, ..
  • données de réanalyses diverses : ERA-40, ERA-Interim, MERRA-1,2, NCEP, FCDR, ..
  • base de données de grandes campagnes de mesure ou chantiers régionaux : INDOEX, AMMA, HyMeX, .
  • base de données de grands projets internationaux d’inter-comparaison de modèles de climat : CMIP, CORDEX, PMIP, Obs4MIPS, CFMIP, …
  • données de simulations du climat réalisées avec les versions successives des modèles de climat de l’IPSL : IPSLCM5, IPSLCM6, LMDZ, NEMO, ORCHIDEE, INCA.

Les données d’observation

  • Les données satellitaires 
    Les données satellite disponibles sur le mésocentre sont soit rapatriées d’autres centres centres de données (NASA, AERIS, Eumetsat, ..), soit produites directement par le groupe ESPRI ou chercheurs de l’IPSL, soit acquises en temps réel (données géostationnaires ou via une antenne en temps réel pour les données IASI notamment). Citons par exemple les données IASI et GOSAT conçues dans le but d’estimer et de suivre les gaz traces tels que l’ozone (uniquement pour IASI), le méthane ou le monoxyde de carbone à l’échelle mondiale. D’autres données satellite sont disponibles sur le mésocentre sur des thématiques cycle de l’eau  comme les données Megha-Tropiques, CALIPSO, AMSU, …On trouve également  des bases de données satellite internationales comme la base GEWEX-Cloud Assessment pour l’intercomparaison de produits  nuageux ou la base de données CFMIP-Obs pour l’évaluation des modèles de climat.
  •  Les données sols
    Les données sol gérées par le groupe ESPRI sont pour une bonne part des données issues des réseaux d’observation ou sites instrumentés opérés par l’IPSL, comme les données du SIRTA (Site Instrumental de Recherche par Télédetection Atmosphérique). Ces données recouvrent également les données acquises par les instruments du réseau NDACC (Network for the Detection of Atmospheric Composition Change) : données lidar ozone, lidar aérosols, lidar vapeur d’eau, lidar température, ozonosonde, données du Dobson et SAOZ.
  •  Les données ballons
    L’ensemble des données des campagnes de mesures sous ballon sont stockées et distribuées par l’IPSL. Ce peuvent être des campagnes d’intercomparaison, de validation ou expérimentales. Comme les données sols, ce sont des données précieuses pour la validation des données satellitaires, pour l’assimilation des données dans les modèles climatiques.

Les données  de réanalyse

L’un des objectifs du groupe ESPRI est de mettre à disposition sur le mésocentre un sous-ensemble des diverses réanalyses existantes.

Depuis presque 20 ans l’IPSL rapatrie et met à disposition les données météorologiques du CEPMMT pour les besoins de la communauté des laboratoires IPSL, à savoir  ERA40, ERA-Interim, ERA-20C et des analyses opérationnelles. Il faut noter que d’autres réanalyses (MERRA, NCEP, ..) font l’objet de rapatriement (reformattage) par le service ESPRI . Ces tâches sont prises en charge par l’IPSL car les volumes en jeu, en tout cas pour ERA-40 à l’époque et ce sera le cas pour ERA5, la future réanalyse du COPERNICUS Climate Change Service opéré par le CEPMMT nécessitent un effort important pour le désarchivage des données et pour l’archivage final à l’IPSL. L’interêt de ces rapatriements réside dans le fait d’avoir une archive centralisée, facile d’accès, dans un format adapté aux besoins (netcdf).

Citons également des nouveaux jeux de données de réanalyses de données satellite, les FCDR, Fundamental Climate Data Record, qui sont  des séries longues d’observations satellite inter-calibrées ou dont la calibration a été corrigée, permettant ainsi une exploitation de ces données du point de vue climat. Trois grands jeux de FCDR sont disponibles à ce jour:  GRIDSAT (réanalyse de données geostationnaires), AMSU-NOAA (réanalyse des sondeurs microonde), SSMI-CSU (réanalyse des imageurs microonde)

Les données de campagne

Depuis 1998, l’IPSL gère des bases de données thématiques de grands projets internationaux de campagnes terrains comme INDOEX dans l’Océan Indien, AMMA en Afrique de l’Ouest ou MISTRAL en Méditerranée. Pour ces projets, ESPRI a en charge la gestion (acquisition, traitement, distribution, documentation) des données modèles (prévisions, réanalyses, simulations), satellites et radar.

ESPRI intervient aussi dans la gestion de bases de données pour les campagnes de Calibration et Validation pour des missions spatiales telles que Megha-Tropiques ou Calipso.

L’IPSL fournit également un support opérationnel pour des campagnes de mesures (Cyndynamo, Arceo, StratoClim …) : mise en place de sites web de campagne, distribution et visualisations de données satellites et de de données de prévisions météorologiques, mise en production de codes scientifiques, fourniture de PC de campagne.

Les données de simulations climatiques

  • Les données de modélisation du climat à l’échelle globale

CMIP : les modèles globaux de climat sont utilisés pour produire des projections climatiques à l’échelle des continents comme celles présentées dans le premier volume du 5e rapport du GIEC. Environ vingt groupes de modélisation contribue au projet d’inter-comparaison CMIP. CMIP est un projet du programme mondial de recherche sur le climat qui définie le protocole expérimentale des inter-comparaisons de modèle. La résolution des modèles utilisés est de l’ordre de 100 à 200 km. Les simulations concernées, les formats et protocoles utilisés suivent les recommandations mises en place par CMIP dont les résultats ont alimenté le 5ème rapport du GIEC. La prochaine phase de CMIP, CMIP6 est la 6ème phase du projet et alimentera le 6ème rapport du GIEC.

  • Les données de modélisation du climat à l’échelle régionale

CORDEX : un projet international de simulations régionales
En parallèle de l’exercice de simulations climatiques à l’échelle globale (CMIP), ce projet international a l’objectif de produire des simulations régionales à haute résolution (50 km). Appelé CORDEX, il est coordonné par le Programme mondial de recherche sur le climat et vient d’achever sa première phase. Lancé pour la première fois en 2010, il se concentre sur 13 régions prédéfinies à 50 km de résolution maximum. Sept zones sont particulièrement bien couvertes : l’Arctique, l’Afrique, l’Amérique du Nord, l’Amérique du Sud, l’Asie du Sud, l’Europe, la Méditerranée. EURO-CORDEX est la composante CORDEX ayant un focus sur l’Europe. Cette composante a réalisé des simulations a une résolution de 12 km sur l’Europe.

  • Les données de modèle Chimie/transport
    • Un modèle 3D de Chimie Transport REPROBUS (Reactive Procecesses Ruling the Ozone Budget in the Stratosphere) calcule quotidiennement l’évolution  temporelle de 55 espèces chimiques via 147 réactions chimiques. Il utilise comme forçage les champs de vent et de température ECMWF toutes les 6 heures. Les calculs chimiques sont produits toutes les 15 minutes et fournissent aux utilisateurs (http://cds-espri.ipsl.fr/etherTypo/index.php?id=1664) des cartes, des profils et des colonnes d’espèces chimiques au dessus de stations de mesure. Chaque année à partir de ce modèle, est calculée l’évolution de la perte d’ozone dans l’hémisphère Nord, ces résultats sont présentés ensuite à diverses instances internationales.
    • Un second modèle MIMOSA (Modélisation Isentrope du transport Méso-échelle de l’Ozone Stratosphérique par Advection) développé par le LATMOS dans le cadre du projet Européen METRO (MEridional TRansport of Ozone in the lower stratosphere) produit quotidiennement des fichiers de Vorticité potentielle (PV) à différentes surfaces isentropiques et sur une couverture spatiale globale dont la discrétisation élémentaire est de 18,5km. Ces données sont essentielles à la prédiction des lâchers de Ballon mais aussi à la préparation des campagnes d’intercomparaison. Des cartes et des fichiers de données de PV et Température sont distribués à cette fin par l’IPSL (http://cds-espri.ipsl.fr/etherTypo/index.php?id=1663)