Sujet de thèse 2019 Département Eaux – Matthieu Masson, UR RiverLy, équipe LAMA – Caractérisation intégrée de la matière organique dissoute : étude d’empreintes physicochimiques et recherche de marqueurs pour tracer les sources de pollutions anthropiques (OT148)

Sujet de thèse 2019 Département Eaux – Matthieu Masson, UR RiverLy, équipe LAMA – Caractérisation intégrée de la matière organique dissoute : étude d’empreintes physicochimiques et recherche de marqueurs pour tracer les sources de pollutions anthropiques (OT148)

Mots clés : empreinte chimique, marqueurs chimiques, matière organique, milieu aquatique, rejets anthropiques, spectrométrie de masse haute résolution, spectroscopie, (bio)statistique, chimiométrie, traitement de données.

Directrice de Thèse : Cécile Miège (cecile.miege@irstea.fr)

Encadrant scientifique : Matthieu Masson

Equipe d’accueil : Laboratoire de chimie des milieux aquatiques (LAMA), UR RiverLy

Ecole doctorale : ED 206, Chimie environnement et procédés, université Lyon 1

Résumé

La matière organique dissoute (MOD), constituée d’un mélange complexe de composés chimiques variés, joue un rôle clé dans le fonctionnement des écosystèmes aquatiques. Les sources naturelles ou anthropiques de MOD dans un bassin versant (BV) sont nombreuses. La nature et le devenir de la MOD dans les milieux aquatiques semblent fortement liés au type de source. L’objectif de cette thèse est d’étudier les empreintes de MOD typiques des sources principales dans les BV et d’identifier des marqueurs physicochimiques. Une nouvelle approche intégrative sera développée en combinant l’ensemble les résultats de différentes techniques (classique ou en développement) de caractérisation de la MOD (dont la spectroscopie et la spectrométrie de masse haute résolution). L’analyse statistique des données vise d’une part, à documenter la variabilité de la nature de la MOD pour les principales sources potentielles naturelles et anthropiques de MOD et d’autre part, à définir un ensemble de marqueurs typique de ces sources. Cette nouvelle approche intégrée de caractérisation de la MOD sera appliquée sur les eaux de rivières de BV péri-urbain (ex : Yzeron) ou fortement anthropisé (ex : Gier) afin de montrer son potentiel pour mettre en évidence différentes sources de MOD dans les cours d’eau.

1. Etat de l’art et problématique

1.1. Contexte et hypothèse de travail

La matière organique (MO) désigne l’ensemble des composés carbonés d’un écosystème, sans compter ceux des organismes vivants. La MO est un constituant majeur des milieux aquatiques où elle joue un rôle clé au coeur des processus biogéochimiques en tant que réactif et produit : e.g. source d’énergie et de carbone pour le biote, contrôle des niveaux d’oxygène dissous ou de nutriments (Leenheer et Croué, 2003). Du fait de son abondance et de sa forte mobilité, la matière organique dissoute (MOD ; obtenue après filtration des eaux à des seuils de coupure de 0,45 ou 0,7 μm) joue un rôle très important dans le cycle global du carbone depuis les têtes de bassins versants (BV) jusqu’aux écosystèmes océaniques et marins (Williams et al. 2016). La MOD est constituée d’un mélange extrêmement complexe de petites molécules, macromolécules et polymères (e.g. acides aminés, protéines, lipides, sucres, acides humiques et fulviques, cellulose) qui possèdent des propriétés physico-chimiques qui leur sont propres (solubilité, hydrophobie, constante d’acidité, aromaticité…). La composition et les propriétés physico-chimiques de la MOD, combinées aux conditions environnementales du milieu (e.g. pH, force ionique, intensité lumineuse, activité bactérienne…), déterminent le comportement de la MOD (e.g. McElmurry et al., 2013), c’est-à-dire son devenir (dégradabilité biotique ou abiotique, distribution dans les différents compartiments du milieu aquatique, …) et sa réactivité (consommation d’oxydants, complexation avec des micropolluants et influence sur leur biodisponibilité et donc leur toxicité, …). Une bonne connaissance de la nature de la MOD est donc nécessaire afin d’évaluer et prédire son impact sur la santé des écosystèmes aquatiques récepteurs.

La MOD provient de sources multiples (Figure 1) qui peuvent être naturelles ou anthropiques, certaines pouvant être diffuses (e.g. MOD autochtone, ruissellement en milieu rural ou péri-urbain) et d’autres localisées (e.g. rejets industriels, rejets de station de traitement d’eaux usées, STEU). La nature (i.e. composition et propriétés physicochimiques) de la MOD est fortement liée à son origine/source (Pernet-Coudrier et al., 2011). Quelques études ont montré que la MOD des milieux aquatiques soumis à des pressions urbaines importantes possède des propriétés physico-chimiques différentes de la MOD naturelle (i.e. MOD des eaux de surface pas ou peu impactées par les rejets anthropiques) : molécules de tailles plus petites, plus faible aromaticité, enrichissement en azote (Imai et al., 2002 ; Pernet-Coudrier et al., 2011). La nature de la MOD anthropique peut aussi varier en fonction de l’origine des rejets (e.g. domestique, industrielle, pluviale) et du type de traitement appliqué ou non (Michael-Kortadou et al., 2015).

L’hypothèse de cette thèse est que la MOD d’échantillons d’eaux issues de sources spécifiques (par ex. lessivage de sols forestiers ou rejets de stations d'épuration à boue activée ou rejets urbains par temps de pluie) a des caractéristiques physico-chimiques propres, comme une empreinte physico-chimique ; et l’étude de ces empreintes et la mise en évidence de marqueurs doit nous permettre de tracer l’origine des MOD dans les milieux aquatiques récepteurs.

1.2. Verrous scientifiques

Verrou #1 : des contraintes techniques limitant les jeux de données La MOD est très souvent analysée après des étapes de pré-concentration et/ou de fractionnement (souvent par chromatographie solide/liquide) en fonction de certaines propriétés physico-chimiques (polarité, pH, hydrophobie… ; e.g. Matar et al., 2015). Ces étapes sont nécessaires pour la réalisation de certaines analyses (ex. pré-concentration de la MOD pour analyse par RMN). Ces techniques de pré-concentration et de séparation nécessitent beaucoup de temps et peuvent altérer la structure de la MOD (Wu et al., 2007 ; Matar, 2013). En conséquence, le nombre d’échantillons dans les études sur la caractérisation approfondie de la MOD est souvent très limité. Or, la mise en évidence d’empreintes chimiques typiques de sources de MOD nécessite d’analyser un large panel d’échantillons différents (e.g. Thibault et al., 2017).

-> Il semble donc essentiel de développer des méthodes de caractérisation de la MOD moins lourdes (en temps et moyens humains) et minimisant le risque d’altération de l’échantillon (en éliminant les étapes de pré-concentration et de séparation).

Verrou #2 : de nombreuses techniques d’analyse mais une image partielle de la nature de la MOD faute de méthodes de traitement statistique intégré

Il existe de nombreuses méthodes pour caractériser la MOD selon i) sa composition globale, ii) certaines propriétés physico-chimiques ou iii) les structures et fonctions chimiques prédominantes des constituants (Figure 2). Depuis 5 ans, la spectrométrie de masse haute résolution (HRMS) commence à générer de nombreuses données relatives à la composition moléculaire de la MOD. L’exploitation des données générées (des milliers de masses détectées) est encore un fort challenge, mais certains auteurs ont récemment proposé un traitement de données sous forme d’empreintes chimiques comme des diagrammes de van Krevelen ou de Vann (e.g. Kiss et al., 2017 ; Rathgeb et al., 2017).

Par ailleurs, chacune de ces techniques (Figure 2), classiques ou innovantes, n’apporte qu’une information partielle sur la nature et les propriétés de la MOD et ne permet pas d’intégrer toute la complexité physico-chimique de cette dernière (Michael-Kordatou et al., 2015). Lorsque plusieurs techniques complémentaires sont appliquées, les données ont généralement été exploitées individuellement.

-> Il semble nécessaire d’appliquer une approche d’analyse et d’exploitation statistique multi-techniques (Mangal et al., 2017), i.e. une approche intégrée de caractérisation combinant l’ensemble des résultats de plusieurs types d’analyses, permettant de rendre compte de la complexité de la MOD.

Verrou #3 : la MOD d’origine anthropique encore peu étudiée par rapport à la MOD naturelle

Historiquement, la MOD a beaucoup été étudiée dans les sols et les eaux naturelles (rivières, lac, estuaires, mer…) et les études concernant la MO dans les rejets urbains sont beaucoup moins nombreuses1. Les connaissances sur la nature de la MO d’origine anthropique, ainsi que sa réactivité et son devenir, restent limitées (e.g. Khamis et al., 2018), principalement à cause de stratégies peu adaptées : i) la MOD est souvent restreinte aux substances humiques (acides humiques et fulviques) qui représentent en moyenne 40 à 60% de la MOD naturelle (Martin-Mousset et al., 1997), mais qui sont peu représentatives de la MOD d’origine anthropique (Pernet-Coudrier et al., 2008) et ii) de nombreuses études se limitent à des rendements d’élimination du carbone avec la mise en œuvre de techniques de

caractérisation globale (e.g. COD, DCO, DBO).

-> Il semble important d’identifier des techniques de caractérisation de la MOD adaptées aux différentes origines (naturelles et anthropiques) de la MOD.

2. Question scientifique et objectifs de la thèse Dans ce contexte, la question centrale est comment mettre en évidence une combinaison de marqueurs physicochimiques (à partir des empreintes globales de la MOD) permettant de tracer in situ les sources de pollutions organiques anthropiques ? Ainsi, les objectifs de la thèse sont :

  • de développer une nouvelle stratégie de caractérisation intégrée de la MOD (i.e. combinant les informations issues de plusieurs techniques d’analyses) qui soit généralisable à tous les types de MOD et applicable à un grand nombre d’échantillons. Il s’agira d’une approche multi-techniques avec un traitement statistique sans a priori de l’ensemble des informations et la mise en évidence de nouveaux marqueurs de la MOD.
  • d’évaluer finement la variabilité spatio-temporelle de la nature de la MOD (composition et propriétés physicochimiques) issue de sources potentielles naturelles et anthropiques dans des BV périurbains.
  • D’étudier les empreintes physico-chimiques (i.e. combinaison de marqueurs) typiques de sources de MOD anthropiques ou naturelles dans des BV périurbains ; et ainsi proposer une typologie de la MOD en fonction des sources.

3. Méthodologie

Afin de répondre aux différents objectifs, le doctorant constituera une banque d’échantillons de plus 200 échantillons comprenant différents types de rejets urbains (eaux de sortie de STEU, eaux pluviales, déversoirs d’orage, eaux de ruissellement de zones urbaines et péri-urbaines, ...), d’eaux d’entrée de STEU (pouvant être rejetées par temps de pluie en cas de réseaux unitaires), et d’eaux de rivières peu ou pas impactées par les activités humaines (principalement en tête de BV). Il sera important de diversifier les sources des eaux prélevées afin de recueillir une large gamme de nature de MOD. La variabilité temporelle sera aussi étudiée par la collecte d’échantillons à différentes périodes (au pas de temps de l’évènement hydrologique, cycle jour/nuit ou à la saison).

Afin de permettre l’analyse de l’ensemble des échantillons (>200) sans altérer la qualité de la MOD, les méthodes analytiques seront directes, c’est-à-dire exemptes d’étapes d’extraction et/ou de pré-concentration de la MOD.

Plusieurs techniques d’analyse envisagées (Tableau 1) sont déjà mises en oeuvre en routine au LAMA (i.e. DCO, DBO, COD, sucres, protéines…) ou en cours de développement avec déjà des applications concrètes (chromatographie d’exclusion stérique avec détection UV-vis et fluorescence ; Masson et al., 2018a). Le doctorant aura recours à ces méthodes et sera plus spécifiquement en charge d’explorer également le potentiel de l’analyse non ciblée par la technique de chromatographie liquide couplée à un spectromètre de masse haute résolution (LC-HRMS) qui génère une grande quantité d’informations sur la MOD, au niveau moléculaire (collab. LAMA ; Bonnefille et al., 2018). Une collaboration externe pour l’analyse par fluorescence-3D est prévue avec E. Parlanti (Université de Bordeaux ; Cf. partie 5 ; Parlanti et al., 2015). Durant les premiers mois de la thèse, le doctorant réalisera une synthèse bibliographique sur les techniques d’analyses de la MOD. Ce travail lui permettra de finaliser le choix des techniques analytiques à utiliser pour la construction de la base de données.

Tableau 1 : techniques analytiques envisagées

Technique de caractérisation Type d’information générée Observations
DCO Composition globale MOD En routine au laboratoire (LAMA)
DBO, DBO Composition globale MOD En routine au laboratoire (LAMA)
COD, Ntot   Composition globale MOD En routine au laboratoire (LAMA)
Glucides, protéines, lipides   Composition globale MOD En routine au laboratoire (LAMA)
Spectrophotométrie UV-vis Caractéristiques physico-chimiques globales En routine au laboratoire (LAMA), travaux en cours dans le cadre d'AQUAREF sur le potentiel de descripteurs spécifiques (Masson, 2016; Masson et al., 2017)
Fluorescence 3D Caractéristiques physico-chimiques globales En routine et en collaboration avec E. Parlanti (EPOC, LPTC, Université Bordeaux) (Elfeky, 2017; Alonso, 2018; Masson et al.,
HP-SEC couplé UV-vis et fluorescence Caractéristiques physico-chimiques globales (distribution de taille molécules) Travaux spécifiques inités au laboratoire (LAMA) en 2017 (Ramgulam, 2017; Masson et al., 2018a) Nouveau système d'analyse performant en cours d'achat, mise en
LC-HRMS Composition moléculaire Travaux spécifiques inités au laboratoire (LAMA) depuis 2017 (Masson et al., 2018a); stage de M2 prévu en 2019

Le traitement et l’interprétation de l’ensemble des données générées s‘appuieront sur des méthodologies chimiométriques innovantes : par exemple, utilisation des méthodes multi-voies, type PARAFAC, pour le traitement et l’interprétation des données de fluorescence 3D (Murphy et al., 2013) ; combinaison de méthodes multi-voies et multi-blocs pour la recherche des différents marqueurs sur l’ensemble des données générées et pour construire une typologie de la MOD en fonction des sources. Le doctorant pourra aussi s’inspirer des nouvelles stratégies de traitement de données (principalement issues du domaine des omics) pour extraire les informations pertinentes à partir de jeu de données complexes (par ex. stratégies de « data mining »).

Enfin, le doctorant appliquera cette stratégie originale de caractérisation pour identifier les sources de MOD dans un BV sous pression urbaine : soit l’Yzeron (BV péri-urbain dont la qualité des eaux est actuellement suivie par les équipes LAMA et HBV dans le cadre du Réseau des Bassins Versants) ou le Gier (BV anthropisé dont la qualité des eaux est actuellement suivie par le LAMA ; projet RSP-EIP, AFB). Il pourra aussi étudier l’atténuation des empreintes à des distances plus ou moins importantes de la source (étude spatiale et temporelle).

La comparabilité des données produites à différents jours d’analyse est essentielle pour un traitement optimal des données. Pour la grande majorité des méthodes analytiques envisagées, celle-ci est parfaitement maitrisée et définie.

Ceci est plus complexe pour les techniques de LC-HRMS (dérive importante dans le temps et manque d’étalons stable dans le temps) ; cependant, des méthodologies sont en cours d’étude au LAMA afin de s’assurer de pouvoir comparer des données produites à des jours différents.

4. Résultats attendus

Les résultats attendus sont les suivants :

  • le développement d’une stratégie innovante de caractérisation approfondie de la MOD basée sur une approche intégrée (incluant le choix des techniques d’analyse et le traitement statistique de l’ensemble des données produites) ;
  • la conception de nouveaux marqueurs et d’une typologie pour identifier des sources de MOD dans les milieux aquatiques ;
  • la constitution d’une base de données originale sur la composition et les propriétés physico-chimiques de la MOD dans des échantillons variés de rejets urbains et d’eaux de rivières. Cette base de données pourra être complétée par la suite et servir comme référence pour les études futures sur la MOD ;
  • la création de nouvelles connaissances sur la variabilité spatio-temporelle de la MOD dans les BV périurbains soumis à des pressions anthropiques et les sources potentielles naturelles et anthropiques de MOD.

Ce projet de thèse s’inscrit dans le thème 1 du projet de l’UR RiverLy « Flux et mécanismes de transferts  », et plus particulièrement dans l’action 1.2 « Transferts, sources, devenir, réactivité des contaminants dans les différents compartiments des cours d’eau, depuis leurs sources, en passant par leurs transferts et leurs transformations, jusqu’à l’évaluation de leur présence au sein des cours d’eau ».

5. Environnement de la thèse, financement et partenariats

Pour élaborer la stratégie d’échantillonnage, le doctorant pourra s’appuyer sur les connaissances et l’expérience du LAMA (i.e. projets AMPERES, ARMISTIQ et ZRV) et sur de la documentation officielle recensant les STEU (type de traitement, capacité, localisation du rejet dans le milieu récepteur… ; cf. portail d'information sur l'assainissement communal). Pour le choix des sites de prélèvement et pour collecter ce vaste panel d’échantillons, le doctorant s’appuiera, entre autre, sur des programmes de recherche du LAMA et des collègues de l’UR RiverLy et d’autres partenaires scientifiques sur les sites ateliers et observatoires de la ZABR (ex : SAAM, RBV Yzeron, OTHU, OSR, Claduègne).

Le LAMA dispose du matériel nécessaire au prélèvement et au conditionnement des échantillons d’eaux avant leur analyse et de l’ensemble des appareils permettant l’analyse des paramètres classiques ou en développement pour la caractérisation des eaux résiduaires et naturelles (https://lama.irstea.fr/). Une partie des analyses sera réalisée par le personnel technique du LAMA et par des stagiaires (niveau IUT). Le doctorant encadrera des étudiants (Master 2) pour l’aider dans la constitution de la base de données (prélèvements et analyses) et le traitement des données.

Pour les analyses par LC-HRMS, le doctorant pourra s’appuyer sur l’expertise de C. Miège et C. Margoum (LAMA) et les travaux menés au sein du réseau NORMAN et dans AQUAREF avec B. Bonnefille (CR en CDD sur l’analyse non ciblée ; réseau français de métabolomique et fluxomique). La thèse sera encadrée par M. Masson qui possède une bonne expérience d’encadrement (actuellement dans deux comités de pilotage de thèse, 5 encadrements de stage à Irstea dont 2 M2) et une solide expertise dans la plupart des techniques envisagées et dans l’analyse et l’interprétation des données (Masson et al., 2011 ; Masson et al., 2018a ; 2018b). La direction sera dirigée par C. Miège (Co-encadrements de 8 thèses, organisatrice principale du VIIIe colloque national de l’IHSS sur les "rôle et fonction des matières organiques dans l'environnement", 27-28 nov. 2007, Lyon, France).

Pour le traitement des données, le doctorant pourra s’appuyer sur des ressources humaines internes Irstea comme D. Degli Esposti (UR RiverLy) qui exploitent des données complexes dans les domaines de l’analyse non ciblée de micropolluants et des biomarqueurs de toxicité pour les organismes aquatiques ; et O Chapleur qui développe des approches biostatistiques dans l’UR PROSE.

Plusieurs partenariats sont envisagés : i) L Mazeas et T Bouchez de l’UR PROSE d’Irstea d’Antony pour les analyses par FT-ICR et pour le traitement des données (biostatistique), ii) E. Parlanti (UMR 5805 CNRS EPOC-LPTC; Université de Bordeaux) pour les analyses par fluorescence 3D, le traitement et l’interprétation des résultats.

6. Profil du candidat

Le candidat recherché devra avoir des connaissances et une expérience en chimie appliquée à l‘environnement et en sciences de l’environnement, ainsi que des compétences et/ou un fort intérêt pour la chimiométrie, (bio)statistiques et traitement de gros jeux de données (de type « data mining », exploration de données et extraction de connaissance à partir d’un jeu de données conséquent). En fin de thèse, le candidat se sera construit un profil à double compétence en chimie (avec une grande palette de techniques dont la spectroscopie et la spectrométrie de masse haute résolution) et en traitement statistique des données complexes. Ce genre de profil se développe fortement et est très recherché, notamment dans le domaine proche des omiques avec recherche de biomarqueurs de toxicité ; il reste très original dans le domaine de la chimie environnementale.

Plus d’informations dans le descriptif de l’offre téléchargeable ici.