Avertissement - Avril 2024
Les données capitalisées dans la BDSolU proviennent de projets de recherche, de rapports de diagnostics de sol et de programmes de détermination de valeurs de fonds pédogéochimiques locales. Le traitement de ces données a permis de déterminer les valeurs de fond présentées ici pour des sols de surface ou des sols profonds. Ces résultats sont mis à disposition afin d’être valorisés respectivement dans le cadre des démarches de diagnostic de sols et de valorisation des terres excavées.
L’usager est responsable de l’utilisation de ces résultats. En particulier, il lui incombe de s’assurer qu'ils sont appropriés au contexte dans lequel il les utilise.
Tout usage ou interprétation des informations statistiques, des graphiques et des cartes présentés ne saurait engager la responsabilité du BRGM, de l’ADEME, des partenaires du projet, du GIS Sol ou des fournisseurs de données de la BDSolU.
Les valeurs de fond apportent une aide à l’analyse de la situation et ne constituent pas des valeurs seuils. Elles ne sont pas gage d’absence de risque sanitaire.
Il est à noter que l'alimentation de la base de données s’effectue au fil du temps en fonction des contributions. Ainsi, les informations statistiques, les graphiques et les cartes présentés dans la BDSolU peuvent évoluer. Merci de vérifier que vous avez pris connaissance des dernières versions mises à jour.
Les travaux faisant référence aux informations statistiques, aux graphiques et aux cartes présentés ici, doivent porter :
- la mention :
Programme BDSolU du GIS Sol développé par le BRGM en partenariat avec INRAE et eOde, avec la collaboration de MINES ParisTech et le soutien de l'ADEME - 2023.
- la date de parution des résultats (voir en couverture) ;
- une référence aux présentes réserves via le site https://www.bdsolu.fr.
Contexte général - Avril 2024
Plus le nombre d'analyses disponibles dans la base de données est élevé et plus il devient possible de calculer des valeurs de fonds pédogéochimiques anthropisés fiables. L'analyse des données actuellement bancarisées dans la BDSolU fait apparaître plusieurs zones géographiques métropolitaines présentant un nombre d'analyses suffisant pour lancer ce calcul, aux profondeurs utiles dans le cadre d’un diagnostic de sol (0-5 et 0-30 cm) et/ou de la valorisation des terres excavées (plus de 30 cm).
Préalablement aux calculs, une étape de sélection des données vise l’obtention de la population la plus représentative possible en fonction de ces deux objectifs. Cette étape est rendue nécessaire en raison de la diversité des projets qui contribuent à la BDSolU et des hétérogénéités qui en découlent. Ainsi, dans un premier temps, les critères de sélection les plus stricts possibles ont été appliqués. Par exemple, pour les échantillons de surface, on a retenu uniquement les échantillons prélevés dans les parcs et jardins. Néanmoins le besoin d'un effectif suffisant pour permettre le calcul a parfois conduit à prendre en compte des données répondant à des critères moins stricts (par exemple, dans le cas de figure précédent, en acceptant les échantillons prélevés dans des espaces verts entourant des lieux d’habitation ou des installations sportives).
L’étape de calcul comprend :
- Un dégroupement spatial des points de prélèvements. En effet, en raison des objectifs des projets contributeurs de la BDSolU et des contraintes de prélèvement en milieu urbain, les points de prélèvements ne sont pas distribués uniformément dans la zone géographique étudiée. Les résultats d’analyse ont donc été pondérés en tenant compte de leur répartition.
- La prise en compte des valeurs inférieures à la limite de quantification ou LQ (valeurs < LQ aussi appelées valeurs censurées). Ces concentrations détectées par les méthodes d’analyse mises en œuvre au laboratoire, sont toutefois trop faibles pour être quantifiées de façon fiable. Souvent ignorées, ces valeurs sont pourtant porteuses d’information. Et leur substitution par des valeurs arbitraires (par exemple, 0 ou LQ/2) entraîne des biais statistiques. Dans le cadre des présents travaux, elles ont donc été valorisées au moyen d’une méthode de discrétisation qui consiste à les remplacer par des valeurs calculées, pondérées et situées entre 0 et la LQ (valeurs discrétisées).
- Le calcul des sommes de concentration pour certaines familles de substances (16 HAP, PCBi, dioxines et furanes…). Il s’agit simplement d’effectuer la somme des concentrations de chaque substance appartenant à cette famille. Toutefois, là aussi les concentrations < LQ, parfois ignorées également, ont été prises en compte. Dans tous les cas la somme indiquée correspond à la somme de l’ensemble des concentrations et des LQ. Si au moins l’une des concentrations concernées est < LQ, alors la somme est indiquée comme < LQ. Les limites de quantification des sommes ont été calculée selon le même principe. En outre, les sommes de dioxines et de furanes sont fournies en TEQ OMS 2005. Il s’agit de Quantités Equivalentes Toxiques calculées par pondération des concentrations de chaque molécule au moyen de Facteurs de Toxicité Equivalente (TEF) proposés par l’organisation mondiale de la santé en 2005).
- Les limites basse et haute sont calculées respectivement selon les formules des vibrisses inférieure et supérieure internes de Tukey (voir la description du diagramme en boîte selon Tukey ci-dessous). La limite haute est aussi appelée la ligne de base de cette gamme.
Enfin, les résultats sont proposés en suivant les principales modalités suivantes :
- si, pour le paramètre retenu, l’effectif de la population des analyses obtenues après sélection des données brutes bancarisées est inférieur à 30, seules les principales valeurs statistiques sont fournies (moyenne, médiane, écart type, coefficient de variation, quantiles) ;
- si, pour le paramètre retenu, l’effectif de la population des analyses obtenues après sélection des données brutes bancarisées est supérieur à 30, les statistiques de bases sont complétées par les limites basse et haute de la gamme des concentrations de fond ;
- L’ensemble de ces valeurs de fonds est associé à un indicateur de fiabilité basé sur un nombre d’étoiles : * peu fiable, ** moyennement fiable, *** fiable ;
Cet indicateur tient compte du caractère plus ou moins strict des critères de sélection appliqués, de l'effectif, du taux de valeurs inférieures à la limite de quantification, de la dispersion (coefficient de variation) et de l'éventuelle plurimodalité de la population obtenue.
Les résultats obtenus sont accessibles depuis une carte ou en sélectionnant dans un formulaire à filtres, une zone géographique et un domaine de profondeur. Les pages qui s’affichent ensuite donnent accès à :
- un tableau simplifié des valeurs de fonds ;
- un tableau détaillé des valeurs de fond pour tableur (téléchargeable au format .csv) ;
- un fichier téléchargeable (au format .pdf) contenant le tableau détaillé des valeurs de fond ainsi que, pour chaque substance ou élément étudié :
- l'histogramme de répartition de la population de résultats d’analyse sélectionnée ;
- les diagrammes en boîtes de la distribution statistique de cette population ;
- une carte montrant la localisation géographique des points de prélèvement des échantillons de sol analysés.
Les informations détaillées concernant le projet ayant conduit à la conception de la BDSolU et du processus de traitement des données bancarisées sont consultables (courant 2024) dans le livrable disponible depuis la page Publications-Communications.
NB :
- Les populations de résultat d’analyse obtenues à l’issue de l’étape de sélection peuvent encore présenter des concentrations élevées. En nombre suffisamment réduit elles n’ont pas d’influence sur le calcul des limites internes de Tukey.
Les histogrammes et diagrammes en boîte fournis ci-après sont plus ou moins réguliers en fonction des caractéristiques de la population sélectionnée (effectif, taux de valeurs inférieures à la limite de quantification analytique, présence d’outliers ou d’une plurimodalité). De plus, on notera qu’un taux élevé de valeurs inférieures à la limite de quantification analytique peut altérer le processus de construction des diagrammes en boîtes codé dans le langage R.
Légende et interprétation - Septembre 2024
Légende du tableau détaillé de résultats
Nb. | Effectif de la population de résultats d’analyses utilisée |
< LQ(%) | Taux de résultats inférieurs à la limite de quantification. Pour une substance donnée, les LQ peuvent varier d’un échantillon à un autres. Ceci est dû :
Il est donc normal que pour des échantillons différents, une même valeur puisse être classée à la fois <LQ et >LQ ou que certaines valeurs plus élevées soient identifiées comme <LQ alors que des valeurs plus faibles sont identifiées comme >LQ. |
Nb. disc. | Nombre de concentrations discrétisées pour le traitement des valeurs inférieures à la limite de quantification |
Moyenne | Moyenne arithmétique des concentrations. Somme des n concentrations divisée par n. Formule de la moyenne des valeurs © Image BRGM |
Ecart type | Mesure de la dispersion des concentrations. Racine carrée de la moyenne des carrés de l’écart des n concentrations à leur moyenne. Formule de l'écart type © Image BRGM |
CV (%) | Coefficient de variation. ERRATUM : les résultats inscrits dans les fichiers PDF et CSV publiés en avril 2024 présentent des CV (%) qui ne sont pas exprimés en % mais selon la formule : écart type divisé par la moyenne. Formule du coefficient de variation © Image BRGM |
Q10 | Quantile 10% |
Q25 | Quantile 25% |
Médiane | Quantile 50% et médiane |
Q75 | Quantile 75% |
Q90 | Quantile 90% |
Q95 | Quantile 95% |
Vibrisse inf. int. | Vibrisse inférieure interne calculée : Limite basse de la gamme de concentrations de fond. Vib. inf. int. calc. = Q25 - 1,5 x (Q75-Q25) |
Vibrisse sup. int. | Vibrisse supérieure interne calculée : Limite haute de la gamme de concentrations de fond, Ligne de base. Vib. sup. int. calc. = Q75 + 1,5 x (Q75-Q25) |
Unités | Unités de mesure |
TEQ | Toxic Equivalent Quantity. Quantité toxique équivalente exprimée selon les modalités de calcul recommandées par l’OMS en 2005. |
Indice de fiabilité | Indice de fiabilité des valeurs de fond fournies : * faible, ** moyen, *** bon |
Description des diagrammes en boîte
Le diagramme en boîte (aussi appelé boite à moustaches ou boite de Tukey ou box and whisker plot en anglais) est une représentation graphique qui permet une visualisation rapide des données statistiques d’une population.
Description du diagramme en boîte
© Image BRGM
Description des histogrammes
L’histogramme est une représentation graphique qui permet de visualiser la distribution des données statistiques d’une population selon des intervalles appelés classes. Chaque classe de données est représentée par une colonne de hauteur proportionnelle à son effectif. Dans les histogrammes présentés ici, les résultats d’analyse inférieurs à la limite de quantification de la méthode d’analyse ont été remplacés par des séries de valeurs dites discrétisées.
Une même population peut présenter plusieurs limites de quantification.
Exemple d'histogramme
© Image BRGM
Description des cartes
Les cartes géographiques permettent d’apprécier l’étendue de la zone géographique où ont été sélectionnée les données, ainsi que l’uniformité de la répartition spatiale des points de prélèvement.