Global ETD Search

191	Méthodes Statistiques pour l'Analyse de Données Génétiques d'Association à Grande Echelle Guedj, Mickael 13 July 2007 (has links) (PDF) Les avancées en Biologie Moléculaire ont accéléré le développement de techniques de génotypage haut-débit et ainsi permis le lancement des premières études génétiques d'association à grande échelle. La dimension et la complexité des données issues de ce nouveau type d'étude posent aujourd'hui de nouvelles perspectives statistiques et informatiques nécessaires à leur analyse, constituant le principal axe de recherche de cette thèse.<br />Après une description introductive des principales problématiques liées aux études d'association à grande échelle, nous abordons plus particulièrement les approches simple-marqueur avec une étude de puissance des principaux tests d'association, ainsi que de leur combinaisons. Nous considérons ensuite l'utilisation d'approches multi-marqueurs avec le développement d'une méthode d'analyse fondée à partir de la statistique du Score Local. Celle-ci permet d'identifier des associations statistiques à partir de régions génomiques complètes, et non plus des marqueurs pris individuellement. Il s'agit d'une méthode simple, rapide et flexible pour laquelle nous évaluons les performances sur des données d'association à grande échelle simulées et réelles. Enfin ce travail traite également du problème du test-multiple, lié aux nombre de tests à réaliser lors de l'analyse de données génétiques ou génomiques haut-débit. La méthode que nous proposons à partir du Score Local prend en compte ce problème. Nous évoquons par ailleurs l'estimation du Local False Discovery Rate à travers un simple modèle de mélange gaussien.<br />L'ensemble des méthodes décrites dans ce manuscrit ont été implémentées à travers trois logiciels disponibles sur le site du laboratoire Statistique et Génome : fueatest, LHiSA et kerfdr. [SDV] Life Sciences Génétique Statistique association déséquilibre de liaison épidémiologie score local test-multiple modèle de mélange puissance modélisation simulation Bioinformatique
192	Etude du déterminisme génétique de caractères quantitatifs chez les végétaux: Méta-analyse de QTL et études d'association. Veyrieras, Jean-Baptiste 02 1900 (has links) (PDF) L'étude de l'hérédité de caractères quantitatifs est au coeur de la génétique depuis l'avènement de cette science au siècle dernier. La génétique quantitative dispose désormais d'un cadre expérimental et théorique bien établi pour étudier les facteurs génétiques sous-jacents à l'hérédité de caractères complexes, que ce soit dans un but cognitif ou pour épauler les programmes d'amélioration variétale chez les espèces d'intérêt agronomique. Généralement, l'étude du déterminisme génétique de caractères quantitatifs s'articule autour de trois étapes majeures: i) déterminer les principaux locus impliqués dans la variation observée (dénommés QTL pour (( Quantitative Trait Loci ))), ii) identifier les gènes en cause, iii) discriminer les principales formes alléliques de ces gènes et évaluer leurs effets. L'avènement des marqueurs moléculaires et de la génomique au cours des vingt dernières années a facilité la mise en oeuvre de dispositifs expérimentaux de cartographie de QTL en génétique végétale. Il est désormais possible d'avoir accès, via les bases de données publiques, à une masse importante de résultats de détection de QTL. Parallèlement, pour certaines espèces végétales, l'annotation de leurs génomes fournit une information de plus en plus riche et précise sur la structure et la fonction des gènes. L'objectif de cette thèse était double. D'une part nous avons cherché à développer une nouvelle approche de type méta-analyse pour optimiser le croisement entre les données de QTL et celles issues de la génomique, dans le but de faciliter la recherche de gènes candidats. Une fois ces derniers identifiés, l'association entre leur diversité allélique et la variation du caractère peut [SDU] Sciences of the Universe [SDV] Life Sciences Marqueurs moléculaires Qtl Méta-analyse D´eséquilibre de liaison Structure génétique études d'association Bioinformatique
193	Étude de l'ordre des gènes clusters de gènes et algorithmique des réarrangements / Figeac, Martin Delahaye, Jean-Paul Varré, Jean-Stéphane January 2007 (has links) Reproduction de : Thèse de doctorat : Informatique : Lille 1 : 2004. / N° d'ordre (Lille 1) : 3565. Titre provenant de la page de titre du document numérisé. Bibliogr. p. 173-177. Index.
194	Caractérisation de marqueurs moléculaires associés à un haut risque de développement de métastases chez des patients atteints du mélanome de la choroïde. Laurent, Cecile 26 September 2011 (has links) (PDF) La choroïde ou uvée, située entre la rétine et la sclérotique, est une membrane vasculaire qui tapisse la paroi de l'œil, son rôle est d'assurer l'apport en nutriment de la rétine et de l'iris. Ce tissu peut être le siège de nombreuses tumeurs, bénignes ou malignes. Le mélanome de la choroïde est la tumeur intra-oculaire la plus fréquente de l'adulte mais les facteurs de risque sont mal connus: l'exposition aux ultraviolets n'est pas clairement établi dans la genèse de la tumeur, de même que l'âge ou le sexe.L'énucléation a longtemps été considérée comme la seule option thérapeutique, mais depuis de nombreuses années, des techniques dites conservatrices de l'œil se sont développées. Des études ont montré qu'il n'y a pas de différence significative de survie entre les patients ayant subis une énucléation et les patients traités avec des méthodes conservatrices. De plus, à ce jour, aucune thérapie adjuvante n'a montré son efficacité après le traitement du mélanome oculaire primaire. En effet, malgré un traitement initial bien adapté, la moitié des patients va récidiver sur le mode métastatique. Environ 30\% des patients récidivent dans les 5 ans, ce chiffre augmente jusqu'à 50\% à 15 ans.L'œil étant dépourvu de structures lymphatiques, la diffusion métastatique du melanome uvéal se fait par voie hématogène. Le foie est le site privilégié de développement de métastases, faisant toute la gravité du pronostic. La médiane de survie après apparition de métastases est de 2 à 6 mois en l'absence de traitement. Il peut exister de façon plus anecdotique des métastases pulmonaires, ganglionnaires, osseuses ou cutanées.Sur un plan génétique, les critères les plus fréquemment détectés pour le mélanome uvéal sont la perte du chromosome 3 et le gain du 8q. Plusieurs études montrent dans beaucoup de cas des aberrations chromosomiques non aléatoires sur les chromosomes 1, 3, 6 et 8 et que la perte du chromosome 3 et le gain du 8q sont associés significativement à une survie réduite et au développement de métastase. Plusieurs rapports suggèrent deux entités distinctes de mélanome uvéal (avec et sans monosomie du chromosome 3) qui ne peuvent pas être différenciées du fait de leur aspect clinico-pathologique similaire.Afin d'améliorer le diagnostic et le traitement du mélanome de la choroïde, nous proposons d'effectuer des analyses d'expression et du nombre de copie d'ADN de ce mélanome particulier, avec pour objectifs : l'identification des gènes liés à l'apparition de métastase pour classer les patients à haut risque afin qu'ils puissent bénéficier d'une immunothérapie adjuvante spécifique, la caractérisation de ces gènes au niveau moléculaire, et l'étude du potentiel de ces gènes en tant que cibles thérapeutiques.Dans ce manuscrit je décrirai en détail le lignage mélanocytaire afin de comprendre les particularités du mélanome de la choroïde par rapport au mélanome cutané, puis j'aborderai l'importance des approches haut débit dans l'étude des cancers et les techniques d'analyse bioinformatiques utilisées. Je présenterai ensuite les différents résultats obtenus comme la mise en évidence d'une phosphatase, PTP4A3, qui semble avoir de l'importance dans le développement métastatique du mélanome de la choroïde. Bioinformatique mélanome de la choroïde Puces à ADN Transcriptome génome Développement métastatique
195	Approches Combinatoires pour le Consensus d'Arbres et de Séquences Guillemot, Sylvain 09 December 2008 (has links) (PDF) Cette thèse étudie d'un point de vue algorithmique diverses méthodes de consensus portant sur des collections d'objets étiquetés. Les problèmes étudiés impliquent des objets étiquetés sans répétition d'étiquettes ; ces objets peuvent être des arbres enracinés ou des séquences, avec des applications à la bioinformatique. Ainsi, les problèmes sur les arbres considérés dans cette thèse peuvent trouver des applications pour l'estimation de congruence entre phylogénies, pour la construction de superarbres, et pour l'identification de transferts horizontaux de gènes. Pour leur part, les problèmes sur les séquences considérés dans cette thèse ont des applications potentielles pour le calcul de distance génomique basé sur les ordres de gènes. De manière générale, ce travail met à profit les théories de la complexité paramétrique et de l'approximabilité pour obtenir des algorithmes et des résultats de difficulté pour les problèmes étudiés. [INFO] Computer Science [INFO] Informatique Méthodes de consensus algorithmique complexité calculatoire complexité paramétrique algorithmes paramétrés algorithmes d'approximation bioinformatique
196	Développement d'une infrastructure d'analyse multi-niveaux pour la découverte des relations entre génotype et phénotype dans les maladies génétiques humaines Luu, Tien Dao 24 October 2012 (has links) (PDF) Répondant au besoin de mieux comprendre les relations qui lient un génotype aux phénotypes moléculaires et cliniques associés, nous avons développé une nouvelle infrastructure bioinformatique qui unit, dans un même système, la collecte, la gestion, la maintenance et le traitement de multiples données ou informations. La première contribution de cette thèse est SM2PH Central et sa capacité de générer des instances. SM2PH Central constitue notre centre de référence en ligne pour toutes les protéines humaines intégrant des niveaux d'informations qui vont des aspects génomiques, structuraux, fonctionnels ou évolutifs aux aspects de transcriptomique, interactomique, protéomique ou métabolomique. La deuxième contribution est MSV3d, une ressource d'annotation multi-niveau (propriétés physico-chimiques, fonction, évolution, structure) des mutations humaines connues. MSV3d fournit l'ensemble des connaissances exploitées par la troisième contribution de cette thèse à savoir KD4v, notre base d'extraction de connaissances pour prédire l'impact phénotypique d'une mutation. La base de connaissances de KD4v induite par la Programmation Logique Inductive contient des règles exploitables par un humain ou un ordinateur et des facteurs prédictifs caractérisant les mutations neutres ou délétères. Enfin, l'ultime contribution de cette thèse est liée au développement de GEPeTTO, un prototype de priorisation de gènes. Une application biologique a été réalisée. Nous avons étudié la cécité nocturne en utilisant SM2PH Central, en combinaison avec le service d'annotation de MSV3d et la méthode de prédiction KD4v pour analyser le gène GPR179 et ses deux mutations nouvellement identifiées. Infrastructure bioinformatique Relations génotype-phénotype SM2PH MSV3d KD4v
197	Extraction de Motifs Communs dans un Ensemble de Séquences.<br />Application à l'identification de sites de liaison aux protéines dans les séquences primaires d'ADN. Mancheron, Alban 29 September 2006 (has links) (PDF) L'extraction de motifs ayant une signification biologique, et notamment l'identification de sites de régulation de la synthèse protéique dans les séquences primaires d'ADN est un des enjeux de la recherche en bioinformatique. Une anomalie dans cette régulation peut avoir de graves conséquences sur la santé d'un organisme. Aussi, l'extraction de ces sites permet de mieux comprendre le fonctionnement cellulaire et de soigner certaines pathologies.<br /><br />Les difficultés posées par ce problème sont le manque d'informations sur les motifs à extraire, ainsi que le volume important des données à traiter. Deux algorithmes polynomiaux -- l'un déterministe et l'autre probabiliste -- permettant de le traiter ont été conçus. Dans ce contexte, nous avons introduit une nouvelle famille de fonctions de score et étudié leurs propriétés statistiques. Nous avons également caractérisé le langage reconnu par la structure d'index appelée "Oracle", et proposé une amélioration la rendant plus efficace. [INFO:INFO_OH] Computer Science/Other [INFO:INFO_OH] Informatique/Autre bioinformatique algorithmique statistiques automates extraction de motifs structures d'index application à l'ADN
198	Outil d'aide au diagnostic du cancer à partir d'extraction d'informations issues de bases de données et d'analyses par biopuces Hedjazi, Lyamine 08 December 2011 (has links) (PDF) Le cancer est l'une des causes les plus fréquentes de décès dans le monde. Actuellement, le cancer du sein est le plus répandu dans les cancers féminins. Malgré les avancées significatives faites ces dernières décennies en vue d'améliorer la gestion du cancer, des outils plus précis sont toujours nécessaires pour aider les oncologues à choisir le traitement nécessaire à des fins de guérison ou de prévention de récidive tout en réduisant les effets néfastes des ces traitements ainsi que leurs coûts élevés. Ce travail porte sur l'utilisation de techniques d'apprentissage automatique pour développer de tels outils de gestion du cancer du sein. Les facteurs cliniques, tels que l'âge du patient et les variables histo-pathologiques, constituent encore la base quotidienne de prise de décision pour la gestion du cancer du sein. Cependant, avec l'émergence de la technologie à haut débit, le profil d'expression génique suscite un intérêt croissant pour construire des outils plus précis de prédiction du cancer du sein. Néanmoins, plusieurs challenges doivent être relevés pour le développement de tels outils, principalement: (1) la dimensionnalité des données issues de la technologie des puces, (2) le faible rapport signal sur bruit dans la mesure de biopuces, (3) l'incertitude d'appartenance des patients aux différents groupes du cancer, et (4) l'hétérogénéité des données présentes habituellement dans les bases de données cliniques. Dans ce travail, nous proposons quelques approches pour surmonter de manière appropriée de tels challenges. Une première approche aborde le problème de haute dimensionnalité des données en utilisant les capacités d'apprentissage dit normé ℓ1 pour la conception d'un algorithme de sélection de variables intégré à la méthode SVM (machines à vecteurs supports), algorithme basé sur une technique de gradient. Une deuxième approche permet de gérer simultanément tous les problèmes, en particulier l'intégration de plusieurs sources de données (cliniques, pu ces à ADN, ...) pour construire des outils prédictifs plus précis. Pour cela, un principe unifié est proposé pour surmonter le problème de l'hétérogénéité des données. Pour tenir compte de l'incertitude d'appartenance et augmenter l'interprétabilité du modèle, ce principe est proposé dans le cadre de la logique floue. Par ailleurs, afin d'atténuer le problème du bruit de niveau élevé, une approche symbolique est proposée suggérant l'utilisation de la représentation par intervalle pour modéliser les mesures bruitées. Nous avons conçu en particulier, basée sur ce principe, une approche floue supervisée de pondération de variables. Le processus de pondération repose essentiellement sur la définition d'une marge d'appartenance pour chaque échantillon. Il optimise une fonction objective basée sur la marge d'appartenance afin d'éviter la recherche combinatoire. Une extension de cette approche au cas non supervisé est effectuée pour développer un algorithme de regroupement automatique basé sur la pondération des règles floues. L'efficacité de toutes les approches a été évaluée par des études expérimentales extensives, et comparée avec des méthodes bien connues de l'état de l'art. Enfin, un dernier travail est consacré à des applications des approches proposées dans le domaine du cancer du sein. En particulier, des modèles prédictifs et pronostiques ont été extraits à partir des données de puces à ADN et/ou des données cliniques, et leurs performances comparées avec celles d'approches génétiques et cliniques existantes. [INFO:INFO_AU] Informatique/Automatique
199	Sources des mycobactéries non-tuberculeuses dans les bassins versants Radomski, Nicolas 28 February 2011 (has links) (PDF) L'eau et le sol sont considérés comme des sources potentielles de mycobactéries non-tuberculeuses (MNT). Parmi les infections humaines causées par les MNT d'origine environnementale, les infections pulmonaires et cutanées sont souvent décrites. Le manque de connaissances sur leur cycle de vie dans l'environnement requiert des outils analytiques, qui ne sont actuellement pas adaptés à ce type d'échantillons. Cette thèse vise donc premièrement à proposer des méthodes de quantification en bactériologie et en biologie moléculaire dans le but de déterminer les sources des MNT dans les bassins versants. Ainsi, la comparaison des méthodes d'isolement de MNT a montré que le traitement au chlorure de cetylpyridininium de l'eau suivi d'une culture en milieu riche supplémenté par un mélange d'antibiotiques (polymyxine B, amphotéricine, acide nalidixique, triméthoprime, carboxy-pénicilline) limitait la croissance des microorganismes interférents et éliminait moins de MNT que les autres méthodes comparées (Radomski et al. 2010, doi: 10.1128/AEM.00942-10). Bien que des espèces de MNT potentiellement pathogènes aient été isolées de l'eau de surface de la Seine en utilisant ces outils bactériologiques, la quantification des MNT ne s'est pas avérée reproductible. En conséquence, une méthode de quantification par polymérisation en chaîne en temps réel (qPCR) a été développée pour énumérer le genre Mycobacterium dans l'eau (Radomski et al. 2010, doi: 10.1128/AEM.02659-09). La nouvelle méthode développée, ciblant l'ARNr 16S, était plus spécifique que les autres méthodes qPCR publiées, ciblant un autre locus de l'ARNr 16S et le gène hsp65 (respectivement 100 % versus 44 % et 91 %). La comparaison des méthodes d'extraction d'ADN mycobactérien a montré que la lyse enzymatique combinée au bromure d'hexadécyltriméthylammonium était la procédure la plus efficace pour énumérer par qPCR les MNT dans des échantillons environnementaux. Ainsi, ces méthodes d'extraction d'ADN et de qPCR ont été utilisées pour étudier des sources de MNT dans des bassins versants. Dans un second temps, nous avons étudié trois sources potentielles de MNT : une ponctuelle et deux diffuses. Plus précisément, une station d'épuration (STEP) a été choisie comme source ponctuelle de MNT et a été étudiée en temps sec en fonction d'indicateurs de contamination fécale et des paramètres globaux habituellement contrôlés. Les MNT ont atteint 5,52×105±3,97×105 copies/L dans l'eau en entrée de STEP (84 % d'échantillons positifs), n'ont pas été détectées dans l'eau en sortie de STEP après décantation physico-chimique et biofiltration et ont été estimées à 1,04×106 ±1,75×106 copies/g dans les boues de STEP (50 % d'échantillons positifs). La plupart des MNT (98±2 %, correspondant à 2,45±0,78 log10) ont été éliminées par décantation physico-chimique et les MNT restantes (0,74×104 ±1,40×104 copies/L) ont été éliminées par biofiltration (53 % d'échantillons positifs). Ces résultats ont montré également que Mycobacterium, Escherichia coli et les entérocoques intestinaux possèdent des comportements significativement différents conduisant respectivement à trois modèles : hydrophobe, hydrophile et intermédiaire. Concernant les sources diffuses, la densité de MNT a été mesurée dans divers sols ruraux et urbains qui ont été caractérisés par différents paramètres physico-chimiques. Les densités de MNT les plus importantes ont été mesurées dans des sols de forêts tourbeuses (9,27×104±5,00×104 copies/g sec) et dans des sols faiblement urbanisés proches de marécages côtiers (1,71×106±2,85×106 copies/g sec) alors qu'aucune MNT n'a été détectée dans les autres types de sols étudiés. De plus, la densité de MNT a été significativement associée à des sols proches de zones acides et des teneurs fortes des sols en eau, matière organique et fer. Ces résultats suggéreraient que les MNT sont dépendantes de leur production intra et extracellulaire de chélateurs de fer et indiqueraient que les zones faiblement urbanisées pourraient être impactées par la proximité de marais acides. Afin d'étudier une autre source diffuse, les MNT et d'autres paramètres ont été mesurés lors d'événements pluvieux dans l'eau de surface de la Marne et de ses principaux affluents. Les densités de MNT ont été estimées à 2,16×105±2,36×105 copies/L dans environ 20 % des échantillons d'eau collectés, et elles ne différaient pas entre les zones péri-urbaines et rurales échantillonnées. Nos résultats ont montré que la pluviométrie et la durée de l'évènement expliquaient la diminution du nombre de MNT détectées dans l'eau de surface au cours de l'événement pluvieux de faible intensité (6,6 mm/h de pluviométrie cumulées en 5,5 h). Ces résultats ont souligné que certains affluents de la Marne pouvaient apporter des MNT en temps sec, mais qu'au cours de l'évènement pluvieux suivi les densités de MNT diminuaient.En guise d'amélioration à ces études appliquées, des réflexions sur les défis relatifs à la surveillance des microorganismes pathogènes dans l'environnement ont été explorées. En nous focalisant sur la MNT la plus pathogène, M. avium, nous avons discuté des défis de la détection et de l'énumération et proposé un guide d'adaptation des méthodes médicales aux échantillons environnementaux (Radomski et al. 2011, ed. A. Méndez-Vilas, Vol. 2). Ce guide se présente sous la forme d'un arbre de décision permettant de choisir les outils analytiques les plus appropriés pour surveiller les microorganismes pathogènes dans l'environnement. De plus, une stratégie in silico de comparaison de génomes bactériens totalement séquencés a été développée dans le but de décrire des nouvelles cibles de détection. L'analyse in silico des génomes totalement séquencés a permis de détecter 11 protéines présentant entre 80 % et 100 % de similarité dans les génomes mycobactériens et moins de 50 % de similarité dans les génomes non-mycobactériens des genres Corynebacterium, Nocardia et Rhodococcus. Sur la base d'alignements des séquences d'ADN de ces cibles potentielles, il a été possible de dessiner des amorces PCR et une sonde pour détecter le gène codant la sous-unité C de la synthase de l'adénosine triphosphate qui semble exclusivement conservée dans le génome mycobactérien. Le développement d'outils analytiques, en particulier la qPCR, a permis de montrer qu'une STEP éliminait efficacement les MNT et que le traitement des eaux usées est nécessaire pour préserver l'eau de surface de cette source ponctuelle de MNT. Il a été mis en évidence que les événements pluvieux diminuent la densité de MNT dans l'eau de surface et que les sols acides sont des sources naturelles majeures de MNT qui pourraient impacter des zones faiblement urbanisées en temps de pluie via le ruissellement. Concernant les réflexions sur la surveillance des microorganismes pathogènes dans l'environnement, l'arbre de décision des outils analytiques appropriés et la nouvelle stratégie in silico de détection de cibles moléculaires pourraient être appliqués pour l'étude d'autres microorganismes de l'environnement Mycobacterie Bacteriologie Biologie moleculaire Eau Sol ADN Bioinformatique
200	Biodiversity occurences and patterns from the angle of systematics / Les occurrences et les tendances de la biodiversité sous l'angle de la systématique Troudet, Julien 29 November 2017 (has links) Dans le contexte actuel de crise de biodiversité, il est primordial de comprendre où et comment se distribuent les êtres vivants. En utilisant les données de biodiversité gérées par le GBIF (> 640 millions d'occurrences) et couvrant 24 classes taxonomiques, j'ai étudié un patron de biodiversité remarquable, le gradient latitudinal de diversité (LDG). Cet objectif m'a d'abord amené à produire des outils informatiques afin de manipuler ces données de biodiversité (Big Data), puis à évaluer la qualité des données. J’ai alors mis en évidence deux phénomènes importants. Premièrement, un fort biais taxonomique existe dans les données d'occurrences de biodiversité. Certains taxons sont plus étudiés que d'autres, créant un déficit de connaissance pour certains groupes et se révélant problématique pour notre compréhension globale de la biodiversité. Ce biais semble s'expliquer en partie par l'impact des préférences sociétales. Deuxièmement, un changement radical dans la production de ces données: de plus en plus de données primaires de biodiversité sont de simples observations et non plus des spécimens récoltés et mis en collection. Les dangers et avantages liés à ce changement de pratique sont discutés, le rôle de spécimens vouchers est rappelé et la nécessité d'acquérir des données supplémentaires est soulignée. Enfin, fort de cette analyse critique des données primaires de biodiversité, six hypothèses pouvant expliquer le LDG sont testées sur un jeu de données nettoyées couvrant huit classes taxonomiques. Ce test permet de réfuter une hypothèse de contrainte géométrique récente mais jamais testée pour finalement révéler que l'hypothèse de productivité est la mieux soutenue. / In the current context of biodiversity crisis, it is essential to understand where and how life is distributed. Using biodiversity data managed by the GBIF (>640 million occurrences) covering 24 taxonomic classes, I investigated one of the best-known biodiversity patterns: the latitudinal diversity gradient (LDG), which is characterized by an increase in specific richness as we approach the equator. This objective first led me to produce informatics tools for handling large amount of data (Big data paradigm), before evaluating the quality of primary biodiversity data. Two important outcomes resulted from this evaluation. First, I highlight that a strong taxonomic bias exists in biodiversity occurrences. This bias implies that some taxa are more studied than others, creating a knowledge gap detrimental to our understanding of biodiversity as a whole. This bias is strongly impacted by societal preferences rather than research activity. Second, a radical change in biodiversity data gathering practices is happening: primary biodiversity data are now mostly observation-based and not specimen-based. Assets and liabilities of this shift are discussed, while the role of voucher specimens is reiterated and, for observations, the need for ancillary data is underlined. Finally, six hypotheses proposed to explain the LDG are tested on a cleaned dataset encompassing eight taxonomic classes. A recent, but never tested, version of the geometric constraint hypothesis is refuted, while the productivity hypothesis is strongly supported. Bioinformatique Données primaires de biodiversité Biais taxonomique Spécimens Big-data Gradient latitudinal de diversité Bioinformatics Primary biodiversity data Taxonomic bias 570.15

Search results