1 |
Interoperabilidade entre o modelo de dados do Taxonomic Data Working Group (TDWG) e tags do OpenStreetMap para a espécie Sotalia Guianensis / Interoperability between the data model of the Taxonomic Data Working Group (TDWG) and OpenStreetMap tags for the species Sotalia guianensisMolina, Cyntia Virolli Cid 23 March 2016 (has links)
A falta de padronização de dados pode resultar em perda de informações de suma importância nas diversas áreas do conhecimento, impossibilitando a integração de dados entre diferentes sistemas ou de diferentes bancos de dados, ou seja, os dados podem não ser interoperáveis. A solução para a integração de dados pode ser chamada de interoperabilidade, que são convenções e normas de formatos (extensões) e ontologias (padrões comuns) instituídos para que os sistemas possam dialogar. Um banco de dados de biodiversidade é um instrumento muito importante para as iniciativas de sua conservação, sendo útil para o seu conhecimento, registro histórico entre outros. Este trabalho desenvolveu uma metodologia para interoperar dados modelados no padrão Taxonomic Data Working Group (TDWG) e tags do OpenStreetMap (OSM) sobre a espécie Sotalia guianensis, conhecida como Boto Cinza. Dentro deste escopo, este trabalho se justifica pelo cenário de ameaça de extinção do Boto Cinza, pela necessidade no desenvolvimento de metodologias para a disponibilização de dados de ocorrência de Boto Cinza em bancos de dados de biodiversidade e pela necessidade de se desenvolver metodologia que permita a interoperabilidade entre bancos de dados de biodiversidade e outros Sistemas de Informação Geográfica (SIG). Este estudo propõe uma metodologia de baixo custo, com a utilização de plataformas livres, para que dados espaciais de Biodiversidade sejam modelados de maneira a evitar problemas taxonômicos, além de serem disponibilizados para conhecimento geral da população. O trabalho se mostra inovador por integrar dados do Global Diversity Information Facility (GBIF) com as Tags do OSM, possibilitando o cadastro padronizado e gratuito em uma plataforma livre e de alcance mundial através da criação de uma etiqueta interoperável de equivalência entre o padrão TDWG e as etiquetas do OSM. O resultado deste trabalho é a metodologia para a modelagem e publicação de dados de Boto Cinza no GBIF e OSM de forma interoperável, que foi implementada, testada e cujos resultados são positivos / The absence of data standardization may result in loss of information of major importance through several areas of knowledge, hindering data integration among different information systems or databases, that is, the data may not be interoperable. The solution for data integration may be called interoperability, which is comprised of conventions, data format standards (file extensions) and ontologies (standards), empowering the communication among information systems. A biodiversity database is a very important tool for biodiversity conservation initiatives, being useful for knowledge transfer, historical data storage among other activities. This work developed a methodology for interoperate data between the Taxonomic Data Working Group (TWDG) standard and OpenStreetMap (OSM) tags on Sotalia guianensis species, as known as Guiana dolphin. This work has its motivation scenario on the fact that the Guiana dolphin is under threat of extinction. This scenario demands the development of methodologies for the publication of the locations where the Guiana dolphin is being spotted over the biodiversity databases and the development of a methodology for interoperability among biodiversity databases as well as Geographic Information Systems (SIG). This study proposes a low cost methodology, which uses open-source platforms and focuses on two main goals: avoidance of taxonomical problems on biodiversity spatial data modelling and to provide the biodiversity spatial data to the population in general. This work proves itself innovative by integrating Global Diversity Information Facility (GBIF) data with OSM tags, allowing a free and standardized registry of data in an open-source global-scale platform by using an interoperable tag of equivalence data between the TDWG standard and OSM tags. The result of this study is the methodology for data modelling and publication of the Guiana dolphin on GBIF and OSM in an interoperable manner, which has been implemented, tested and gave positive results
|
2 |
Interoperabilidade entre o modelo de dados do Taxonomic Data Working Group (TDWG) e tags do OpenStreetMap para a espécie Sotalia Guianensis / Interoperability between the data model of the Taxonomic Data Working Group (TDWG) and OpenStreetMap tags for the species Sotalia guianensisCyntia Virolli Cid Molina 23 March 2016 (has links)
A falta de padronização de dados pode resultar em perda de informações de suma importância nas diversas áreas do conhecimento, impossibilitando a integração de dados entre diferentes sistemas ou de diferentes bancos de dados, ou seja, os dados podem não ser interoperáveis. A solução para a integração de dados pode ser chamada de interoperabilidade, que são convenções e normas de formatos (extensões) e ontologias (padrões comuns) instituídos para que os sistemas possam dialogar. Um banco de dados de biodiversidade é um instrumento muito importante para as iniciativas de sua conservação, sendo útil para o seu conhecimento, registro histórico entre outros. Este trabalho desenvolveu uma metodologia para interoperar dados modelados no padrão Taxonomic Data Working Group (TDWG) e tags do OpenStreetMap (OSM) sobre a espécie Sotalia guianensis, conhecida como Boto Cinza. Dentro deste escopo, este trabalho se justifica pelo cenário de ameaça de extinção do Boto Cinza, pela necessidade no desenvolvimento de metodologias para a disponibilização de dados de ocorrência de Boto Cinza em bancos de dados de biodiversidade e pela necessidade de se desenvolver metodologia que permita a interoperabilidade entre bancos de dados de biodiversidade e outros Sistemas de Informação Geográfica (SIG). Este estudo propõe uma metodologia de baixo custo, com a utilização de plataformas livres, para que dados espaciais de Biodiversidade sejam modelados de maneira a evitar problemas taxonômicos, além de serem disponibilizados para conhecimento geral da população. O trabalho se mostra inovador por integrar dados do Global Diversity Information Facility (GBIF) com as Tags do OSM, possibilitando o cadastro padronizado e gratuito em uma plataforma livre e de alcance mundial através da criação de uma etiqueta interoperável de equivalência entre o padrão TDWG e as etiquetas do OSM. O resultado deste trabalho é a metodologia para a modelagem e publicação de dados de Boto Cinza no GBIF e OSM de forma interoperável, que foi implementada, testada e cujos resultados são positivos / The absence of data standardization may result in loss of information of major importance through several areas of knowledge, hindering data integration among different information systems or databases, that is, the data may not be interoperable. The solution for data integration may be called interoperability, which is comprised of conventions, data format standards (file extensions) and ontologies (standards), empowering the communication among information systems. A biodiversity database is a very important tool for biodiversity conservation initiatives, being useful for knowledge transfer, historical data storage among other activities. This work developed a methodology for interoperate data between the Taxonomic Data Working Group (TWDG) standard and OpenStreetMap (OSM) tags on Sotalia guianensis species, as known as Guiana dolphin. This work has its motivation scenario on the fact that the Guiana dolphin is under threat of extinction. This scenario demands the development of methodologies for the publication of the locations where the Guiana dolphin is being spotted over the biodiversity databases and the development of a methodology for interoperability among biodiversity databases as well as Geographic Information Systems (SIG). This study proposes a low cost methodology, which uses open-source platforms and focuses on two main goals: avoidance of taxonomical problems on biodiversity spatial data modelling and to provide the biodiversity spatial data to the population in general. This work proves itself innovative by integrating Global Diversity Information Facility (GBIF) data with OSM tags, allowing a free and standardized registry of data in an open-source global-scale platform by using an interoperable tag of equivalence data between the TDWG standard and OSM tags. The result of this study is the methodology for data modelling and publication of the Guiana dolphin on GBIF and OSM in an interoperable manner, which has been implemented, tested and gave positive results
|
3 |
Limitations in Global Information on Species OccurrencesMeyer, Carsten 13 May 2015 (has links)
Detaillierte Informationen über die Verbreitungsareale von Arten sind essentiell für die Beantwortung zentraler Fragen der Ökologie, Evolutionsbiologie und Biogeographie. Solche Informationen sind auch notwendig, um Naturschutzressourcen kostenwirksam zwischen verschiedenen Regionen und Maßnahmen zu verteilen. Unser Wissen über Artverbreitungen beruht vor allem auf Punktdaten, die das Vorkommen einer bestimmten Art an einem bestimmten Ort zu einem bestimmten Zeitpunkt belegen (nachstehend „Records“). Riesige Mengen solcher Records wurden über internationale Data-Sharing-Netzwerke mobilisiert, allen voran durch die Global Biodiversity Information Facility (GBIF). Auch wenn diese Netzwerke die Zugänglichkeit zu solchen Informationen enorm verbessert haben, ist unser Wissen über globale Artverbreitungen immer noch äußerst lückenhaft und von grober räumlicher Auflösung – der sogenannte Wallace’sche Wissensrückstand. Vorhandene Informationen enthalten zudem zahlreiche Unsicherheiten, Fehler und Daten-‘Biases’. Diese könnten durch Ort-spezifische Faktoren wie Zugänglichkeit oder durch artspezifische Faktoren, wie Entdeckungswahrscheinlichkeit, verursacht werden. Zukünftiges Sammeln und Mobilisieren von Informationen sollte so gestaltet werden, dass der erreichte Nutzen der Records für Forschung und Naturschutz maximiert wird. Hierfür ist ein tiefgehendes Verständnis der Lücken, Unsicherheiten und Biases in den Informationen sowie der sie verursachenden Faktoren notwendig. Bisher wurden diese Mängel in globalen Artverbreitungsinformationen niemals quantitativ untersucht. Mit meiner Dissertation liefere ich die ersten globalen Analysen zu Mängeln von digital verfügbaren Verbreitungsinformationen für terrestrische Wirbeltiere und Landpflanzen.
Ich habe >300 Millionen Records für Landpflanzen und drei Gruppen terrestrischer Wirbeltiere (Amphibien, Säugetiere, Vögel) über GBIF abgerufen. Diese Informationen habe ich mit taxonomischen Datenbanken sowie unabhängigen Verbreitungskarten und Checklisten verbunden. Auf Grundlage der erstellten Datensätze habe ich unterschiedliche Formen von Informations-Mängeln für verschiedene taxonomische Gruppen und auf mehreren räumlichen Maßstäben untersucht. In Kapitel I habe Daten-Abdeckung sowie Daten-Unsicherheiten in Informationen zu Pflanzenvorkommen jeweils in Bezug auf Taxonomie, Raum und Zeit quantifiziert. Für diese insgesamt 6 Maße habe in anschließend Variation in den drei Dimensionen (Taxonomie, Raum, Zeit) gemessen. Zudem habe ich mithilfe von paarweisen Spearman-Rang-Korrelationen und Hauptkomponentenanalysen die Zusammenhänge zwischen diesen verschiedenen Formen von Informationsmängeln analysiert. In Kapitel II habe ich anhand von terrestrischen Wirbeltieren zwei spezielle Aspekte von Datenabdeckung zwischen geographischen Regionen verglichen: i) die Datendichte und ii) die Vollständigkeit der abgedeckten Arten. Durch Multi-Modell-Analysen habe ich die Effekte von zwölf potentiellen sozioökonomischen Einflussfaktoren auf Informationsmängel verglichen, und zwar einzeln für jede der drei Wirbeltiergruppen auf jeder von vier verschiedenen räumlichen Auflösungen. In Kapitel III habe ich anhand von Säugetieren drei Aspekte von Datenabdeckung zwischen einzelnen Arten verglichen: i) die Anzahl von Records pro Art, ii) die räumliche Abdeckung der Verbreitungsareale durch Records, und iii) den räumlichen Bias in der Abdeckung verschiedener Teile der Verbreitungsareale. Durch Multi-Modell-Analysen und Variations-Partitionierung habe ich die Effekte von verschiedenen Artmerkmalen, Größe und Form der Verbreitungsareale sowie von sozioökonomischen Faktoren untersucht. Diese Analysen habe ich auf globalem Maßstab sowie einzeln für sechs zoogeographische Gebiete durchgeführt.
In meiner Dissertation habe ich in allen untersuchten Aspekten von Artverbreitungsinformationen starke Biases gefunden. Die Anzahl von Records variierte um mehrere Größenordnungen zwischen Arten und zwischen geographischen Gebieten. Verschiedene Maße von Datenabdeckung und Datenunsicherheiten zeigten klare taxonomische, geographische und zeitliche Muster. Ich fand beispielsweise Höchstwerte von taxonomischer Abdeckung in industrialisierten westlichen Ländern, aber auch in einigen tropischen Gebieten wie Mexiko. Im Gegensatz dazu gab es in weiten Teilen Afrikas und Asiens entweder gar keine oder nur sehr veraltete Informationen. Da taxonomische, räumliche und zeitliche Abdeckung jeweils durch die Anzahl der Records numerisch eingeschränkt sind, fand ich zwischen diesen Maßen gemäßigte bis starke positive Korrelationen. Maße von Datenunsicherheiten hingegen korrelierten kaum untereinander oder mit Datenabdeckungsmaßen.
In Kapitel II habe ich den Einfluss von zwölf potentiellen sozioökonomischen Einflussfaktoren auf Datendichte und Datenvollständigkeit von geographischen Artgemeinschaften untersucht. Nur vier hatten einen durchweg für alle untersuchten Wirbeltiergruppen und räumlichen Auflösungen starken Einfluss. Dies waren der Endemitenreichtum, die räumliche Nähe zu Daten-beisteuernden Institutionen, politische Mitgliedschaft im GBIF-Netzwerk, sowie lokal verfügbare Forschungsgelder. Andere Faktoren, von denen man oft annimmt, dass sie eine große Rolle spielen würden, hatten einen erstaunlich geringen Einfluss, wie z.B. Verkehrsinfrastruktur oder Größe und Finanzausstattungen westlicher Daten-beisteuernder Institutionen. Meine Analysen in Kapitel III ergaben, dass die vier in Kapitel II identifizierten sozioökonomischen Schlüsselfaktoren ebenfalls einen starken Einfluss auf Artverbreitungsinformationen auf der Ebene von einzelnen Arten hatten. Jedoch unterschied sich ihre relative Wichtigkeit deutlich zwischen geographischen Gebieten. Zwischenartliche Unterschiede in Verbreitungsinformationen waren zudem sehr stark durch Größe und Form der Verbreitungsareale beeinflusst. Dies unterstützt meine Hypothese, dass diese geometrischen Faktoren die Wahrscheinlichkeit beeinflussen, dass sich Verbreitungsgebiete bestimmter Arten mit Untersuchungsgebieten von Feldforschern überschneiden, was wiederum Aufswirkungen auf die Wahrscheinlichkeiten hat, mit denen diese Arten besammelt werden. Entgegen unserer Annahmen hatten Artmerkmale wie etwa Nachtaktivität, die das Entdecken oder Sammeln bestimmter Arten wahrscheinlich machen sollten, kaum einen Einfluss auf zwischenartliche Unterschiede in Verbreitungsinformationen.
Die Ergebnisse meiner Dissertation lassen wichtige Schlussfolgerungen darüber zu, wie mobilisierte Artverbreitungsinformationen effizient genutzt und verbessert werden können. Erstens belegen meine Ergebnisse schwerwiegende Mängel in digital verfügbaren Artverbreitungsinformationen, insbesondere für Gebiete und Arten von besonderer Wichtigkeit für den Naturschutz. Zweitens zeigen sie, dass für die allermeisten Arten feiner aufgelöste Informationen nur durch Artverbreitungsmodelle erreicht werden können, die mit geringen Datenmengen auskommen, die starke Datenunsicherheiten und Biases innehaben. Eine vielversprechende Methode, um in solchen Modellen mit Biases umzugeben, ist das explizite Einbeziehen der Bias-verursachenden Faktoren in die Modelle, und meine Ergebnisse bieten hilfreiche Anhaltspunkte für die Auswahl relevanter Faktoren. Drittens schaffen meine Ergebnisse eine empirische Grundlage zur Überwachung von Fortschritten in der Verbesserung weltweiter Artverbreitungsinformationen. Schließlich schafft mein Identifizieren der global wichtigsten Informations-limitierenden Faktoren sowie das Unterscheiden verschiedener Informationsaspekte eine Grundlage dafür, um Aktivitäten zu identifizieren, die Datenmängel effektiv beheben können. Als wichtigste Aktivitäten empfehle ich unter anderem i) das Unterstützen von Bemühungen zur Datenmobilisierung in Institutionen, die in geographischer Nähe zu datenarmen Gebieten liegen, ii) das Fördern von Kooperation zwischen großen Schwellenländern und Data-Sharing-Netzwerken, iii) die Durchführung von neuen Biodiversitäts-Surveys im zentralen Afrika und südlichen Asien, um weitgehend veraltete Informationen zu aktualisieren, und iv) das Verschieben des Fokus von Datensammel- und Datenmobilisierungsbemühungen auf Asien sowie Arten mit begrenzten Verbreitungsarealen.
|
Page generated in 0.0156 seconds