Vamos falar de compartilhamento de dados científicos? (parte 2)
- batepapocomnetuno
- 17 de abr.
- 6 min de leitura
Por Valéria M. Lemos & Marianna Lanari

No post “Vamos falar de compartilhamento de dados científicos? (parte 1)” nós abordamos como surgiu o movimento Open Science, sua importância e alguns dos benefícios do compartilhamento de dados brutos de pesquisa. A pergunta que ficou é: “Mas como fazer isso? Como compartilhar os dados brutos da minha pesquisa de forma segura?” É compreensível que exista insegurança e dúvidas sobre o processo. Mas as dúvidas são frutos do desconhecimento sobre as boas práticas de compartilhamento de dados. Quer saber mais? Pega um cafezinho e vem ler, vamos dar algumas dicas...
Boas práticas de compartilhamento de dados brutos de pesquisa
Em meados de 2016 surge na comunidade acadêmica os Princípios FAIR (um acrônimo para Findable, Accessible, Interoperable and Reusable) (Wilkinson, 2016). Os princípios FAIR anunciam que a condição para os dados serem reutilizados por outras pessoas é que eles devem ser localizáveis, acessíveis, interoperáveis e reutilizáveis. Mas o que isso quer dizer?
Isso quer dizer, que há métodos para atingir cada uma das características dos princípios FAIR. As duas primeiras condições para o compartilhamento de dados é que eles devam ser localizáveis e acessíveis (FindableAccessibleIR). Dados facilmente localizáveis, entre outros atributos, precisam estar identificados e com bons metadados ou descritores de dados.

Metadados são importantes porque geralmente são o primeiro recurso alvo de uma busca e também porque através da leitura das informações contidas neles, a possibilidade de uso dos dados se concretiza ou não. Quando nos referimos à acessibilidade, estamos falando basicamente na facilidade e simplicidade de acesso. Uma das características que tornam os dados acessíveis é que eles estejam disponíveis em formatos de arquivos que sejam lidos sem a necessidade, por exemplo, de softwares específicos, ou então, que o acesso aos dados ocorra sem a necessidade de realizarmos um registro ou login no ambiente onde estão armazenados. Todas essas questões são possivelmente resolvidas desde que o compartilhamento seja através de repositórios de dados. Repositórios de dados são plataformas digitais que armazenam e disponibilizam os dados compartilhados pelos pesquisadores por longo prazo e de forma segura. Segue lendo que vamos falar mais deles.
As outras duas condições dos princípios FAIR são a necessidade de garantir que nossos dados sejam interoperáveis e reutilizáveis (FAInteroperableReusable). A interoperabilidade faz referencia ao modo pelo qual os dados estão formatados, o qual deve permitir que conjuntos de dados diferentes possam ser mesclados ou agregados. Para algumas áreas das ciências existem padrões de formatação já estabelecidos, como por exemplo, o padrão Darwin Core para dados de biodiversidade. Já falando em reutilização dos dados, entre outras coisas, é necessário que seus dados passem por um processo de controle de qualidade. Isso ocorre primeiramente a nível interno, ou seja, o pesquisador deve fazer um controle do conteúdo científico, validação, controle taxonômico, verificação de erros técnicos de formatação ou digitalização, etc. Feito isso, ainda há uma segunda etapa de controle de qualidade que ocorre no nível do repositório de dados escolhido para o depósito dos dados. Este controle pode ser realizado de duas formas distintas: através de ferramentas automatizadas de verificação ou então por serviços de curadoria de dados. Cada repositório tem sua forma de realizar a verificação da qualidade dos dados antes do compartilhamento. Independentemente das formas, podemos afirmar que quanto maior é o controle de qualidade, maior será sua capacidade de reutilização!
Como compartilhar de modo seguro?
Uma das principais preocupações dos pesquisadores sobre esta temática é a dúvida e insegurança da garantia da manutenção dos seus direitos autorais. E isso é muito relevante, pois afinal, dados não caem do céu! Há todo um esforço para que sejam coletados de forma adequada e séria. Só que devemos entender que em repositórios adequados e certificados, há todo um processo para garantir que você seja citado e para garantir que seus dados sejam usados para finalidades especificadas por você através do tipo de licença de uso. Há ainda as métricas, onde você pode acompanhar os acessos do público, etc. Ou seja, a manutenção dos direitos autorais é garantida, desde que se faça uma boa escolha do repositório de dados.
Como escolher um repositório de dados?

Este é um ponto importante! E vale tanto para quem está pensando em compartilhar seus dados ou pensando em buscar dados para complementar seus estudos. Para tornar os dados FAIR, preservando-os ao longo do tempo, é necessário escolher um bom repositório! Um bom repositório apresenta uma estrutura organizacional sólida e confiável, infraestrutura e sustentabilidade de longo prazo. A escolha de um repositório deve ser embasada nos Princípios TRUST (um acrônimo para Transparency, Responsibility, User Focus, Sustainability, and Technology). Assim como os princípios FAIR para dados, o princípio TRUST para repositórios nos auxiliam com a indicação de alguns parâmetros que devemos atentar na escolha de um repositório. Estar em conformidade com este princípio quer dizer que o repositório deve garantir que todos os processos e informações sejam transparentes, que exista uma responsabilidade pela administração de seus acervos de dados, como por exemplo, gerenciar os direitos de propriedade intelectual do pesquisador ou direitos autorais. Isso ocorre por meio das licenças de uso dos dados, atribuição de identificadores únicos persistentes (DOIs), obrigatoriedade de citação da fonte dos dados por quem vai reutilizá-los, etc. Além disso, um bom repositório deve principalmente comportar uma estrutura para a preservação necessária de dados em longo prazo para que os dados permaneçam detectáveis, acessíveis e utilizáveis no futuro. Um ponto importante durante a escolha do repositório é dar uma olhada se a agencia de financiamento do projeto possui alguma orientação e sugestão de repositório!
Como encontrar os dados que preciso?
Há inúmeros repositórios de dados, alguns deles mais abrangentes, generalistas, que publicam dados das mais diversas áreas como o PANGEA e o DRYAD. Lá você pode encontrar dados de ecologia, biologia, meteorologia, oceanografia física, entre outros. Se você busca dados mais específicos, há os repositórios com uma temática central. Por exemplo, para busca de dados de biodiversidade, o SIBBr - Sistema de Informação sobre a Biodiversidade Brasileira é uma boa fonte de informação. O SIBBr é o braço brasileiro do GBIF - Global Biodiversity Information Facility, que representa a principal plataforma mundial sobre registros e dados de biodiversidade. Nadando em direção ao mar, na busca de dados oceanográficos, uma boa escolha é consultar o OBIS - Ocean Biodiversity Information System, também ligado ao GBIF.
Então, vale a pena compartilhar meus dados?
Alguém pode estar pensando “Ah, mas meus dados não são interessantes…” Isso não é verdade! A ideia é disponibilizar e compartilhar os dados com o objetivo de resguardá-los para o futuro. Para que alguém, em algum momento, possa utilizá-los. Se isso vai acontecer, não sabemos, mas a probabilidade que isso aconteça com eles compartilhados é muito maior do que se os dados estiverem e permanecerem guardados em uma gaveta!
Então é isso pessoal, agora que você já sabe um pouquinho sobre o movimento Open Science e Open Data, esperamos que você compartilhe (olha que trocadilho!!!) e discuta esse assunto com a sua comunidade acadêmica, para que possamos contribuir no esforço coletivo para uma ciência mais acessível e colaborativa, onde todos ganham no final!

Referências
GBIF - Global Biodiversity Information Facility https://www.gbif.org/
OBIS - Ocean Biodiversity Information System https://obis.org/
SiBBr - Sistema de Informação sobre a Biodiversidade Brasileira https://www.sibbr.gov.br/
Wilkinson, M. D., Dumontier, M., Aalbersberg, I. J., Appleton, G., Axton, M., Baak, A., ... & Mons, B. (2016). The FAIR Guiding Principles for scientific data management and stewardship. Scientific data, 3(1), 1-9. https://doi.org/10.1038/sdata.2016.18
Sobre as autoras

Valéria Marques Lemos é bióloga, mestre e doutora em Oceanografia Biológica pela Universidade Federal do Rio Grande – FURG. Sua área de pesquisa é a ictiologia, participando e desenvolvendo pesquisas sobre bioecologia e pesca de teleósteos marinhos e estuarinos. Atua como gestora de dados de pesquisa do projeto Pesquisa Ecológica de Longa Duração sítio 8- Estuário da Lagoa dos Patos e Costa Marinha Adjacente PELD-ELPA, do Instituto de Oceanografia da FURG. E, assim como todas, todes e todos leitores do Bate-papo com Netuno... ama o mar!

Marianna de Oliveira Lanari é oceanóloga, mestre em Ecologia pela Universidade Federal do Rio de Janeiro - UFRJ e doutora em Oceanografia Biológica pela Universidade Federal do Rio Grande – FURG. Sua linha de pesquisa é focada em comunidades vegetais costeiras e como estas contribuem para o funcionamento e serviços ecossistêmicos em estuários e costões rochosos. Tem grande interesse em gestão de dados e no seu compartilhamento em repositórios digitais. Mergulhou pela primeira vez aos cinco anos de idade e, a partir daí, decidiu que nunca mais queria ficar longe do mar.
#CiênciasDoMar #DadosAbertos #CienciaAberta #OpenScience #OpenData #SIBBR #OBIS #GBIF #RepositorioDeDados #TRUST #FAIR #DarwinCore




Comentários