GUIA DE USUÁRIOS ALEIA

 

 

 

 

 

 

 

 

 

Ibict

2024

 

 

Instituto Brasileiro de Informação em Ciência e Tecnologia - Ibict

 

Diretor

Tiago Emmanuel Nunes Braga

 

Coordenador-Geral de Informação Científica e Técnica do Ibict

Washington Luís Ribeiro de Carvalho Segundo

 

Coordenador de Tratamento, Análise e Disseminação da Informação Científica

Marcel Garcia de Souza

 

Elaboração:

Letícia Guarany Bonetti

Tatyane Guedes Martins da Silva

Henrique Fernandes Rodrigues

Rene F. Gabriel Junior

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Instituto Brasileiro de Informação em Ciência e Tecnologia (Ibict)

SAUS - Quadra 05 - Lote 06 - Bloco H – 4° andar - CEP: 70070-912 - Brasília, DF – Telefone: +55 (61) 3217-6449

 

1 APRESENTAÇÃO

 

Este guia apresenta informações sobre o Repositório do Instituto Brasileiro de Informação em Ciência e Tecnologia (Aleia), uma base de dados de acesso aberto que tem como objetivos custodiar, publicar, disseminar, preservar e compartilhar conjuntos de dados da comunidade científica do Ibict (constituída por seus servidores, pesquisadores visitantes, bolsistas e alunos do programa de pós-graduação).

 

O repositório é gerido pela Coordenação de Tratamento, Análise e Disseminação da Informação Científica (CODIC), coordenação que faz parte do Ibict.

 

Consulte-nos sempre que for necessário por meio do seguinte e-mail: aleia@ibict.br

 

Organização das comunidades

 

O Aleia foi estruturado no Dataverse, software de código aberto direcionado para dados de pesquisa. O Dataverse foi desenvolvido em 2006 pelo Instituto de Ciências Sociais Quantitativas da Universidade de Harvard em colaboração com profissionais de todo o mundo, por meio do Dataverse Project.

O Aleia hospeda vários arquivos virtuais chamados Comunidades Dataverses. Cada comunidade contém conjuntos de dados chamados datasets, e cada dataset contém objetos digitais (arquivos) e metadados.

 

Imagem 1 - Estrutura do Dataverse

Fonte: DATAVERSE PROJECT, 2020.

 

O Aleia contempla 7 comunidades, construídas a partir dos assuntos gerais tratados pelo Ibict. Sendo elas:

      Tecnologias da Informação

      Informação Científica

      Informação para Sustentabilidade

      Informação Tecnológica

      Ensino e Pesquisa

      Popularização da Ciência

      Informação para a Sociedade

Deverão ser escolhidas de acordo com o assunto.

 

2 PREPARAÇÃO DOS DADOS PARA DEPÓSITO

 

Formatos e tamanhos

 

O software Dataverse suporta uma variedade de tipos e formatos de arquivos, incluindo: imagens, gráficos, planilhas, dados audiovisuais, entre outros.

Para que um conjunto de dados seja depositado no Aleia ele não deve ser maior do que 1 (um) GB.

Embora qualquer formato de arquivo possa ser depositado no repositório, sempre que possível devem ser escolhidos formatos que ajudem a preservar e garantir o acesso a longo prazo aos arquivos depositados no Aleia, com preferência por arquivos em formatos abertos e não-proprietários. Confira abaixo uma lista de formatos preferidos para depósito:

 

Tipo

Formato(s) preferido(s)

Formatos não preferenciais

Documentos de texto

 

 

Texto simples

 

 

Linguagem de marcação

XML (.xml)

HTML (.html)

Related files: .css, .xslt, .js, .es

 

 

Linguagens de programação

 

 

Planilhas

 

Bancos de dados

 

 

Dados estatísticos

 

 

Imagens rasterizadas

 

 

Imagens vetoriais

 

 

Áudio

 

 

Vídeo

 

 

Projeto assistido por computador (CAD)

 

 

Sistemas de Informação Geográfica (SIG)

 

 

Imagens georreferenciadas

 

 

SIG raster

 

 

3D

 

 

RDF

RDF/XML (.rdf)

Trig (.trig)

Turtle (.ttl)

NTriples (.nt)

JSON-LD

 

Fonte: DANS (2023)

 

 

Como nomear os arquivos

 

        Evitar o uso de acentos gráficos e caracteres especiais, tanto na identificação das variáveis, quanto na identificação dos nomes dos arquivos e diretórios, pois os caracteres podem se tornar uma barreira para pesquisadores internacionais;

        Não utilizar espaços nos nomes dos arquivos ou pastas. Utilize “_” para separar as palavras e evitar quebra dentro dos arquivos e incompatibilidade;

        Use zeros à esquerda ao incorporar números para habilitar a classificação (uma sequência de 1 a 100 deve ser numerada de 001 a 100. Por exemplo: exemplo_arquivo_dado_de_pesquisa_001 ; exemplo_arquivo_dado_de_pesquisa_002…

        Os nomes dos arquivos devem ser curtos o suficiente para serem legíveis, enquanto ainda transmitem informações pertinentes o suficiente. De preferência com até 32 caracteres;

        Se for utilizar data na descrição opte por colocar: ANO MÊS E DIA. Exemplo: 20230123.

 

Anonimização

 

Para conjuntos de dados que envolvem pesquisas com seres humanos, de qualquer natureza e área do conhecimento, os pesquisadores devem certificar-se e garantir que todos os preceitos éticos e procedimentos foram seguidos. Os dados pessoais devem estar anonimizados ou pseudonimizados antes do depósito, de forma a impedir a identificação dos indivíduos. Além disso, a publicação precisa ser autorizada pelos comitês de ética do projeto.

Para os fins deste guia e de acordo com a Lei Geral de Proteção de Dados (Lei nº 13.709/18):

        dado pessoal é a "informação relacionada a pessoa natural identificada ou identificável";

        dado pessoal sensível é o "dado pessoal sobre origem racial ou étnica, convicção religiosa, opinião política, filiação a sindicato ou a organização de caráter religioso, filosófico ou político, dado referente à saúde ou à vida sexual, dado genético ou biométrico, quando vinculado a uma pessoa natural" e

        anonimização é a "utilização de meios técnicos razoáveis e disponíveis no momento do tratamento, por meio dos quais um dado perde a possibilidade de associação, direta ou indireta, a um indivíduo".

 

3 LOGIN E ACESSO AO REPOSITÓRIO

 

Qualquer pessoa pode consultar e baixar conjuntos de dados no Aleia sem a necessidade de se cadastrar. Já a realização de depósito, edição e publicação de dados é restrita e demanda prévio cadastro no repositório. Para isso, basta acessar o repositório em seu endereço eletrônico: https://aleia.ibict.br/. Para ver em mais detalhes como criar um conjunto de dados no Aleia, vá para a seção Criação de conjuntos de dados do guia.

 

Conforme apresentado anteriormente, comunidade científica do Ibict (constituída por seus servidores, pesquisadores visitantes, bolsistas e alunos do programa de pós-graduação) podem depositar conjuntos de dados no repositório.

 

No tópico seguinte será apresentado o passo a passo para realizar o cadastro e login do Aleia.

 

Cadastro e login

 

Para realizar o cadastro e login, siga os seguintes passos:

 

  1. Acesse a página do Aleia e clique em “Iniciar sessão”:

  1. Em seguida, clique no botão “ORCID”:

  1. Clique em “Crie ou conecte seu ORCID”:

 

  1. Coloque seu login e sua senha do ORCID para realizar a autenticação:

 

  1. Caso não tenha se cadastrado no ORCID, clique em “Registrar agora” e preencha os campos solicitados:

 

 

  1. Após esses passos, você estará cadastrado e logado no repositório.

 

 

Caso tenha alguma dificuldade, entre em contato no seguinte e-mail: aleia@ibict.br

Espaço pessoal do usuário

 

Quando autenticado no Aleia, você terá acesso ao seu espaço pessoal, no canto superior direito, ao clicar no seu nome. Lá você poderá consultar as seguintes informações, conforme mostra a imagem abaixo:

        Meus dados;

        Notificações;

        Informações da conta;

        Token da API.

 

 

4 CRIAÇÃO DE CONJUNTOS DE DADOS

 

O povoamento do Aleia será realizado exclusivamente por meio de autoarquivamento por parte dos autores, salvo acordo previamente estabelecido e será publicado pelo revisor de cada comunidade do Aleia.

 

Para realizar o autoarquivamento é preciso que o autor dos dados solicite permissão para depositar, o que deve ser feito mediante pedido para o e-mail institucional do repositório: aleia@ibict.br. Após concedida a permissão, o autor deve seguir os passos abaixo.

 

Os dados a serem depositados no Aleia deverão ser incluídos em uma comunidade correspondente à temática da pesquisa.

 

 

  1. Para escolher a comunidade desejada, clique no ícone correspondente:

 

  1. Após selecionar a comunidade na qual o usuário tem permissão para depositar dados, deve-se à direita da tela, clicar em “Adicionar dados” e a seguir em “Novo conjunto de dados”:

 

 

Preenchimento de metadados e carga de arquivos

 

Após selecionar a opção “Novo conjunto de dados”, o usuário será direcionado para uma página que contém os campos de metadados para que seja descrito com detalhes o conjunto que está sendo criado. O campo "Dataverse anfitrião" é uma caixa de digitação autocompletante pelo sistema do repositório e não requer nenhum outro preenchimento.

Nesta primeira etapa de preenchimento, é apresentado um conjunto reduzido de campos de metadados, além de ser possível carregar o(s) arquivo(s) que farão parte do conjunto de dados (upload).

 

Abaixo serão apresentadas as orientações detalhadas para o preenchimento dos metadados obrigatórios e opcionais.

 

Metadado obrigatórios

Preenchimento

Título*

Preencha de forma objetiva e sucinta o nome pelo qual o conjunto de dados será conhecido.
Somente a letra inicial, substantivos próprios e nomes científicos devem ser grafados em letra maiúscula.
Não finalizar com ponto.

Autor*

O nome do autor e a afiliação são preenchidos de forma automática via ORCID, se alguma informação estiver equivocada, é necessário alterar na própria conta do ORCID.
No subcampo Esquema de Identificadores, selecione a plataforma e insira o seu número de identificação.

Entre em contato*

Nome: Sobrenome (s), Prenome (sem ponto final)

Afiliação: Informe o nome, por extenso, da instituição a qual o (s) autor (es) está (ão) filiado (s) e entre parênteses acrescente a sigla da instituição.

Ex.: Instituto Brasileiro de Informação em Ciência e Tecnologia (Ibict)

E-mail: Informe o endereço de e-mail do (s) autor (es) do conjunto de dados. Deve ser informado, preferencialmente, o e-mail institucional do (s) autor (es). Evite, portanto, e-mails pessoais.

 

Descrição*

Escreva um resumo descrevendo a finalidade, a natureza e o escopo dos conjuntos de dados. Recomenda-se o máximo de 500 caracteres.

Assunto*

Selecione as principais áreas do conhecimento em que o conjunto de dados faz parte.

Palavras-chave*

Escreva termos que representam aspectos importantes dos conjuntos de dados

Não finalizar com ponto.

 

 

Metadados opcionais

Preenchimento

Subtítulo

Preencha para ampliar ou especificar aspectos do título principal

Título alternativo

Preencha colocando a tradução do título em inglês ou uma abreviação do título.
Não finalizar com ponto.

URL alternativo

Indique uma URL externa pela qual o conjunto de dados pode ser acessado; por exemplo, um site do projeto de origem ou mesmo pessoal.

Outro ID

Indique outro identificador exclusivo que faz referência a este conjunto de dados (por exemplo, número do produtor dos dados ou de outro repositório).

Agência ou Instituição

Indique o nome da agência que gerou esse identificador. Recomenda-se verificar o nome adotado na página institucional para evitar inconsistências e erros.

Identificador

Indique outro identificador que corresponda ao dataset.

Classificação de tópicos

Preencha com as categorias abrangentes do vocabulário controlado usado para atribuição de assuntos do conjunto de dados. Por exemplo, no Nal Thesaurus, a grande categoria P Natural Resources, Earth and Environmental Sciences ou, ainda, a sub-categoria Soil Science.

Publicação relacionada

Indique publicações (artigos, livros, capítulos de livro, artigos em congressos, etc.) que referenciam ou usam os dados dos conjuntos de dados descritos.

Notas

Escreva informações adicionais importantes sobre os conjuntos de dados

Idioma

Selecione o idioma dos conjuntos de dados

Produtor

Indique pessoa ou organização responsável financeira ou administrativamente pelo conjunto de dados.

Data de produção

Coloque a data em que a coleta de dados foram produzidas (não distribuídos, publicados ou arquivados). Ordem de preenchimento: ANO MÊS DIA.

Local de produção

Coloque o local onde a coleta de dados foram produzidos

Colaborador

Coloque a organização ou pessoa responsável por coletar, gerenciar ou de alguma forma contribuiu para o desenvolvimento do recurso. Selecione o papel da organização ou da pessoa. Ex.: coletador de dados, curador de dados…
Depois preencha por extenso o nome da organização ou da pessoa.

Conceder informação

Coloque o nome da agência financiadora por extenso e a sigla entre parênteses e número do processo

Distribuidor

A instituição designada pelo autor ou produtor do conjunto de dados para gerar cópias do trabalho, incluindo edições e revisões quando necessário.

Data de distribuição

Data em que o conjunto de dados tornou-se disponível para distribuição. Usar o padrão AAAA-MM-DD.

Depositante

Preenchimento automático via Dataverse

Data do depósito

Preenchimento automático via Dataverse

Período coberto

Coloque o período de tempo ao qual os dados se referem. Este campo reflete o período de tempo abrangido pelos dados, não as datas de codificação ou criação de documentos legíveis por máquina ou as datas em que os dados foram coletados, também conhecidos como spam. Ordem de preenchimento: ANO MÊS DIA.

Data de coleta

Coloque a data que os dados foram coletados. Ordem de preenchimento: ANO MÊS DIA.

Tipos de dados

Tipos de dados incluídos no arquivo: dados de pesquisa, dados de censo, dados agregados, dados clínicos, dados de eventos, dados de registros administrativos, documentos codificados ou outros.

Série

Caso o conjunto de dados faça parte de uma série, as informações sobre ela devem ser incluídas neste tópico. A informação de série pode ser útil para agrupar conjuntos de dados de um projeto de pesquisa, ou mesmo de uma sequência de dados experimentais e observacionais que foram desenvolvidos por meio de esforços de vários projetos simultaneamente, ou por uma sequência de projetos. O campo permite múltiplas entradas

Software

Informações sobre o software usado para gerar o conjunto de dados.

Material relacionado

Qualquer material relacionado a este conjunto de dados.

Relacionados conjuntos de dados

Quaisquer conjuntos de dados relacionados a esse conjunto de dados, como pesquisas anteriores sobre este assunto.

Outras referências

Quaisquer referências que sirvam como pano de fundo ou material de apoio a este conjunto de dados.

Fontes de dados

Lista de livros, artigos, publicações em série ou arquivos de dados legíveis por máquina que serviram como fontes da coleta de dados

Origem das fontes

Em caso de materiais históricos, as informações sobre a origem das fontes e as regras seguidas para estabelecê-las ou delimitá-las devem ser especificadas.

Características das fontes observadas

Observações sobre o material e as características da(s) fonte(s) do conjunto de dados. Qualquer informação considerada importante pelo depositante que pode ser útil na reutilização dos dados

Documentação e acesso a fontes

Nível de documentação das fontes originais. Caso haja alguma restrição de acesso às fontes, informar neste campo

 

Carga de arquivos

 

Após o preenchimento dos metadados, na seção “Arquivos” (parte inferior da tela), clique em “Selecionar arquivos para adicionar” para fazer a carga de todos os arquivos de seu conjunto de dados. Vale lembrar que ele não deve ser maior do que 1 (um) GB e cada arquivo não pode ser maior que 100 MB.

 

Caso você precise carregar um ou mais arquivos maiores que 1GB, envie um e-mail para aleia@ibict.br  para obter orientações sobre como proceder.

 

Ao concluir a etapa de carga dos arquivos, clique em "Salvar conjunto de dados". A disponibilização on-line do conjunto de dados não ocorre imediatamente após o depósito. O item submetido será revisado e validado pela equipe do Aleia e, assim que aprovado, será disponibilizado na interface do repositório.

 

Caso o item submetido seja rejeitado, o depositante receberá um e-mail no qual constará o motivo da rejeição e deverá fazer a correção da submissão. Após concluída a correção da submissão, o item submetido será novamente revisado e, assim que aprovado, será disponibilizado na interface do Aleia.

 

No momento da publicação, o nível de acesso a um arquivo ou conjunto de arquivos de um conjunto de dados será definido como público:

 

a) Público – quando o pesquisador autoriza o acesso, reuso e redistribuição de dados para pesquisa e não há restrições legais, éticas e estratégicas. No caso do acesso a dados públicos, o autor e/ou gestor dos dados poderão definir questionários e termos a serem preenchidos e aceitos pelos usuários para o efetivo acesso aos datasets.

 

A critério do autor dos dados de pesquisa, poderão ser aplicadas regras específicas e controle de acesso para os conjuntos de dados, que ficarão como restritos no repositório (os usuários têm acesso apenas aos metadados do conjunto de dados).

 

Curadoria (Revisão)

 

A Coordenação de Tratamento, Análise e Disseminação da Informação Científica (CODIC) será responsável pelo controle de qualidade na produção dos metadados para recuperação da informação no Aleia e pela identificação de problemas relativos à busca e à identificação dos documentos disponibilizados.

 

5 EDIÇÃO DOS CONJUNTOS DE DADOS

 

Após a etapa inicial da  inserção dos conjuntos de dados, o autor dos dados tem permissão para editar, modificando ou adicionando metadados - uma vez que agora é apresentado o formulário completo com todos os metadados (obrigatórios e opcionais). O autor dos dados também pode modificar termos e arquivos. Para isso basta acessar o conjunto de dados que deseja editar e seguir o passo a passo abaixo:

 

Editar arquivos de dados

 

A opção “Editar arquivos (upload)” permite que novo(s) arquivo(s) seja(m) depositado(s) no conjunto. Os arquivo(s) carregado(s) pode(m) receber uma breve descrição e ter tag(s) atribuída(s).

 

Caso tenha feito o upload de um arquivo que não deseje mais adicionar ao conjunto de dados, basta clicar na opção "excluir". Ao final, salve as alterações feitas.

 

Editar metadados

 

No mesmo painel "editar" é possível fazer a edição dos metadados do conjunto de dados. Conforme já citado, a edição de metadados apresenta um formulário maior que o disponível na etapa de criação do conjunto de dados, contemplando todos os campos disponíveis pelo sistema. Após terminar a edição dos metadados, clique em "salvar alterações".

 

Assim que finalizar as operações de criação ou edição de acordo com as orientações deste guia do usuário,  o conjunto de dados poderá ser enviado para revisão. Para isso, basta clicar no botão "submeter para revisão". O curador responsável analisará todos os elementos do conjunto de dados (arquivos, metadados, termos de uso, etc.) para validá-los, sugerir alterações ao criador (depositante), ou ele mesmo fazer os ajustes que julgar necessários quando estes não representem mudanças radicais nas informações e outros elementos inseridos na versão esboço (rascunho).

 

Quando o conjunto de dados for publicado pelo curador, o depositante será notificado em sua área pessoal. Vale relembrar que mesmo depois de publicado, um conjunto de dados ainda pode ser modificado, com edição dos metadados, acréscimo de arquivos e outros elementos. Quando estas modificações são feitas, o conjunto de dados é publicado como uma nova versão e todas as versões ficam salvas na página do dataset, conforme a figura abaixo.

 

 

 

6 FLUXO DE DEPÓSITO

 

 

Perfis e permissões de usuários:

        Administrador: perfil que possui todas as permissões em dataverses, datasets e arquivos. Tem como função/permissão: adicionar dataverses, adicionar conjuntos de dados (datasets), visualizar dataveses não publicados, fazer download de arquivos, editar dataverse, editar conjuntos de dados (datasets), gerenciar permissões do dataverse, gerenciar permissões do dataset, publicar dataverse, publicar conjuntos de dados (dataset), deletar dataverse e deletar dataset e visualizar dataverses e conjuntos de dados (datasets) que estão em modo público.

        Autor dos conjuntos de dados: perfil para pesquisadores brasileiros vinculados a instituições científicas que ainda não possuem seus repositórios de dados de pesquisa e/ou de pesquisadores brasileiros que executaram seus conjuntos de dados em produções científicas em instituições estrangeiras de ensino e pesquisa. Tem como função/permissão: inserir conjuntos de dados (datasets), visualizar os próprios conjuntos de dados não publicados, fazer download de arquivos, editar conjuntos de dados, deletar conjuntos de dados e visualizar dataverses e conjuntos de dados (datasets) que estão em modo público.

        Usuário: perfil para usuários não autenticados no ORCID. Tem como função/permissão: fazer download de arquivos e visualizar dataverses e conjuntos de dados (datasets) que estão em modo público.

        Revisor: perfil que dedica-se em especial à revisão da descrição dos metadados realizada pelos autores e à publicação dos dados.Tem como função/permissão: visualizar dataveses não publicados. fazer download de arquivos, editar conjuntos de dados (datasets), gerenciar permissões do dataset, publicar conjuntos de dados (dataset), deletar dataset e visualizar dataverses e conjuntos de dados (datasets) que estão em modo público.

 

7 CONTATO/SUPORTE

 

Se tiver alguma dúvida, quiser obter informações ou iniciar um processo de depósito no Aleia, envie um e-mail para o endereço aleia@ibict.br  

 

REFERÊNCIAS

BRASIL. Lei nº 13.709, de 14 de agosto de 2018. Lei Geral de Proteção de Dados Pessoais (LGPD). Brasília: Presidência da República, 2018. Disponível em: https://www.planalto.gov.br/ccivil_03/_ato2015-2018/2018/lei/l13709.htm. Acesso em: 13 dez. 2023.

 

DANS. Disponível em: https://dans.knaw.nl/en/file-formats/. Acesso em: 13 dez. 2023.

 

FELICISSIMO, C. H. et al. Boas práticas na nomeação dos arquivos para o compartilhamento. [S.l.: s.n.], 2022. 1 vídeo (4 min.). Publicado pelo canal Instituto Brasileiro de Informação em Ciência e Tecnologia. Disponível em: https://www.youtube.com/watch?v=I6tXlHPMxHg. Acesso em: 13 dez. 2023.