GUIA DE USUÁRIOS ALEIA
Ibict
2024
Instituto Brasileiro de Informação em Ciência e Tecnologia - Ibict
Diretor
Tiago Emmanuel Nunes Braga
Coordenador-Geral de Informação Científica e Técnica do Ibict
Washington Luís Ribeiro de Carvalho Segundo
Coordenador de Tratamento, Análise e Disseminação da Informação Científica
Marcel Garcia de Souza
Elaboração:
Letícia Guarany Bonetti
Tatyane Guedes Martins da Silva
Henrique Fernandes Rodrigues
Rene F. Gabriel Junior
Instituto Brasileiro de Informação em Ciência e Tecnologia (Ibict)
SAUS - Quadra 05 - Lote 06 - Bloco H – 4° andar - CEP: 70070-912 - Brasília, DF – Telefone: +55 (61) 3217-6449
Este guia apresenta informações sobre o Repositório do Instituto Brasileiro de Informação em Ciência e Tecnologia (Aleia), uma base de dados de acesso aberto que tem como objetivos custodiar, publicar, disseminar, preservar e compartilhar conjuntos de dados da comunidade científica do Ibict (constituída por seus servidores, pesquisadores visitantes, bolsistas e alunos do programa de pós-graduação).
O repositório é gerido pela Coordenação de Tratamento, Análise e Disseminação da Informação Científica (CODIC), coordenação que faz parte do Ibict.
Consulte-nos sempre que for necessário por meio do seguinte e-mail: aleia@ibict.br
Organização das comunidades
O Aleia foi estruturado no Dataverse, software de código aberto direcionado para dados de pesquisa. O Dataverse foi desenvolvido em 2006 pelo Instituto de Ciências Sociais Quantitativas da Universidade de Harvard em colaboração com profissionais de todo o mundo, por meio do Dataverse Project.
O Aleia hospeda vários arquivos virtuais chamados Comunidades Dataverses. Cada comunidade contém conjuntos de dados chamados datasets, e cada dataset contém objetos digitais (arquivos) e metadados.
Imagem 1 - Estrutura do Dataverse
Fonte: DATAVERSE PROJECT, 2020.
O Aleia contempla 7 comunidades, construídas a partir dos assuntos gerais tratados pelo Ibict. Sendo elas:
● Tecnologias da Informação
● Informação Científica
● Informação para Sustentabilidade
● Informação Tecnológica
● Ensino e Pesquisa
● Popularização da Ciência
● Informação para a Sociedade
Deverão ser escolhidas de acordo com o assunto.
2 PREPARAÇÃO DOS DADOS PARA DEPÓSITO
Formatos e tamanhos
O software Dataverse suporta uma variedade de tipos e formatos de arquivos, incluindo: imagens, gráficos, planilhas, dados audiovisuais, entre outros.
Para que um conjunto de dados seja depositado no Aleia ele não deve ser maior do que 1 (um) GB.
Embora qualquer formato de arquivo possa ser depositado no repositório, sempre que possível devem ser escolhidos formatos que ajudem a preservar e garantir o acesso a longo prazo aos arquivos depositados no Aleia, com preferência por arquivos em formatos abertos e não-proprietários. Confira abaixo uma lista de formatos preferidos para depósito:
Tipo |
Formato(s) preferido(s) |
Formatos não preferenciais |
Documentos de texto |
|
|
Texto simples |
|
|
Linguagem de marcação |
|
|
Linguagens de programação |
|
|
Planilhas |
|
|
Bancos de dados |
|
|
Dados estatísticos |
|
|
Imagens rasterizadas |
|
|
Imagens vetoriais |
|
|
Áudio |
|
|
Vídeo |
|
|
Projeto assistido por computador (CAD) |
|
|
Sistemas de Informação Geográfica (SIG) |
|
|
Imagens georreferenciadas |
|
TIFF World File (.tfw & .tif, possibly with additional files) JPEG World File (.jgw & .jpg, possibly with additional files)
|
SIG raster |
|
|
3D |
|
|
RDF |
RDF/XML (.rdf) Trig (.trig) Turtle (.ttl) NTriples (.nt) JSON-LD |
|
Fonte: DANS (2023)
Como nomear os arquivos
● Evitar o uso de acentos gráficos e caracteres especiais, tanto na identificação das variáveis, quanto na identificação dos nomes dos arquivos e diretórios, pois os caracteres podem se tornar uma barreira para pesquisadores internacionais;
● Não utilizar espaços nos nomes dos arquivos ou pastas. Utilize “_” para separar as palavras e evitar quebra dentro dos arquivos e incompatibilidade;
● Use zeros à esquerda ao incorporar números para habilitar a classificação (uma sequência de 1 a 100 deve ser numerada de 001 a 100. Por exemplo: exemplo_arquivo_dado_de_pesquisa_001 ; exemplo_arquivo_dado_de_pesquisa_002…
● Os nomes dos arquivos devem ser curtos o suficiente para serem legíveis, enquanto ainda transmitem informações pertinentes o suficiente. De preferência com até 32 caracteres;
● Se for utilizar data na descrição opte por colocar: ANO MÊS E DIA. Exemplo: 20230123.
Anonimização
Para conjuntos de dados que envolvem pesquisas com seres humanos, de qualquer natureza e área do conhecimento, os pesquisadores devem certificar-se e garantir que todos os preceitos éticos e procedimentos foram seguidos. Os dados pessoais devem estar anonimizados ou pseudonimizados antes do depósito, de forma a impedir a identificação dos indivíduos. Além disso, a publicação precisa ser autorizada pelos comitês de ética do projeto.
Para os fins deste guia e de acordo com a Lei Geral de Proteção de Dados (Lei nº 13.709/18):
● dado pessoal é a "informação relacionada a pessoa natural identificada ou identificável";
● dado pessoal sensível é o "dado pessoal sobre origem racial ou étnica, convicção religiosa, opinião política, filiação a sindicato ou a organização de caráter religioso, filosófico ou político, dado referente à saúde ou à vida sexual, dado genético ou biométrico, quando vinculado a uma pessoa natural" e
● anonimização é a "utilização de meios técnicos razoáveis e disponíveis no momento do tratamento, por meio dos quais um dado perde a possibilidade de associação, direta ou indireta, a um indivíduo".
3 LOGIN E ACESSO AO REPOSITÓRIO
Qualquer pessoa pode consultar e baixar conjuntos de dados no Aleia sem a necessidade de se cadastrar. Já a realização de depósito, edição e publicação de dados é restrita e demanda prévio cadastro no repositório. Para isso, basta acessar o repositório em seu endereço eletrônico: https://aleia.ibict.br/. Para ver em mais detalhes como criar um conjunto de dados no Aleia, vá para a seção Criação de conjuntos de dados do guia.
Conforme apresentado anteriormente, comunidade científica do Ibict (constituída por seus servidores, pesquisadores visitantes, bolsistas e alunos do programa de pós-graduação) podem depositar conjuntos de dados no repositório.
No tópico seguinte será apresentado o passo a passo para realizar o cadastro e login do Aleia.
Cadastro e login
Para realizar o cadastro e login, siga os seguintes passos:
Caso tenha alguma dificuldade, entre em contato no seguinte e-mail: aleia@ibict.br
Espaço pessoal do usuário
Quando autenticado no Aleia, você terá acesso ao seu espaço pessoal, no canto superior direito, ao clicar no seu nome. Lá você poderá consultar as seguintes informações, conforme mostra a imagem abaixo:
● Meus dados;
● Notificações;
● Informações da conta;
● Token da API.
4 CRIAÇÃO DE CONJUNTOS DE DADOS
O povoamento do Aleia será realizado exclusivamente por meio de autoarquivamento por parte dos autores, salvo acordo previamente estabelecido e será publicado pelo revisor de cada comunidade do Aleia.
Para realizar o autoarquivamento é preciso que o autor dos dados solicite permissão para depositar, o que deve ser feito mediante pedido para o e-mail institucional do repositório: aleia@ibict.br. Após concedida a permissão, o autor deve seguir os passos abaixo.
Os dados a serem depositados no Aleia deverão ser incluídos em uma comunidade correspondente à temática da pesquisa.
Preenchimento de metadados e carga de arquivos
Após selecionar a opção “Novo conjunto de dados”, o usuário será direcionado para uma página que contém os campos de metadados para que seja descrito com detalhes o conjunto que está sendo criado. O campo "Dataverse anfitrião" é uma caixa de digitação autocompletante pelo sistema do repositório e não requer nenhum outro preenchimento.
Nesta primeira etapa de preenchimento, é apresentado um conjunto reduzido de campos de metadados, além de ser possível carregar o(s) arquivo(s) que farão parte do conjunto de dados (upload).
Abaixo serão apresentadas as orientações detalhadas para o preenchimento dos metadados obrigatórios e opcionais.
Metadado obrigatórios |
Preenchimento |
Título* |
Preencha de forma
objetiva e sucinta o nome pelo qual o conjunto de dados será conhecido. |
Autor* |
O nome do autor e a afiliação são
preenchidos de forma automática via ORCID, se alguma informação estiver
equivocada, é necessário alterar na própria conta do ORCID. |
Entre em contato* |
Nome: Sobrenome (s), Prenome (sem ponto final) Afiliação: Informe o nome, por extenso, da instituição a qual o (s) autor (es) está (ão) filiado (s) e entre parênteses acrescente a sigla da instituição. Ex.: Instituto Brasileiro de Informação em Ciência e Tecnologia (Ibict) E-mail: Informe o endereço de e-mail do (s) autor (es) do conjunto de dados. Deve ser informado, preferencialmente, o e-mail institucional do (s) autor (es). Evite, portanto, e-mails pessoais.
|
Descrição* |
Escreva um resumo descrevendo a finalidade, a natureza e o escopo dos conjuntos de dados. Recomenda-se o máximo de 500 caracteres. |
Assunto* |
Selecione as principais áreas do conhecimento em que o conjunto de dados faz parte. |
Palavras-chave* |
Escreva termos que representam aspectos importantes dos conjuntos de dados Não finalizar com ponto. |
Metadados opcionais |
Preenchimento |
Subtítulo |
Preencha para ampliar ou especificar aspectos do título principal |
Título alternativo |
Preencha colocando a tradução do
título em inglês ou uma abreviação do título. |
URL alternativo |
Indique uma URL externa pela qual o conjunto de dados pode ser acessado; por exemplo, um site do projeto de origem ou mesmo pessoal. |
Outro ID |
Indique outro identificador exclusivo que faz referência a este conjunto de dados (por exemplo, número do produtor dos dados ou de outro repositório). |
Agência ou Instituição |
Indique o nome da agência que gerou esse identificador. Recomenda-se verificar o nome adotado na página institucional para evitar inconsistências e erros. |
Identificador |
Indique outro identificador que corresponda ao dataset. |
Classificação de tópicos |
Preencha com as categorias abrangentes do vocabulário controlado usado para atribuição de assuntos do conjunto de dados. Por exemplo, no Nal Thesaurus, a grande categoria P Natural Resources, Earth and Environmental Sciences ou, ainda, a sub-categoria Soil Science. |
Publicação relacionada |
Indique publicações (artigos, livros, capítulos de livro, artigos em congressos, etc.) que referenciam ou usam os dados dos conjuntos de dados descritos. |
Notas |
Escreva informações adicionais importantes sobre os conjuntos de dados |
Idioma |
Selecione o idioma dos conjuntos de dados |
Produtor |
Indique pessoa ou organização responsável financeira ou administrativamente pelo conjunto de dados. |
Data de produção |
Coloque a data em que a coleta de dados foram produzidas (não distribuídos, publicados ou arquivados). Ordem de preenchimento: ANO MÊS DIA. |
Local de produção |
Coloque o local onde a coleta de dados foram produzidos |
Colaborador |
Coloque a organização ou pessoa
responsável por coletar, gerenciar ou de alguma forma contribuiu para o
desenvolvimento do recurso. Selecione o papel da organização ou da pessoa.
Ex.: coletador de dados, curador de dados… |
Conceder informação |
Coloque o nome da agência financiadora por extenso e a sigla entre parênteses e número do processo |
Distribuidor |
A instituição designada pelo autor ou produtor do conjunto de dados para gerar cópias do trabalho, incluindo edições e revisões quando necessário. |
Data de distribuição |
Data em que o conjunto de dados tornou-se disponível para distribuição. Usar o padrão AAAA-MM-DD. |
Depositante |
Preenchimento automático via Dataverse |
Data do depósito |
Preenchimento automático via Dataverse |
Período coberto |
Coloque o período de tempo ao qual os dados se referem. Este campo reflete o período de tempo abrangido pelos dados, não as datas de codificação ou criação de documentos legíveis por máquina ou as datas em que os dados foram coletados, também conhecidos como spam. Ordem de preenchimento: ANO MÊS DIA. |
Data de coleta |
Coloque a data que os dados foram coletados. Ordem de preenchimento: ANO MÊS DIA. |
Tipos de dados |
Tipos de dados incluídos no arquivo: dados de pesquisa, dados de censo, dados agregados, dados clínicos, dados de eventos, dados de registros administrativos, documentos codificados ou outros. |
Série |
Caso o conjunto de dados faça parte de uma série, as informações sobre ela devem ser incluídas neste tópico. A informação de série pode ser útil para agrupar conjuntos de dados de um projeto de pesquisa, ou mesmo de uma sequência de dados experimentais e observacionais que foram desenvolvidos por meio de esforços de vários projetos simultaneamente, ou por uma sequência de projetos. O campo permite múltiplas entradas |
Software |
Informações sobre o software usado para gerar o conjunto de dados. |
Material relacionado |
Qualquer material relacionado a este conjunto de dados. |
Relacionados conjuntos de dados |
Quaisquer conjuntos de dados relacionados a esse conjunto de dados, como pesquisas anteriores sobre este assunto. |
Outras referências |
Quaisquer referências que sirvam como pano de fundo ou material de apoio a este conjunto de dados. |
Fontes de dados |
Lista de livros, artigos, publicações em série ou arquivos de dados legíveis por máquina que serviram como fontes da coleta de dados |
Origem das fontes |
Em caso de materiais históricos, as informações sobre a origem das fontes e as regras seguidas para estabelecê-las ou delimitá-las devem ser especificadas. |
Características das fontes observadas |
Observações sobre o material e as características da(s) fonte(s) do conjunto de dados. Qualquer informação considerada importante pelo depositante que pode ser útil na reutilização dos dados |
Documentação e acesso a fontes |
Nível de documentação das fontes originais. Caso haja alguma restrição de acesso às fontes, informar neste campo |
Carga de arquivos
Após o preenchimento dos metadados, na seção “Arquivos” (parte inferior da tela), clique em “Selecionar arquivos para adicionar” para fazer a carga de todos os arquivos de seu conjunto de dados. Vale lembrar que ele não deve ser maior do que 1 (um) GB e cada arquivo não pode ser maior que 100 MB.
Caso você precise carregar um ou mais arquivos maiores que 1GB, envie um e-mail para aleia@ibict.br para obter orientações sobre como proceder.
Ao concluir a etapa de carga dos arquivos, clique em "Salvar conjunto de dados". A disponibilização on-line do conjunto de dados não ocorre imediatamente após o depósito. O item submetido será revisado e validado pela equipe do Aleia e, assim que aprovado, será disponibilizado na interface do repositório.
Caso o item submetido seja rejeitado, o depositante receberá um e-mail no qual constará o motivo da rejeição e deverá fazer a correção da submissão. Após concluída a correção da submissão, o item submetido será novamente revisado e, assim que aprovado, será disponibilizado na interface do Aleia.
No momento da publicação, o nível de acesso a um arquivo ou conjunto de arquivos de um conjunto de dados será definido como público:
a) Público – quando o pesquisador autoriza o acesso, reuso e redistribuição de dados para pesquisa e não há restrições legais, éticas e estratégicas. No caso do acesso a dados públicos, o autor e/ou gestor dos dados poderão definir questionários e termos a serem preenchidos e aceitos pelos usuários para o efetivo acesso aos datasets.
A critério do autor dos dados de pesquisa, poderão ser aplicadas regras específicas e controle de acesso para os conjuntos de dados, que ficarão como restritos no repositório (os usuários têm acesso apenas aos metadados do conjunto de dados).
Curadoria (Revisão)
A Coordenação de Tratamento, Análise e Disseminação da Informação Científica (CODIC) será responsável pelo controle de qualidade na produção dos metadados para recuperação da informação no Aleia e pela identificação de problemas relativos à busca e à identificação dos documentos disponibilizados.
5 EDIÇÃO DOS CONJUNTOS DE DADOS
Após a etapa inicial da inserção dos conjuntos de dados, o autor dos dados tem permissão para editar, modificando ou adicionando metadados - uma vez que agora é apresentado o formulário completo com todos os metadados (obrigatórios e opcionais). O autor dos dados também pode modificar termos e arquivos. Para isso basta acessar o conjunto de dados que deseja editar e seguir o passo a passo abaixo:
Editar arquivos de dados
A opção “Editar arquivos (upload)” permite que novo(s) arquivo(s) seja(m) depositado(s) no conjunto. Os arquivo(s) carregado(s) pode(m) receber uma breve descrição e ter tag(s) atribuída(s).
Caso tenha feito o upload de um arquivo que não deseje mais adicionar ao conjunto de dados, basta clicar na opção "excluir". Ao final, salve as alterações feitas.
Editar metadados
No mesmo painel "editar" é possível fazer a edição dos metadados do conjunto de dados. Conforme já citado, a edição de metadados apresenta um formulário maior que o disponível na etapa de criação do conjunto de dados, contemplando todos os campos disponíveis pelo sistema. Após terminar a edição dos metadados, clique em "salvar alterações".
Assim que finalizar as operações de criação ou edição de acordo com as orientações deste guia do usuário, o conjunto de dados poderá ser enviado para revisão. Para isso, basta clicar no botão "submeter para revisão". O curador responsável analisará todos os elementos do conjunto de dados (arquivos, metadados, termos de uso, etc.) para validá-los, sugerir alterações ao criador (depositante), ou ele mesmo fazer os ajustes que julgar necessários quando estes não representem mudanças radicais nas informações e outros elementos inseridos na versão esboço (rascunho).
Quando o conjunto de dados for publicado pelo curador, o depositante será notificado em sua área pessoal. Vale relembrar que mesmo depois de publicado, um conjunto de dados ainda pode ser modificado, com edição dos metadados, acréscimo de arquivos e outros elementos. Quando estas modificações são feitas, o conjunto de dados é publicado como uma nova versão e todas as versões ficam salvas na página do dataset, conforme a figura abaixo.
Perfis e permissões de usuários:
● Administrador: perfil que possui todas as permissões em dataverses, datasets e arquivos. Tem como função/permissão: adicionar dataverses, adicionar conjuntos de dados (datasets), visualizar dataveses não publicados, fazer download de arquivos, editar dataverse, editar conjuntos de dados (datasets), gerenciar permissões do dataverse, gerenciar permissões do dataset, publicar dataverse, publicar conjuntos de dados (dataset), deletar dataverse e deletar dataset e visualizar dataverses e conjuntos de dados (datasets) que estão em modo público.
● Autor dos conjuntos de dados: perfil para pesquisadores brasileiros vinculados a instituições científicas que ainda não possuem seus repositórios de dados de pesquisa e/ou de pesquisadores brasileiros que executaram seus conjuntos de dados em produções científicas em instituições estrangeiras de ensino e pesquisa. Tem como função/permissão: inserir conjuntos de dados (datasets), visualizar os próprios conjuntos de dados não publicados, fazer download de arquivos, editar conjuntos de dados, deletar conjuntos de dados e visualizar dataverses e conjuntos de dados (datasets) que estão em modo público.
● Usuário: perfil para usuários não autenticados no ORCID. Tem como função/permissão: fazer download de arquivos e visualizar dataverses e conjuntos de dados (datasets) que estão em modo público.
● Revisor: perfil que dedica-se em especial à revisão da descrição dos metadados realizada pelos autores e à publicação dos dados.Tem como função/permissão: visualizar dataveses não publicados. fazer download de arquivos, editar conjuntos de dados (datasets), gerenciar permissões do dataset, publicar conjuntos de dados (dataset), deletar dataset e visualizar dataverses e conjuntos de dados (datasets) que estão em modo público.
Se tiver alguma dúvida, quiser obter informações ou iniciar um processo de depósito no Aleia, envie um e-mail para o endereço aleia@ibict.br
BRASIL. Lei nº 13.709, de 14 de agosto de 2018. Lei Geral de Proteção de Dados Pessoais (LGPD). Brasília: Presidência da República, 2018. Disponível em: https://www.planalto.gov.br/ccivil_03/_ato2015-2018/2018/lei/l13709.htm. Acesso em: 13 dez. 2023.
DANS. Disponível em: https://dans.knaw.nl/en/file-formats/. Acesso em: 13 dez. 2023.
FELICISSIMO, C. H. et al. Boas práticas na nomeação dos arquivos para o compartilhamento. [S.l.: s.n.], 2022. 1 vídeo (4 min.). Publicado pelo canal Instituto Brasileiro de Informação em Ciência e Tecnologia. Disponível em: https://www.youtube.com/watch?v=I6tXlHPMxHg. Acesso em: 13 dez. 2023.