Sobre os dados usados neste portal

Todos os dados usados neste portal foram obtidos de fontes abertas, descritas a seguir. Os dados foram importados em uma base criada para facilitar a extração e cruzamento entre as fontes.

Sobre as fontes dos dados

Quatro fontes de dados foram consideradas para os gráficos, mapas e relatórios neste portal:

  1. O Portal de Dados Abertos da CAPES é bem organizado e permite baixar várias planilhas com dados sobre programas, docentes, discentes, produções, etc. Para cada conjunto de dados existe um documento descrevendo os dados.
    Os dados são bem organizados mas é preciso reestabelecer ou procurar algumas conexões entre as bases. Por exemplo, para recuperar informações sobre um livro (parte da produção bibliográfica de um programa) é necessário procurar pelo título em um arquivo e pelos autores em outro, usando a chave que identifica o livro e que é igual nos dois arquivos. O software usado para importar os dados no banco usado neste portal reestabelece estas conexões.
  2. A Plataforma Sucupira permite a busca de programas por área, instituição, nota, etc. Os resultados da busca não incluem informações sobre docentes, discentes ou produção, mas incluem as coordenadas geográficas da sede do programa usadas nos mapas neste portal.
  3. A Plataforma Sucupira também permite acesso aos dados do envio das informações preenchidas pelos programas. Estes dados são razoavelmente completos e mais atuais do que os obtidos na plataforma de dados abertos, mas seu acesso automatizado é bem complexo: É preciso fornecer o ano, a instituição de ensino, selecionar o programa, expandir algumas abas e baixar diversas planilhas. Por ser inviável fazer isto para todos os programas, optamos por usar bases mais acessíveis mesmo que não tão atualizadas.
  4. O site analisevisual.capes.gov.br mostra vários gráficos e tabelas associados a indicadores. É possível comparar os indicadores de um PPG contra todos da mesma área, e em alguns casos baixar as tabelas que geraram os gráficos, mas estas tabelas são em grande parte sumarizadas.
    O site pede uma senha para entrar, mas permite o acesso como "guest".
    O link indicado pode não funcionar em alguns navegadores, neste caso basta copiar e colar ao invés de clicar.

Por causa da facilidade de acesso (o que possibilita auditoria e replicação dos resultados neste portal) somente as duas primeiras fontes foram usadas.

Mapas

As visualizações de dados espaciais (mapas) foram desenvolvidas usando a biblioteca Leaflet.

Mapas que mostram as divisões de estados foram criados a partir do arquivo GeoJSON publicado em https://carto.com/ e simplificado com a ferramenta mapshaper. O arquivo resultante foi editado para corrigir a acentuação dos nomes dos estados.

As coordenadas geográficas de cada programa de pós-graduação (ou das sedes no caso de programas em rede) foram extraídas da Plataforma Sucupira, usando o código de cada programa para achar a página correspondente. Como exemplo, veja aqui a página do programa de Pós-Graduação em Computação Aplicada do Instituto Nacional de Pesquisas Espaciais.

Estes dados foram coletados e processados em Dezembro de 2019. As informações das coordenadas podem estar incompletas ou incorretas em alguns casos: veja por exemplo a página do programa em rede Ensino de História -- provavelmente nem todas as sedes informaram as coordenadas no preenchimento da Plataforma Sucupira. Outro exemplo é do programa de Desenvolvimento de Jogos Digitais, que lista as coordenadas como (1,1).

Não corrigi os dados para manter o portal fiel aos dados originais da CAPES. Eventualmente os dados serão recuperados novamente do site original para incorporar as atualizações e correções que tiverem sido feitas.

Alguns Problemas com os Dados

Alguns dos relatórios são voltados para programas da área Interdisciplinar, que é composta de quatro câmaras. Alguns programas não foram classificados nestas quatro câmaras da área Interdisciplinar (45), e podem não aparecer na lista de programas quando um filtro for aplicado.

Atualização

Os dados foram atualizados em janeiro de 2020, mas usando os dados disponibilizados pela CAPES conforme descrições acima.