Você é desenvolvedor(a) iniciante e gostaria de trabalhar com a Base dos Dados?👩💻
Estamos buscando desenvolvedores(as) em Python para participar da criação e manutenção de novas funcionalidades da nossa API.
Veja mais no fio 🧶
Como desenvolvedor(a) você irá nos ajudar a:
- Criar novas funcionalidades e fazer manutenção da API em Python
- Criar pipelines de validação de dados e metadados
- Ajudar na documentação das ferramentas e infraestrutura
Temos planos para melhorar a interface com o usuário e também expandir nossas validações automáticas de qualidade dos dados e você pode fazer parte desse time dinâmico e colaborativo que mantém um dos maiores projetos open source do Brasil.
Estamos buscando alguém com conhecimento intermediário de Python e SQL e que saiba usar o git e GitHub. Se você já tem conhecimento da plataforma CKAN e familiaridade com o cloud do Google, melhor ainda!
Vale lembrar que encorajamos candidatos(as) de minorias como por raça, gênero ou religião. Somos uma organização comprometida com a diversidade e inclusão social.
Esse mês tivemos o lançamento dos dados do Censo Escolar na BD+, junto de um tutorial que te ensina a explorar esses dados pelo nosso datalake público.
Tivemos também workshops apresentando nossa versão em R, explorando os dados da Série A do Brasileirão e muito mais!
Nós preparamos ainda textos explicando como explorar nossos dados pelo BigQuery e como funciona a infra da BD, muito conteúdo interessante para te ajudar a aproveitar o máximo do nosso datalake público.
Os dados da mais importante pesquisa estatística educacional brasileira já estão disponíveis na BD+ para facilitar sua análise! 👨🏫
Você encontra dados do Censo Escolar já integrados, limpos e organizados em nosso data lake público! Veja mais no fio🧶
O Censo Escolar, coordenado pelo @inep_oficial, é o principal instrumento de coleta de informações da educação básica no Brasil. Ele abrange as diferentes etapas e modalidades da educação, ou seja, compreende desde a educação infantil até cursos técnicos e profissionalizantes.
Para demonstrar como é possível fazer análises bem ricas com esses dados, nós elaboramos estes gráficos que apontam a diferença do perfil racial existente entre escolas públicas e privadas pelos municípios brasileiros.
Nesse mês começa o Brasileirão! Que tal acessar os dados da Série A do campeonato? As tabelas com dados desde 2003 já estão na BD+ ! ⚽🏟️
São dados sobre cada partida, os times que estão jogando, pontuação, número de gols, detalhes sobre técnicos, estádio e mais! Veja o fio 🧶
Com a BD+ você pode acessar e explorar esses dados com mais facilidade. 👩💻
Para exemplificar, preparamos essa tabela com os pontos acumulados dos times da série A e o gráfico que mostra a frequência de número de gols no campeonato, de 2003 até 2020. 📉
Hoje é o Dia Mundial do Trabalho e, para comemorar a ocasião, nós disponibilizamos os dados do CAGED na BD+ para sua análise. 👷♀️
Com esses dados, nós criamos esses gráficos que traçam um panorama interessante sobre a média salarial e os tipos de contratação mais comuns no BR.
Veja que o primeiro gráfico demonstra, em um mapa, a média salarial no Brasil em 2019. Como foi a média salarial em seu Estado?📈 🔎
O segundo gráfico traça a evolução dos tipos de contratações mais comuns no Brasil, nesse mesmo ano.
O Cadastro Geral de Empregados e Desempregados foi criado como instrumento de acompanhamento e de fiscalização do processo de admissão e de dispensa de trabalhadores regidos pela CLT, com o objetivo de assistir os desempregados e de apoiar medidas contra o desemprego.
Os dados dos indicadores educacionais chegaram à BD+ para você manusear e cruzar usando poucas linhas de código.
Você já pode acessar a base completa por município com todos os indicadores da série histórica pelo nosso data lake público! Veja mais 🧶
Com esses dados pudemos elaborar esses dois gráficos. O gráfico de barras mostra que, em 13 estados, as crianças matriculadas em creches públicas nas áreas urbanas passam tempo integral nas atividades escolares, com uma média diária de horas-aula de pelo menos 7 horas.
O gráfico scatter plot mostra a taxa de distorção idade-série, que é a proporção de alunos com mais de 2 anos de atraso escolar. A taxa de abandono possui forte ligação com a defasagem idade-série, porque alunos atrasados nos estudos têm maiores chances de desistirem da escola.
Quer explorar os dados do comércio exterior brasileiro?💱📊
As tabelas do Comex Stat vão estar disponíveis na BD+ para facilitar e agilizar o acesso a esses dados. Você vai poder analisar e cruzar elas usando poucas linhas de código, como fizemos na elaboração deste gráfico. 🧶
Com esses dados nós montamos esse gráfico que mostra os 10 estados que mais exportaram no Brasil em 2020, elencados por valor exportado (US$ FOB).
💻 Veja o código que utilizamos: github.com/basedosdados/a…
O Comex Stat divulga mensalmente dados detalhados das exportações e importações brasileiras, extraídas do SISCOMEX e baseados na declaração dos exportadores e importadores.
➡️ Confira essa base por aqui: basedosdados.org/dataset/comex-…