Coronavirus Brasil

 

Coronavirus Brasil é um trabalho de estética de banco de dados, tema que venho marginalmente trabalhando já há alguns anos, junto ao mergulho que dei na programação de softwares. Essa iteração da pesquisa de estética de banco de dados nasceu nas conversas iniciais dessa edição da NaBorda, no longínquo março, onde definimos o tema da pandemia, cuja onipresença e sequestro da subjetividade se mostrou impossível ou desnecessário escapar.

Esse tipo de trabalho é um tanto difícil de desvincular do jornalismo, haja visto o grande sequestro subjetivo que a conjuntura da década nos submeteu, nossa/minha Síndrome de Estocolmo.

Fases

0.

A primeira idéia, que serviu de modelo para o projeto, foi gerar um mapa-múndi que serviria para ilustrar o convite da edição. Fui em busca dos dados e de um mapa-mundi na rede que fosse dividido por países e que pudesse manipular os polígonos com facilidade. Isso foi feito, e os artistas receberam o convite. Mas me pareceu redundante e meio besta fazer algo que já tinha um monte por aí.

Nessa época ainda, a pandemia não era um fenômeno local, não havia informação aqui e daqui, ninguém tava dando muita pelota, além do fique em casa.
Diante de todo tempo disponível diante da prisão domiciliar voluntária e estado de exceção sanitário que nos encontrávamos, era claramente um lugar pra operar.

1.

A primeira fase desse tipo de trabalho é encontrar uma base de dados consistentes, de fácil acesso e que tenha os dados que quero. Encontrei um cara, Wesley Cota, doutorando de física da UFV, que começava a compilar os dados do jeito que eu queria: entidade com fase histórica e os dados pandêmicos, em tabelas separadas para estados e municípios, em tipo de arquivo padrão para dados universais desde o dia 0.
O dump de dados segue o padrão apresentado abaixo:

date,country,state,city,newDeaths,deaths,newCases,totalCases,deathsMS,totalCasesMS,deaths_per_100k_inhabitants,totalCases_per_100k_inhabitants,deaths_by_totalCases,recovered,suspects,tests,tests_per_100k_inhabitants 2020-02-25,Brazil,SP,TOTAL,0,0,1,1,0,0,0.00000,0.00218,0.00000,,,, 2020-02-25,Brazil,TOTAL,TOTAL,0,0,1,1,0,0,0.00000,0.00048,0.00000,,,,

e

date,country,state,city,ibgeID,newDeaths,deaths,newCases,totalCases,deaths_per_100k_inhabitants,totalCases_per_100k_inhabitants,deaths_by_totalCases,_source 2020-02-25,Brazil,SP,São Paulo/SP,3550308,0,0,1,1,0.00000,0.00816,0.00000,SES 2020-02-25,Brazil,TOTAL,TOTAL,0,0,0,1,1,0.00000,0.00048,0.00000,

2.

O próximo passo é escrever um programa que puxe os dados pra dentro, faça uma análise de cada linha e cada ítem da linha e coloque cada dado no lugar certo. Isso é: dados do Ceará no Ceará, Manaus em Manaus, etc. Criei 3 objetos para armazenar cada estrutura: Entrada, Cidade e Estado, onde Entrada é o tijolo de cada edifício.
A primeira visualiação criada foi feita para testar a garantia de que esses dados estavam no lugar certo. Se tudo estiver certo, se poderia avançar.
Tudo Certo = ter os dados numéricos por estado, plotar as curvas dos dados disponíveis na época: total de casos (tC) em verde e novos casos (nC) em vermelho e trocar o estado visualizado pelas setas laterais do teclado e trocar a data pelas teclas verticais do teclado.

3.

Garantida a geolocalização dos dados, era hora de aprimorar a visualização desses dados. A primeira tarefa foi o trabalho com os mapas estaduais vetoriais. Encontrar um mapa político do Brasil em vetor, tratar e colocar no formato certo para a entrada e manipulação no software. Bem como melhorar a visualização desses dados.
Nesse momento surgiu um novo dado na tabela que foi o número de mortes. A criação de uma estrutura modular logo no começo não transformou isso num problema. Essa nova necessidade validou as fases anteriores.
Escolhi o fundo preto e essa versão dark para poder projetar os mapas Brasil afora. Foram feitas algumas tentativas mas sem muito sucesso. Visualização de dados não tem tanto apelo imediato, deixestar.
Já em 1/abril essa fase estava resolvida.

Em abril, seguindo um ensaio de março, começam os factóides do governo como forma de distrair a atenção da pandemia e das políticas nocivas do governo. Era só uma gripezinha, vai passar rápido, não vai contaminar ninguém, ninguém vai morrer, mas em 21 de março o gênio Paulo Jegues já tinha cedido 1,2 trilhões (16% do PIB nacional) para a banca financeira segurar o tranco do meteoro que estava em rota de colisão.

4.

Já tinhamos domínio sobre jogar peteca com os números, agora era a hora de começar a indagar que história esses números sobre os mapas ao longo do tempo nos contam.
A primeira investigação foi programar dois gráficos de pizza de casos e mortes por estados, o índice de contaminação da população de acordo com os padrões internacionais e a primeira investigação sobre as cidades.

As cidades geraram uma nova necessidade, o dump de dados é muito maior do que o dos estados; temos a criação de alguns outros problemas de representação.
Um deles foi facilmente resolvido, com um cruzamento de algumas tabelas de municípios do IBGE para a criação de um novo banco de dados de municípios, com população de cada município e suas coordenadas geográficas, latitude e longitude.
Mexer com programação ensina a compartimentalizar os problemas, o famoso um problema da cada vez. Era hora de soltar o primeiro resultado de cidades enquanto em paralelo trabalhava no segundo problema.
O resultado já está na figura abaixo, já no dia 10/abril.

5.

O segundo problema com visualização de cidades foi bem mais trabalhoso, o que me obrigou a retomar um projeto abandonado, de ter um arquivo vetorial da malha de todos os municípios brasileiros, dividida por estados, cada um com seu código IBGE. Fase embaçada por ter de fazer 5570 vezes a mesma coisa manualmente, sem assistentes ou estudantes bolsistas. Mala.

Já em 20/abril essa questão já estava resolvida, bem como o que fazer com ela, uma visualização coroplética de todos os municípios do País, dividida por estados, onde a cor de cada município é dada pelos tCs.

Nessa época tanto os dados como o governo passaram a assumir um padrão de codependência. Todo final de semana, domingos e segundas, os valores aferidos despencam para 40% do original, na terça-feira eles retornam, e quarta e quinta consolidam um novo patamar mais alto que o anterior. Toda quarta-feira era iniciada uma nova não-crise com factóides e falas do Bozo feitas para tirar a atenção dos números. De merchans a carreatas da mortes, e falas culminando com a defenestração do primeiro ministro da Saúde, que entrou no governo para desmontar o SUS e retalhá-lo aos poucos para a privatização, mas tomou uma bola nas costas e saiu como herói pros coxas arrependidos.

6.

A abertura da janela coroplética dos estados deixou um espaço para preencher, uma outra pergunta/necessidade pra ser preenchida diante dos fatos e dados. A pandemia Covid-19 é um fenômeno das altas densidades e ela atinge duramente as cidades brasileiras inseridas no espaço de fluxos, as cidades brasileiras inseridas no espaço da globalização: São Paulo, Rio de Janeiro, Fortaleza, Recife, São Luís e Manaus.
Diante dessa constatação mais três tarefas se fizeram necessárias,

  1. Em estados, a criação dos mapas coropléticos das regiões metropolitanas das capitais
  2. Visualização dos mapas dos municípios
  3. Busca dos microdados municipais e dados demográficos.

Em poucos dias o item 1 já estava resolvido, o item 2, meio, e o terceiro se tornou e ainda é o maior problema.

7.

O mapa das cidades para entrar no estilo certo (cores e fontes) foi um pouco mais trabalhoso, pois dependia da conversa com o criador da biblioteca de mapas, e software livre tem dessas coisas; os caras criam bibliotecas e não as atualizam; então foi abrir chamado no github e esperar começar o diálogo com a Alemanha.
Resolvida a fase, que incluiu criar um novo método na classe original, consegui inserir os mapas como queria, com estilo próprio.

Nessa época a chave de criptografia do Bozo foi quebrada, quer dizer, a tática de factóides programados para desviar a atenção da mortalidade e mal-feitos realizados pelo governo em antecipação a nova escalada dos números já não tem a mesma preponderância na mídia oficial e redes-soçiais. Bom lembrar que Bozo sempre contou com as redes-soçiais para seu crescimento, manipulando como mestre o fator indignação de tolas exquerdas para expandir sua mensagem e dar mais ímpeto e piadas a seus seguidores

8.

A versão 8 surgiu para otimizações e debugagens de código, bem como alterações na estutura que melhorassem a performance da máquina. A quantidade de dados não parava de crescer, a pandemia não parava de se expandir, já estávamos no segundo ministro da Saúde e ainda tínhamos o padrão Bozo de criar um factóide por semana para tirar a atenção dos dados crescentes.
Se no começo da pesquisa por cidades estávamos com poucos municípios, a essa altura de maio já tínhamos 2580 municípios ativos, e plotar 2580 círculos com 3 pixels de diâmetro são muito mais caros computacionalmente do que plotar 2580 pontos com 3 pixels de espessura.
Temos também a primeira versão para Windows, que por ser mais limitado, demanda acertos na estrutura de programação que valem muito na otimização dos recursos computacionais da máquina.

9.

A versão 9 do programa surgiu com duas finalidades, visualizar os dados qualitativos, resolver questões de interface e fazer uma prévia de uma versão para distribuição.
Em termos de interface, criei uma navegação por botões, que facilita a vida de quem não lê manual e se atrapalha todo com comandos de teclado.
Gráficos qualitativos são os gráficos de densidade, que levam em consideração fatores locais. Um gráfico traz a densidade contaminação da população (d), número de casos por 100 mil habitantes, e o outro traz a taxa de mortalidade local (tML), qual porcentagem dos contaminados morre. O segundo gráfico é mais interessante pois dá mais duas leituras; uma é o grau de subnotificação da pandemia em cada local, e a probabilidade de morte se a pessoa se contaminar naquela cidade.
Abaixo temos as 4 visualizações, total de casos (tCs) em escalas de vermelho, densidade(d) em escalas de pink, total de mortes (tDs) em escalas de azul e taxa de Mortalidade Local (tML) em escalas de verde.

Já do meio pro fim de maio os factóides começaram a acabar e o regime Bozo começa a endurecer. Cai o segundo ministro da Saúde e entra o pelotão dos generais dispostos a vencer a pandemia na bala, censura e repressão.

10.

Agora em junho, dois desafios se apresentam.

O primeiro é em relação ao software em si, os microdados seguem uma incógnita. As prefeituras tem verdadeiro pânico e horror por divulgar esses dados. Não existem dados oficiais padronizados na divisão por distritos ou outras subdivisões municipais bem como a demografia localizada dos contaminados e mortos. Isso precisa mudar

O outro, político-conjuntural, é vencer o Apagão de Dados Federais imposto pelo regime bozo, que decidiu acabar com a pandemia por decreto, na bala, censura e na ignorância da realidade. A sociedade procura se mobilizar para fazer oposição ao governo e trazer a deposição desse gabinete de maldades, mas a farda e o PIB não quer e os coxas gopistas que tão puxando a tal oposição não são de confiança. Desejo fazer uma distribuição pública controlada do software pois parece que fazer mapas virou um ato terrorista, quem diria.

Abaixo seguem duas playlists do youtube com as animações dos gráficos diários por estados da pandemia. As playlists são dos meses de abril e maio.