Os dados cadastrais de empresas brasileiras são públicos. Diz a lei, diz a Receita Federal, diz o portal de dados abertos. Qualquer pessoa pode baixar o cadastro completo de CNPJ, de graça.
Mas público virou uma palavra técnica. Significa que existe um link. Que aponta para 85 gigabytes de arquivos compactados. Que mudam de formato sem aviso. Que baixam a 200KB/s, quando baixam.
O dado é público. O acesso, não.
Então surgiram as APIs, cobrando por consulta de um dado que já é seu por direito. E as plataformas de prospecção, cobrando por mês pelo mesmo dado com um filtro bonito em cima. E centenas de projetos no GitHub, cada um tentando resolver o mesmo problema, cada um quebrando quando a Receita muda o layout.
O que decidimos fazer
Resolvemos o pipeline uma vez. Download, layout que muda, campos corrompidos, tudo. E abrimos o código para quem quiser rodar por conta própria, no próprio banco, sem depender de ninguém.
Em cima dele, construímos um lugar onde qualquer pessoa encontra uma empresa sem saber SQL, sem chave de API e sem cadastro para ver dado que já é público. Não para vender lead. Não para cobrar por consulta. Para que dado público seja, de fato, público.
Porque dado público sem acesso é só um arquivo num servidor. E um arquivo que ninguém consegue abrir não é transparência. É só uma formalidade.