Release: dadosgovbr, biblioteca de exploração de dados públicos do Brasil

by George Y. Kussumoto

Uma das iniciativas legais de uma política mais transparente é o acesso às informações públicas. O governo brasileiro disponibiliza essas informações em um portal próprio e a quantidade de dados é bem significativa e constantemente atualizada. Inclusive, diversos eventos relacionados já foram realizados, ou seja é de interesse geral que esses dados continuem sendo disponibilizados.

Como nem tudo são flores, a exploração das informações não é das melhores, algumas funcionalidades básicas como a busca de conjunto de dados estavam instáveis quando testei, além de problemas de interface ao usuário mais leigo. Do ponto de vista do desenvolvedor, existe uma API que podemos consultar de forma mais programática. Resolvi criar uma outra biblioteca para que seja mais confortável para desenvolvedores python explorarem esses dados, visto que lidar com estruturas aninhadas (dict/json) é um pouco entendiante.

A biblioteca dadosgovbr é bem simples e apenas encapsula os resultados da API em objetos python, facilitando o acesso de atributos e outras estruturas mais internas. A instalação e uso são bem simples:

$ pip install dadosgovbr

Ainda faltam mais exemplos de uso já que não teria muito sentido em criar uma documentação para um projeto tão simples. Parte da exploração é descobrir quais dados estão sendo disponibilizados, nem sempre os destaques no portal são relevantes ou de interesse pessoal. Como exemplo, para buscar recursos relacionados com a Lei Rouanet:

>>> from dadosgovbr import DadosGovBR
>>> api = DadosGovBR()
>>> list(api.search_resources('rouanet'))[0]
Resource(mimetype=u'application/xml', resource_group_id=u'1119d7d3-4461-4863-8b68-4fcc7d556515', mimetype_inner=None,
 cache_url=None, hash=u'', description=u'N\xfamero de projetos aprovados pela Lei Rouanet - projetos culturais aprovados para receber incentivos fiscais.', cache_last_updated=None, url=u'http://api.pgi.gov.br/api/1/serie/1477.xml', format=u'XML', name=u'N\xfamero de projetos aprovados pela Lei Rouanet', state=u'active', last_modified=None, created=u'2015-07-02T17:20:31.694380', webstore_last_updated=None, url_type=None, position=0, revision_id=u'be970743-6222-49ea-b91f-39a30130098a', webstore_url=u'http://www.cultura.gov.br/', id=u'a7367c91-bcf7-4e3b-a97c-db61af8ae645', resource_type=None, size=None)

O resultado acima pode estar desatualizado, mas é interessante saber que existem dados disponíveis para qualquer pessoa sobre os projetos incentivados pela lei em questão. Já existem alguns aplicativos que utilizam dados públicos e quem sabe podemos aumentar mais essas iniciativas. Acredito que o primeiro passo seja facilitar a descoberta de informações relevantes para outros desenvolvedores e espero ter contribuído com isso.

o/