Coleções para MongoDB – parte 2

Muitos meses atrás, eu fiz um post com algumas poucas dicas para conseguir bases para testar a API do MongoDB. Após esse tempo, eu adquiri novas estratégias para alimentar uma base de dados para começar a brincar com o MongoDB. Esse post é a continuação que detalha essas novas dicas.

um projeto que mantém uma base de dados com os trajetos dos taxis de New York. Esses dados estão salvos no formato CSV e eu fiz um script para baixar (~50G) e converter esses dados para MongoDB. O script depende do bash para funcionar.

Um pouco apelação, pois os dados não são muito relevantes, mas eu fiz um script em Python para transformar a base de dados dos pacotes do ArchLinux instalados em uma base do MongoDB.

Uma outra fonte de dados interessante é a base de dados que o projeto DataViva mantém e pode ser importado via csv. A base de dados contém informações interessantes sobre, entre outros (visite a página!), salários. Vale a pena, também, visitar a página principal do projeto DataViva.

E, como última dica, há também as bases de dados que o curso OpenIntro Statistics utiliza. OpenIntro Statistics é uma iniciativa nobre de oferecer material de ensino de qualidade para qualquer um com acesso a internet. O meu atual professor de probabilidade e estatística desistiu do material anteriormente adotado ao descobrir essa iniciativa.

EDIT (2016/03/04):

Achei outro projeto interessante para gerar bases de dados, o MongoDB Smasher. Essa é uma pequena ferramenta semelhante em funcionamento ao site http://www.json-generator.com/.

Tags:

Comentários (with MarkDown support)

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair / Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair / Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair / Alterar )

Foto do Google+

Você está comentando utilizando sua conta Google+. Sair / Alterar )

Conectando a %s

%d blogueiros gostam disto: