sabe quantas perguntas são feitas a google por minuto? pense um pouco. a internet tem algo entre 2.1 e 2.5 bilhões de usuários, dependendo da medida. fiquemos com o menor número, só pra simplificar. se cada um destes dois bilhões e cem milhões de indivíduos fizer uma pergunta por dia à máquina de busca dominante, google seria questionado quase um e meio milhão de vezes por minuto. na verdade, são dois milhões de perguntas por minuto, segundo esta fonte. considerando a baixa penetração de google em partes da ásia, notadamente a china [distribuição dos usuários da internet no mundo na figura a seguir], parece que cada um dos usuários de google faz bem mais de uma pergunta à máquina de busca por dia.
este é um dos dados [sobre dados, na internet] mostrado neste texto, que ainda diz que mais de 100.000 tweets são enviados por minuto, em média, isso quando algo realmente diferente não acontece. o que é “diferente”? coisas como o anúncio da gravidez de beyoncé no MTV VMA… que gerou 8.868 tweets por segundo, ou mais de 532.000 por minuto. sabe o que é isso, pra comparar? a bmf/bovespa realizou 567.187 negócios por dia em 2011. na brincadeira, a bolsa de são paulo faz, por dia, o que beyoncé faz em um minuto de twitter.
somando o que é adicionado [quase 700 mil itens] com os comentários [mais de meio milhão] faceBook tem que ter capacidade para muito mais de um milhão de transações por minuto, a maior parte delas bem mais complexa do que um tweet.
mas o campeão é emeio, porque universal e absolutamente distribuído: são mais de 200 milhões de mensagens por minuto, o que dá cerca de uma mensagem por cada usuário da rede a cada dez minutos. boa parte disso é spam, o que é boa parte, também, do problema de emeio. há quem diga que isso não tem jeito e que levará ao fim do emeio. mas não: tem jeito sim, e emeio é –e pode continuar sendo- a principal forma de interação em rede.
gerar tanto dado assim, o tempo todo, é uma característica de nossos tempos em rede. há dois anos, o blog publicou um texto mostrando que, em 2011, metade dos dados criados no planeta teria que ser descartado simplesmente porque não haveria armazenamento para guardá-los. e isso já rola há mais de meia década, quando o volume de dados gerados passou a capacidade global de armazená-los.
mesmo para o dado que está guardado, há problemas de formato, recuperação e apresentação, o que deve fazer com boa parte do que está sendo “salvo”, hoje, não sirva para nada em uma ou duas décadas. ou antes, se aquele startup no qual você armazena suas transações desaparecer de uma hora pra outra. há saída? sim, há. qual? uma mudança de paradigma de rede onde cada um seja dono de e tenha a posse efetiva de seus dados, armazenados sob seu controle em ambiente aberto, em formatos abertos e universais.
ainda assim, é muito provável que seus dados, para sobreviverem, terão que ficar armazenados em um sistema fora da sua casa ou empresa [ou seja, na nuvem] e muito provavelmente vão desaparecer assim que você deixar de pagar a conta. este é um dos problemas da informaticidade, informática provida e usada [e cobrada e paga] como fluxo, como serviço, como é o caso da eletricidade. sendo cobrados por uso e não pagando, teremos o serviço “cortado”. e bye, bye, dados.