tá fazendo dois anos que a gente deu uma definição pra big data aqui no blog. e ela diz que…
…a expressão BIG DATA se refere qualquer coleção de dados cuja combinação de volume [tamanho da coleção],variedade [dos tipos de dados e das suas fontes] e velocidade [de geração e captura dos dados e de eventuais mudanças de formatos, fontes… e seu efeito no ciclo de vida da informação] esteja no limite ou exceda os métodos, processos, algoritmos e capacidade computacional contemporânea para simplificar seu entendimento através de sínteses capazes de gerar significados para os modelos e processos de negócio para os quais estão sendo levados em conta.
se a gente, em rede, já cria o volume de dados atual [90% de toda informação existente apareceu nos últimos 2, 3 anos], imagine o que vai acontecer quando a internet das coisas “pegar”. os impactos serão universais, como se pode ver na figura abaixo [que ainda se pode dizer incompleta; ela está em The Internet of Things VISION, de Eleonora Borgia]
dependendo do seu grau de otimismo e credulidade, os números de dispositivos conectados, já ali em 2020, é astronômico. pelas contas da NCTA, nada menos do que 50 bilhões, incluindo nossos laptops, tablets e os smartphones. vamos ver se chegamos lá.
é desse mundo de dispositivos, usuários e aplicações que virá um universo de dados, em tempo real. ou quase. para os quais uma coisa é certa: só serão realmente úteis para as instituições que os terão se forem tratados em tempo quasi-real. e o que nos dá uma boa ideia disso é a imagem abaixo, modificada a partir de um original de richard hackathorn, publicado em “The BI Watch: Real-Time to Real-Value.”. a imagem original foi usada no relatório do fórum econômico mundial Global Information Technology Report 2014. observe, entenda e leia o comentário depois da imagem.
a observação de hackathorn, dada bem antes da expressão big data se popularizar, estava associada a uma discussão sobre business intelligence e data warehousing nos negócios e alertava que dados e inteligência não interessam aos negócios per se. o que importa é o valor que eles criam ao serem utilizados para tomadas de decisão que, por sua vez, levam a ações concretas de interesse do negócio [porque, na maioria das vezes, de interesse de seus clientes e usuários].
o que o gráfico tenta mostrar é que o valor dos dados capturados em um evento de negócios qualquer cai, e muito [o muito é nosso; a curva original de hackathorn é mais suave], à medida que o ponto de tomada de decisão para ação, no tempo, se distancia do ponto em que o evento aconteceu.
o que a curva não diz é que, em certas situações, quando a distância é grande demais, é melhor nem tomar uma decisão e agir sobre um problema [por exemplo] que acabamos de descobrir que aconteceu lá atrás… porque qualquer ação, agora, pode piorar um estado de coisas que talvez já tenha se resolvido por si só.
é certo que com organização e tempo, acha-se o segredo de fazer tudo e bem feito [atribuído a pitágoras]; mas o problema das instituições, aqui, vai ser o de… desenvolver as novas formas de organização e uso do tempo que as permita usar, melhor do que seus competidores, o grande volume e variedade de dados que vão vir da internet das suas coisas, em alta velocidade, para simplificar seu entendimento [de mundo!…] através de sínteses capazes de gerar significados para os modelos e processos de negócio para os quais estão sendo levados em conta. simplesmente porque quem conseguir fazer isso terá uma chance bem maior de sobreviver ao dilúvio de dados em que já estamos.