vez por outra alguém faz uma previsão radical que realmente acontece, e até mais do que pensado. doug laney é autor de uma delas, de 2001, sobre como negócios intensamente dependentes de informática [e-businesses] iriam mudar a forma de capturar, processar, armazenar, recuperar e [entre muitas outras coisas…] apresentar dados. a previsão original de laney era que…
During 2001/02, leading enterprises will increasingly use a centralized data warehouse to define a common business vocabulary that improves internal and external collaboration. Through 2003/04, data quality and integration woes will be tempered by data profiling technologies (for generating metadata, consolidated schemas, and integration logic) and information logistics agents. By 2005/06, data, document, and knowledge management will coalesce, driven by schema-agnostic indexing strategies and portal maturity.
no mesmo texto, laney também definia o que iria mudar, nos dados corporativos, a ponto de causar mudanças radicais na gestão de seu ciclo de vida e, claro, nos processos computacionais associados. segundo laney, os negócios passariam a depender do entendimento de novos e muito maiores volumes, velocidade e variedade de dados no seu dia a dia. a imagem correspondente, ainda da previsão original, é mostrada abaixo.
dia destes, participei de uma discussão para encontrar uma definição contemporânea para a noção de big data, uma das expressões mais pronunciadas pelas comunidades de informática e negócios nos últimos anos, e que quase ninguém consegue definir com alguma precisão, como acontece com quase toda buzzword de TICs. a minha sugestão foi de que o essencial ainda está lá na previsão de laney, especialmente para quem se dedique a ler o original com cuidado e situar a previsão no contexto atual. partindo da definição original, minha sugestão é de que…
…a expressão BIG DATA se refere qualquer coleção de dados cuja combinação de volume [tamanho da coleção],variedade [dos tipos de dados e das suas fontes] e velocidade [de geração e captura dos dados e de eventuais mudanças de formatos, fontes… e seu efeito no ciclo de vida da informação] esteja no limite ou exceda os métodos, processos, algoritmos e capacidade computacional contemporânea para simplificar seu entendimento através de sínteses capazes de gerar significados para os modelos e processos de negócio para os quais estão sendo levados em conta.
definida em termos de 3V/3S, a expressão BIG DATA passa a ser [quase] atemporal e vai continuar valendo por muito tempo. buzzwords como big data ou banda larga deviam ter definições mais ou menos como esta, sem o que perdem significado. há 15 anos, banda larga queria dizer, basicamente, acesso não discado à rede. hoje, pense, quantos megabit por segundo você queria ter para dizer que tem, mesmo, acesso em banda larga? pois é. precisamos de definições que resistam ao tempo, pra ter menos buzzwords e mais conceitos, em TICs. aliás, qual seria uma definição atemporal de banda larga, hoje e por muito tempo?…