mais de 65% das buscas na web são feitas em google. e são respondidas por uma rede de data centers que pode ter, hoje, algo entre 200 e 500 mil servidores [dependendo de quem faz a estimativa]. e a tal rede está crescendo, até porque porque uma pergunta envolve o trabalho de 700 a 1.000 servidores diferentes até se transformar numa resposta [segundo marissa mayer, vp de busca de google].
google constrói boa parte do seu próprio hardware, e isso faz parte do espírito do negócio: pra ser melhor do que a concorrência, é preciso saber fazer melhor do que a concorrência -e seus fornecedores. abaixo, foto de um rack básico de servidores de google.
pra saber o tamanho do problema que é operar uma infra-estrutura do porte que empresas como a microsoft, yahoo, google, ebay e amazon, têm, hoje, na internet, pra servir o software que chega às nossas telas, veja o que diz jeff dean sobre a problemática de operar o monte de servidores de google: In each cluster’s first year, it’s typical that 1,000 individual machine failures will occur; thousands of hard drive failures will occur; one power distribution unit will fail, bringing down 500 to 1,000 machines for about 6 hours; 20 racks will fail, each time causing 40 to 80 machines to vanish from the network; 5 racks will “go wonky,” with half their network packets missing in action; and the cluster will have to be rewired once, affecting 5 percent of the machines at any given moment over a 2-day span, Dean said. And there’s about a 50 percent chance that the cluster will overheat, taking down most of the servers in less than 5 minutes and taking 1 to 2 days to recover... [para traduzir este texto em babelfish, clique aqui].
a descrição de dean lembra as primeiras décadas da rede de geração e distribuição de energia elétrica, quando absolutamente tudo podia falhar o tempo todo e… falhava mesmo. google resolve o problema replicando tudo, muitas vezes, para que tenhamos a impressão, de longe, de que nada falha. o que faz muito bem. mais na frente, em alguns anos, a maioria dos sistemas computacionais não só vai parecer simples mas, externamente e, em boa parte, internamente, será mais simples de verdade. informática, então, parecerá mais com eletricidade e estaremos chegando mais perto de informaticidade… ou de uma informática tão simples e tão invisível que terá desaparecido atrás das paredes e das poucas interfaces quase transparentes que vamos usar.