TI.Com

Por que o Google não sai do ar?
Eduardo Campos -
Técnico de Informática e TI

eddcampos2@gmail.com

Apesar da quantidade de acessos, o Google não sai do ar. Entenda a razão da estabilidade do maior site de buscas do mundo.

A marca Google é estimada em aproximadamente 100 bilhões de dólares (mais do que a Microsoft, a Apple ou a Coca-Cola), ou seja, é considerado o “nome” mais valioso do mundo.

Esta informação é ainda mais interessante se levarmos em conta a quantidade de dados processados todos os dias pelo site - o Google domina 6% de todo o tráfego da internet, segundo pesquisa da Arbor Networks.

Que o Google é a maior ferramenta de buscas do mundo todo mundo já sabe. A empresa de Larry Page e Sergey Brin continua navegando de vento em popa desde 1998. Porém, você sabe o que faz o buscador ser tão estável, uma vez que conta com uma enormidade de acessos diários?

Números do Google

Em 2008 o blog oficial do Google comemorou a chegada a um trilhão (isso mesmo!) de URLs na internet de uma só vez. Este número corresponde a páginas únicas, ou seja, às páginas de um site e não aos links que surgem conforme você navega dentro de um mesmo site.

Estima-se que o buscador processe duas bilhões de pesquisas por dia. Isso quer dizer que, além de indexar as URLs para o acesso, o Google precisa lidar com cada acesso e pesquisa feita em uma busca.

Some a isso o a quantidade de sites adquiridos pelo Googlecomplex – Youtube, Gmail e o próprio Orkut também pertencem ao complexo de Page e Brin – e você terá um problema em mãos: administrar uma “enxurrada” de informação.

Sucesso com dados

Porém, o Google administra com maestria. O Sistema de arquivos do Google (GFS ou Google File System) funciona através de uma infraestrutura de Sistemas Distribuídos. O site de buscas precisa lidar com uma enormidade de informações todos os dias, sendo elas dados ou buscas, e organizar tudo isso de forma rápida e eficaz.

Os sites indexados são computados através de links entre páginas, motivo pelo qual a ferramenta é um sucesso. Seu processo de busca e indexação dos dados faz com que aquilo considerado mais relevante suba nas pesquisas, de forma que você ache o que procura rapidamente.

O Google possui basicamente um servidor principal, no qual as consultas são enviadas. Este servidor não possui dados internos de outros sites, mas sim informações sobre cada máquina interligada. Ele aponta com qual máquina você deve se conectar para que sua procura tenha resposta.

O servidor principal também sabe quando um computador interligado para de funcionar e deve ser substituído por outra máquina do sistema. É tarefa dele também espalhar informações entre as diversas máquinas para, no caso de uma delas quebrar, os dados não sejam perdidos.

Esta é uma explicação simplificada do processamento de dados do Google, que possui outras ferramentas para indexar, mapear e acessar rapidamente estes dados. Mas não iremos nos aprofundar mais o assunto, que pende para um lado mais técnico.

O que é importante saber é que este esquema faz com que não haja sobrecarga no sistema e o processo seja otimizado, de forma a criar um site de buscas rápido, eficiente e que não perca dados do usuário ou das páginas indexadas.

Datacenters e servidores

Porém, você pode se perguntar: onde são armazenados todos estes dados e pesquisas? É aí que entram os datacenters (ou centros de dados, se traduzirmos ao pé da letra) do Google. São eles que processam e armazenam as informações, fazendo a infraestrutura do complexo Google ser o que é.

De acordo com uma pesquisa do Royal Pingdom, conclui-se que o Google tenha 36 datacenters espalhados pelo mundo, sendo 19 nos Estados Unidos, 12 na Europa, 3 na Ásia, um na Rússia e um no Brasil - em São Paulo.

Para que um local seja escolhido como datacenter, o Google segue alguns critérios: energia elétrica barata, proximidade com rios e lagos (para o resfriamento dos sistemas); grandes áreas de terra que proporcionem privacidade e segurança; distância para outros centros de dados (para que a conexão seja rápida) e incentivos fiscais.

No caso do Brasil, sabe-se que os incentivos fiscais para empresas estrangeiras são extremamente atraentes. Além disso, as hidrelétricas proporcionam energia barata e somos privilegiados em termos de rios. Desta forma, somos o único país com um centro de dados do Google na América Latina.

Google na América Latina

Com tantos datacenters, estima-se que o Google seja atualmente dono de 2% dos servidores do mundo: em 2006, apontava-se um total de 450 mil servidores pertencentes ao Google.

Porém o Google é extremamente silencioso em relação aos seus centros de dados e servidores. Ninguém sabe ao certo os números desta gigante da internet, pois eles não são divulgados.

Não só o Google

Apesar de ser o maior, o Google não está sozinho. A Microsoft tem uma quantidade expressiva de servidores, assim como a Apple, a Amazon e a Yahoo!. Várias companhias estão investindo no conceito de computação em nuvens.

As estruturas destas grandes também oferecem uma tecnologia mais híbrida e flexível como a da cloud computing, que combina serviços locais para acesso rápido e os datacenters para os serviços remotos.

Com isso, o custo para o usuário final cai e a preocupação crescente em manter suas máquinas mais leves sem a instalação de inúmeras ferramentas muda. O usuário pode confiar em grandes serviços online para guardar as informações e passa mais tempo acessando propagandas, promoções e outras opções que trazem retorno financeiro à empresa.

Nem tudo são flores

Obviamente o Google não é infalível. Quem tentou acessar a ferramenta em janeiro deste ano teve um grande susto quando todos os sites eram considerados maliciosos, devido a um erro humano.

Outro episódio, este mais recente foi a morte de Michael Jackson. A procura foi tão intensa pelo nome do cantor que o sistema do Google reconheceu o fato como um “ataque cibernético”, o que gerou uma mensagem de possível vírus na rede (um procedimento normal de segurança). Após 50 minutos tudo foi normalizado pelos operadores, que reorganizaram o sistema.

Nessas duas falhas, porém, não houve pane no sistema do Google, falta de banda ou limite de acessos. Os erros podem ser considerados “normais” no sentido de que não fizeram o site sair do ar em nenhum momento, mas sim apresentar mensagens de vírus ou sites maliciosos.

Toda a estrutura do Google, até hoje, funciona dentro dos conformes e o site está cada vez maior, comprando outras empresas e investindo para se tornar mais potente. A pergunta do título não é tão segredo assim: o Google não cai porque conta com uma estrutura de dar inveja a muita gente, parcerias de sucesso e dinheiro para investir ainda mais.

Até logo.
















0 comentários:

Postar um comentário