Joseph Shafan

"Então uma voz se elevou do abismo. Era o grito da Luz"  Visão de Hermes

Textos

O Google e as Publicações na Internet
 
O Google é denominado tecnicamente como um 'motor de busca' (Search Engine, genericamente ou, melhor descrevendo Crawler-Based Search Engine - Rastreador Baseado em Motor de Busca), que automaticamente cria listas através de uma 'seleção baseada em dados' disponíveis desde as diversas publicações na Web (www - World Wide Web - Rede de Alcance Mundial) a 'parte' lógica do sistema (- a outra 'parte' é a física).
 
A partir dessa 'parte lógica' é que há um 'processamento' gerador das listas que se vê como 'resultado de busca' dos 'motores de busca' como o Yahoo, Bing, Google e muitos outros disponíveis para os internautas.
 
A 'Rede de Alcance Mundial' (WWW) é um sistema de 'documentos' que 'apresenta' o que há no 'conglomerado de redes de computadores interligados' como resultado da 'abertura' do sistema de 'transferência de dados em pacotes' ainda baseado em ARPA (ARPANet, por exemplo, que interconectava sistemas independentes de universidades americanas) desde a CERN (Conseil Européen pour la Recherche Nucléaire - Organização Europeia para a Investigação Nuclear) que na etapa inicial do projeto Web possibilitava aos cientistas trocarem dados e depois expandiu-se graças ao 'projeto hipertexto' e o 'programa Enquire' ('programa de armazenamento de informações), tornando-se global.
 
A ação de 'seguir hiperligações' (links - hipertextos) foi denominada 'navegar' ou 'surfar' na Rede (Web). A 'globalização' da Web fez desenvolver uma infinidade de 'ferramentas' despertando a contínua 'publicação' na Rede. Essas 'publicações' inseridas em 'páginas' ('endereços' - URL - Uniform Resource Locator - Localizador-Padrão de Recursos), pelo interesse geral, fez fomentar a criação de 'motores de busca' cada vez mais sofisticados para atender a demanda dos 'internautas'. As técnicas utilizadas na criação das 'páginas' da Web são comumente englobadas no conceito webwriting que inclui 'padrões' ('endereçamento', 'protocolos de transferência', 'navegadores', 'plataformas', 'interpretadores', 'formatações' etc). Além disso, essas 'páginas' lidam com 'documentos' onde as próprias 'páginas' também são consideradas 'documentos'. Dentre 'documentos' da Web, afora os 'Hipertextos', temos 'Sons', 'Figuras', 'Vídeos', etc. A transição entre o 'envio' (upload) e o 'recebimento' (download) dos 'pacotes de dados' se dá mediante os 'servidores web' que atendem os 'pedidos' de processamento da Rede.
 
Basicamente, como exemplo, o Google 'roda' sobre uma rede distribuída composta de milhares de computadores que realizam um rápido 'processamento paralelo' (um método que envolve diversos 'cálculos' sendo realizados simultaneamente o que redunda num aceleramento de 'leitura-interpretação-exposição' dos dados). Com esse 'ambiente' uma 'primeira execução' do Google (chamada 'Googlebot') faz um 'rastreamento da Rede' (web crawler) que localiza e obtém as 'páginas' da web. Simultaneamente, numa 'segunda execução', o Google determina um 'indexador' (indexer-sorts) que 'classifica' cada 'palavra' em cada 'página' armazenando um índice resultante de 'entradas' num imenso 'banco de dados'. A 'terceira execução' do Google, concomitante, é um 'processador de consultas' que compara a 'pesquisa da entrada' com o 'índice' e 'recomenda' os documentos pertinentes que 'considera' mais 'relevantes'. Essa 'execução' final, que 'retorna' à 'entrada' de uma 'caixa de pesquisa', faz uso, entre outras ferramentas' de um sistema 'PageRank', onde uma página é considerada 'importante' mais que outra criando uma lista em 'graus de importância', conforme os dados 'comparados' através de 'cálculos paralelos'. Nesse processamento em 'execuções', um dos fatores mais 'influenciáveis' para a composição da 'lista final ordenada' é a 'reindexação' entre 'palavras' e 'links'. Em outras palavras, quanto mais há 're-linkagem' (ou seja, uma url é 'mencionada' mais vezes em múltiplas 'páginas', maior 'influência' terá na ordem de exposição final). Um exemplo disso no Brasil é a 're-indexação' com 're-linkagem' artificial criada com a 'associação' da palavra 'mentiroso' com a 'página' da Wikipedia referente a 'Lula' que durante muito tempo vigiu como resultado de 'busca' no Google, criada por seus adversários políticos. Isso quer dizer que, conhecendo-se os mecanismos de busca e utilizando-se de 'ferramentas adequadas para um resultado, uma 'publicação' pode ser, de uma maneira ou de outra, 'vinculada' artificialmente, e 'surgir' como 'relevante' para o 'pesquisador'. Assim, podem ocorrer 'induções' forjadas e conforme o usuário tenha mais ou menos conhecimento dos 'sistemas motores de busca' pode atribuir como 'real' ou 'verdadeira' informação que, em essência, pode ser deturpada, manipulada ou errônea. Para compensar isso, é importante que o utilizador desse tipo de sistema saiba fazer 'reconhecimento de fontes', o que implica maior 'detalhamento' de pesquisa.
 
Esse resumo se faz para responder uma questão que pode intrigar um 'publicador': como fazer 'aparecer' sua publicação?. A própria Web dispõe de 'malabarismo técnicos' que fundamentalmente se utilizam de 'artifícios matemáticos' implícitos para fazer os 'motores de busca' associarem certas 'entradas' a certas 'páginas' para atender um desejoso blogueiro ou publicitário a encaminhar o resultado de busca para a sua(s) página(s). Mas, na forma 'natural' e com o 'refinamento de pesquisa' o usuário mais atento irá disponibilizar e/ou encontrar a(s) resposta(s) mais adequada(s).
Assim, quando se publica um 'documento' PDF (Portable Document Format - Formato de Documento Portátil), para que ele seja considerado pelo Google como 'importante', dentre outras 'ferramentas' pode-se:
a) constituí-lo com um teor que abranja grau de interesse numa escala de busca grande (por exemplo, se quiser hoje basta associá-lo a um candidato de 'prestígio' como o Tiririca, ou a uma música 'da moda');
b) publicá-lo num sítio com uma gama de 'visitas' ampla (um vídeo no YouTube que contenha um ou dois dos 'elementos' citados acima teria um número maior de visitas);
c) indexá-lo com 'referências habituais' (um vídeo no YouTube, com o Tiririca, sob título 'Pior não Fica' e tendo um link inserido dentro do vídeo que remeta ao site 'oficial' da Lady Gaga e outro com um 'twitter' de algum "Google Trend" - lista de palavras mais buscadas num país, num continente ou global, teria uma boa possibilidade ter um número maior de visitas);
d) associar o arquivo a um 'sistema de busca de blogs' (há um número muito grande desse tipo de 'ferramenta' disponível na Rede - aliás tanto o Wordpress quanto o Blogger disponibilizam indexações de referências);
e) Associar o arquivo na Web 2.00 ('ferramentas' como o Twitter, Facebook, RSS, Orkut etc), inserindo a URL do arquivo ou página de publicação do arquivo, ou os dois, em perfis e 'o que estou fazendo agora' ao mesmo tempo em que 'amigos' compreendidos na 'ferramenta' Web2 'repliquem' a URL do arquivo;
f) Fazer 'compartilhamento' do documento em redes 'share' (como Scribd, 4Shared, Taringa etc);
g) contratar um 'serviço de divulgação' para a Rede, que irá fazer para você o 'uso' das 'ferramentas' citadas acima e outras mais possíveis que 'interfiram' nos sistemas como o 'PageRank' e faça os 'motores de busca' apresentarem o documento como 'relevante' expondo-o nas primeiras 'páginas' de resultado.
 
 
 
 

Joseph Shafan
Enviado por Joseph Shafan em 04/10/2010


Comentários

Site do Escritor criado por Recanto das Letras