quarta-feira, 4 de março de 2015

Google pretende utilizar datamining para identificar conteúdo "verdadeiro" na internet



Datamining (mineração de dados) 
Google pretende usar o cruzamento de informações para identificar conteúdo "verdadeiro" na internet

Google estuda tecnologia para identificar conteúdo "verdadeiro" na internet
Um estudo desenvolvido por cientistas da computação ligados ao Google propõe uma maneira de classificar os resultados das pesquisas não mais pela popularidade das páginas, mas por sua precisão factual.  A pesquisa, segundo o jornal americano "The Washington Post", foi publicada pela gigante das buscas em fevereiro.
Tudo não passa de um estudo teórico e nada tem a ver com o anúncio de uma nova metodologia. Ainda assim, a publicação tende a dar mais forma à possibilidade de uma busca "qualitativa".
Como os próprios pesquisadores definiram, não é muito difícil identificar se uma informação é verdadeira ou falsa. Para avaliar o conteúdo, segundo o estudo, basta comparar o fato a uma referência.


O Google já teria inclusive começado a criar essa lista de referência com o Knowledge Graph (Diagrama de Conhecimento) --que é uma base de conhecimento do sistema de pesquisa da empresa.  Ao pesquisar "aniversário de Jennifer Lawence", por exemplo, a busca vai exibir como resultado "15 de agosto de 1990".


Essa 'lista' colhe informações de serviços como Freebase, Wikipedia e Cia World Factbook para criar um banco de dados de pesquisa capaz de extrair automaticamente os resultados. Portanto, segundo o estudo, para verificar se um conteúdo na web é preciso, bastaria que o Google fizesse o cruzamento das informações.
Em um ensaio com uma amostra aleatória de páginas, os pesquisadores descobriram que apenas 20 dos 85 sites 'corretos' para aquela busca eram ranqueados no alto. Com o cruzamento de dados, as informações das buscas ficariam mais confiáveis.
A qualidade das informações tem sido uma preocupação recorrente. Há apenas três semanas, por exemplo, o Google começou a exibir informações de saúde controladas por médicos. Mas ainda não está claro exatamente o que a empresa planeja fazer com esta nova tecnologia.

Fonte: UOL 

Nenhum comentário:

Postar um comentário