terça-feira, 28 de julho de 2009

Google revela o segredo do seu scanner de livros

Texto original de Maureen Clementstradução livre de Moreno Barros
Outro dia, meu colega Kee Malesky me deixou surpreso com um artigo incrivelmente interessante publicado no site da New Scientist sobre o registro da patente 7508978. E você se pergunta, o que há de tão importante com a Patente 7508978 ? É a patente que explica como funciona a tecnologia proprietária do Google para scaneamento de livros.
Antes do Google entrar em cena, o scaneamento de livros era um processo entediante que algumas vezes resultava na morte do livro. O software utilizado para scanear livros, chamado Optical Character Recognition ou simplesmente OCR, exigia que cada página do livro estivesse perfeitamente reta. Mas qualquer pessoa que já abriu um livro sabe que é quase impossível deixar um livro perfeitamente reto sem a ajuda de algum tipo de aparato. Uma solução para esse problema foi utilizar pranchas de vidro que achatavam cada página, mas esse método não era muito eficiente. A outra solução era desencadernar o livro, mas esse método destruía o livro. Como que alguém poderia scanear um livro de maneira rápida e eficiente sem destruí-lo? Era uma problema que irritou os scaneadores de livros, até que o Google apareceu com esta solução.
O Google criou uma interessante tecnologia de câmeras infravermelhas que detecta a forma tridimensional e o ângulo das páginas dos livros quando o livro é colocado sobre o scanner. Essa informação é transmitida ao software OCR, que ajusta as distorções e permite que o software de OCR leia o texto mais precisamente. Sem mais destruição das encadernações, sem mais pranchas de vidro ineficientes. O Google finalmente arranjou uma maneira de digitalizar livros em massa. Para todos aqueles que se perguntam “Como eles fariam isso?”, finalmente vocês tem suas respostas.
Patente 7508978
Texto original publicado no NPR, 30 de abril de 2009http://www.npr.org/blogs/library/

http://extralibris.org/2009/05/patente-scanner-google/

Nenhum comentário:

Postar um comentário