quarta-feira, 5 de agosto de 2009

Projetos de digitalização de bibliotecas da USP disponibilizam livros gratuitamente pela internet

Rodolfo Blancato / USP Online

rodolfo.barros@usp.br
Você já imaginou que pelo seu computador é possível ler o texto original de uma obra do século XV, ou a primeira edição de um livro de Machado de Assis, com dedicatória do autor? As bibliotecas digitais da USP, como a Brasiliana Digital, a Biblioteca Digital de Obras Raras e Especiais e a Biblioteca Digital do Instituto de Estudos Brasileiros (IEB), disponibilizam na rede mundial de computadores um acervo de milhares de obras, que em poucos cliques podem ser lidas por qualquer pessoa.
O maior projeto de digitalização de livros da USP é parte do processo de criação da Biblioteca Brasiliana Guita e José Mindlin, que está atualmente em construção e abrigará o acervo que o empresário e bibliófilo José Mindlin doou para a Universidade em 2006. A Brasiliana Digital, que tem como objetivo inicial colocar na internet todos os 17 mil títulos doados por Mindlin, disponibiliza atualmente cerca 3 mil livros em seu site.
Desde o mês passado é possível ler e baixar as primeiras edições dos Sermões do Padre Vieira e de diversas obras de Machado de Assis, por exemplo. Também estão disponíveis a edição original de Duas Viagens ao Brasil, de 1557, clássico em que o aventureiro alemão Hans Staden descreve suas experiências como cativo de uma tribo tupinambá, e o primeiro livro publicado no Brasil, impresso em 1747 por Antonio Isidoro da Fonseca, cuja tipografia foi fechada e confiscada.
Para o professor István Jancsó, coordenador geral do projeto, a disponibilização dos livros da Brasiliana é dever de uma universidade pública, que deve sempre prezar pelo acesso universal e irrestrito a suas obras. “Isso significa fazer com que esse acervo não esteja só à disposição de quem pode chegar na Cidade Universitária, no Butantã. Ele tem que estar à disposição de quem quiser, porque essa é uma universidade pública e esse é o seu papel.”
O professor afirma que a idéia de fazer uma biblioteca digital sempre esteve presente nas conversas que realizou com Mindlin, quando era diretor do IEB, para viabilizar a doação de seu acervo para a USP. “Ele perguntou o que eu estava imaginando e eu usei uma expressão, que foi a seguinte: ‘Doutor José, em cima da sua ideia de parceria, eu estava imaginando criar uma estrutura aonde a soma de um mais um fosse mais do que dois. Porque a sua biblioteca é um tremendo acervo, e o IEB também tem um tremendo acervo, e esse conjunto deveria ser dotado de uma estrutura tecnológica, com um tremendo ganho de escala.”
Para coordenar a implementação da Brasiliana Digital, o Jancsó convidou Pedro Puntoni, professor da Faculdade de Filosofia, Letras e Ciências Humanas (FFLCH), que assumiu a tarefa. Puntoni, por sua vez, procurou Edson Gomi, do Laboratório de Engenharia de Conhecimento (Knoma) da Escola Politécnica (Poli), para cuidar da parte técnica do projeto.
Gomi afirma que na época o Knoma não possuía experiência com digitalização de livros, então ele e Puntoni visitaram diversas instituições que possuíam iniciativas similares, como a Biblioteca Nacional e a Biblioteca do Congresso dos Estados Unidos.
Um obstáculo para o projeto era a grande quantidade de livros que deveriam ser digitalizados. “Se fôssemos fazer no processo manual, no scanner de mesa, isso levaria dezenas de anos”, explica Gomi. “Então foi necessário procurarmos alternativas que nos dessem um ganho de escala em termos de velocidade e de digitalização.” A solução foi a compra do scanner robô Kirtas APT BookScan 2400RA. O equipamento, apelidado pela equipe da biblioteca de Maria Bonita, custou 220 mil dólares e consegue digitalizar até 2400 páginas por hora. Obviamente, quando se trabalha com obras de mais de um século de vida, essa velocidade é apenas teórica. “Quando um livro oferece risco, a manipulação é manual. Mas livro normal ele [o robô] faz com uma delicadeza incrível”, afirma Jancsó.Após a digitalização, os arquivos passam por um software que realiza o reconhecimento ótico de caracteres (OCR, da sigla em inglês), transformando-os em arquivos de texto editáveis, ou seja, em arquivos em que é possível copiar e colar o texto, ou buscar por uma palavra específica. Obviamente, quanto mais antigo é o livro, maior é a possibilidade de erros, já que as tipografias são bem diferentes das atuais. “Existe uma dificuldade natural ao fazer a OCR nos livros que estamos trabalhando. Por serem livros às vezes antigos, com 200, 300, 400 anos de existência, os caracteres não são exatamente os caracteres modernos”, explica Gomi. Ele diz que o aperfeiçoamento da OCR, na qual os pesquisadores do Knoma estão trabalhando, permitirá que no futuro a Brasiliana Digital disponibilize também arquivos em áudio das obras do acervo.Para Gomi, o maior desafio da biblioteca, no futuro próximo, é aumentar o ritmo de trabalho. “Se nós quisermos, num horizonte de meses, conseguir digitalizar esses 40 mil volumes, nós vamos ter que implantar uma fábrica de digitalização.” Para isso, ele crê ser essencial aumentar a equipe, que hoje é composta por cerca de 30 pessoas. Mais adiante, o professor diz que o intuito dos coordenadores do projeto é que essa infra-estrutura seja compartilhada com outros setores da Universidade. “Nós temos já algumas conversas com outras bibliotecas de unidades da USP que já manifestaram interesse.” Por fim, Gomi faz um convite à comunidade universitária: “Todos os estudantes e pesquisadores que estiverem interessados em trabalhar, que entrem em contato conosco. Tem tanto trabalho que não temos a pretensão de fazer isso sozinhos.”
Outros projetos
Além da Brasiliana Digital, a USP possui outras duas bibliotecas digitais que disponibilizam gratuitamente parte de seu acervo: a Biblioteca Digital de Obras Raras e Especiais e a Biblioteca Digital do Instituto de Estudos Brasileiros (IEB).
A Biblioteca Digital de Obras Raras e Especiais é um projeto mantido pelo Sistema Integrado de Bibliotecas (SIBi) da USP, que tem o objetivo de divulgar e facilitar o acesso ao conteúdo de livros raros ou com características especiais existentes nas diversas bibliotecas da Universidade. A biblioteca foi inaugurada em 2003, com a disponibilização de 38 livros digitalizados por uma empresa particular.Para dar continuidade ao projeto, que prevê a disponibilização de 1224 títulos, o SIBi inaugurou, em setembro do ano passado, uma oficina de digitalização. Depois disso, em dezembro, foi criada uma comissão para estabelecer diretrizes para esse trabalho. Roberto Barsotti, coordenador da oficina, afirma que assim que a comissão terminar de definir esses parâmetros, o que deve ocorrer nas próximas reuniões, eles iniciarão o trabalho. “Assim que [as diretrizes] forem estabelecidas, o que a gente vai fazer é começar a verificar aquelas obras que precisam ser digitalizadas urgentemente devido ao seu estado físico."
O IEB também possui uma biblioteca digital, que pode ser acessada a partir do site do instituto e compila obras digitalizadas a partir de solicitações de pesquisadores de várias instituições.Além dessas ações esporádicas, boa parte do acervo disponibilizado foi digitalizado pelo Projeto Brasil Ciência, coordenado por Márcia Moisés Ribeiro, pesquisadora do instituto. “A intenção desse projeto foi fazer um grande banco de dados sobre obras relacionadas à cultura científica, a interesses diversos sobre história da ciência, pegando Brasil e Portugal, no período do final do século XVI ao século XIX”, explica Márcia. O projeto digitalizou cerca de 130 documentos entre 2002 e 2006, quando terminou.
O IEB também possui uma parceria com a Brasiliana Digital para digitalização de dicionários e mapas. O primeiro fruto desse trabalho foi a disponibilização do primeiro dicionário da língua portuguesa, o Vocabulário Portuguez e Latino, escrito no século XVIII por Raphael Bluteau. O documento, que faz parte do acervo do IEB, está disponível nos sites do instituto e da Brasiliana. Segundo Márcia, no final desse mês deve ser disponibilizado o Dicionário da Língua Portugueza, obra escrita em 1789 pelo fluminense António de Morais Silva.Há ainda outro projeto que deve aumentar o acervo da Biblioteca Digital do IEB. Márcia está coordenando uma pesquisa iniciada a dois meses que está realizando um levantamento dos livros relacionados à história da África no acervo do instituto. O objetivo é digitalizar e disponibilizar todos esses documentos, o que deve acontecer a partir de janeiro do ano que vem.

Nenhum comentário:

Postar um comentário