sábado, 7 de fevereiro de 2009

Sobre a Teoria da Informação

Por Francisco José dos Santos Braga

Um amigo de São Paulo, Professor José Luiz Celeste, também ex-Professor da Fundação Getúlio Vargas, envia-me texto deveras interessante sobre um teste de capacidade de leitura através de letras e algaritmos - não somente através de letras - e a sua utilidade em prevenir o aparecimento do Mal de Alzheimer. Em seguida ao texto, faz inúmeras observações judiciosas sobre o seu conhecimento de algumas línguas ocidentais.

"Inicialmente fixe seus olhos no texto abaixo e deixe que a sua mente leia corretamente o que está escrito:

3573 P3QU3N0 73X70

53RV3 4P3N45 P4R4

M057R4R C0M0 N0554

C4B3Ç4 C0NS3GU3

F423R C01545

1MPR3551ON4N735!!!

R3P4R3 N1550!!!

N0 C0M3Ç0 3574V4

M310 C0MPL1C4D0,

M45 N3574 L1NH4

5U4 M3N73 V41

D3C1FR4ND0 0

C0D1G0 QU453

4UTOM471C4M3N73,

53M PR3C1S4R P3N54R

MU170, C3R70?

P0D3 F1C4R B3M

0RGULH050 D1550!!!

5U4 C4P4C1D4D3 M3R3C3!

P4R4B3N5!!!

(Se você conseguiu identificar o texto com os seguintes dizeres: "Este pequeno texto serve apenas para mostrar como nossa cabeça consegue fazer coisas impressionantes!!! Repare nisso!!! No começo estava muito complicado, mas nesta linha sua mente vai decifrando o código quase automaticamente, sem precisar pensar muito, certo? Pode ficar bem orgulhoso disso!!! Sua capacidade merece! Parabéns!!! ", certamente, além de estar com sua vista boa ou pelo menos usando óculos com grau certo, você também está longe de um possível Mal de Alzheimer.)

Essa mensagem é mesmo muito interessante. Existe um estudo matemático sobre isso, na teoria da informação, de C. E. Shannon e W. Weaver. Há um limite além do qual os ruídos não podem mais ser reparados. Isso é importante na transmissão de dados, situação em que sempre há uma probabilidade não nula de enviar letras ou símbolos errados. Até um certo limite quem recebe uma mensagem pode corrigir os erros de transmissão e entender corretamente. Aí, também é interessante ver que as línguas mais redundantes - e há uma maneira de calcular o nível de redundância de um idioma! - permitem uma regeneração melhor dos erros de transmissão. Por exemplo, o Português, língua analítica por excelência, é mais redundante que o Latim, língua sintética, que é uma das línguas menos redundantes. Uns dos primeiros a tratarem desse assunto, senão os primeiros, foram Shannon e Weaver em seu livro " The Mathematical Theory of Communication", em 1949.

Eu tenho uma amiga que foi para os Estados Unidos da América , depois para a Inglaterra e finalmente para a Itália. Quando voltou ao Brasil, depois de 10 anos, ela me dizia: "Ai, como o Português é redundante !" E é mesmo.

Até em relação ao Italiano o Português é redundante. Por exemplo, em Português existe uma forma verbal para cada pessoa: eu vou, tu vais, ele vai... etc. que repetimos ao falar, quando não seria necessário. Em Italiano não se diz o pronome nas flexões verbais.

Eu falava sobre isso nas minhas aulas de Estatística, e inclusive alguns alunos fizeram trabalhos sobre o assunto, mas era uma voz no deserto. Nenhum professor se interessava, não havia com quem conversar. E nisso, meu caro, de acreditar em mim mesmo, eu sou muito ruim. Ao invés de prosseguir nesta senda, nesta rota, nesta vereda, eu desistia.

O negócio é ouvir Picasso. "Saia de casa, faça uma viagem á cidade vizinha, ou uma grande viagem, mas não viaje ao passado. É muito doloroso."

Gostaria ainda de acrescentar mais um comentário de que me esqueci acima. É sobre o Alemão. Essa língua, que é a dos meus avós maternos e era falada em sua casa, é , em princípio, sintética. Além de declinações, tem a célebre característica de aparecerem os verbos no final da frase, empurrados por conjunções subordinativas. Pois bem, não obstante essas características linguísticas, pode reparar que o Alemão é das línguas mais prolixas, fato esse que pode ser notado nas tabuletas de avisos que aparecem nos aviões e aeroportos. Quando ocorre uma instrução em vários idiomas, uma ao lado da outra, pode reparar que a que aparece em Alemão é sempre a mais longa. Isso foi observado por um colega nosso da FGV. Também aquela atriz que fez a Escrava Isaura, Lucélia Santos, falou disso num programa de tv. Dizia ela que não dava tempo para dublar as próprias falas em Alemão, ou seja , a mesma coisa dita em Alemão tinha mais palavras que em Português. Quer dizer, esse negócio de língua sintética parece que não funciona, pelo menos no sentido da extensão. Não sei se foi calculada a entropia, que é o nível de redundância, do Alemão naquele livro do Shanon que citei. Mas acredito que sim, senão lá, então alhures.

Outro comentário é sobre um trabalho de alunos meus comparando a extensão do Português e do Inglês. Como tenho a tradução de alguns romances do Machado de Assis para o Inglês, fez-se uma comparação para ver se o Inglês dizia as coisas com um número menor de palavras. Adotou-se, do que me lembro, um teste de comparação de duas médias. Foram selecionadas amostras, ou seja, trechos do livro Memórias Póstumas de Brás Cubas, e suas correspondentes versões para o Inglês. Contaram-se as palavras contidas nesses trechos, e aplicou-se o teste de duas médias, se bem me lembro. Sabe qual foi o resultado? Surpreendente: não se pode afirmar que haja diferenças significativas entre a extensão das duas Línguas. Quer dizer, o fato de ser o Inglês menos entrópico não significa que é menos extenso. Pois não é interessante?"

Até aqui o texto do Professor. Quanto ao jargão estatístico passado pela sua mensagem, vale lembrar que a teoria da informação é um ramo da matemática aplicada e da engenharia elétrica envolvendo a quantificação da informação. Historicamente, a teoria da informação se desenvolveu para encontrar os limites fundamentais ao comprimir dados e comunicá-los com fidelidade. Sua aplicação ampliou-se para outras áreas, incluindo inferência estatística, processamento de linguagem natural, criptografia, redes fora do âmbito da comunicação como é o caso na neurobiologia, e assim por diante.

Uma medida-chave de informação na teoria é conhecida como entropia, que é comumente expressa pelo número médio de bits necessários à armazenagem ou à comunicação.



* Francisco José dos Santos Braga, cidadão são-joanense, tem Bacharelado em Letras (Faculdade Dom Bosco de Filosofia, Ciências e Letras, atual UFSJ) e Composição Musical (UnB), bem como Mestrado em Administração (EAESP-FGV). Além de escrever artigos para revistas e jornais, é autor de dois livros e traduziu vários livros na área de Administração Financeira. Participa ativamente de instituições no País e no exterior, como Membro, cabendo destacar as seguintes: Académie Internationale de Lutèce (Paris), Familia Sancti Hieronymi (Clearwater, Flórida), SBME-Sociedade Brasileira de Música Eletroacústica (2º Tesoureiro), CBG-Colégio Brasileiro de Genealogia (Rio de Janeiro), Academia de Letras e Instituto Histórico e Geográfico de São João del-Rei-MG, Instituto Histórico e Geográfico de Campanha-MG, Academia Valenciana de Letras e Instituto Cultural Visconde do Rio Preto de Valença-RJ e Fundação Oscar Araripe em Tiradentes-MG. Possui o Blog do Braga (www.bragamusician.blogspot.com), um locus de abordagem de temas musicais, literários, literomusicais, históricos e genealógicos, dedicado, entre outras coisas, ao resgate da memória e à defesa do nosso patrimônio histórico.Mais...

2 comentários:

Umberto Freitas disse...

Olá, Braga.
Sensacional o seu post. Eu, que não sou nem um neófito nesses assuntos, fico a imaginar os possíveis desdobramentos desses tipos de discussão na área musical, principalmente no campo do ensino-aprendizagem de teoria e leitura/escrita musical, que é o que mais dedico atualmente, mas também no que tange a performance e à composição.
Parabéns pelo blog, é minha primeira visita (espero que de muitas outras).
Grande abraço,
Umberto

Professor José Luiz Celeste disse...

Prezado Prof. Braga,
Eu gostaria de acrescentar mais um comentário de que me esqueci naquela ocasião. É sobre o Alemão, essa lingua que é a dos meus avós maternos. Eu tinha tias que só falavam Alemão em casa, sendo, em princípio, sintética. Tem declinações e a célebre característica de aparecerem os verbos no final da frase, um sinal dessas línguas. Pois bem, pode reparar: é das mais prolixas, fato esse que pode ser notado nos cartões de avisos que aparecem nos aviões. Quando tem notícia em vários idiomas, uma ao lado da outra, pode reparar que a que aparece em Alemão é sempre a mais longa. Isso foi observado por um colega nosso da FGV. Aquela atriz que fez a Escrava Isaura, Lucélia Santos, também falou disso num programa de tv. Dizia ela que não dava tempo para dublar as falas dela em Alemão, ou seja , a mesma coisa dita em Alemão tinha mais palavras que em Português. Quer dizer, esse negócio de Lingua sintética, parece que não funciona, pelo menos no sentido da extensão. Não sei se foi calculada a entropia, que é o nível de redundância, do Alemão naquele livro do Shanon que citei. Mas acredito que sim, senão lá, então allhures.
Outro comentário é de um trabalho de alunos meus comparando a extensão do Português e do Inglês. Como tenho a tradução de alguns romances do Machado de Assis para o Inglês, fez-se uma comparação para ver se o Inglês dizia as coisas com um número menor de palavras. Adotou-se, do que me lembro, um teste de comparação de duas médias. Foram selecionadas amostras, ou seja, trechos do livro Memórias Póstumas de Brás Cubas, e suas correspondentes versões para o Inglês. Contaram-se as palavras contidas nesses trechos, e aplicou-se o teste de duas médias, se bem me lembro. Sabe qual foi o resultado? Surpreendente: não se pode afirmar que haja diferenças significativas entre a extensão das duas Línguas. Quer dizer, o fato de ser o Inglês menos entrópico não significa que é menos extenso. Pois não é interessante?
Vou ficando com um forte abraço.
Professor José Luiz Celeste