“Et veritas liberabit vos”
  • Início
  • Economia e liberdade
  • ABC & XYZ

Contagem de páginas em traduções diferentes de um mesmo livro

17/11/2012

0 Comments

 
Um amigo do Facebook, Bruno, deparou-se com um problema. Estava lendo um livro traduzido do alemão e sentiu a necessidade de ler o trecho do capítulo em que estava no original. Aí, vem a pergunta clássica: meu trecho está na página 85 da tradução em português. Qual é a página em que está no original?
Várias considerações entram em jogo. Primeiro, o tamanho da letra, depois, o tamanho da folha, a diferença das palavras (um simples “até logo” em alemão fica auf Wiedersehen), e, por fim, até as próprias escolhas estéticas do editor (por exemplo, se cada capítulo começa numa página nova, se deve começar sempre numa página ímpar). Como vencer isso?
Meu amigo chegou com uma proposta interessante: aproximações sucessivas. Por esse raciocínio, ele viu em que páginas ficava o início do 1.º capítulo e em que página ficava a última palavra do livro. Por uma simples divisão proporcional, achou em que página do original ficaria determinada palavra da tradução. É claro que o resultado não deu certo (por causa dos diversos problemas citados acima), mas a aproximação ficou boa.
O que fez o método dele ficar legal foi que, cada palavra nova cuja localização ele descobria em ambas as versões se tornava mais um subsídio ao seu cálculo. De acordo com sua própria descrição, bastava fazer uma coluna de páginas da tradução e uma coluna com as correspondentes páginas (já conhecidas) do original. Ao fazer uma interpolação pelo MS Excel, cada nova iteração trazia resultados cada vez melhores.
Vou, então, com autorização dele (heheheheheh…), fazer uma apresentação de por que o método funciona, e como dá para ter, de cara, uma aproximação desde a primeira vez. Antes, como se faz em textos “científicos”, uma introdução teórica.

Reta a partir de dois pontos
Imagine que x seja o número da página em que está o trecho numa versão X, e y o número da página em que o mesmo trecho está em outra versão Y. O que pretendemos é achar uma equação que atribua cada x ao seu y. Com o objetivo de se manter simples, vamos buscar uma relação linear, o que implica uma relação de 1.º grau dada por equação da forma y = ax + b.
Se começar com duas correspondências (como o Bruno), podemos tomar dois pontos num plano cartesiano da forma (x1 ; y1) e (x2 ; y2). No plano, eles poderiam ficar (no exemplo, temos (5;6) e (271;224):
Picture
A projeção de uma função linear que ligue esses dois pontos é um tanto simples. Para um ponto hipotético (x* ; y*), uma vez conhecido o valor de x*, para achar y* basta fazer a relação:
(y2 – y*)/(y2 – y1) = (x2 – x*)/(x2 – x1)

Resolvendo a equação para y*, temos:
y* = y2 + (x* – x2)(y2 – y1)/(x2 – x1)

Isso equivale a localizar o ponto que tem abscissa x* sobre a reta que liga os dois pontos da figura anterior, como segue (o terceiro ponto marcado é o que tem x* = 100, que corresponde a y* = 83,86):
Picture
Isso nos faria buscar o trecho no fim da página 83, início da página 84 da versão Y. Suponhamos que o trecho esteja na página 90 da versão Y. Agora, sabemos que a equação não servirá, pois há fatores que não tornam a correspondência exatamente linear. Como fazer a previsão da página y* correta em outros trechos, uma vez sabendo que o ponto (100;90) agora faz parte de nosso universo conhecido?

Regressão linear
Antes de continuar, vamos convencionar algumas notações simplificadoras, para que nossas fórmulas não fiquem muito monstruosas. Considere que temos um conjunto de pontos dados na forma (x ; y), da seguinte maneira:
{(x1 ; y1);(x2 ; y2);(x3 ; y3)… (xn ; yn)}

Nesse caso, indicaremos a média dos valores de x por μ(x), e a média dos valores de y, por μ(y), de forma que:
μ(x) = Σ(x)/n
μ(y) = Σ(y)/n

Também, para efeito de simbologia, vamos estabelecer as seguintes notações:
Σ(x2) = soma dos quadrados de x
Σ(xy) = soma dos produtos de cada x por seu respectivo y

Uma vez definidas essas somas e médias, podemos estabelecer os seguintes símbolos, de uso comum na Estatística Inferencial:
Sxx = Σ(x2) – n (μ(x))2
Sxy = Σ(xy) – n μ(x) μ(y)

Agora, imagine que os n pontos sejam marcados no plano cartesiano. Obteremos a chamada nuvem de dispersão, que tem um aspecto semelhante ao seguinte:
Picture
Da mesma forma, tentaremos passar uma reta que represente todos esses pontos. É claro que não é possível passar uma reta exatamente por todos os pontos. Assim, deve-se estabelecer um critério para escolha da “melhor reta”. Esse critério é conhecido como mínimos quadrados, e remete ao fato de que, dada a equação da reta aproximada (conforme a figura seguinte) y = ax + b, se aplicarmos cada valor x1, x2… à equação, encontraremos valores aproximados de y cuja distância dos valores reais são as menores possíveis (no caso, para ter as menores possíveis, toma-se a menor soma dos quadrados dos erros; daí o nome de “mínimos quadrados”).
Picture
Para determinar a reta, achamos o valor dos parâmetros a e b por meio das fórmulas:
a = Sxy/Sxx
b = μ(y) – a μ(x)

Nesse momento, você deve estar pensando: “Fazer isso tudo só para procurar páginas numa tradução? Prefiro procurar uma por uma!”. E, realmente, é melhor, mesmo. Por isso, para fazer a busca, usamos um recurso computacional oferecido pelo programa MS Excel, cuja formulação passo a explicar.

A função “PREVISÃO” do MS Excel
Esses métodos são usados até hoje para fazer previsões. É claro que muitos outros fatores entram em jogo quando se analisam variáveis que têm interdependência, ou mesmo que tenham algum cunho sociopolítico. P. ex., é possível usar a regressão linear para encontrar uma correlação entre a altura das marés e o preço de uma cesta de ações de alguma bolsa de valores, mas será que essa correlação é justificada por alguma teoria? É exatamente isso que falta, muitas vezes, em analistas que parecem ter uma bola de cristal…
Ferramentas computacionais surgem conforme a tecnologia avança. Assim, o MS Excel, que é uma ferramenta de planilhas eletrônicas (tabelas que realizam cálculos), possui uma função que calcula a previsão de y para um dado x, considerando conhecidos alguns pares de (x ; y). Para resolver nosso problema, podemos proceder assim:
1) Coloque, na primeira linha, nas células A1 e B1, os títulos das versões que você tem disponíveis (ALEMÃO e PORTUGUÊS, p. ex.).
2) Arranje o maior número de correspondências entre trechos que você tiver. Algumas que sempre funcionam são a primeira página de cada versão, a última página de cada versão, e as páginas iniciais de cada capítulo (o início do 1.º capítulo alemão com o início do 1.º capítulo português, o início do 2.º alemão com o início do 2.º português, e assim por diante). Se o livro tem oito capítulos, sua tabela terá, além do título, 10 linhas, ou seja, seus dados irão de A2 até B11.
3) Abaixo da última linha que você preencheu no MS Excel, escreva a página que você conhece com certeza na versão que está lendo (por exemplo, uma palavra que está na p. 120 na alemã). No nosso caso, o número 120 irá na célula A12. Para achar a localização na versão portuguesa, basta colocar, na célula B12, a seguinte fórmula:
=PREVISÃO(A12;B2:B11;A2:A11)

A ordem importa: no primeiro argumento da função, coloca-se o valor conhecido cuja correspondência se quer conhecer. No segundo argumento, a coluna de valores do idioma-meta. No terceiro argumento, a coluna dos valores do idioma-fonte (o conhecido, o que tem a p. 120 no nosso exemplo).
Pronto. Assim, fica exposta a teoria que explica a previsão. Eventuais erros sempre vão acontecer, devido aos fatores já mencionados. Mas, quanto mais pares forem conhecidos, mais esses fatores vão sendo considerados na média da reta de previsão, e mais acertada deve ser sua previsão. Boa leitura!
0 Comments

Your comment will be posted after it is approved.


Leave a Reply.

    Autor

    Cristão, economista, professor de matemática e libertário. Isso basta.

    Arquivo

    December 2014
    November 2014
    June 2014
    September 2013
    December 2012
    November 2012
    September 2012
    July 2012
    June 2012

    Assuntos

    All
    Acordo
    Alfabeto
    Bayes
    Bispo
    Campinas
    Chocottone
    Contagem
    Crime
    Cuoco
    Declinação
    Djavan
    Escrita
    Esperanto
    Estados Unidos
    Feminino
    Galão
    Gramática
    Idioma
    Inglês
    Jorge Benjor
    Kiss
    Leis
    Lei Seca
    Letras
    Liberdade
    Medidas
    Mínimos Quadrados
    Ms Excel
    Neologismo
    Ortografia
    Páginas
    Português
    Português
    Previsão
    Probabilidades
    Pronúncia
    Regras
    Regressão Linear
    Scorpions
    Tonelada
    Tradução

    RSS Feed

Quis custodiet ipsos custodes?