Várias considerações entram em jogo. Primeiro, o tamanho da letra, depois, o tamanho da folha, a diferença das palavras (um simples “até logo” em alemão fica auf Wiedersehen), e, por fim, até as próprias escolhas estéticas do editor (por exemplo, se cada capítulo começa numa página nova, se deve começar sempre numa página ímpar). Como vencer isso?
Meu amigo chegou com uma proposta interessante: aproximações sucessivas. Por esse raciocínio, ele viu em que páginas ficava o início do 1.º capítulo e em que página ficava a última palavra do livro. Por uma simples divisão proporcional, achou em que página do original ficaria determinada palavra da tradução. É claro que o resultado não deu certo (por causa dos diversos problemas citados acima), mas a aproximação ficou boa.
O que fez o método dele ficar legal foi que, cada palavra nova cuja localização ele descobria em ambas as versões se tornava mais um subsídio ao seu cálculo. De acordo com sua própria descrição, bastava fazer uma coluna de páginas da tradução e uma coluna com as correspondentes páginas (já conhecidas) do original. Ao fazer uma interpolação pelo MS Excel, cada nova iteração trazia resultados cada vez melhores.
Vou, então, com autorização dele (heheheheheh…), fazer uma apresentação de por que o método funciona, e como dá para ter, de cara, uma aproximação desde a primeira vez. Antes, como se faz em textos “científicos”, uma introdução teórica.
Reta a partir de dois pontos
Imagine que x seja o número da página em que está o trecho numa versão X, e y o número da página em que o mesmo trecho está em outra versão Y. O que pretendemos é achar uma equação que atribua cada x ao seu y. Com o objetivo de se manter simples, vamos buscar uma relação linear, o que implica uma relação de 1.º grau dada por equação da forma y = ax + b.
Se começar com duas correspondências (como o Bruno), podemos tomar dois pontos num plano cartesiano da forma (x1 ; y1) e (x2 ; y2). No plano, eles poderiam ficar (no exemplo, temos (5;6) e (271;224):
(y2 – y*)/(y2 – y1) = (x2 – x*)/(x2 – x1)
Resolvendo a equação para y*, temos:
y* = y2 + (x* – x2)(y2 – y1)/(x2 – x1)
Isso equivale a localizar o ponto que tem abscissa x* sobre a reta que liga os dois pontos da figura anterior, como segue (o terceiro ponto marcado é o que tem x* = 100, que corresponde a y* = 83,86):
Regressão linear
Antes de continuar, vamos convencionar algumas notações simplificadoras, para que nossas fórmulas não fiquem muito monstruosas. Considere que temos um conjunto de pontos dados na forma (x ; y), da seguinte maneira:
{(x1 ; y1);(x2 ; y2);(x3 ; y3)… (xn ; yn)}
Nesse caso, indicaremos a média dos valores de x por μ(x), e a média dos valores de y, por μ(y), de forma que:
μ(x) = Σ(x)/n
μ(y) = Σ(y)/n
Também, para efeito de simbologia, vamos estabelecer as seguintes notações:
Σ(x2) = soma dos quadrados de x
Σ(xy) = soma dos produtos de cada x por seu respectivo y
Uma vez definidas essas somas e médias, podemos estabelecer os seguintes símbolos, de uso comum na Estatística Inferencial:
Sxx = Σ(x2) – n (μ(x))2
Sxy = Σ(xy) – n μ(x) μ(y)
Agora, imagine que os n pontos sejam marcados no plano cartesiano. Obteremos a chamada nuvem de dispersão, que tem um aspecto semelhante ao seguinte:
a = Sxy/Sxx
b = μ(y) – a μ(x)
Nesse momento, você deve estar pensando: “Fazer isso tudo só para procurar páginas numa tradução? Prefiro procurar uma por uma!”. E, realmente, é melhor, mesmo. Por isso, para fazer a busca, usamos um recurso computacional oferecido pelo programa MS Excel, cuja formulação passo a explicar.
A função “PREVISÃO” do MS Excel
Esses métodos são usados até hoje para fazer previsões. É claro que muitos outros fatores entram em jogo quando se analisam variáveis que têm interdependência, ou mesmo que tenham algum cunho sociopolítico. P. ex., é possível usar a regressão linear para encontrar uma correlação entre a altura das marés e o preço de uma cesta de ações de alguma bolsa de valores, mas será que essa correlação é justificada por alguma teoria? É exatamente isso que falta, muitas vezes, em analistas que parecem ter uma bola de cristal…
Ferramentas computacionais surgem conforme a tecnologia avança. Assim, o MS Excel, que é uma ferramenta de planilhas eletrônicas (tabelas que realizam cálculos), possui uma função que calcula a previsão de y para um dado x, considerando conhecidos alguns pares de (x ; y). Para resolver nosso problema, podemos proceder assim:
1) Coloque, na primeira linha, nas células A1 e B1, os títulos das versões que você tem disponíveis (ALEMÃO e PORTUGUÊS, p. ex.).
2) Arranje o maior número de correspondências entre trechos que você tiver. Algumas que sempre funcionam são a primeira página de cada versão, a última página de cada versão, e as páginas iniciais de cada capítulo (o início do 1.º capítulo alemão com o início do 1.º capítulo português, o início do 2.º alemão com o início do 2.º português, e assim por diante). Se o livro tem oito capítulos, sua tabela terá, além do título, 10 linhas, ou seja, seus dados irão de A2 até B11.
3) Abaixo da última linha que você preencheu no MS Excel, escreva a página que você conhece com certeza na versão que está lendo (por exemplo, uma palavra que está na p. 120 na alemã). No nosso caso, o número 120 irá na célula A12. Para achar a localização na versão portuguesa, basta colocar, na célula B12, a seguinte fórmula:
=PREVISÃO(A12;B2:B11;A2:A11)
A ordem importa: no primeiro argumento da função, coloca-se o valor conhecido cuja correspondência se quer conhecer. No segundo argumento, a coluna de valores do idioma-meta. No terceiro argumento, a coluna dos valores do idioma-fonte (o conhecido, o que tem a p. 120 no nosso exemplo).
Pronto. Assim, fica exposta a teoria que explica a previsão. Eventuais erros sempre vão acontecer, devido aos fatores já mencionados. Mas, quanto mais pares forem conhecidos, mais esses fatores vão sendo considerados na média da reta de previsão, e mais acertada deve ser sua previsão. Boa leitura!