machine translation

Machine Translation: um futuro que já é presente (mas com a pessoa no centro)

O uso de traduções automáticas está se difundindo em todos as áreas, dos negócios ao entretenimento. Mas os resultados conseguem satisfazer os mais altos padrões de qualidade?

O mercado das traduções e dos serviços linguísticos está vivendo um crescimento constante, há vários anos, e alguns setores em particular se beneficiaram de grandes aumentos ligados à situação da pandemia, a partir de 2019: assistência médica e plataformas de redes sociais sobretudo. Embora outras áreas tenham sido penalizadas pela disseminação da Covid (viagens, eventos e meios de transporte), em geral a indústria da tradução e dos serviços relacionados hoje movimenta dezenas de bilhões de euros por ano, confirmando um estado de saúde mais do que satisfatório.

Este crescimento é o resultado de uma série de fatores, entre eles se destacam três dinâmicas principais:

  • a globalização, e a necessidade associada de disponibilizar, a muito mais comunidades, conteúdos relacionados a negócios, serviços digitais, produção cultural e lazer;
  • o desenvolvimento de tecnologias de informação ligadas à web e não só, como a realidade aumentada ou inteligência artificial, que estão sendo cada vez mais aplicadas a produtos e serviços de largo consumo (da conta bancária on-line aos conteúdos de automóveis, aos feeds dos nossos perfis nas redes sociais);
  • as novas fronteiras exploradas pela linguística computacional, na base das metodologias de Machine Translation (MT) mais eficazes.

Das CAT Tools à Machine Translation

Para atender a enorme demanda por “content localization” e os respectivos prazos de entrega, profissionais e agências têm recorrido progressivamente a uma nova organização de fluxos e à ajuda da tecnologia. Plataformas e softwares, as chamadas 'CAT Tools' (Computer-Aided Translation Tools), deram a possibilidade de abreviar e otimizar o processo de trabalho (e em alguns aspectos até mesmo melhorá-lo), graças, entre outras funções, às memórias de tradução e bases terminológicas.

Nos últimos anos, a esses recursos se juntaram programas, principalmente na forma de SaaS, que deram um passo adiante e permitiram que a máquina completasse toda a tradução de forma independente. Google Translate e DeepL são duas das mais conhecidas, e se a opinião mais comum, até há pouco tempo, era que os resultados ainda deixavam a desejar, alguns estudos agora mostram um nível generalizado de satisfação entre os usuários profissionais, que classificam muitas traduções automáticas de 'aceitáveis' a 'muito boas'.

Quando a isto se é capaz de acrescentar as habilidades humanas para complementar a MT, superando a já antiga contraposição entre tradução humana versus tradução automática (portanto, com uma sábia combinação de abordagens), o "muito bom" também se torna a oportunidade para quem consegue aproveitar o novo cenário: todos os negócios, potencialmente. Porque reduzindo o tempo e os custos de suas traduções não só aumentam os lucros, mas você pode se abrir para públicos e mercados globais, transformando-os em novas oportunidades de crescimento e lucro.

A evolução da Machine Translation

Na realidade, aorigem das traduções automáticas não é recente, se é verdade que os primeiros experimentos datam da década de 1940. Apesar dos resultados pouco animadores obtidos, no entanto, a pesquisa nunca parou, até ressurgir com força, a partir do final do século passado, com novos modelos. Os principais, que se alternaram, desde os anos sessenta, são três:

  • a tradução baseada em regras;
  • a tradução com base estatística;
  • a tradução neural.

O primeiro método (rule-based) usa um sistema de regras sintáticas e lexicais, que permite descompor a frase, identificar a função de cada palavra e reconstruir a proposição no idioma de destino.

O modelo com base estatística, difundido desde o início dos anos 2000, baseia-se essencialmente em enormes arquivos de textos traduzidos, que constituem o corpus a partir do qual o computador realiza suas análises numéricas e percentuais de ocorrências e contextos para determinar a melhor escolha.

A mais recente, e a mais promissora, em termos de qualidade de resultados, é a tradução neural, que se baseia na hierarquização de conceitos: a máquina consegue executar funções complexas (como a tradução) porque são descritas em uma linguagem formal baseada precisamente em dependências hierárquicas, que permitem também uma remodelação contínua, com conceitos cada vez mais profundos (Deep Learning) e, portanto, uma aprendizagem constante pela inteligência artificial. Aqui está uma análise detalhada e muito técnica publicada pela ScienceDirect sobre os mecanismos de automação linguística .

Este é o terreno no qual os serviços de tradução on-line estão proliferando, mas também a base, por exemplo, dos novos óculos que o Google anunciou, este ano, e que irão permitir que duas ou mais pessoas dialoguem usando idiomas diferentes, ou do serviço prometido pela Apple com legendas simultâneas para qualquer conteúdo em seus principais dispositivos. Sem falar do universo de possibilidades ainda in nuce previsto pelo metaverso no qual uma das fronteiras que o Meta de Zuckerberg propõe ultrapassar é precisamente a quebra de todas as barreiras linguísticas.

Então, a MT é um perigo ou um aliado?

Como foi dito, a coisa mais útil é dar um passo além da contraposição, e pensar em um ecossistema no qual o ser humano e a máquina são partes de uma engrenagem, que leva ao melhor resultado.

Em última análise, a Machine Translation hoje é uma grande oportunidade à disposição dos negócios e dos profissionais: uma ferramenta, não um substituto, para tomar decisões mais funcionais, otimizar tempo e recursos e, em última análise, produzir um conteúdo mais eficaz. Que vão cada vez mais além da dimensão textual: pensamos, de fato, em gráficos, áudio, vídeo, código, metadados. Todas as áreas em que estas novas formas de geração de conteúdo estão dando resultados muito interessantes. Mas é sempre a intervenção humana, com sua abordagem human-in-the-loop, que torna a inteligência artificial uma ferramenta ainda mais formidável. Por outro lado, as previsões de crescimento do mercado de serviços linguísticos e de tradução são mais do que encorajadoras: de acordo com esta análise da Nimdzi, em 2022, a indústria terá um valor de 64,7 bilhões de dólares, com uma projeção, para 2026, de 84,9 bilhões e um crescimento médio constante de 7% (!). Melhor se aliar às máquinas, então, do que lutar contra elas - caso ainda exista alguém que considere lutar contra elas uma opção.