Enquanto plataforma sino-lusófona, Macau é um local com grande procura por serviços de tradução entre as línguas chinesa e portuguesa. Para apoiar esse trabalho, estão em desenvolvimento no território diversos projectos de tradução automática, com o objectivo de colocar os computadores e a inteligência artificial ao serviço da cooperação entre a China e os países de língua portuguesa
Texto Vitória Man Sok Wa
Ao longo do último ano, a inteligência artificial esteve nas paragonas internacionais, muito por culpa da emergência do ChatGPT, um modelo de linguagem avançado que gera conteúdo em resposta a pedidos dos utilizadores. Entre as valências deste produto encontra-se também a tradução automática, algo já anteriormente popularizado por outras ferramentas digitais, como o Google Translate. Macau não está alheio a esta onda: o território é mesmo líder em vários aspectos no campo da tradução automática, com tecnologia de ponta especialmente desenvolvida para produtos de tradução chinês-português, de forma a apoiar o papel da cidade enquanto plataforma de serviços entre a China e o espaço da lusofonia.
A aposta no recurso às máquinas para apoiar o trabalho de tradução remonta a ainda antes do estabelecimento da Região Administrativa Especial de Macau (RAEM), em 1999. Devido aos preparativos para a transferência de administração, o Governo da época viu-se a braços com a necessidade de traduzir um enorme volume de documentos de português para chinês, tendo assim sido lançado em 1996 um projecto envolvendo a Universidade de Macau (UM), entre outras instituições de ensino superior, para o desenvolvimento de um Sistema de Pronunciação e Tradução Português-Chinês (PCT, na sigla inglesa). Segundo o académico Derek Wong Fai, esta terá sido a primeira ferramenta de tradução automática chinês-português a nível mundial. Anos depois, em 2009, a UM lançou o Laboratório de Processamento de Linguagem Natural e de Tradução Automática Chinês-Português (NLP2CT, na sigla em inglês), tendo Derek Wong sido nomeado director.
Mercado com potencial
O académico destaca que o mercado da tradução automática chinês-português tem elevado potencial, a começar pela dimensão do universo de pessoas que pode directamente servir: o chinês é, hoje, o idioma mais utilizado no mundo por número de falantes nativos, com o português a ocupar o sexto lugar. De acordo com algumas estimativas, em 2023, o valor do mercado global de tradução automática atingiu já 7 mil milhões de dólares americanos, com o mercado chinês responsável por 5,9 mil milhões de dólares americanos. Embora existam estimativas mais conservadoras, a maioria dos analistas aponta para que este mercado continue a registar taxas de crescimento acima dos 10 por cento nos próximos anos. A isso, associa-se o potencial das relações económicas e comerciais entre a China e os países de língua portuguesa: segundo dados oficiais chineses, as trocas comerciais sino-lusófonas ascenderam a 214,8 mil milhões de dólares americanos em 2022, um aumento homólogo superior a 6 por cento.
Por outro lado, continua Derek Wong, Macau tem também um papel a desempenhar no seio da iniciativa “Uma Faixa, Uma Rota”, que conta actualmente com o envolvimento de mais de 150 países, incluindo oito nações lusófonas. Por tudo isto, refere o académico, a tradução automática é essencial para o território no âmbito do seu papel de plataforma.
“Em Macau, para além da indústria do jogo, a tradução automática é também um sector importante, que foi capaz de atingir um nível internacional”
DEREK WONG FAI
DIRECTOR DO LABORATÓRIO DE PROCESSAMENTO DE LINGUAGEM NATURAL E DE TRADUÇÃO AUTOMÁTICA CHINÊS-PORTUGUÊS DA UNIVERSIDADE DE MACAU
O especialista reconhece que os modelos de tradução automática podem ser aplicados a diferentes idiomas. No entanto, aponta, tanto o facto de o chinês e o português serem línguas oficiais de Macau, como a existência de “preciosos” talentos bilingues no território, são factores que contribuem para a especialização da RAEM na tradução automática chinês-português, o que, de resto, coincide com as necessidades ao nível de recursos da China e dos países de língua portuguesa.
Reconhecimento nacional
Em 2016, o Instituto Politécnico de Macau (actual Universidade Politécnica de Macau – UPM), a Universidade de Estudos Estrangeiros de Guangdong e a empresa chinesa Global Tone Communication Technology Co Ltd assinaram um acordo para a criação do Laboratório de Tradução Automática Chinês-Português-Inglês, com sede na UPM. Motivado pelos bons resultados alcançados pela cooperação, em 2019, o Ministério da Educação da República Popular da China autorizou a UPM a estabelecer o Centro de Investigação de Engenharia em Tecnologia Aplicada à Tradução Automática e Inteligência Artificial, no qual o laboratório de tradução automática foi incluído. O centro de investigação é o primeiro ligado à engenharia autorizado pelo Ministério da Educação em Hong Kong e Macau. Além disso, é o único no país que tem a tradução automática e a inteligência artificial como áreas prioritárias de investigação.
“Este reconhecimento nacional é para nós uma grande honra, representando que o centro é obrigado a observar rigorosos padrões de qualidade”, explica Zhang Yunfeng, director substituto da Faculdade de Línguas e Tradução da UPM. “Entretanto, tem a vantagem acrescida de poder recrutar recursos nacionais e internacionais para a investigação.”
O académico descreve a equipa do centro como interdisciplinar. “A equipa é composta por talentos de quatro áreas, que são especialistas linguísticos em chinês e português, responsáveis pela verificação da precisão dos dados e sistemas, área de inteligência artificial, bem como desenvolvimento e manutenção de produtos. Os colegas são oriundos de institutos de ensino superior de Macau, da China e de países de língua portuguesa, ou seja, é uma aliança internacional liderada por Macau”, refere Zhang Yunfeng.
Constante aperfeiçoamento
Segundo o dirigente da UPM, para além da investigação académica, o centro é responsável pelo lançamento de produtos de software de carácter prático. “O que está na base dos produtos inovadores é a tecnologia e, no nosso caso, é a plataforma de tradução automática de rede neural chinês-português e o sistema de reconhecimento de voz e interpretação simultânea chinês-português-inglês”, diz.
No que toca à tradução automática neural, esta tem como uma das suas características traduzir frase por frase ou parágrafo por parágrafo, em vez de palavra por palavra. Os modelos são “treinados” utilizando grandes conjuntos de dados, processo durante o qual o modelo ajusta os seus parâmetros. Após o treino, o modelo pode ser usado para traduzir novas frases, por procedimentos de inferência.
Entre os produtos lançados pelo centro, o responsável afirma que o mais significativo é o Sistema Auxiliar de Tradução de Documentos Oficiais Chinês-Português/Português-Chinês, que já está a ser amplamente utilizado por numerosos departamentos governamentais, instituições de diferentes sectores e bancos em Macau, bem como em países de língua portuguesa, no âmbito da iniciativa “Uma Faixa, Uma Rota”.
“Desde dados, termos técnicos, verificações de precisão a servidores especiais com elevada confidencialidade, o sistema de tradução automática é customizado [a cada entidade utilizadora]. Até ao momento, este produto já serviu cerca de 40 instituições em Macau e nos países de língua portuguesa”, diz Zhang Yunfeng.
O sistema fornece uma vasta gama de funções, incluindo tradução de frases, tradução de documentos e base de termos, entre outras. Os resultados da tradução automática caracterizam-se pela sua conformidade com os requisitos sintácticos e gramaticais do português europeu, enquanto o estilo da tradução pretende aproximar-se do da língua escrita local de Macau.
A par da optimização da eficiência e precisão da tradução automática, o desenvolvimento de um sistema de reconhecimento de voz é outra missão desafiante para o centro. Há cerca de dez anos, o organismo desenvolveu um produto denominado “Sistema de Interpretação Simultânea CH-PT”, que utiliza simultaneamente tecnologias de rede neural e de reconhecimento multilingue e de síntese de voz.
Inicialmente, a investigação do centro em matéria de reconhecimento de voz baseou-se no conceito de que a máquina reconhece primeiro as palavras e depois constrói as frases consoante o significado do texto. Os seres humanos não falam com sinais de pontuação, mas a máquina tem de os identificar no seio do discurso oral para dividir as frases e traduzir o significado em tempo real. Além disso, tem de distinguir palavras homófonas.
Zhang Yunfeng confessa que o desempenho inicial do “Sistema de Interpretação Simultânea CH-PT” ficou aquém do esperado. No entanto, um ponto de viragem ocorreu a partir de 2018, com um rápido desenvolvimento a nível global dos sistemas de tradução automática neural. Tal permitiu ao centro optimizar a estabilidade, a velocidade operacional, a eficiência de transcrição e a precisão do reconhecimento de voz e da tradução automática proporcionados pelo produto: em Novembro de 2021, foi lançada a versão 2.0 do “Sistema de Interpretação Simultânea CH-PT”, que é agora apresentado como um sistema avançado de reconhecimento de voz e interpretação simultânea chinês-português.
“O Sistema Auxiliar de Tradução de Documentos Oficiais Chinês-Português/Português‑Chinês da UPM já serviu cerca de 40 instituições em Macau e na lusofonia”
ZHANG YUNFENG
DIRECTOR SUBSTITUTO DA FACULDADE DE LÍNGUAS E TRADUÇÃO DA UNIVERSIDADE POLITÉCNICA DE MACAU (UPM)
O académico acredita que a investigação em tradução automática em Macau já está muito avançada. No entanto, a tecnologia de reconhecimento de voz tem espaço para se desenvolver, e esta é também uma área em que a UPM irá reforçar a sua acção no futuro, afirma.
Quanto aos resultados do centro, “de acordo com várias verificações de peritos linguísticos internacionais”, a sua plataforma de tradução automática de rede neural chinês-português “é actualmente considerada a mais precisa do mundo”, enquanto o seu sistema de reconhecimento de voz e interpretação simultânea chinês-português-inglês “estabeleceu o maior e mais preciso corpus” chinês-português, composto por dezenas de milhões de frases paralelas, nota Zhang Yunfeng.
Brilhar na cena internacional
Em contrapartida, na Universidade de Macau, o laboratório NLP2CT está empenhado noutras partes indispensáveis da tradução automática, incluindo a aprendizagem automática, o raciocínio em linguagem natural e a correcção automática de erros. Uma das áreas em que se tem vindo a destacar é a avaliação automática da qualidade da tradução, com vista a desenvolver modelos que permitam elevar a eficácia na detecção de erros, contribuindo para o ajuste dos parâmetros nos sistemas de tradução.
Em 2022, o modelo de avaliação da qualidade da tradução automática RoBLEURT – desenvolvido conjuntamente pelo NLP2CT Lab e uma equipa de investigação da Alibaba DAMO Academy, ligada à empresa tecnológica chinesa Alibaba – ganhou cinco primeiros prémios na 6.ª Conferência sobre Tradução Automática. Este modelo avaliou oito traduções, tendo sido o melhor em quatro traduções de comunicados de imprensa e numa tradução oral, conquistando ainda dois segundos lugares e um quinto lugar. Bateu rivais como o gigante tecnológico norte-americano Google e a Unbabel, uma start-up portuguesa que se dedica à tradução automática, combinando inteligência artificial com pós-edição humana.
“Começámos a colaborar com a Alibaba DAMO Academy em 2012 e já nomeámos três estudantes para trabalharem para o Grupo Alibaba no domínio da tradução automática”, diz Derek Wong. “O Grupo Alibaba tem negócios importantes no Brasil, exigindo inúmeras traduções chinês-português. Na prática, o grupo tem encontrado muitos problemas de tradução na realidade do dia-a-dia empresarial. Tudo isto é um recurso valioso para investigarmos soluções e melhorarmos o modelo de avaliação da tradução automática.”
Até agora, o NLP2CT publicou mais de 100 artigos de investigação em diversas conferências internacionais de relevo, além de ter conquistado diversos outros prémios. “O nosso laboratório tem sido convidado para muitos eventos internacionais”, afirma Derek Wong. “Isto demonstra que, em Macau, para além da indústria do jogo, a tradução automática é também um sector importante, que foi capaz de atingir um nível internacional.”
Factor humano (ainda) indispensável
O avanço da tradução automática em Macau elevou o relevo do território na cena internacional, mas, por outro lado, levantou preocupações sobre a eventualidade de este tipo de programas poder vir a substituir os profissionais da área da tradução. Bill Gao Ming, fundador em 2011 da Boss Translation Co Ltd, empresa de tradução de Macau pioneira localmente na aplicação de sistemas de tradução assistida por computador (CAT, na sigla em inglês), é peremptório: não acredita que tal possa vir a acontecer.
Diferente da tradução automática, o sistema CAT baseia-se na utilização de software especializado para apoiar o trabalho de um tradutor humano – por exemplo, através de programas informáticos disponibilizando acesso a bases de dados de apoio. Bill Gao recorda que, há cerca de 20 anos, quando estava a estudar tradução em Pequim, já sentia a necessidade de haver um sistema do género, nomeadamente para facilitar na tradução de termos técnicos e nomes próprios, e, por isso, criou o seu primeiro sistema CAT com um grupo de amigos do sector da informática. Até hoje, já foram desenvolvidos por Bill Gao e a sua equipa um total de seis produtos a partir deste sistema, que incluem dados de vários sectores específicos de Macau, nomeadamente nomes próprios, moradas, termos técnico-jurídicos, informação turística e vocabulário ligado à gastronomia e entretenimento, entre outros.
“De facto, o objectivo de desenvolver produtos a partir do sistema CAT é facilitar o nosso trabalho. No entanto, também gosto de partilhar esses resultados com o público e, actualmente, muitos dos nossos produtos, como os de pesquisa de nomes e endereços, estão disponíveis gratuitamente na Internet”, diz Bill Gao. “Isso é benéfico para a nossa reputação e fortalece a promoção da empresa.”
O empresário acredita que a tradução automática é uma ferramenta para auxiliar o tradutor, mas não uma ameaça: ajuda os profissionais na realização de tarefas básicas e repetitivas, proporcionando-lhes mais tempo para se dedicarem a trabalhos de maior complexidade que as máquinas (ainda) não conseguem fazer, como a revisão de traduções.
“Deixem que a máquina faça a tradução básica da informação geral. Os tradutores devem dedicar-se a traduzir em sectores específicos”
BILL GAO MING
FUNDADOR DA EMPRESA DE TRADUÇÃO BOSS TRANSLATION
Ainda assim, Bill Gao considera que a tradução automática veio mudar o paradigma da profissão de tradutor, passando a exigir um tipo de competências diferentes – e o ensino na área da tradução deve acompanhar esta evolução, afirma. Na sua opinião, cada vez mais, os tradutores devem saber trabalhar “em equipa” com as máquinas de tradução automática. Dessa forma, com os avanços da tecnologia, a qualidade do trabalho realizado pelos tradutores humanos pode também melhorar.
“Deixem que a máquina faça a tradução básica da informação geral. Os tradutores devem dedicar-se a traduzir em sectores específicos, como o jurídico, o médico, o jornalístico, e a fazer revisões de textos mais complicados. Se não elevarem a profissão a um nível de maior especialização e se não tiverem capacidade para o trabalho interdisciplinar, então é claro que vão ficar para trás”, prevê.
Já Derek Wong, da Universidade de Macau, no seu papel de investigador, salienta que a tradução automática é uma tendência e que, se os tradutores não se adaptarem, podem, obviamente, ser substituídos. “De facto, neste momento, a tradução automática não é capaz de realizar traduções em áreas específicas, que impliquem conhecimento e experiência profissionais. Uma tradução de qualidade tem de envolver um tradutor humano, porque a tradução não se limita a transcrever frases e palavras. Requer também interpretação do significado do texto”, diz. “Além disso, a verificação da precisão da tradução tem de ser feita por um ser humano e não por uma máquina.”
Zhang Yunfeng, da UPM, sublinha que a tradução automática não é um inimigo: facilita o acesso do público à informação noutras línguas – no contexto de Macau, a notícias produzidas em língua portuguesa ou a ementas de restaurantes de gastronomia portuguesa, por exemplo. No entanto, o responsável realça que o produto final actualmente disponível se trata ainda de uma tradução básica e genérica. Para traduções profissionais e de elevada complexidade, como literatura, ainda é impossível às ferramentas automáticas conseguirem substituir a sensibilidade e o conhecimento humanos, afirma.