Os ruídos da vida moderna e as pressões históricas têm silenciado muitas línguas ao redor do mundo. Há mais de um século, depois de toda a colonização, a língua Ainu, falada pelos povos indígenas do norte do Japão, quase desapareceu. Mas no meio desse cenário desanimador, a Inteligência Artificial (IA) agora está se aprofundando em horas de gravações antigas, aprendendo a dar uma nova voz a essas línguas em perigo e, com isso, manter culturas vivas.
Para Maya Sekine, as histórias de ninar eram algo muito especial. “O toca-fitas pegava os rolos, puxando a fita magnética através dele. No início, apenas um chiado leve de estática, e então a voz dos nossos ancestrais inundava a sala”, descreve ela sobre o ambiente íntimo de sua infância.
Escolhidas por seu pai, essas narrativas chegavam a ela através de fitas antigas, com contos populares narrados em Ainu, a língua de seus antepassados indígenas que habitavam as regiões da ilha norte do que hoje é o Japão desde o século XII, antes de serem colonizados. Hoje, com seus vinte e poucos anos, Maya é a criadora de um popular canal de conversação Ainu no YouTube, e se considera “especial e sortuda” por ter tido acesso a essa herança.
Quando criança, a história favorita de Sekine era sobre um lobo-de-Hokkaido que cantava. A narrativa tinha uma melodia própria, com um refrão que alternava entre frases cantadas em Ainu e uivos de lobo. No entanto, na escola, nenhum dos amigos de Sekine entendia Ainu. Embora sua mãe e avós soubessem algumas frases, eles falavam principalmente japonês. Outros adultos não falavam absolutamente nada. Foi então que ela se deu conta de que a língua e a cultura de sua família estavam morrendo.
Atualmente, restam apenas pouquíssimos falantes nativos de Ainu. A língua está hoje listada pela UNESCO como “Criticamente Ameaçada”. Registros indicam que em 1870, um ano depois que Ezo ou Ezochi (hoje Hokkaido) foi declarada parte do Japão, cerca de 15 mil pessoas falavam dialetos locais de Ainu, e a maioria não falava nenhuma outra língua. No entanto, várias políticas governamentais, incluindo “a proibição do Ainu nas escolas”, quase apagaram a língua e a cultura. Por volta de 1917, o número estimado de falantes havia caído drasticamente para “apenas 350” e desde então a queda tem sido vertiginosa.
A IA na manutenção da existência do Ainu
Apesar da devastação histórica, o Ainu está, de certa forma, passando por um renascimento. Em 2019, o Japão finalmente reconheceu legalmente o povo Ainu como indígena do país, através de um projeto de lei que incluía medidas para promover sua inclusão e visibilidade. E agora, vários projetos buscam preservar e revitalizar a língua – inclusive com o auxílio da inteligência artificial. Há uma chance real de que o Ainu possa sobreviver por muitas gerações.
“A língua é a coisa mais importante para nós. É a conexão entre nossa cultura e nossos valores”, afirma Sekine, que cresceu em Nibutani, Hokkaido, onde “cerca de 80%” dos moradores têm raízes Ainu. No entanto, mesmo lá, o conhecimento da língua é raro.
Embora muitas das nuances do Ainu tenham sido perdidas com o tempo, o conhecimento sobrevive. O pai de Sekine, Kenji, um professor de língua Ainu, aponta que existem “mais de 80 maneiras diferentes de descrever um urso”. A língua reflete a conexão da comunidade com a natureza e o respeito por outros seres vivos.
“Na forma de pensar dos Ainu, tudo, exceto o ser humano, é ‘kamuy’ (deus ou divindade espiritual). Alguns animais são frequentemente chamados de ‘kamuy’, como ‘kimunkamuy’ (urso) e ‘horkewkamuy’ (lobo)”, ele explica.
Apesar de o Ainu ser reconhecido como uma segunda língua nacional, “não faz parte do currículo escolar em Hokkaido”. Hirofumi Kato, professor de arqueologia e diretor da Estação Global para Estudos Indígenas e Diversidade Cultural da Universidade de Hokkaido, lamenta.
“Os alunos não têm chance de aprender sobre a cultura e a língua Ainu. Existe apenas uma imagem estereotipada da cultura e história japonesa. O sistema educacional [reforça] essa perspectiva monocultural.”
Desafios e avanços
Mesmo com poucos falantes de Ainu hoje, existe um rico acervo de histórias orais. Nos últimos anos, pesquisadores recorreram a esses arquivos de áudio com o objetivo de dar nova vida ao Ainu.
“Ao usar nossa tecnologia, esse processo foi amplamente automatizado. Eles agora têm de 300 a 400 horas de dados”, diz Tatsuya Kawahara, professor de informática da Universidade de Kyoto, que lidera um projeto usando tecnologia de reconhecimento de fala por IA para preservar gravações Ainu.
“A qualidade do som não é tão boa porque muitas foram gravadas em dispositivos analógicos em casas, onde às vezes havia ruído. É realmente desafiador”, diz.
Com apoio de financiamento governamental, Kawahara e seus colegas usaram cerca de “40 horas” de gravações com “uwepeker” (histórias narradas em prosa) de oito falantes, compartilhadas pelo Museu Nacional Ainu Upopoy e pelo Museu Cultural Ainu de Nibutani.
Essas gravações fazem parte de um arquivo maior que, no total, contém “cerca de 700 horas de dados vocais” coletados desde a década de 1970. A maior parte do arquivo está em fitas cassete, exatamente como os contos populares que Sekine ouvia quando criança.
Em 2015, a Agência de Assuntos Culturais do Japão começou a “digitalizar” essas gravações para fins de pesquisa e educação, com a iniciativa de IA surgindo três anos depois. Normalmente, a tecnologia de reconhecimento automático de fala é construída usando enormes conjuntos de dados que ajudam o sistema a entender as regras de uma língua antes de transcrevê-la. No entanto, línguas ameaçadas, como o Ainu, não possuem esses dados de base. Isso significou que os pesquisadores tiveram que usar um modelo “ponta a ponta”, uma abordagem que permite que o sistema aprenda a processar fala em texto sem conhecimento prévio da língua.
A equipe de Kawahara está agora desenvolvendo um sistema para sintetizar a fala Ainu, que usa IA para gerar áudio a partir de texto. Até agora, eles treinaram com sucesso a IA para imitar falantes que forneceram “mais de 10 horas de fala gravada”.
O sistema conseguiu até mesmo produzir áudio a partir do texto de duas histórias em prosa: “Conto do Urso”, transcrito entre 1950 e 1960; e “A Irmã de Raijin”, transcrito em 1958. A versão em áudio de “A Irmã de Raijin” gerada por IA foi compartilhada com o Museu Nacional Ainu Upopoy para treinar atores em apresentações.
Para quem não tem o ouvido treinado, “a gravação” – feita com uma voz que poderia ser de uma senhora idosa – “soa estranhamente natural, com as pausas repentinas e ligeiras variações de tom que se esperaria de um falante real, embora um pouco rápida demais”.
Questões de autenticidade e ética
“Espero que esse tipo de IA possa ajudar as pessoas em Hokkaido, ancestrais Ainu ou jovens, a aprender a língua Ainu”, diz Kawahara. Ele sugere que a tecnologia poderia permitir avatares virtuais, assistentes de ensino Ainu que guiam jovens aprendizes da língua. A equipe de Kawahara também espera capturar mais dialetos Ainu com IA e incluir conteúdo de gerações mais jovens, não apenas gravações antigas.
Mas quão precisos são esses sistemas? No momento, a habilidade de tradução da IA é comparável à de um estudante de pós-graduação em Ainu, afirmam os pesquisadores. Ao transcrever alguns falantes, a precisão do reconhecimento de palavras é de “85%”. A precisão da IA no reconhecimento de fonemas (unidades individuais de som em uma língua) pode ser de até “95%”, embora caia para “93%” para falantes desconhecidos usando o mesmo dialeto, e para “85%” para falantes de dialetos diferentes.
Maya Sekine, no entanto, duvida da capacidade da IA de falar Ainu de forma autêntica e teme que a tecnologia possa “espalhar pronúncias erradas ou outros erros”. No início, muitos membros da comunidade contatados por Kawahara e sua equipe estavam igualmente receosos com o projeto e expressaram preocupações de que a tecnologia pudesse “criar falas falsas ou espalhar desinformação”. No entanto, aqueles que apoiaram o projeto ajudaram a verificar a qualidade das transcrições e da fala gerada por computador, bem como os dados originais.
“É difícil dizer o que penso sobre [o projeto]”, diz Sekine. Embora tal sistema possa ajudar a aumentar a conscientização sobre a língua, “o povo Ainu precisa ter conhecimento sobre a língua, para que possam entender o que é falso. Eu diria que é mais importante obter e verificar dados vivos.” Sekine fez suas próprias gravações de histórias Ainu contadas por sua avó e outros moradores idosos em Nibutani.
O pai de Maya participou da iniciativa, ajudando a conseguir as gravações para a equipe de Kawahara. Embora ele mesmo não seja Ainu, começou a aprender o dialeto Saru da língua ao ajudar a mãe de Sekine a dar aulas de Ainu para crianças quando se estabeleceu em Nibutani em 1999. Ele acabou assumindo o curso e tem ensinado Ainu desde então. “É o trabalho da minha vida”, diz ele. “Quero que mais pessoas aprendam. Acho que [projeto de IA] é uma coisa boa.”
O futuro da língua
Manter o Ainu vivo é, sem dúvida, fundamental para essa comunidade. Mas a que custo? Maya Sekine questiona se os dados usados para treinar o sistema de IA serão totalmente acessíveis ao público.
David Ifeoluwa Adelani, professor assistente na Escola de Ciência da Computação da Universidade McGill no Canadá e especialista em línguas de baixo recurso na África, afirma que os pesquisadores de Ainu precisarão construir confiança e transparência com a comunidade.
“Em alguns casos [de revitalização de línguas], há um aspecto de ‘Você chega, coleta dados e depois nos vende de volta'”, diz Adelani. “Pesquisadores precisam obter consentimento e, em seguida, concordar sobre como os dados serão usados”, explica.
Este é um ponto particularmente sensível para pessoas com herança Ainu porque, ao longo dos anos, a cultura Ainu foi “comercializada e apropriada para lucro no Japão”, por meio do turismo, mídia e comércio.
A ameaça de exploração adicional é real para o povo Ainu, cuja terra foi colonizada pelo estado japonês. Proibidos de pescar e caçar por séculos, muitos Ainu foram forçados a sobreviver através da agricultura e de trabalhos de baixo valor.
Não há estatísticas oficiais sobre quantos Ainu permanecem no Japão hoje, mas uma pesquisa de 2023 do governo da Prefeitura de Hokkaido revelou que “29% dos Ainu sofreram discriminação”, um aumento de 6% em relação à pesquisa anterior em 2017. Relatórios da mídia local também sugerem que os Ainu têm “rendas mais baixas” do que a média nacional e são mais propensos a ter “emprego instável”.
É mais ético treinar membros da comunidade sobre como usar essas ferramentas para revitalizar sua língua, em vez de simplesmente chegar e coletar dados, argumenta Adelani.
“Trabalhamos em línguas com muito poucos recursos com falantes nativos em Camarões porque eles querem trabalhar nisso. É por isso que é importante treinar membros da comunidade. Se você os ensina, eles podem priorizar”, conclui.
Críticas à iniciativa
Embora alguns membros da comunidade Ainu recebam bem o recente interesse do governo na preservação cultural indígena, os críticos afirmam que as ações não foram suficientes para abordar as injustiças históricas e garantir direitos fundamentais.
Alguns argumentam que o Museu Nacional Ainu Upopoy, que abriga restos humanos Ainu que os membros da comunidade buscam reaver, é apenas mais uma continuação das políticas de assimilação do Japão.
“Upopoy parece mais um exemplo de os japoneses exercendo seu poder sobre os Ainu”, disse a ativista Ainu Shikada Kawami “em um comunicado” dias antes da abertura do museu. “Não sei quantos Ainu estão cientes do grau em que ainda são explorados.”
Segundo Kawahara, o Museu Nacional Ainu detém os direitos autorais dos dados originais usados para desenvolver o sistema, com o consentimento das famílias dos falantes. O laboratório possui os direitos do próprio sistema de IA. “Mas o sistema não funciona sem dados”, observa ele.
“Em um mundo ideal, a tecnologia da linguagem é feita pelos falantes, para os falantes”, afirma Francis Tyers, consultor de linguística computacional da Common Voice. Ele exemplifica a Espanha, onde muitos sistemas de tradução automática que visam línguas menos representadas como o catalão ou o basco são liderados por membros dessas próprias comunidades.
Em outros casos, onde os falantes nativos são raros ou inexistentes, os líderes podem garantir que as comunidades indígenas tenham autonomia sobre como o dinheiro público é gasto para preservar ou desenvolver ferramentas de aprendizado de idiomas. Tyers dá o exemplo de um “projeto de língua Sámi”, onde os envolvidos “são os que tomam as decisões financeiras políticas”.
Os esforços para melhorar a representação Ainu continuam. Para Sekine e seu pai, a esperança é que mais pessoas Ainu se tornem fluentes no futuro, e que a sociedade japonesa venha a entender e abraçar melhor este aspecto único da herança indígena da região. E há esperança. As gerações mais jovens, por exemplo, continuam a criar novas palavras e frases em Ainu, incluindo “imeru kampi”. Imeru significa raio, enquanto kampi significa letra, juntos eles se tornaram o termo Ainu para “e-mail”.
“A língua em si não será a mesma de tempos antigos, mas tudo bem”, diz Kenji. “Toda língua é viva, vibrante e em constante mudança”. A IA, nesse contexto, é aliada na garantia de que a voz dos ancestrais possa continuar a ressoar, adaptando-se e evoluindo com as novas gerações.
Com informações de Jessie Lau, da BBC