logo

Programação do 63º seminário do GEL


63º SEMINáRIO DO GEL - 2015
Título: Análise quantitativa de modelos teóricos para a questão do acento no Português Brasileiro
Autor(es): Bruno Ferrari Guide. In: SEMINÁRIO DO GEL, 63 , 2015, Programação... São Paulo (SP): GEL, 2015. Acesso em: 22/02/2024
Palavra-chave Lingustica computacional, Fonologia, Lingustica de Corpus
Resumo

A presente comunicação se propõe a trazer uma análise quantitativa sobre a questão do acento no português brasileiro. Isso será conduzido através da breve apresentação de teorias sobre o assunto (no caso, Bisol (1992) e Lee (1994)), a identificação das variáveis que cada teoria apresenta como relevantes para a questão, a discussão sobre sua natureza algoritmica e uma breve exposição sobre o processo de implementação das mesmas através do uso da linguagem de programação Python.

Seguindo a isso, exporei o processo de compilação de um corpus volumoso do português brasileiro que foi construido justamente para servir de base a essa análise, me detendo nos aspectos práticos que emergem na construção e desenvolvimento de um corpus fonológico e como tais aspectos foram tratados visando sempre o uso de métodos automáticos para que a quantidade de dados utilizados pudesse ser a maior possível.

Então, exporei os desempenhos dos modelos linguísticos construídos a partir das teorias em termos quantitativos a fim de fundamentar a discussão acerca da natureza categorial do comportamento do acento, que servirá de base para o desenvolvimento de uma abordagem probabilística da questão.

 Por fim, espero deixar uma fundamentação empírica quantitativa relevante para a abordagem probabilística que estou desenvolvendo. A apresentação dessa abordagem passa pela breve discussão sobre duas ferramentas computacionais que serão empregadas.

Em primeiro lugar, os n-gramas, que constituem um método de encarar a questão que se despe em grande parte do conhecimento linguístico, mas que possui algumas vantagens computacionais e que pode demonstrar algum tipo de padrão que passa ao largo das abordagens tradicionais.

Em segundo lugar, o classificador bayesiano ingênuo, uma ferramenta probabilística que permite levar em conta qualquer tipo de informação sobre um item para classificá-lo, no caso, para lhe atribuir uma categoria acentual, discutirei aqui as exigências e as possibilidades que esse tipo de abordagem poderá trazer para a questão.

Em conclusão: espero demonstrar que a análise quantitativa do perfil do acento no português brasileiro pode trazer um novo fôlego à questão, seja pelo seu poder descritivo, seja pela possibilidade de com isso criar ferramentas computacionais para abordar a questão.