ProgramaÃ§Ã£o do 63º seminÃ¡rio do GEL

63Âº SEMINÃ¡RIO DO GEL - 2015
TÃtulo:	Análise quantitativa de modelos teóricos para a questão do acento no Português Brasileiro
Autor(es):	Bruno Ferrari Guide. In: SEMINÃRIO DO GEL, 63 , 2015, ProgramaÃ§Ã£o... SÃ£o Paulo (SP): GEL, 2015. Acesso em: 27/07/2024
Palavra-chave	Linguística computacional, Fonologia, Linguística de Corpus
Resumo	A presente comunicação se propõe a trazer uma análise quantitativa sobre a questão do acento no português brasileiro. Isso será conduzido através da breve apresentação de teorias sobre o assunto (no caso, Bisol (1992) e Lee (1994)), a identificação das variáveis que cada teoria apresenta como relevantes para a questão, a discussão sobre sua natureza algoritmica e uma breve exposição sobre o processo de implementação das mesmas através do uso da linguagem de programação Python. Seguindo a isso, exporei o processo de compilação de um corpus volumoso do português brasileiro que foi construido justamente para servir de base a essa análise, me detendo nos aspectos práticos que emergem na construção e desenvolvimento de um corpus fonológico e como tais aspectos foram tratados visando sempre o uso de métodos automáticos para que a quantidade de dados utilizados pudesse ser a maior possível. Então, exporei os desempenhos dos modelos linguísticos construídos a partir das teorias em termos quantitativos a fim de fundamentar a discussão acerca da natureza categorial do comportamento do acento, que servirá de base para o desenvolvimento de uma abordagem probabilística da questão. Por fim, espero deixar uma fundamentação empírica quantitativa relevante para a abordagem probabilística que estou desenvolvendo. A apresentação dessa abordagem passa pela breve discussão sobre duas ferramentas computacionais que serão empregadas. Em primeiro lugar, os n-gramas, que constituem um método de encarar a questão que se despe em grande parte do conhecimento linguístico, mas que possui algumas vantagens computacionais e que pode demonstrar algum tipo de padrão que passa ao largo das abordagens tradicionais. Em segundo lugar, o classificador bayesiano ingênuo, uma ferramenta probabilística que permite levar em conta qualquer tipo de informação sobre um item para classificá-lo, no caso, para lhe atribuir uma categoria acentual, discutirei aqui as exigências e as possibilidades que esse tipo de abordagem poderá trazer para a questão. Em conclusão: espero demonstrar que a análise quantitativa do perfil do acento no português brasileiro pode trazer um novo fôlego à questão, seja pelo seu poder descritivo, seja pela possibilidade de com isso criar ferramentas computacionais para abordar a questão.