Resumo |
A evolução dos estudos linguísticos trouxe consigo o estabelecimento de preciosas parcerias entre a Linguística e as outras ciências, de modo que, atualmente, existem vários recursos tecnológicos que podem prestar inestimável auxílio aos trabalhos que envolvam o processamento de grandes quantidades de informação. Um exemplo é o que se deu no campo da Lexicografia. Antes da existência dos computadores que possibilitaram os bancos de dados e os ferramentais de apoio a catalogação dos dados lexicográficos era feita manualmente, através de fichas. Este processo, como é possível imaginar, possuía vários problemas: difícil manipulação e arquivamento funcional dos dados; incomunicabilidade do arquivo, pois os dados só permitiam consultas in loco; perenidade do arquivo; espaço físico ocupado pelo arquivo. Relacionado ao trabalho lexicográfico, com o avanço tecnológico e a criação de grandes corpora eletrônicos, houve uma grande aumento na produção e qualidade das obras lexicográficas. Hwang (2010, p.43) aponta que o advento da informática propiciou o surgimento de um grande momento da história lexicográfica, a Lexicografia informatizada, que trouxe consigo uma verdadeira transformação nas condições de trabalho dos lexicógrafos (facilidade, rapidez e novas possibilidades de produção material dos dicionários), mas também uma evolução nas formas de pensamento e nas práticas lexicográficas atuais. Diante do exposto, o objetivo deste trabalho consiste em apresentar e discorrer sobre como algumas ferramentas computacionais podem auxiliar no desenvolvimento de produtos lexicográficos e terminológicos, em especial na criação de dicionários de língua. Essa pesquisa é parte do projeto Dicionário de Lexicografia: uma proposta para o Português do Brasil, em desenvolvimento como tese de doutoramento no Programa de Pós-Graduação em Estudos Linguísticos da Universidade Estadual Paulista Júlio de Mesquita Filho, campus de São José do Rio Preto. Para tanto, na perspectiva lexicográfica embasamo-nos na perspectiva teórica proposta por Rey (1965), Rey-Debove (1971), Haensch (1982), Biderman (1984, 1993, 1994, 2001), Cabré (1993, 1999), Martinez de Sousa (1995), Borba (1998), Hartmann & James (1998), Dapena (2002), Guerra (2003), Welker (2004), Wiegand & Moran (2010) e Marzá (2011, 2012). Na Linguística de Córpus apoiamo-nos nos pressupostos de Berber-Sardinha (2000), Sinclair (1987), McEnery and Wilson (2001), e da Linguística Computacional contamos com ferramentas disponíveis para análise e/ou exploração de corpora, tais como concordanciadores, etiquetadores morfossintáticos, de análise lexical (WordSmith Tools), bem como de corpora eletrônicos disponíveis gratuitamente na Web. |