O que é e como se constrói um corpus? Lições aprendidas na compilação de vários corpora para pesquisa linguística
Resumo
As pesquisas baseadas em corpus têm tido na última década um amplo desenvolvimento no contexto brasileiro. Nota-se a sua relevância e pertinência nos domínios da Lingüística, da Lingüística Aplicada e da Lingüística Computacional. Em vista disso, uma abordagem surge para sistematizar procedimentos e dar conta desse novo modo de fazer pesquisa. Essa abordagem é a Lingüística de Corpus que, auxiliada pelo desenvolvimento de ferramentas computacionais específicas para o tratamento do português brasileiro, pode alcançar um grande desenvolvimento no Brasil. Entretanto, muito do que já se obteve de desenvolvimento em Lingüística de Corpus no cenário internacional não se reflete em muitas das pesquisas realizadas no Brasil, uma vez que as práticas mundialmente aceitas ainda não estão aqui sedimentadas, a despeito de haver no país eminentes pesquisadores que desenvolvem extraordinários projetos baseados em corpus. Assim, este artigo tem o propósito de discorrer sobre a concepção de corpus, os requisitos e procedimentos para a sua elaboração, os corpora e ferramentas existentes e disponíveis e, finalmente, apresentar quatro projetos envolvendo corpus cuja descrição e detalhamento pode auxiliar outros pesquisadores nessa tarefa.
Palavras-chave: corpus; lingüística de corpus; processamento de corpus.Downloads
Publicado
Como Citar
Edição
Seção
Licença
Concedo à Calidoscópio o direito de primeira publicação da versão revisada do meu artigo, licenciado sob a Licença Creative Commons Attribution (que permite o compartilhamento do trabalho com reconhecimento da autoria e publicação inicial nesta revista).
Afirmo ainda que meu artigo não está sendo submetido a outra publicação e não foi publicado na íntegra em outro periódico e assumo total responsabilidade por sua originalidade, podendo incidir sobre mim eventuais encargos decorrentes de reivindicação, por parte de terceiros, em relação à autoria do mesmo.
Também aceito submeter o trabalho às normas de publicação da Calidoscópio acima explicitadas.