Compilação de corpus: representatividade e o CORPOBRAS
Resumo
O objetivo deste trabalho é discutir a importância do parâmetro da representatividade no design e compilação de corpus, mostrando a sua relevância para estudos que visem desenvolver uma descrição abrangente da língua. Este trabalho também apresenta um corpus do português do Brasil, o CORPOBRAS, em desenvolvimento, cujo parâmetro norteador tem sido a representatividade. Este corpus compõe-se, atualmente, de 27 gêneros do discurso oral, discurso escrito e discurso escrito para ser falado. Com a finalidade de ilustrar possíveis usos do CORPOBRAS, no final do trabalho, são listadas algumas pesquisas que utilizaram dados do corpus em suas análises.
Palavras-chave: CORPOBRAS, corpus do português do Brasil, linguística de corpus, variação entre gêneros discursivos, representatividade, discurso oral e escrito.Downloads
Publicado
Como Citar
Edição
Seção
Licença
Concedo à Calidoscópio o direito de primeira publicação da versão revisada do meu artigo, licenciado sob a Licença Creative Commons Attribution (que permite o compartilhamento do trabalho com reconhecimento da autoria e publicação inicial nesta revista).
Afirmo ainda que meu artigo não está sendo submetido a outra publicação e não foi publicado na íntegra em outro periódico e assumo total responsabilidade por sua originalidade, podendo incidir sobre mim eventuais encargos decorrentes de reivindicação, por parte de terceiros, em relação à autoria do mesmo.
Também aceito submeter o trabalho às normas de publicação da Calidoscópio acima explicitadas.