Compilação de corpus: representatividade e o CORPOBRAS

Lúcia Pacheco de Oliveira, Maria Carmelita Padua Dias

Resumo


O objetivo deste trabalho é discutir a importância do parâmetro da representatividade no design e compilação de corpus, mostrando a sua relevância para estudos que visem desenvolver uma descrição abrangente da língua. Este trabalho também apresenta um corpus do português do Brasil, o CORPOBRAS, em desenvolvimento, cujo parâmetro norteador tem sido a representatividade. Este corpus compõe-se, atualmente, de 27 gêneros do discurso oral, discurso escrito e discurso escrito para ser falado. Com a finalidade de ilustrar possíveis usos do CORPOBRAS, no final do trabalho, são listadas algumas pesquisas que utilizaram dados do corpus em suas análises.

Palavras-chave: CORPOBRAS, corpus do português do Brasil, linguística de corpus, variação entre gêneros discursivos, representatividade, discurso oral e escrito.

Texto completo: PDF



ISSN: 2177-6202 - Melhor visualizado no Mozilla Firefox

Licença Creative Commons
Este trabalho está licenciado sob uma Licença Creative Commons Attribution 3.0

São Leopoldo, RS. Av. Unisinos, 950. Bairro Cristo Rei, CEP: 93.022 -000. Atendimento Unisinos +55 (51) 3591 1122

Projeto gráfico: Jully Rodrigues


 

SCImago Journal & Country Rank Crossref Member Badge Crossref Similarity Check logo