Classes de palavras e etiquetagem na Lingüística Computacional

Claudia Oliveira, Maria Claudia de Freitas

Resumo


A categorização da palavra de acordo com traços que a posicionam dentro do sistema lingüístico é um elemento formal subjacente a qualquer descrição gramatical. Na Lingüística Computacional, etiquetagem consiste na atribuição de categorias a porções do texto. O objetivo desse artigo é discutir, no contexto da Lingüística Computacional, a procedência da informação lingüística nos conjuntos de etiquetas de POS – do inglês part of speech. Ao longo da discussão evidenciamos a relevância da participação do lingüista na compilação teoricamente bem fundamentada dos conjuntos de etiquetas da prática do Processamento de Linguagem Natural (PLN). Direcionamos nosso olhar, especificamente, para fenômenos relacionados à anotação por classes de palavras, mas que têm recebido um tratamento secundário por parte da lingüística - como as formas nominais do verbo, notadamente o particípio, as palavras denotativas e o aposto.

Palavras-chave: conjunto de etiquetas, particípio, aposto, palavras denotativas, lingüística computacional, PLN.

Texto completo: PDF



ISSN: 2177-6202 - Melhor visualizado no Mozilla Firefox

Licença Creative Commons
Este trabalho está licenciado sob uma Licença Creative Commons Attribution 3.0

São Leopoldo, RS. Av. Unisinos, 950. Bairro Cristo Rei, CEP: 93.022 -000. Atendimento Unisinos +55 (51) 3591 1122

Projeto gráfico: Jully Rodrigues


 

SCImago Journal & Country Rank Crossref Member Badge Crossref Similarity Check logo