Classes de palavras e etiquetagem na Lingüística Computacional
Resumen
A categorização da palavra de acordo com traços que a posicionam dentro do sistema lingüístico é um elemento formal subjacente a qualquer descrição gramatical. Na Lingüística Computacional, etiquetagem consiste na atribuição de categorias a porções do texto. O objetivo desse artigo é discutir, no contexto da Lingüística Computacional, a procedência da informação lingüística nos conjuntos de etiquetas de POS – do inglês part of speech. Ao longo da discussão evidenciamos a relevância da participação do lingüista na compilação teoricamente bem fundamentada dos conjuntos de etiquetas da prática do Processamento de Linguagem Natural (PLN). Direcionamos nosso olhar, especificamente, para fenômenos relacionados à anotação por classes de palavras, mas que têm recebido um tratamento secundário por parte da lingüística - como as formas nominais do verbo, notadamente o particípio, as palavras denotativas e o aposto.
Palavras-chave: conjunto de etiquetas, particípio, aposto, palavras denotativas, lingüística computacional, PLN.Descargas
Publicado
Cómo citar
Número
Sección
Licencia
Concedo à Calidoscópio o direito de primeira publicação da versão revisada do meu artigo, licenciado sob a Licença Creative Commons Attribution (que permite o compartilhamento do trabalho com reconhecimento da autoria e publicação inicial nesta revista).
Afirmo ainda que meu artigo não está sendo submetido a outra publicação e não foi publicado na íntegra em outro periódico e assumo total responsabilidade por sua originalidade, podendo incidir sobre mim eventuais encargos decorrentes de reivindicação, por parte de terceiros, em relação à autoria do mesmo.
Também aceito submeter o trabalho às normas de publicação da Calidoscópio acima explicitadas.