The lexicon of Rio de Janeiro traffic: Study of annotation of aerial reports corpus from the radio

Authors

  • Marco Aurélio Silva Souza Pontifícia Universidade Católica do Rio de Janeiro - PUC-Rio
  • Maria Cláudia de Freitas Pontifícia Universidade Católica do Rio de Janeiro - PUC-Rio
  • Maria das Graças Dias Pereira Pontifícia Universidade Católica do Rio de Janeiro - PUC-Rio

Abstract

This article presents a study on the lexicon of the domain “traffic”, held by manual annotation of a corpus with transcriptions of aerial reports about the traffic, transmitted on radio stations of the city of Rio de Janeiro. The aim of the annotation is to observe, systematically, words and expressions used by aerial reporters referring to different situations on traffic. The corpus consists of the transcription of 17 reports from four aerial reporters in six FM radio stations in Rio de Janeiro. The transcriptions were manually annotated for assigning categories and subcategories of the domain “traffic”, developed during the research, using an annotation tool (Etiquet(H)AREM), especially adapted for this purpose. The results not only reinforce the immense potential of the annotation as a means of study and description of language portions as well as systematize a lexicon of a genre (aerial reports), not yet studied, with categories of the domain “traffic” and with information that enables the future projection of traffic conditions in their spatial, temporal and situational aspects.

Keywords: corpus, lexical annotation, aerial reporter, traffic, radio.

Author Biographies

Marco Aurélio Silva Souza, Pontifícia Universidade Católica do Rio de Janeiro - PUC-Rio

Doutorando em Estudos da Linguagem - Pontifícia Universidade Católica do Rio de Janeiro (PUC-Rio)

Mestrado em Estudos da Linguagem - Pontifícia Universidade Católica do Rio de Janeiro (PUC-Rio)

Especialização em Gramática e Linguística - Universidade Castelo Branco (UCB)

Especialização em Planejamento, Implementação e Gestão da Educação a Distância - Universidade Federal Fluminense (UFF)

Maria Cláudia de Freitas, Pontifícia Universidade Católica do Rio de Janeiro - PUC-Rio

Graduação em Letras pela Pontifícia Universidade Católica do Rio de Janeiro.

Mestrado em Letras pela Pontifícia Universidade Católica do Rio de Janeiro.

Doutorado em Letras pela Pontifícia Universidade Católica do Rio de Janeiro

Pesquisadora da Linguateca desde 2007

Professora da PUC-Rio, ligada à linha de pesquisa Descrição do Português, Ensino e Tecnologia

Tem experiência na área de Lingüística, com ênfase em Lingüística Computacional e Linguística com Corpus, atuando principalmente nos seguintes temas: anotação semântica e sintática de corpora, léxicos e ontologias lexicais, extração automática de informação a partir de textos, descrição do português e Humanidades Digitais.

Maria das Graças Dias Pereira, Pontifícia Universidade Católica do Rio de Janeiro - PUC-Rio

Doutora pela PUC-Rio.

Pós-Doutorado pela Universidade de Lisboa e ILTEC

Professora Associada do Departamento de Letras.

Coordenadora de linha de pesquisa no Programa de Pós-Graduação em Estudos da Linguagem da PUC-Rio.

Líder do Grupo de Pesquisa CNPq Linguagem, Cultura e Trabalho, com pesquisas em Linguística Aplicada, Sociolinguística Interacional, Análise da Conversa, Análise da Narrativa e Pragmática.

Published

2015-11-29

How to Cite

Souza, M. A. S., de Freitas, M. C., & Pereira, M. das G. D. (2015). The lexicon of Rio de Janeiro traffic: Study of annotation of aerial reports corpus from the radio. Calidoscópio, 13(3), 416–423. Retrieved from https://revistas.unisinos.br/index.php/calidoscopio/article/view/cld.2015.133.12