Use este identificador para citar ou linkar para este item: http://repositorio.ufes.br/handle/10/3733
Título: Descrição de expressões fixas do português brasileiro para processamento automático de linguagem natural
Autor(es): Santos, Vangevaldo Cardoso dos
Orientador: Smarsaro, Aucione das Dores
Data do documento: 31-Mar-2011
Editor: Universidade Federal do Espírito Santo
Resumo: Esta pesquisa propõe um estudo das expressões fixas do português do Brasil, em especial, aquelas com nomes de partes do corpo, identificadas em dicionários e textos jornalísticos. A descrição e a formalização dessas expressões fixas são de suma importância para o Processamento Automático de Linguagem Natural. Seleciou-se um corpus com 558 expressões fixas, 351 são de estruturas argumentais verbais e 207 de estruturas argumentais substantivais. Essas expressões são analisadas a partir de critérios linguísticos formais, para se identificar o comportamento morfossintático-semântico de cada uma delas e, a partir dessas propriedades estruturais, observadas em contexto de uso, propõe-se uma codificação para formalizá-las, com intuito de serem inseridas em um ambiente computacional, ampliando os estudos descritivos sobre o léxico do português e corrigindo falhas que possam prejudicar a qualidade de um texto processado automaticamente. A representação formal dessas expressões fixas é essencial para que se possa incluí-las em um dicionário eletrônico e, assim, utilizá-las pelo software Unitex ou por qualquer outro analisador morfossintático.
This research proposes a study of fixed expressions of Portuguese in Brazil, especially those with names of body parts, identified in newspaper texts and dictionaries. The description and formalization of these fixed expressions are of utmost importance to Automatic Processing of Natural Language. We selected a corpus with 558 fixed expressions, 351 are of verbal argument structures and 207 nouns argument structures. These expressions are analyzed from formal linguistic criteria to identify the morphosyntactic-semantic behavior of each one and, from these structural properties observed in the context of use, we propose an encoding to formalize them, with the aim to be inserted into a computing environment, expanding the descriptive studies on the lexicon of Portuguese and correcting deficiencies that might impair the quality of a text processed automatically. The formal representation of these fixed expressions is essential so that we can include them in an electronic dictionary, and thus use them at Unitex software or any other morphosyntactic analyzer.
URI: http://repositorio.ufes.br/handle/10/3733
Aparece nas coleções:PPGEL - Dissertações de mestrado

Arquivos associados a este item:
Arquivo TamanhoFormato 
tese_4945_DISSERTACAO - Vangevaldo Santos.pdf1.41 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.