Interpretação automatizada de textos : processamento de anáforas
dc.contributor.advisor-co1 | Lopes, José Gabriel Pereira | |
dc.contributor.advisor1 | Menezes, Crediné Silva de | |
dc.contributor.author | Freitas, Sérgio Antônio Andrade de | |
dc.contributor.referee1 | Cury, Davidson | |
dc.contributor.referee2 | Garcia, Berilhes Borges | |
dc.contributor.referee3 | Vicari, Rosa Maria | |
dc.contributor.referee4 | Tavares, Orivaldo de Lira | |
dc.date.accessioned | 2016-08-29T15:32:42Z | |
dc.date.available | 2016-07-11 | |
dc.date.available | 2016-08-29T15:32:42Z | |
dc.date.issued | 2005-04-11 | |
dc.description.abstract | This thesis presents a solution to the interpretation of de nite descriptions in Portuguese. For example, consider the following text: (1) a. Mariana bought a new car. b. The engine was damaged. The sentence (1a) introduces two entities: Mariana and a car which is new. The sentence (1b) introduces only one entity the engine. In a human or computer interpretation process, the use of the de nite article the preceeding a noun indicates that the introduced entity was already present at the discourse, i.e., it is an anaphoric entity. The resolution of an anaphora is a reference problem, but in the example (1) there is another problem: although the car is the entity that gives context to the engine, we can not say that the engine is the car (as for a pronominal anaphora). It also must be determined how the engine is related to the car. This is a de nite description problem. The interpretation of any kind of anaphora can be represented by the following equation: R(A, T ) (2) where A denotes an entity introduced by the context interpretation of a pronoun, an ellipsis or a de nite noun phrase, T denotes its antecedent and R is the relation between A and T . The equation's resolution process is summarized as: given A nd T and R. This thesis proposes a methodology to the de nite description interpretation that the relation R is of: part of, member of, subcategorized by and corefers. These relations are obtained by a set of pragmatic rules [Freitas, Lopes e Menezes 2004, Filho e Freitas 2003], which are here de ned (chapter 3). Also if A is not anaphoric then it is acommodated in the discourse context. The computational methodology is implemented in a logic programming system [Damásio, Nejdl e Pereira 1994] that permits an abductive reasoning [Kakas, Kowalski e Toni 1992] at the semantic representation of the discourse [Kamp e Reyle 1993]. The interpretation of the entities is the basis to the Discourse Nominal Structure [Lopes e Freitas 1994] (chapter 4), which allows: (1) to track the most salient entities at each sentence [Freitas e Lopes 1994], (2) to limit the number of possible antecedents [Freitas e Lopes 1996] and (3) to give a discourse entities summary. The result is an integrated metodology to solve anaphors and ellipses. Finally, the Nominal Structure of the Discourse can help the search/index of digital documents. | eng |
dc.description.resumo | Esta tese apresenta uma solução para a interpretação de anáforas nominais definidas.Considere o seguinte texto: (1) a. Mariana comprou um carro novo. b. O motor veio danificado. A frase (1a) apresenta duas entidades: Mariana e um carro novo. Já a frase (1.2b) tem apenas uma entidade o motor. No processo de interpretação, humano ou computacional, a utilização do artigo de nido o é um indicativo de que a entidade já havia sido introduzida no discurso, i.e. apresenta um caráter anafórico. Resolver uma anáfora é, a priori, identi car a quem ou a que se refere esta anáfora. Mas no caso acima é mais do que isto: sem dúvida o motor existe no texto por causa da existência de um carro, porém a interpretação do motor deve ir além disto e identi car como este motor está ligado com aquele carro. Isto é uma anáfora nominal de nida. A interpretação das anáforas nominais de nidas ou de qualquer fenômeno anafórico pode ser generalizada como um processo que atribui valores aos itens da seguinte equação: R(A, T ) (2) onde: A denota a entidade introduzida pela interpretação fora de contexto de um pronome, de uma elipse ou de um sintagma nominal de nido, T denota o seu antecedente e R é a relação existente entre A e T . O processo de resolução da equação, que é propriamente o processo de resolução de anáforas, consiste em descobrir T e R dado A. Nesta tese é proposta uma metodologia computacional que interpreta as anáforas nominais de nidas cuja relação R é uma dentre: parte de, membro de, subcategorizado por e coreferência. A obtenção das relações é feita por um conjunto de regras pragmáticas [Freitas, Lopes e Menezes 2004, Filho e Freitas 2003] (cap. 3). Caso seja constatado que A não seja anafórica então ela é acomodada no contexto. A metodologia computacional é construída sobre um ambiente de programação em lógica [Damásio, Nejdl e Pereira 1994] que permite raciocinar abdutivamente [Kakas, Kowalski e Toni 1992] sobre a representação semântica do texto [Kamp e Reyle 1993]. A partir da interpretação das entidades é construída a estrutura nominal do discurso [Lopes e Freitas 1994] (cap. 4), a qual permite: (1) fazer o acompanhamento das entidades mais salientes em cada frase [Freitas e Lopes 1994], (2) limitar o universo de escolha de possíveis antecedentes[Freitas e Lopes 1996] e (3) prover um resumo das entidades do discurso. O resultado é uma metodologia que permite, de forma integrada, resolver anáforas e elipses, sendo que a estrutura nominal do discurso pode ser usada na busca de informações. | |
dc.format | Text | |
dc.identifier.citation | FREITAS, Sérgio Antônio Andrade de. Interpretação automatizada de textos: processamento de anáforas. 2005. Tese (Doutorado) - Universidade Federal do Espírito Santo, Centro Tecnológico, Vitória, 2002. | |
dc.identifier.uri | http://repositorio.ufes.br/handle/10/4114 | |
dc.language | por | |
dc.publisher | Universidade Federal do Espírito Santo | |
dc.publisher.country | BR | |
dc.publisher.course | Doutorado em Engenharia Elétrica | |
dc.publisher.department | Centro Tecnológico | |
dc.publisher.initials | UFES | |
dc.publisher.program | Programa de Pós-Graduação em Engenharia Elétrica | |
dc.rights | open access | |
dc.subject.br-rjbn | Processamento de textos (Computação) | |
dc.subject.br-rjbn | Algoritmos de computador | |
dc.subject.br-rjbn | Anáfora (Linguística) | |
dc.subject.br-rjbn | Processamento da linguagem natural (Computação) | |
dc.subject.cnpq | Eletrônica Industrial, Sistemas e Controles Eletrônicos | |
dc.subject.udc | 621.3 | |
dc.title | Interpretação automatizada de textos : processamento de anáforas | |
dc.type | doctoralThesis |
Arquivos
Pacote Original
1 - 1 de 1
Carregando...
- Nome:
- Tese-SergioAntonioAndradedeFreitas.pdf
- Tamanho:
- 996.88 KB
- Formato:
- Adobe Portable Document Format
- Descrição: