Interpretação automatizada de textos : processamento de anáforas

dc.contributor.advisor-co1Lopes, José Gabriel Pereira
dc.contributor.advisor1Menezes, Crediné Silva de
dc.contributor.authorFreitas, Sérgio Antônio Andrade de
dc.contributor.referee1Cury, Davidson
dc.contributor.referee2Garcia, Berilhes Borges
dc.contributor.referee3Vicari, Rosa Maria
dc.contributor.referee4Tavares, Orivaldo de Lira
dc.date.accessioned2016-08-29T15:32:42Z
dc.date.available2016-07-11
dc.date.available2016-08-29T15:32:42Z
dc.date.issued2005-04-11
dc.description.abstractThis thesis presents a solution to the interpretation of de nite descriptions in Portuguese. For example, consider the following text: (1) a. Mariana bought a new car. b. The engine was damaged. The sentence (1a) introduces two entities: Mariana and a car which is new. The sentence (1b) introduces only one entity the engine. In a human or computer interpretation process, the use of the de nite article the preceeding a noun indicates that the introduced entity was already present at the discourse, i.e., it is an anaphoric entity. The resolution of an anaphora is a reference problem, but in the example (1) there is another problem: although the car is the entity that gives context to the engine, we can not say that the engine is the car (as for a pronominal anaphora). It also must be determined how the engine is related to the car. This is a de nite description problem. The interpretation of any kind of anaphora can be represented by the following equation: R(A, T ) (2) where A denotes an entity introduced by the context interpretation of a pronoun, an ellipsis or a de nite noun phrase, T denotes its antecedent and R is the relation between A and T . The equation's resolution process is summarized as: given A nd T and R. This thesis proposes a methodology to the de nite description interpretation that the relation R is of: part of, member of, subcategorized by and corefers. These relations are obtained by a set of pragmatic rules [Freitas, Lopes e Menezes 2004, Filho e Freitas 2003], which are here de ned (chapter 3). Also if A is not anaphoric then it is acommodated in the discourse context. The computational methodology is implemented in a logic programming system [Damásio, Nejdl e Pereira 1994] that permits an abductive reasoning [Kakas, Kowalski e Toni 1992] at the semantic representation of the discourse [Kamp e Reyle 1993]. The interpretation of the entities is the basis to the Discourse Nominal Structure [Lopes e Freitas 1994] (chapter 4), which allows: (1) to track the most salient entities at each sentence [Freitas e Lopes 1994], (2) to limit the number of possible antecedents [Freitas e Lopes 1996] and (3) to give a discourse entities summary. The result is an integrated metodology to solve anaphors and ellipses. Finally, the Nominal Structure of the Discourse can help the search/index of digital documents.eng
dc.description.resumoEsta tese apresenta uma solução para a interpretação de anáforas nominais definidas.Considere o seguinte texto: (1) a. Mariana comprou um carro novo. b. O motor veio danificado. A frase (1a) apresenta duas entidades: Mariana e um carro novo. Já a frase (1.2b) tem apenas uma entidade o motor. No processo de interpretação, humano ou computacional, a utilização do artigo de nido o é um indicativo de que a entidade já havia sido introduzida no discurso, i.e. apresenta um caráter anafórico. Resolver uma anáfora é, a priori, identi car a quem ou a que se refere esta anáfora. Mas no caso acima é mais do que isto: sem dúvida o motor existe no texto por causa da existência de um carro, porém a interpretação do motor deve ir além disto e identi car como este motor está ligado com aquele carro. Isto é uma anáfora nominal de nida. A interpretação das anáforas nominais de nidas ou de qualquer fenômeno anafórico pode ser generalizada como um processo que atribui valores aos itens da seguinte equação: R(A, T ) (2) onde: A denota a entidade introduzida pela interpretação fora de contexto de um pronome, de uma elipse ou de um sintagma nominal de nido, T denota o seu antecedente e R é a relação existente entre A e T . O processo de resolução da equação, que é propriamente o processo de resolução de anáforas, consiste em descobrir T e R dado A. Nesta tese é proposta uma metodologia computacional que interpreta as anáforas nominais de nidas cuja relação R é uma dentre: parte de, membro de, subcategorizado por e coreferência. A obtenção das relações é feita por um conjunto de regras pragmáticas [Freitas, Lopes e Menezes 2004, Filho e Freitas 2003] (cap. 3). Caso seja constatado que A não seja anafórica então ela é acomodada no contexto. A metodologia computacional é construída sobre um ambiente de programação em lógica [Damásio, Nejdl e Pereira 1994] que permite raciocinar abdutivamente [Kakas, Kowalski e Toni 1992] sobre a representação semântica do texto [Kamp e Reyle 1993]. A partir da interpretação das entidades é construída a estrutura nominal do discurso [Lopes e Freitas 1994] (cap. 4), a qual permite: (1) fazer o acompanhamento das entidades mais salientes em cada frase [Freitas e Lopes 1994], (2) limitar o universo de escolha de possíveis antecedentes[Freitas e Lopes 1996] e (3) prover um resumo das entidades do discurso. O resultado é uma metodologia que permite, de forma integrada, resolver anáforas e elipses, sendo que a estrutura nominal do discurso pode ser usada na busca de informações.
dc.formatText
dc.identifier.citationFREITAS, Sérgio Antônio Andrade de. Interpretação automatizada de textos: processamento de anáforas. 2005. Tese (Doutorado) - Universidade Federal do Espírito Santo, Centro Tecnológico, Vitória, 2002.
dc.identifier.urihttp://repositorio.ufes.br/handle/10/4114
dc.languagepor
dc.publisherUniversidade Federal do Espírito Santo
dc.publisher.countryBR
dc.publisher.courseDoutorado em Engenharia Elétrica
dc.publisher.departmentCentro Tecnológico
dc.publisher.initialsUFES
dc.publisher.programPrograma de Pós-Graduação em Engenharia Elétrica
dc.rightsopen access
dc.subject.br-rjbnProcessamento de textos (Computação)
dc.subject.br-rjbnAlgoritmos de computador
dc.subject.br-rjbnAnáfora (Linguística)
dc.subject.br-rjbnProcessamento da linguagem natural (Computação)
dc.subject.cnpqEletrônica Industrial, Sistemas e Controles Eletrônicos
dc.subject.udc621.3
dc.titleInterpretação automatizada de textos : processamento de anáforas
dc.typedoctoralThesis
Arquivos
Pacote Original
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
Tese-SergioAntonioAndradedeFreitas.pdf
Tamanho:
996.88 KB
Formato:
Adobe Portable Document Format
Descrição: