Development of a mobile service robot system: enhancing localization, guidance, and search tasks in indoor environments

dc.contributor.advisor-co1Jiménez-Hernández, Mario Fernando
dc.contributor.advisor-co1IDhttps://orcid.org/0000-0003-0965-277X
dc.contributor.advisor-co1Latteshttp://lattes.cnpq.br/6078067029625341
dc.contributor.advisor1Frizera Neto, Anselmo
dc.contributor.advisor1IDhttps://orcid.org/0000-0002-0687-3967
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/8928890008799265
dc.contributor.authorRodriguez, Elio David Triana
dc.contributor.authorIDhttps://orcid.org/0009-0000-4454-987X
dc.contributor.authorLattesttp://lattes.cnpq.br/3696912600039873
dc.contributor.referee1Santos, Thiago Oliveira dos
dc.contributor.referee1IDhttps://orcid.org/0000-0001-7607-635X
dc.contributor.referee1Latteshttp://lattes.cnpq.br/5117339495064254
dc.contributor.referee2Avilés Sanchez, Oscar Fernando
dc.contributor.referee2IDhttps://orcid.org/0000-0001-8676-9926
dc.contributor.referee2Latteshttp://lattes.cnpq.br/7481150993160615
dc.date.accessioned2025-11-17T22:50:14Z
dc.date.available2025-11-17T22:50:14Z
dc.date.issued2025-08-06
dc.description.abstractAdvancements in service robotic systems demand robust Human-Robot Interaction (HRI) strategies capable of operating in multilingual and dynamic environments. However, current HRI approaches based on Natural Language Processing (NLP) often face limitations related to scalability, ambiguity in communication, and dif f iculty in linking unstructured input to structured data, thereby reducing robotic adaptability. This study proposes an HRI framework that integrates NLP through Large Language Models, combined with a decision-making algorithm grounded in Generative Artificial Intelligence (Generative AI) and context-aware reasoning. The system adopts a modular architecture comprising request validation, map valida tion, and response generation, enabling the synthesis and association of structured andunstructured data. As a result, the robot is capable of navigating, guiding users, executing adaptive tasks, and responding to user requests through a chat-style in terface. The framework was implemented on a mobile robot that was structurally, electrically, and software-wise adapted, culminating in the development of an au tonomous system able to complete localization, guidance and search tasks in in door environments. The NLP-based interaction modules were then integrated, and the resulting autonomous responses to user requests were evaluated as satisfactory. Usability evaluations conducted with real users, using the System Usability Scale (SUS), yielded consistently high scores ranging from “good” to “excellent.” How ever, participants reported a slightly lower perception of accuracy and increased frustration when operating in fully autonomous LLM mode compared to a pre programmed control mode. On the other hand, validation experiments demon strated a 91% success rate, confirming the system’s capability to process user re quests andexecutetaskstypicalofguiderobots. Theseresultsvalidatethefeasibility of integrating LLMs into multilingual robotic systems, highlighting both the poten tial and current limitations of NLP in HRI. They also highlight the transformative role of LLMs in enhancing natural language understanding and decision-making in real-world scenarios. Future work should focus on improving the handling of ambiguous user requests and refining feedback mechanisms to enhance the overall user experience.
dc.description.resumoOs avanços nos sistemas robóticos de serviço exigem estratégias robustas de Interação Humano-Robô (IHR) capazes de operar em ambientes multilíngues e dinâmicos. No entanto, as abordagens atuais de IHR baseadas em Processamento de Linguagem Natural (PLN) frequentemente enfrentam limitações relacionadas à escalabilidade, ambiguidade na comunicação e dificuldade em vincular entradas não estruturadas a dados estruturados, o que reduz a adaptabilidade robótica. Este estudo propõe uma estrutura de IHR que integra PLN por meio de Modelos de Linguagem de Grande Escala (LLMs), combinados com um algoritmo de tomada de decisão baseado em Inteligência Artificial Generativa (IAG) e raciocínio sensível ao contexto. O sistema adota uma arquitetura modular composta por validação de solicitações, validação de mapa e geração de respostas, permitindo a síntese e associação de dados estruturados e não estruturados. Como resultado, o robô é capaz de navegar, guiar usuários, executar tarefas adaptativas e responder a solicitações por meio de uma interface em estilo de chat. A estrutura foi implementada em um robô móvel que foi adaptado em termos estruturais, elétricos e de software, culminando no desenvolvimento de um sistema autônomo capaz de realizar tarefas de localização, orientação e busca em ambientes internos. Os módulos de interação baseados em PLN foram então integrados, e as respostas autônomas geradas às solicitações dos usuários foram avaliadas como satisfatórias. Avaliações de usabilidade conduzidas com usuários reais, utilizando a Escala de Usabilidade do Sistema (SUS), apresentaram pontuações consistentemente altas, variando de “boa” a “excelente”. No entanto, os participantes relataram uma percepção ligeiramente inferior de precisão e aumento da frustração ao operar no modo totalmente autônomo com LLM, em comparação com um modo de controle pré-programado. Por outro lado, experimentos de validação demonstraram uma taxa de sucesso de 91%, confirmando a capacidade do sistema de processar solicitações de usuários e executar tarefas típicas de robôs-guia. Esses resultados validam a viabilidade da integração de LLMs em sistemas robóticos multilíngues, destacando tanto o potencial quanto as limitações atuais do uso de PLN em HRI. Também evidenciam o papel transformador dos LLMs no aprimoramento da compreensão da linguagem natural e da tomada de decisão em cenários do mundo real. Trabalhos futuros devem concentrar-se em melhorar o tratamento de solicitações ambíguas dos usuários e aperfeiçoar os mecanismos de feedback para aprimorar a experiência geral do usuário
dc.description.sponsorshipFundação de Amparo à Pesquisa e Inovação do Espírito Santo (FAPES)
dc.formatText
dc.identifier.urihttp://repositorio.ufes.br/handle/10/20629
dc.languagepor
dc.language.isoen
dc.publisherUniversidade Federal do Espírito Santo
dc.publisher.countryBR
dc.publisher.courseMestrado em Engenharia Elétrica
dc.publisher.departmentCentro Tecnológico
dc.publisher.initialsUFES
dc.publisher.programPrograma de Pós-Graduação em Engenharia Elétrica
dc.rightsopen access
dc.rights.urihttps://creativecommons.org/licenses/by-sa/4.0/
dc.subjectHuman robot interaction
dc.subject Large language models
dc.subjectNatural language processing
dc.subjectMobile robot
dc.subjectDecision-making algorithm
dc.subjectProcessamento de linguagem natural
dc.subjectModelos de linguagem de grande escala
dc.subjectInteração humano-robô
dc.subjectRobô móvel
dc.subjectAlgoritmo de tomada de decisão
dc.subject.cnpqEngenharia Elétrica
dc.titleDevelopment of a mobile service robot system: enhancing localization, guidance, and search tasks in indoor environments
dc.typemasterThesis
Arquivos
Pacote Original
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
ElioDavidTrianaRodriguez-2025-dissertacao.pdf
Tamanho:
46.43 MB
Formato:
Adobe Portable Document Format
Descrição:
Licença do Pacote
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
license.txt
Tamanho:
1.71 KB
Formato:
Item-specific license agreed upon to submission
Descrição: