• Mi Re-Unir
    Búsqueda Avanzada
    JavaScript is disabled for your browser. Some features of this site may not work without it.
    Ver ítem 
    •   Inicio
    • TRABAJOS FIN DE MÁSTER
    • Área de Ingeniería y Tecnología
    • Ver ítem
    •   Inicio
    • TRABAJOS FIN DE MÁSTER
    • Área de Ingeniería y Tecnología
    • Ver ítem

    Quantum-Annealed Action Selection Policy for Reinforcement Learning

    Autor: 
    Caponera-De Cobellis, Romolo Rosario
    Fecha: 
    01/07/2023
    Palabra clave: 
    computación cuántica; quantum annealing; Q-Learning; aprendizaje por refuerzo; quantum computing; reinforcement learning; Máster Universitario en Computación Cuántica
    Tipo de Ítem: 
    masterThesis
    URI: 
    https://reunir.unir.net/handle/123456789/15624
    Open Access
    Resumen:
    De entre todos los tipos de machine learning, el aprendizaje por refuerzo es posiblemente el menos estudiado en t´erminos de computaci´on cu´antica, si bien tiene potencial para beneficiarse en gran medida del no-determinismo intr´ınseco de la cu´antica. Este trabajo explora el uso del Quantum Annealing en el ´ambito del aprendizaje por refuerzo y, concretamente, el Q-Learning, proponiendo una pol´ıtica de selecci´on de acciones basada en el annealing. Se proporciona una revisi´on de algunas de las pol´ıticas cl´asicas m´as utilizadas, para permitir una mejor comprensi´on de las mismas, y posteriormente se compara el rendimiento de la pol´ıtica cu´antica QAASP con ellas. Las pruebas se realizan en el entorno FrozenLake ofrecido por Gymnasium (anteriormente conocido como OpenAI Gym). Los resultados indican ventajas potenciales ligadas al uso de QAASP, si bien el rendimiento final es similar a las pol´ıticas cl´asicas en t´erminos de episodios hasta el fin del entrenamiento.
    Descripción: 
    Reinforcement Learning is, amongst all Machine Learning types, the least studied in Quantum Computing, yet one that could greatly benefit from the quantum non-determinism in order to approach the exploration-exploitation dilemma. This work explores the usage of Quntum Annealing in the field of Reinforcement Learning and Q-Learning, proposing an annealing-based action selection policy. An overview of some of the most popular classical action selecion policies is offered, so that they are better understood, after which a performance comparison between the classical policies and the proposed QAASP is given. Tests and benchmarks are performed on the FrozenLake envoironment offered by Gymnasium (formerly OpenAI Gym). Results show some potential benefits on the usage of QAASP, yet an overall similar performance compared to classical policies in terms of episodes until convergence
    Mostrar el registro completo del ítem
    Ficheros en el ítem
    icon
    Nombre: Caponera-De Cobellis, Romolo Rosario.pdf
    Tamaño: 2.553Mb
    Formato: application/pdf
    Ver/Abrir
    Este ítem aparece en la(s) siguiente(s) colección(es)
    • Área de Ingeniería y Tecnología

    Estadísticas de uso

    Año
    2012
    2013
    2014
    2015
    2016
    2017
    2018
    2019
    2020
    2021
    2022
    2023
    2024
    2025
    Vistas
    0
    0
    0
    0
    0
    0
    0
    0
    0
    0
    0
    20
    131
    80
    Descargas
    0
    0
    0
    0
    0
    0
    0
    0
    0
    0
    0
    6
    47
    49

    Ítems relacionados

    Mostrando ítems relacionados por Título, autor o materia.

    • Determinantes de la información sostenible divulgada por las empresas de electricidad: un estudio internacional 

      Sáez Martín, Alejandro; Haro De Rosario, Arturo; Caba Pérez, María Del Carmen; Benítez Sánchez, María Nieves (RETOS: Revista de Ciencias de la Administracion Economica, 01/2014)
      El objetivo del artículo es examinar los factores que afectan a la información voluntaria suministrada por las organizaciones del sector eléctrico en sus memorias de sostenibilidad. La metodología utilizada consiste en ...
    • Memoria para la gestión de la jefatura del servicio de otorrinolaringología del Hospital Morales Meseguer 

      Gómez-González, Mª del Rosario (05/2017)
      El propósito de mi Trabajo Fin de Máster consiste en la presentación de la memoria de gestión para la jefatura de servicio de Otorrinolaringología (ORL) del Hospital Morales Meseguer de Murcia, que es un hospital público ...
    • Valoración de la relación entre Rendimiento Académico y Condición Física en escolares zaragozanos 

      Castro López, Rosario ; Pérez Gómez, V; Cachón Zagalaz, Javier; Zagalaz Sánchez, María Luisa (Sport TK: Revista Euroamericana de Ciencias del Deporte, 01/2016)
      Introducción: El estudio analiza las asociaciones entre la condición física y el rendimiento académico, atendiendo al género, curso y origen del alumnado. Material y métodos: Fueron analizados 338 alumnos. El rendimiento ...

    Mi cuenta

    AccederRegistrar

    ¿necesitas ayuda?

    Manual de UsuarioContacto: reunir@unir.net

    Listar

    todo Re-UnirComunidades y coleccionesPor fecha de publicaciónAutoresTítulosPalabras claveTipo documentoTipo de accesoEsta colecciónPor fecha de publicaciónAutoresTítulosPalabras claveTipo documentoTipo de acceso






    Aviso Legal Política de Privacidad Política de Cookies Cláusulas legales RGPD
    © UNIR - Universidad Internacional de La Rioja
     
    Aviso Legal Política de Privacidad Política de Cookies Cláusulas legales RGPD
    © UNIR - Universidad Internacional de La Rioja