Q-Learning es una técnica de aprendizaje por refuerzo, un área de la inteligencia artificial que se enfoca en cómo los agentes deben tomar decisiones para maximizar alguna noción de recompensa acumulativa a lo largo del tiempo.

En Q-Learning, el agente aprende a decidir qué acción tomar en un estado dado para maximizar las recompensas futuras.

Conceptos clave en Q-Learning:

Estado (State): Representa la situación actual en la que se encuentra el agente.

Acciones (Actions): Son las opciones o movimientos que el agente puede realizar.

Política (Policy): Es una estrategia que el agente sigue para decidir la acción a realizar en un estado dado.

Recompensa (Reward): Es un feedback inmediato que el agente recibe por realizar una acción en un estado específico.

Valor Q (Q-value o Quality): Es una estimación de la recompensa total que un agente puede obtener, empezando desde un estado específico y siguiendo una política específica.

Se representa en una tabla llamada Q-table que asigna valores Q a combinaciones de estados y acciones.

El proceso de aprendizaje en Q-Learning involucra la actualización iterativa de los valores Q en la Q-table.

Esto se hace usando la ecuación de Bellman, que en cada paso actualiza el valor Q basándose en la recompensa recibida y la estimación del mejor valor Q futuro.

La idea es que, con suficiente entrenamiento, la Q-table converge a un estado que ofrece una buena aproximación de las mejores acciones a tomar para cada estado, es decir, la política óptima.

El Q-Learning es particularmente poderoso porque es un método de aprendizaje sin modelo, lo que significa que puede aprender a tomar decisiones óptimas sin necesidad de conocer todos los detalles del entorno en el que opera.

Esto lo hace aplicable a una amplia gama de problemas, especialmente en situaciones donde el modelo del entorno es desconocido o demasiado complejo para modelar con exactitud.

« Volver al índice del glosario

ADVERTENCIA: Este es un artículo de carácter informativo. DiarioBitcoin es un medio de comunicación, no promociona, respalda ni recomienda ninguna inversión en particular. Vale señalar que las inversiones en criptoactivos no están reguladas en algunos países. Pueden no ser apropiadas para inversores minoristas, pues se podría perder el monto total invertido. Consulte las leyes de su país antes de invertir.