Planificación basada en preferencias

Forma de planificación y programación automatizada

En inteligencia artificial , la planificación basada en preferencias es una forma de planificación y programación automatizada que se centra en la producción de planes que satisfagan, además, tantas preferencias especificadas por el usuario como sea posible. En muchos dominios de problemas, una tarea se puede lograr mediante varias secuencias de acciones (también conocidas como planes). Estos planes pueden variar en calidad: puede haber muchas formas de resolver un problema, pero las preferidas generalmente son las más rentables, rápidas y seguras.

Los planificadores basados ​​en preferencias tienen en cuenta estas preferencias al elaborar un plan para un problema determinado. Entre los ejemplos de software de planificación basado en preferencias se incluyen PPLAN [1] y HTNPlan-P [2] ( planificación de red de tareas jerárquica (HTN) basada en preferencias).

Descripción general

Las preferencias pueden considerarse restricciones blandas en un plan. La calidad de un plan aumenta cuando se satisfacen más preferencias, pero puede que no sea posible satisfacer todas las preferencias en un solo plan. Esto difiere de las restricciones duras que deben satisfacerse en todos los planes producidos por el software de planificación. Estas restricciones duras son parte del conocimiento del dominio , mientras que las restricciones blandas (o preferencias) son especificadas por separado por el usuario. Esto permite que el mismo conocimiento del dominio se reutilice para varios usuarios que pueden tener diferentes preferencias.

El uso de preferencias también puede aumentar la duración de un plan para satisfacer más preferencias. Por ejemplo, al planificar un viaje desde su casa hasta la escuela, el usuario puede preferir comprar una taza de café en el camino. El software de planificación podría ahora planificar visitar primero la cafetería y luego continuar hasta la escuela. [3] Esto aumenta la duración del plan, pero se satisface la preferencia del usuario.

Lenguaje de definición del dominio de planificación

El lenguaje de definición de dominio de planificación , a partir de la versión 3.0, [4] admite la especificación de preferencias mediante preferencedeclaraciones. Por ejemplo, la declaración

(preference (always (clean room1)))

indica que el usuario prefiere que room1se limpie en cada estado del plan. En otras palabras, el planificador no debe programar una acción que haga room1que se ensucie. Como muestra este ejemplo, se evalúa una preferencia con respecto a todos los estados de un plan (si se requiere semánticamente ).

Además de always, también se admiten otros constructos basados ​​en la lógica temporal lineal , como sometime(al menos una vez durante el plan), sometime-after(se debe planificar después de un estado particular) y at-most-once(la preferencia se mantiene durante como máximo una secuencia de estados en el plan).

Planificar la calidad

Además de determinar si se satisface una preferencia, también necesitamos calcular la calidad de un plan en función de cuántas preferencias se satisfacen. Para este propósito, PDDL 3.0 incluye una expresión llamada is-violated <name>que es igual a "la cantidad de preferencias distintas con el nombre dado que no se satisfacen en el plan". [4] Para un plan, ahora se puede calcular un valor utilizando una función métrica, que se especifica con :metric:

(:metric minimize (+ (* 5 (is-violated pref1)) (* 7 (is-violated pref2))))

Esta función métrica de ejemplo especifica que el valor calculado del plan debe minimizarse (es decir, un plan con valor v1 y un plan con valor v2 tal que v1 < v2 , el primer plan es estrictamente preferido). El valor de un plan se calcula mediante la función dada, que se expresa en notación polaca . En este caso, la violación de la segunda preferencia, pref2, ha recibido una penalización mayor que la de la primera preferencia, pref1.

Problema de satisfacción de restricciones

En el área de problemas de satisfacción de restricciones , existen variantes flexibles que abordan las restricciones blandas de manera similar a las preferencias en la planificación basada en preferencias.

Referencias

  1. ^ PPLAN, Bienvenido et al.
  2. ^ Planificación de HTN con preferencias, Sohrabi et al.
  3. ^ Planificación con preferencias mediante programación lógica, Son y Pontelli
  4. ^ ab Planificación determinista en la quinta competencia internacional de planificación: PDDL3 y evaluación experimental de los planificadores, Gerevini et al.
Obtenido de "https://es.wikipedia.org/w/index.php?title=Planificación_basada_en_preferencias&oldid=1236153186"