Control de modo deslizante

Método en la teoría de control no lineal

En los sistemas de control , el control de modo deslizante ( SMC ) es un método de control no lineal que altera la dinámica de un sistema no lineal mediante la aplicación de una señal de control discontinua (o más rigurosamente, una señal de control con valor establecido) que obliga al sistema a "deslizarse" a lo largo de una sección transversal del comportamiento normal del sistema. La ley de control de retroalimentación de estado no es una función continua del tiempo. En cambio, puede cambiar de una estructura continua a otra en función de la posición actual en el espacio de estado. Por lo tanto, el control de modo deslizante es un método de control de estructura variable . Las múltiples estructuras de control están diseñadas de modo que las trayectorias siempre se muevan hacia una región adyacente con una estructura de control diferente, por lo que la trayectoria final no existirá completamente dentro de una estructura de control. En cambio, se deslizará a lo largo de los límites de las estructuras de control. El movimiento del sistema a medida que se desliza a lo largo de estos límites se denomina modo deslizante [1] y el lugar geométrico que consiste en los límites se denomina (hiper)superficie deslizante . En el contexto de la teoría de control moderna, cualquier sistema de estructura variable , como un sistema bajo SMC, puede verse como un caso especial de un sistema dinámico híbrido ya que el sistema fluye a través de un espacio de estados continuo pero también se mueve a través de diferentes modos de control discretos.

Introducción

Figura 1: Trayectoria del plano de fase de un sistema que se estabiliza mediante un controlador de modo deslizante. Después de la fase de alcance inicial, el sistema se "desliza" a lo largo de la línea . Se elige la superficie particular porque tiene una dinámica de orden reducido deseable cuando se la restringe. En este caso, la superficie corresponde al sistema LTI de primer orden , que tiene un origen exponencialmente estable . s = 0 {\estilo de visualización s=0} s = 0 {\estilo de visualización s=0} s = incógnita 1 + incógnita ˙ 1 = 0 {\displaystyle s=x_{1}+{\punto {x}}_{1}=0} incógnita ˙ 1 = incógnita 1 {\displaystyle {\punto {x}}_{1}=-x_{1}}

La Figura 1 muestra un ejemplo de trayectoria de un sistema bajo control de modo deslizante. La superficie deslizante se describe mediante , y el modo deslizante a lo largo de la superficie comienza después del tiempo finito en el que las trayectorias del sistema han alcanzado la superficie. En la descripción teórica de los modos deslizantes, el sistema permanece confinado a la superficie deslizante y solo necesita verse deslizándose a lo largo de la superficie. Sin embargo, las implementaciones reales del control de modo deslizante se aproximan a este comportamiento teórico con una señal de control de conmutación de alta frecuencia y generalmente no determinista que hace que el sistema "vibre" [nb 1] en un vecindario estrecho de la superficie deslizante. El vibrocombustión se puede reducir mediante el uso de bandas muertas o capas límite alrededor de la superficie deslizante u otros métodos compensatorios. Aunque el sistema es no lineal en general, el comportamiento idealizado (es decir, sin vibrocombustión) del sistema en la Figura 1 cuando está confinado a la superficie es un sistema LTI con un origen exponencialmente estable . Uno de los métodos compensatorios es el método de control de modo deslizante adaptativo propuesto en [2] [3] que utiliza la incertidumbre estimada para construir una ley de control continua. En este método se elimina el traqueteo mientras se preserva la precisión (para más detalles, consulte las referencias [2] y [3]). Las tres características distintivas del controlador de modo deslizante adaptativo propuesto son las siguientes: (i) Las incertidumbres estructuradas (o paramétricas) y las incertidumbres no estructuradas (dinámica no modelada, perturbaciones externas desconocidas) se sintetizan en un solo término de incertidumbre de tipo llamado incertidumbre acumulada. Por lo tanto, no se requiere un modelo dinámico linealmente parametrizado del sistema, y ​​la estructura simple y las propiedades computacionalmente eficientes de este enfoque lo hacen adecuado para las aplicaciones de control en tiempo real. (ii) El diseño del esquema de control de modo deslizante adaptativo se basa en el vector de incertidumbre estimado en línea en lugar de depender del peor escenario posible (es decir, límites de incertidumbres). Por lo tanto, no se requiere un conocimiento a priori de los límites de incertidumbres, y en cada instante de tiempo, la entrada de control compensa la incertidumbre que existe. (iii) La ley de control continuo desarrollada utilizando los fundamentos de la teoría de control de modo deslizante elimina los fenómenos de vibración sin compensar el rendimiento y la robustez, lo cual es frecuente en el enfoque de capa límite. s = 0 {\estilo de visualización s=0} s = 0 {\estilo de visualización s=0}

Intuitivamente, el control de modo deslizante utiliza una ganancia prácticamente infinita para forzar las trayectorias de un sistema dinámico a deslizarse a lo largo del subespacio de modo deslizante restringido. Las trayectorias de este modo deslizante de orden reducido tienen propiedades deseables (por ejemplo, el sistema se desliza naturalmente a lo largo de él hasta que llega al reposo en un equilibrio deseado ). La principal fortaleza del control de modo deslizante es su robustez . Debido a que el control puede ser tan simple como un cambio entre dos estados (por ejemplo, "encendido"/"apagado" o "adelante"/"atrás"), no necesita ser preciso y no será sensible a las variaciones de parámetros que ingresan al canal de control. Además, debido a que la ley de control no es una función continua , el modo deslizante se puede alcanzar en un tiempo finito (es decir, mejor que el comportamiento asintótico). Bajo ciertas condiciones comunes, la optimalidad requiere el uso del control bang-bang ; por lo tanto, el control de modo deslizante describe el controlador óptimo para un amplio conjunto de sistemas dinámicos.

Una aplicación del controlador de modo deslizante es el control de accionamientos eléctricos operados por convertidores de potencia conmutados. [4] : "Introducción"  Debido al modo de funcionamiento discontinuo de esos convertidores, un controlador de modo deslizante discontinuo es una opción de implementación natural en lugar de los controladores continuos que pueden necesitar ser aplicados por medio de modulación de ancho de pulso o una técnica similar [nb 2] de aplicar una señal continua a una salida que solo puede tomar estados discretos. El control de modo deslizante tiene muchas aplicaciones en robótica. En particular, este algoritmo de control se ha utilizado para el control de seguimiento de buques de superficie no tripulados en mares agitados simulados con un alto grado de éxito. [5] [6]

El control en modo deslizante debe aplicarse con más cuidado que otras formas de control no lineal que tienen una acción de control más moderada. En particular, debido a que los actuadores tienen retrasos y otras imperfecciones, la acción de control en modo deslizante dura puede provocar vibraciones, pérdida de energía, daños a la planta y excitación de dinámicas no modeladas. [7] : 554–556  Los métodos de diseño de control continuo no son tan susceptibles a estos problemas y se pueden hacer para imitar a los controladores en modo deslizante. [7] : 556–563 

Esquema de control

Consideremos un sistema dinámico no lineal descrito por

incógnita ˙ ( a ) = F ( incógnita , a ) + B ( incógnita , a ) ( a ) {\displaystyle {\dot {\mathbf {x}}(t)=f(\mathbf {x},t)+B(\mathbf {x},t)\,\mathbf {u} (t)} ( 1 )

dónde

incógnita ( a ) [ incógnita 1 ( a ) incógnita 2 ( a ) incógnita norte 1 ( a ) incógnita norte ( a ) ] R norte {\displaystyle \mathbf {x} (t)\triangleq {\begin{bmatrix}x_{1}(t)\\x_{2}(t)\\\vpuntos \\x_{n-1}(t)\\x_{n}(t)\end{bmatrix}}\in \mathbb {R} ^{n}}

es un vector de estado n -dimensional y

( a ) [ 1 ( a ) 2 ( a ) metro 1 ( a ) metro ( a ) ] R metro {\displaystyle \mathbf {u} (t)\triangleq {\begin{bmatrix}u_{1}(t)\\u_{2}(t)\\\vdots \\u_{m-1}(t)\\u_{m}(t)\end{bmatrix}}\in \mathbb {R} ^{m}}

es un vector de entrada m -dimensional que se utilizará para la retroalimentación de estado . Se supone que las funciones y son continuas y suficientemente suaves para que se pueda utilizar el teorema de Picard-Lindelöf para garantizar que la solución de la ecuación ( 1 ) exista y sea única . F : R norte × R R norte {\displaystyle f:\mathbb {R} ^{n}\times \mathbb {R} \to \mathbb {R} ^{n}} B : R norte × R R norte × metro {\displaystyle B:\mathbb {R} ^{n}\times \mathbb {R} \to \mathbb {R} ^{n\times m}} incógnita ( a ) {\displaystyle \mathbf {x} (t)}

Una tarea común es diseñar una ley de control de retroalimentación de estado (es decir, una aplicación del estado actual en el tiempo t a la entrada ) para estabilizar el sistema dinámico en la ecuación ( 1 ) alrededor del origen . Es decir, bajo la ley de control, siempre que el sistema se aleje del origen, volverá a él. Por ejemplo, el componente del vector de estado puede representar la diferencia entre una salida y una señal conocida (por ejemplo, una señal sinusoidal deseable); si el control puede asegurar que vuelve rápidamente a , entonces la salida seguirá la sinusoide deseada. En el control de modo deslizante, el diseñador sabe que el sistema se comporta de manera deseable (por ejemplo, tiene un equilibrio estable ) siempre que esté restringido a un subespacio de su espacio de configuración . El control de modo deslizante fuerza las trayectorias del sistema hacia este subespacio y luego las mantiene allí para que se deslicen a lo largo de él. Este subespacio de orden reducido se denomina superficie (hiper)deslizante y, cuando la retroalimentación de bucle cerrado obliga a las trayectorias a deslizarse a lo largo de él, se denomina modo deslizante del sistema de bucle cerrado. Las trayectorias a lo largo de este subespacio se pueden comparar con las trayectorias a lo largo de vectores propios (es decir, modos) de los sistemas LTI ; sin embargo, el modo deslizante se impone al plegar el campo vectorial con retroalimentación de alta ganancia. Como una canica que rueda a lo largo de una grieta, las trayectorias se limitan al modo deslizante. ( incógnita ( a ) ) {\displaystyle \mathbf {u} (\mathbf {x} (t))} incógnita ( a ) {\displaystyle \mathbf {x} (t)} {\displaystyle \mathbf {u}} incógnita = [ 0 , 0 , , 0 ] {\displaystyle \mathbf {x} =[0,0,\ldots ,0]^{\intercal }} incógnita 1 estilo de visualización x_{1}} incógnita {\displaystyle \mathbf {x}} {\displaystyle \mathbf {u}} incógnita 1 estilo de visualización x_{1}} incógnita 1 = 0 {\displaystyle x_{1}=0}

El esquema de control de modo deslizante implica

  1. Selección de una hipersuperficie o una variedad (es decir, la superficie deslizante) tal que la trayectoria del sistema exhiba un comportamiento deseable cuando se limita a esta variedad.
  2. Encontrar ganancias de retroalimentación para que la trayectoria del sistema se cruce y permanezca en el colector.

Debido a que las leyes de control del modo deslizante no son continuas , tiene la capacidad de conducir trayectorias al modo deslizante en un tiempo finito (es decir, la estabilidad de la superficie deslizante es mejor que la asintótica). Sin embargo, una vez que las trayectorias alcanzan la superficie deslizante, el sistema adquiere el carácter del modo deslizante (por ejemplo, el origen solo puede tener estabilidad asintótica en esta superficie). incógnita = 0 {\displaystyle \mathbf {x} =\mathbf {0} }

El diseñador del modo deslizante elige una función de conmutación que representa un tipo de "distancia" a la que se encuentran los estados respecto de una superficie deslizante. σ : R norte R metro {\displaystyle \sigma :\mathbb {R} ^{n}\to \mathbb {R} ^{m}} incógnita {\displaystyle \mathbf {x}}

  • Un estado que está fuera de esta superficie deslizante tiene . incógnita {\displaystyle \mathbf {x}} σ ( incógnita ) 0 {\displaystyle \sigma (\mathbf {x} )\neq 0}
  • Un estado que se encuentra en esta superficie deslizante tiene . σ ( incógnita ) = 0 {\displaystyle \sigma(\mathbf{x})=0}

La ley de control del modo deslizante cambia de un estado a otro en función del signo de esta distancia. Por lo tanto, el control del modo deslizante actúa como una presión rígida que siempre empuja en la dirección del modo deslizante donde . Las trayectorias deseables se acercarán a la superficie deslizante y, como la ley de control no es continua (es decir, cambia de un estado a otro a medida que las trayectorias se mueven a través de esta superficie), la superficie se alcanza en un tiempo finito. Una vez que una trayectoria llega a la superficie, se deslizará a lo largo de ella y puede, por ejemplo, moverse hacia el origen. Por lo tanto, la función de conmutación es como un mapa topográfico con un contorno de altura constante a lo largo del cual se fuerzan a moverse las trayectorias. σ ( incógnita ) = 0 {\displaystyle \sigma(\mathbf{x})=0} incógnita ( a ) {\displaystyle \mathbf {x} (t)} incógnita = 0 {\displaystyle \mathbf {x} =\mathbf {0} }

La superficie/variedad deslizante (hiper) suele tener una dimensión donde n es el número de estados en y m es el número de señales de entrada (es decir, señales de control) en . Para cada índice de control , existe una superficie deslizante -dimensional dada por norte metro {\estilo de visualización nm} incógnita {\displaystyle \mathbf {x}} {\displaystyle \mathbf {u}} 1 a metro {\displaystyle 1\leq k\leq m} ( norte 1 ) {\estilo de visualización (n-1)}

{ incógnita R norte : σ a ( incógnita ) = 0 } {\displaystyle \left\{\mathbf {x} \in \mathbb {R} ^{n}:\sigma _{k}(\mathbf {x} )=0\right\}} ( 2 )

La parte vital del diseño de SMC es elegir una ley de control de modo que el modo deslizante (es decir, esta superficie dada por ) exista y sea alcanzable a lo largo de las trayectorias del sistema. El principio del control del modo deslizante es restringir forzosamente el sistema, mediante una estrategia de control adecuada, para que permanezca en la superficie deslizante en la que el sistema exhibirá características deseables. Cuando el sistema está restringido por el control deslizante para permanecer en la superficie deslizante, la dinámica del sistema está gobernada por el sistema de orden reducido obtenido a partir de la ecuación ( 2 ). σ ( incógnita ) = 0 {\displaystyle \sigma (\mathbf {x} )=\mathbf {0} }

Para forzar que los estados del sistema satisfagan , se debe: incógnita {\displaystyle \mathbf {x}} σ ( incógnita ) = 0 {\displaystyle \sigma (\mathbf {x} )=\mathbf {0} }

  1. Asegúrese de que el sistema sea capaz de alcanzar cualquier condición inicial. σ ( incógnita ) = 0 {\displaystyle \sigma (\mathbf {x} )=\mathbf {0} }
  2. Una vez alcanzado , la acción de control es capaz de mantener el sistema en σ ( incógnita ) = 0 {\displaystyle \sigma (\mathbf {x} )=\mathbf {0} } σ ( incógnita ) = 0 {\displaystyle \sigma (\mathbf {x} )=\mathbf {0} }

Existencia de soluciones de circuito cerrado

Tenga en cuenta que debido a que la ley de control no es continua , ciertamente no es localmente Lipschitz continua , y por lo tanto la existencia y unicidad de las soluciones para el sistema de bucle cerrado no está garantizada por el teorema de Picard-Lindelöf . Por lo tanto, las soluciones deben entenderse en el sentido de Filippov . [1] [8] En términos generales, el sistema de bucle cerrado resultante que se mueve se aproxima por la dinámica suave ; sin embargo, este comportamiento suave puede no ser verdaderamente realizable. De manera similar, la modulación de ancho de pulso de alta velocidad o la modulación delta-sigma produce salidas que solo asumen dos estados, pero la salida efectiva oscila a través de un rango continuo de movimiento. Estas complicaciones se pueden evitar utilizando un método de diseño de control no lineal diferente que produzca un controlador continuo. En algunos casos, los diseños de control de modo deslizante se pueden aproximar mediante otros diseños de control continuo. [7] σ ( incógnita ) = 0 {\displaystyle \sigma (\mathbf {x} )=\mathbf {0} } σ ˙ ( incógnita ) = 0 ; {\displaystyle {\dot {\sigma }}(\mathbf {x} )=\mathbf {0} ;}

Fundamentación teórica

Los siguientes teoremas forman la base del control de estructura variable.

Teorema 1: Existencia del modo deslizante

Consideremos un candidato a función de Lyapunov

V ( σ ( incógnita ) ) = 1 2 σ ( incógnita ) σ ( incógnita ) = 1 2 " σ ( incógnita ) " 2 2 {\displaystyle V(\sigma (\mathbf {x} ))={\frac {1}{2}}\sigma ^{\intercal }(\mathbf {x} )\sigma (\mathbf {x} )= {\frac {1}{2}}\|\sigma (\mathbf {x} )\|_{2}^{2}} ( 3 )

donde es la norma euclidiana (es decir, es la distancia desde la variedad deslizante donde ). Para el sistema dado por la ecuación ( 1 ) y la superficie deslizante dada por la ecuación ( 2 ), una condición suficiente para la existencia de un modo deslizante es que " " {\displaystyle \|{\mathord {\cdot }}\|} " σ ( incógnita ) " 2 {\displaystyle \|\sigma(\mathbf {x})\|_{2}} σ ( incógnita ) = 0 {\displaystyle \sigma (\mathbf {x} )=\mathbf {0} }

σ V σ σ ˙ d σ d a d V d a < 0 (es decir,  d V d a < 0 ) {\displaystyle \underbrace {\overbrace {\sigma ^{\intercal }} ^{\tfrac {\partial V}{\partial \sigma }}\overbrace {\dot {\sigma }} ^{\tfrac {\operatorname {d} \sigma }{\operatorname {d} t}}} _{\tfrac {\operatorname {d} V}{\operatorname {d} t}}<0\qquad {\text{(es decir, }}{\tfrac {\operatorname {d} V}{\operatorname {d} t}}<0{\text{)}}}

en un vecindario de la superficie dada por . σ ( incógnita ) = 0 {\displaystyle \sigma(\mathbf{x})=0}

En términos generales (es decir, para el caso de control escalar cuando ), para lograr , se elige la ley de control de retroalimentación de modo que y tengan signos opuestos. Es decir, metro = 1 {\estilo de visualización m=1} σ σ ˙ < 0 {\displaystyle \sigma ^{\intercal }{\dot {\sigma }}<0} ( incógnita ) {\displaystyle u(\mathbf {x} )} σ {\estilo de visualización \sigma} σ ˙ {\displaystyle {\punto {\sigma}}}

  • ( incógnita ) {\displaystyle u(\mathbf {x} )} hace negativo cuando es positivo. σ ˙ ( incógnita ) {\displaystyle {\punto {\sigma}}(\mathbf {x} )} σ ( incógnita ) {\displaystyle \sigma (\mathbf {x} )}
  • ( incógnita ) {\displaystyle u(\mathbf {x} )} hace positivo cuando es negativo σ ˙ ( incógnita ) {\displaystyle {\punto {\sigma}}(\mathbf {x} )} σ ( incógnita ) {\displaystyle \sigma (\mathbf {x} )}

Tenga en cuenta que

σ ˙ = σ incógnita incógnita ˙ d incógnita d a = σ incógnita ( F ( incógnita , a ) + B ( incógnita , a ) ) incógnita ˙ {\displaystyle {\dot {\sigma }}={\frac {\partial \sigma }{\partial \mathbf {x} }}\overbrace {\dot {\mathbf {x} }} ^{\tfrac {\operatorname {d} \mathbf {x} }{\operatorname {d} t}}={\frac {\partial \sigma }{\partial \mathbf {x} }}\overbrace {\left(f(\mathbf {x} ,t)+B(\mathbf {x} ,t)\mathbf {u} \right)} ^{\dot {\mathbf {x} }}}

y por lo tanto la ley de control de retroalimentación tiene un impacto directo en . u ( x ) {\displaystyle \mathbf {u} (\mathbf {x} )} σ ˙ {\displaystyle {\dot {\sigma }}}

Alcance: obtención de una variedad deslizante en tiempo finito

Para garantizar que el modo deslizante se alcance en un tiempo finito, debe estar más fuertemente acotado alejándose de cero. Es decir, si se desvanece demasiado rápido, la atracción hacia el modo deslizante solo será asintótica. Para garantizar que se ingrese al modo deslizante en un tiempo finito, [9] σ ( x ) = 0 {\displaystyle \sigma (\mathbf {x} )=\mathbf {0} } d V / d t {\displaystyle \operatorname {d} V/{\operatorname {d} t}}

d V d t μ ( V ) α {\displaystyle {\frac {\operatorname {d} V}{\operatorname {d} t}}\leq -\mu ({\sqrt {V}})^{\alpha }}

donde y son constantes. μ > 0 {\displaystyle \mu >0} 0 < α 1 {\displaystyle 0<\alpha \leq 1}

Explicación por lema de comparación

Esta condición asegura que para la vecindad del modo deslizante , V [ 0 , 1 ] {\displaystyle V\in [0,1]}

d V d t μ ( V ) α μ V . {\displaystyle {\frac {\operatorname {d} V}{\operatorname {d} t}}\leq -\mu ({\sqrt {V}})^{\alpha }\leq -\mu {\sqrt {V}}.}

Entonces, para , V ( 0 , 1 ] {\displaystyle V\in (0,1]}

1 V d V d t μ , {\displaystyle {\frac {1}{\sqrt {V}}}{\frac {\operatorname {d} V}{\operatorname {d} t}}\leq -\mu ,}

lo cual, por la regla de la cadena (es decir, con ), significa d W / d t {\displaystyle \operatorname {d} W/{\operatorname {d} t}} W 2 V {\displaystyle W\triangleq 2{\sqrt {V}}}

D + ( 2 V σ 2 W ) D + W Upper right-hand  W ˙ = 1 V d V d t μ {\displaystyle {\mathord {\underbrace {D^{+}{\Bigl (}{\mathord {\underbrace {2{\mathord {\overbrace {\sqrt {V}} ^{{}\propto \|\sigma \|_{2}}}}} _{W}}}{\Bigr )}} _{D^{+}W\,\triangleq \,{\mathord {{\text{Upper right-hand }}{\dot {W}}}}}}}={\frac {1}{\sqrt {V}}}{\frac {\operatorname {d} V}{\operatorname {d} t}}\leq -\mu }

donde es la derivada superior derecha de y el símbolo denota proporcionalidad . Entonces, en comparación con la curva que está representada por la ecuación diferencial con condición inicial , debe ser el caso que para todo t . Además, debido a que , debe alcanzar en un tiempo finito, lo que significa que V debe alcanzar (es decir, el sistema ingresa al modo deslizante) en un tiempo finito. [7] Debido a que es proporcional a la norma euclidiana de la función de conmutación , este resultado implica que la tasa de aproximación al modo deslizante debe estar firmemente acotada lejos de cero. D + {\displaystyle D^{+}} 2 V {\displaystyle 2{\sqrt {V}}} {\displaystyle \propto } z ( t ) = z 0 μ t {\displaystyle z(t)=z_{0}-\mu t} z ˙ = μ {\displaystyle {\dot {z}}=-\mu } z ( 0 ) = z 0 {\displaystyle z(0)=z_{0}} 2 V ( t ) V 0 μ t {\displaystyle 2{\sqrt {V(t)}}\leq V_{0}-\mu t} V 0 {\displaystyle {\sqrt {V}}\geq 0} V {\displaystyle {\sqrt {V}}} V = 0 {\displaystyle {\sqrt {V}}=0} V = 0 {\displaystyle V=0} V {\displaystyle {\sqrt {V}}} 2 {\displaystyle \|{\mathord {\cdot }}\|_{2}} σ {\displaystyle \sigma }

Consecuencias del control en modo deslizante

En el contexto del control del modo deslizante, esta condición significa que

σ V σ σ ˙ d σ d t d V d t μ ( σ 2 V ) α {\displaystyle \underbrace {\overbrace {\sigma ^{\intercal }} ^{\tfrac {\partial V}{\partial \sigma }}\overbrace {\dot {\sigma }} ^{\tfrac {\operatorname {d} \sigma }{\operatorname {d} t}}} _{\tfrac {\operatorname {d} V}{\operatorname {d} t}}\leq -\mu ({\mathord {\overbrace {\|\sigma \|_{2}} ^{\sqrt {V}}}})^{\alpha }}

donde es la norma euclidiana . Para el caso en que la función de conmutación tiene un valor escalar, la condición suficiente se convierte en {\displaystyle \|{\mathord {\cdot }}\|} σ {\displaystyle \sigma }

σ σ ˙ μ | σ | α {\displaystyle \sigma {\dot {\sigma }}\leq -\mu |\sigma |^{\alpha }} .

Tomando , la condición escalar suficiente se convierte en α = 1 {\displaystyle \alpha =1}

sgn ( σ ) σ ˙ μ {\displaystyle \operatorname {sgn} (\sigma ){\dot {\sigma }}\leq -\mu }

lo cual es equivalente a la condición de que

sgn ( σ ) sgn ( σ ˙ ) and | σ ˙ | μ > 0 {\displaystyle \operatorname {sgn} (\sigma )\neq \operatorname {sgn} ({\dot {\sigma }})\qquad {\text{and}}\qquad |{\dot {\sigma }}|\geq \mu >0} .

Es decir, el sistema siempre debe estar moviéndose hacia la superficie de conmutación y su velocidad hacia la superficie de conmutación debe tener un límite inferior distinto de cero. Por lo tanto, aunque puede volverse extremadamente pequeño a medida que se acerca a la superficie, siempre debe estar acotado firmemente lejos de cero. Para garantizar esta condición, los controladores de modo deslizante son discontinuos a lo largo de la variedad; cambian de un valor distinto de cero a otro a medida que las trayectorias cruzan la variedad. σ = 0 {\displaystyle \sigma =0} | σ ˙ | {\displaystyle |{\dot {\sigma }}|} σ {\displaystyle \sigma } x {\displaystyle \mathbf {x} } σ ( x ) = 0 {\displaystyle \sigma (\mathbf {x} )=\mathbf {0} } σ ˙ {\displaystyle {\dot {\sigma }}} σ = 0 {\displaystyle \sigma =0}

Teorema 2: Región de atracción

Para el sistema dado por la ecuación ( 1 ) y la superficie deslizante dada por la ecuación ( 2 ), el subespacio para el cual la superficie es alcanzable está dado por { x R n : σ ( x ) = 0 } {\displaystyle \{\mathbf {x} \in \mathbb {R} ^{n}:\sigma (\mathbf {x} )=\mathbf {0} \}}

{ x R n : σ ( x ) σ ˙ ( x ) < 0 } {\displaystyle \{\mathbf {x} \in \mathbb {R} ^{n}:\sigma ^{\intercal }(\mathbf {x} ){\dot {\sigma }}(\mathbf {x} )<0\}}

Es decir, cuando las condiciones iniciales provienen completamente de este espacio, la función de Lyapunov candidata es una función de Lyapunov y las trayectorias seguramente se moverán hacia la superficie del modo deslizante donde . Además, si se satisfacen las condiciones de alcanzabilidad del Teorema 1, el modo deslizante entrará en la región donde está más fuertemente acotado lejos de cero en tiempo finito. Por lo tanto, el modo deslizante se alcanzará en tiempo finito. V ( σ ) {\displaystyle V(\sigma )} x {\displaystyle \mathbf {x} } σ ( x ) = 0 {\displaystyle \sigma (\mathbf {x} )=\mathbf {0} } V ˙ {\displaystyle {\dot {V}}} σ = 0 {\displaystyle \sigma =0}

Teorema 3: Movimiento deslizante

Dejar

σ x B ( x , t ) {\displaystyle {\frac {\partial \sigma }{\partial {\mathbf {x} }}}B(\mathbf {x} ,t)}

ser no singular . Es decir, el sistema tiene un tipo de controlabilidad que garantiza que siempre haya un control que pueda mover una trayectoria para acercarse al modo deslizante. Entonces, una vez que se alcanza el modo deslizante donde, el sistema permanecerá en ese modo deslizante. A lo largo de las trayectorias del modo deslizante, es constante, por lo que las trayectorias del modo deslizante se describen mediante la ecuación diferencial σ ( x ) = 0 {\displaystyle \sigma (\mathbf {x} )=\mathbf {0} } σ ( x ) {\displaystyle \sigma (\mathbf {x} )}

σ ˙ = 0 {\displaystyle {\dot {\sigma }}=\mathbf {0} } .

Si un equilibrio es estable con respecto a esta ecuación diferencial, entonces el sistema se deslizará a lo largo de la superficie del modo deslizante hacia el equilibrio . x {\displaystyle \mathbf {x} }

La ley de control equivalente en el modo deslizante se puede encontrar resolviendo

σ ˙ ( x ) = 0 {\displaystyle {\dot {\sigma }}(\mathbf {x} )=0}

para la ley de control equivalente . Es decir, u ( x ) {\displaystyle \mathbf {u} (\mathbf {x} )}

σ x ( f ( x , t ) + B ( x , t ) u ) x ˙ = 0 {\displaystyle {\frac {\partial \sigma }{\partial \mathbf {x} }}\overbrace {\left(f(\mathbf {x} ,t)+B(\mathbf {x} ,t)\mathbf {u} \right)} ^{\dot {\mathbf {x} }}=\mathbf {0} }

y por lo tanto el control equivalente

u = ( σ x B ( x , t ) ) 1 σ x f ( x , t ) {\displaystyle \mathbf {u} =-\left({\frac {\partial \sigma }{\partial \mathbf {x} }}B(\mathbf {x} ,t)\right)^{-1}{\frac {\partial \sigma }{\partial \mathbf {x} }}f(\mathbf {x} ,t)}

Es decir, aunque el control real no es continuo , el cambio rápido a través del modo deslizante obliga al sistema a actuar como si fuera impulsado por este control continuo. u {\displaystyle \mathbf {u} } σ ( x ) = 0 {\displaystyle \sigma (\mathbf {x} )=\mathbf {0} }

De la misma manera, las trayectorias del sistema en el modo deslizante se comportan como si

x ˙ = f ( x , t ) B ( x , t ) ( σ x B ( x , t ) ) 1 σ x f ( x , t ) f ( x , t ) + B ( x , t ) u = f ( x , t ) ( I B ( x , t ) ( σ x B ( x , t ) ) 1 σ x ) {\displaystyle {\dot {\mathbf {x} }}=\overbrace {f(\mathbf {x} ,t)-B(\mathbf {x} ,t)\left({\frac {\partial \sigma }{\partial \mathbf {x} }}B(\mathbf {x} ,t)\right)^{-1}{\frac {\partial \sigma }{\partial \mathbf {x} }}f(\mathbf {x} ,t)} ^{f(\mathbf {x} ,t)+B(\mathbf {x} ,t)u}=f(\mathbf {x} ,t)\left(\mathbf {I} -B(\mathbf {x} ,t)\left({\frac {\partial \sigma }{\partial \mathbf {x} }}B(\mathbf {x} ,t)\right)^{-1}{\frac {\partial \sigma }{\partial \mathbf {x} }}\right)}

El sistema resultante coincide con la ecuación diferencial del modo deslizante.

σ ˙ ( x ) = 0 {\displaystyle {\dot {\sigma }}(\mathbf {x} )=\mathbf {0} }

, la superficie del modo deslizante y las condiciones de trayectoria de la fase de alcance ahora se reducen a la condición más simple derivada anteriormente. Por lo tanto, se puede suponer que el sistema sigue la condición más simple después de algún transitorio inicial durante el período mientras el sistema encuentra el modo deslizante. El mismo movimiento se mantiene aproximadamente cuando la igualdad solo se cumple aproximadamente. σ ( x ) = 0 {\displaystyle \sigma (\mathbf {x} )=\mathbf {0} } σ ˙ = 0 {\displaystyle {\dot {\sigma }}=0} σ ( x ) = 0 {\displaystyle \sigma (\mathbf {x} )=\mathbf {0} }

De estos teoremas se desprende que el movimiento deslizante es invariante (es decir, insensible) a perturbaciones suficientemente pequeñas que entran en el sistema a través del canal de control. Es decir, siempre que el control sea lo suficientemente grande para garantizar que y esté uniformemente acotado a partir de cero, el modo deslizante se mantendrá como si no hubiera perturbaciones. La propiedad de invariancia del control del modo deslizante ante ciertas perturbaciones e incertidumbres del modelo es su característica más atractiva; es muy robusto . σ σ ˙ < 0 {\displaystyle \sigma ^{\intercal }{\dot {\sigma }}<0} σ ˙ {\displaystyle {\dot {\sigma }}}

Como se analiza en un ejemplo a continuación, una ley de control de modo deslizante puede mantener la restricción

x ˙ + x = 0 {\displaystyle {\dot {x}}+x=0}

para estabilizar asintóticamente cualquier sistema de la forma

x ¨ = a ( t , x , x ˙ ) + u {\displaystyle {\ddot {x}}=a(t,x,{\dot {x}})+u}

cuando tiene un límite superior finito. En este caso, el modo deslizante es donde a ( ) {\displaystyle a(\cdot )}

x ˙ = x {\displaystyle {\dot {x}}=-x}

(es decir, donde ). Es decir, cuando el sistema está restringido de esta manera, se comporta como un sistema lineal estable simple y, por lo tanto, tiene un equilibrio globalmente exponencialmente estable en el origen. x ˙ + x = 0 {\displaystyle {\dot {x}}+x=0} ( x , x ˙ ) = ( 0 , 0 ) {\displaystyle (x,{\dot {x}})=(0,0)}

Ejemplos de diseño de control

  • Considere una planta descrita por la ecuación ( 1 ) con una sola entrada u (es decir, ). La función de conmutación se elige como la combinación lineal m = 1 {\displaystyle m=1}
σ ( x ) s 1 x 1 + s 2 x 2 + + s n 1 x n 1 + s n x n {\displaystyle \sigma (\mathbf {x} )\triangleq s_{1}x_{1}+s_{2}x_{2}+\cdots +s_{n-1}x_{n-1}+s_{n}x_{n}} ( 4 )
donde el peso para todos . La superficie deslizante es el símplex donde . Cuando las trayectorias se ven obligadas a deslizarse a lo largo de esta superficie, s i > 0 {\displaystyle s_{i}>0} 1 i n {\displaystyle 1\leq i\leq n} σ ( x ) = 0 {\displaystyle \sigma (\mathbf {x} )=0}
σ ˙ ( x ) = 0 {\displaystyle {\dot {\sigma }}(\mathbf {x} )=0}
y entonces
s 1 x ˙ 1 + s 2 x ˙ 2 + + s n 1 x ˙ n 1 + s n x ˙ n = 0 {\displaystyle s_{1}{\dot {x}}_{1}+s_{2}{\dot {x}}_{2}+\cdots +s_{n-1}{\dot {x}}_{n-1}+s_{n}{\dot {x}}_{n}=0}
que es un sistema de orden reducido (es decir, el nuevo sistema es de orden porque el sistema está restringido a este simplex de modo deslizante de dimensión 1). Esta superficie puede tener propiedades favorables (por ejemplo, cuando la dinámica de la planta se ve obligada a deslizarse a lo largo de esta superficie, se mueve hacia el origen ). Tomando la derivada de la función de Lyapunov en la ecuación ( 3 ), tenemos n 1 {\displaystyle n-1} ( n 1 ) {\displaystyle (n-1)} x = 0 {\displaystyle \mathbf {x} =\mathbf {0} }
V ˙ ( σ ( x ) ) = σ ( x ) T V x σ ˙ ( x ) d σ d t {\displaystyle {\dot {V}}(\sigma (\mathbf {x} ))=\overbrace {\sigma (\mathbf {x} )^{\text{T}}} ^{\tfrac {\partial V}{\partial \mathbf {x} }}\overbrace {{\dot {\sigma }}(\mathbf {x} )} ^{\tfrac {\operatorname {d} \sigma }{\operatorname {d} t}}}
Para garantizarlo , la ley de control de retroalimentación debe elegirse de manera que V ˙ < 0 {\displaystyle {\dot {V}}<0} u ( x ) {\displaystyle u(\mathbf {x} )}
{ σ ˙ < 0 if  σ > 0 σ ˙ > 0 if  σ < 0 {\displaystyle {\begin{cases}{\dot {\sigma }}<0&{\text{if }}\sigma >0\\{\dot {\sigma }}>0&{\text{if }}\sigma <0\end{cases}}}
Por lo tanto, el producto, ya que es el producto de un número negativo y uno positivo. Nótese que σ σ ˙ < 0 {\displaystyle \sigma {\dot {\sigma }}<0}
σ ˙ ( x ) = σ ( x ) x x ˙ σ ˙ ( x ) = σ ( x ) x ( f ( x , t ) + B ( x , t ) u ) x ˙ = [ s 1 , s 2 , , s n ] σ ( x ) x ( f ( x , t ) + B ( x , t ) u ) x ˙ ( i.e., an  n × 1  vector ) {\displaystyle {\dot {\sigma }}(\mathbf {x} )=\overbrace {{\frac {\partial {\sigma (\mathbf {x} )}}{\partial {\mathbf {x} }}}{\dot {\mathbf {x} }}} ^{{\dot {\sigma }}(\mathbf {x} )}={\frac {\partial {\sigma (\mathbf {x} )}}{\partial {\mathbf {x} }}}\overbrace {\left(f(\mathbf {x} ,t)+B(\mathbf {x} ,t)u\right)} ^{\dot {\mathbf {x} }}=\overbrace {[s_{1},s_{2},\ldots ,s_{n}]} ^{\frac {\partial {\sigma (\mathbf {x} )}}{\partial {\mathbf {x} }}}\underbrace {\overbrace {\left(f(\mathbf {x} ,t)+B(\mathbf {x} ,t)u\right)} ^{\dot {\mathbf {x} }}} _{{\text{( i.e., an }}n\times 1{\text{ vector )}}}} ( 5 )
La ley de control se elige de modo que u ( x ) {\displaystyle u(\mathbf {x} )}
u ( x ) = { u + ( x ) if  σ ( x ) > 0 u ( x ) if  σ ( x ) < 0 {\displaystyle u(\mathbf {x} )={\begin{cases}u^{+}(\mathbf {x} )&{\text{if }}\sigma (\mathbf {x} )>0\\u^{-}(\mathbf {x} )&{\text{if }}\sigma (\mathbf {x} )<0\end{cases}}}
dónde
  • u + ( x ) {\displaystyle u^{+}(\mathbf {x} )} es algún control (por ejemplo, posiblemente extremo, como "encendido" o "adelante") que garantiza que la ecuación ( 5 ) (es decir, ) sea negativa en σ ˙ {\displaystyle {\dot {\sigma }}} x {\displaystyle \mathbf {x} }
  • u ( x ) {\displaystyle u^{-}(\mathbf {x} )} es algún control (por ejemplo, posiblemente extremo, como "apagado" o "reverso") que garantiza que la ecuación ( 5 ) (es decir, ) sea positiva en σ ˙ {\displaystyle {\dot {\sigma }}} x {\displaystyle \mathbf {x} }
La trayectoria resultante debe moverse hacia la superficie deslizante donde . Debido a que los sistemas reales tienen retardo, las trayectorias del modo deslizante a menudo oscilan de un lado a otro a lo largo de esta superficie deslizante (es decir, la trayectoria verdadera puede no seguir suavemente , pero siempre regresará al modo deslizante después de abandonarlo). σ ( x ) = 0 {\displaystyle \sigma (\mathbf {x} )=0} σ ( x ) = 0 {\displaystyle \sigma (\mathbf {x} )=0}
x ¨ = a ( t , x , x ˙ ) + u {\displaystyle {\ddot {x}}=a(t,x,{\dot {x}})+u}
que puede expresarse en un espacio de estados bidimensional (con y ) como x 1 = x {\displaystyle x_{1}=x} x 2 = x ˙ {\displaystyle x_{2}={\dot {x}}}
{ x ˙ 1 = x 2 x ˙ 2 = a ( t , x 1 , x 2 ) + u {\displaystyle {\begin{cases}{\dot {x}}_{1}=x_{2}\\{\dot {x}}_{2}=a(t,x_{1},x_{2})+u\end{cases}}}
Supongamos también que (es decir, tiene un límite superior finito k que se conoce). Para este sistema, elija la función de conmutación sup { | a ( ) | } k {\displaystyle \sup\{|a(\cdot )|\}\leq k} | a | {\displaystyle |a|}
σ ( x 1 , x 2 ) = x 1 + x 2 = x + x ˙ {\displaystyle \sigma (x_{1},x_{2})=x_{1}+x_{2}=x+{\dot {x}}}
En el ejemplo anterior, debemos elegir la ley de control de retroalimentación de manera que . Aquí, u ( x , x ˙ ) {\displaystyle u(x,{\dot {x}})} σ σ ˙ < 0 {\displaystyle \sigma {\dot {\sigma }}<0}
σ ˙ = x ˙ 1 + x ˙ 2 = x ˙ + x ¨ = x ˙ + a ( t , x , x ˙ ) + u x ¨ {\displaystyle {\dot {\sigma }}={\dot {x}}_{1}+{\dot {x}}_{2}={\dot {x}}+{\ddot {x}}={\dot {x}}\,+\,\overbrace {a(t,x,{\dot {x}})+u} ^{\ddot {x}}}
  • Cuando (es decir, cuando ), para hacer , la ley de control debe elegirse de manera que x + x ˙ < 0 {\displaystyle x+{\dot {x}}<0} σ < 0 {\displaystyle \sigma <0} σ ˙ > 0 {\displaystyle {\dot {\sigma }}>0} u > | x ˙ + a ( t , x , x ˙ ) | {\displaystyle u>|{\dot {x}}+a(t,x,{\dot {x}})|}
  • Cuando (es decir, cuando ), para hacer , la ley de control debe elegirse de manera que x + x ˙ > 0 {\displaystyle x+{\dot {x}}>0} σ > 0 {\displaystyle \sigma >0} σ ˙ < 0 {\displaystyle {\dot {\sigma }}<0} u < | x ˙ + a ( t , x , x ˙ ) | {\displaystyle u<-|{\dot {x}}+a(t,x,{\dot {x}})|}
Sin embargo, por la desigualdad triangular ,
| x ˙ | + | a ( t , x , x ˙ ) | | x ˙ + a ( t , x , x ˙ ) | {\displaystyle |{\dot {x}}|+|a(t,x,{\dot {x}})|\geq |{\dot {x}}+a(t,x,{\dot {x}})|}
y por la suposición acerca de , | a | {\displaystyle |a|}
| x ˙ | + k + 1 > | x ˙ | + | a ( t , x , x ˙ ) | {\displaystyle |{\dot {x}}|+k+1>|{\dot {x}}|+|a(t,x,{\dot {x}})|}
De esta manera, el sistema puede estabilizarse por retroalimentación (para volver al modo deslizante) mediante la ley de control.
u ( x , x ˙ ) = { | x ˙ | + k + 1 if  x + x ˙ < 0 , ( | x ˙ | + k + 1 ) if  x + x ˙ σ > 0 {\displaystyle u(x,{\dot {x}})={\begin{cases}|{\dot {x}}|+k+1&{\text{if }}\underbrace {x+{\dot {x}}} <0,\\-\left(|{\dot {x}}|+k+1\right)&{\text{if }}\overbrace {x+{\dot {x}}} ^{\sigma }>0\end{cases}}}
que puede expresarse en forma cerrada como
u ( x , x ˙ ) = ( | x ˙ | + k + 1 ) sgn ( x ˙ + x σ ) (i.e., tests  σ > 0 ) {\displaystyle u(x,{\dot {x}})=-(|{\dot {x}}|+k+1)\underbrace {\operatorname {sgn} (\overbrace {{\dot {x}}+x} ^{\sigma })} _{{\text{(i.e., tests }}\sigma >0{\text{)}}}}
Suponiendo que las trayectorias del sistema se ven obligadas a moverse de manera que , entonces σ ( x ) = 0 {\displaystyle \sigma (\mathbf {x} )=0}
x ˙ = x (i.e.,  σ ( x , x ˙ ) = x + x ˙ = 0 ) {\displaystyle {\dot {x}}=-x\qquad {\text{(i.e., }}\sigma (x,{\dot {x}})=x+{\dot {x}}=0{\text{)}}}
Así, una vez que el sistema alcanza el modo deslizante, la dinámica bidimensional del sistema se comporta como este sistema unidimensional, que tiene un equilibrio globalmente exponencialmente estable en . ( x , x ˙ ) = ( 0 , 0 ) {\displaystyle (x,{\dot {x}})=(0,0)}

Soluciones de diseño automatizadas

Aunque existen varias teorías para el diseño de sistemas de control de modo deslizante, no existe una metodología de diseño altamente efectiva debido a las dificultades prácticas que se encuentran en los métodos analíticos y numéricos. Sin embargo, se puede utilizar un paradigma computacional reutilizable, como un algoritmo genético , para transformar un "problema irresoluble" de diseño óptimo en un "problema polinomial no determinista" prácticamente solucionable. Esto da como resultado diseños automatizados por computadora para el control de modelos deslizantes. [10]

Observador en modo deslizante

El control de modo deslizante se puede utilizar en el diseño de observadores de estado . Estos observadores no lineales de alta ganancia tienen la capacidad de llevar las coordenadas de la dinámica del error del estimador a cero en un tiempo finito. Además, los observadores de modo conmutado tienen una atractiva resiliencia al ruido de medición que es similar a un filtro de Kalman . [11] [12] Para simplificar, el ejemplo aquí utiliza una modificación de modo deslizante tradicional de un observador de Luenberger para un sistema LTI . En estos observadores de modo deslizante, el orden de la dinámica del observador se reduce en uno cuando el sistema ingresa al modo deslizante. En este ejemplo particular, el error del estimador para un solo estado estimado se lleva a cero en un tiempo finito y, después de ese tiempo, los otros errores del estimador decaen exponencialmente a cero. Sin embargo, como lo describió por primera vez Drakunov, [13] se puede construir un observador de modo deslizante para sistemas no lineales que lleva el error de estimación para todos los estados estimados a cero en un tiempo finito (y arbitrariamente pequeño).

Aquí, consideremos el sistema LTI

{ x ˙ = A x + B u y = [ 1 0 0 ] x = x 1 {\displaystyle {\begin{cases}{\dot {\mathbf {x} }}=A\mathbf {x} +B\mathbf {u} \\y={\begin{bmatrix}1&0&0&\cdots &\end{bmatrix}}\mathbf {x} =x_{1}\end{cases}}}

donde el vector de estado , es un vector de entradas, y la salida y es un escalar igual al primer estado del vector de estado. Sea x ( x 1 , x 2 , , x n ) R n {\displaystyle \mathbf {x} \triangleq (x_{1},x_{2},\dots ,x_{n})\in \mathbb {R} ^{n}} u ( u 1 , u 2 , , u r ) R r {\displaystyle \mathbf {u} \triangleq (u_{1},u_{2},\dots ,u_{r})\in \mathbb {R} ^{r}} x {\displaystyle \mathbf {x} }

A [ a 11 A 12 A 21 A 22 ] {\displaystyle A\triangleq {\begin{bmatrix}a_{11}&A_{12}\\A_{21}&A_{22}\end{bmatrix}}}

dónde

  • a 11 {\displaystyle a_{11}} es un escalar que representa la influencia del primer estado sobre sí mismo, x 1 {\displaystyle x_{1}}
  • A 21 R ( n 1 ) {\displaystyle A_{21}\in \mathbb {R} ^{(n-1)}} es un vector de fila correspondiente a la influencia del primer estado sobre los demás estados,
  • A 22 R ( n 1 ) × ( n 1 ) {\displaystyle A_{22}\in \mathbb {R} ^{(n-1)\times (n-1)}} es una matriz que representa la influencia de los demás estados sobre sí mismos, y
  • A 12 R 1 × ( n 1 ) {\displaystyle A_{12}\in \mathbb {R} ^{1\times (n-1)}} es un vector de columna que representa la influencia de los otros estados en el primer estado.

El objetivo es diseñar un observador de estado de alta ganancia que estime el vector de estado utilizando solo información de la medición . Por lo tanto, sea el vector las estimaciones de los n estados. El observador toma la forma x {\displaystyle \mathbf {x} } y = x 1 {\displaystyle y=x_{1}} x ^ = ( x ^ 1 , x ^ 2 , , x ^ n ) R n {\displaystyle {\hat {\mathbf {x} }}=({\hat {x}}_{1},{\hat {x}}_{2},\dots ,{\hat {x}}_{n})\in \mathbb {R} ^{n}}

x ^ ˙ = A x ^ + B u + L v ( x ^ 1 x 1 ) {\displaystyle {\dot {\hat {\mathbf {x} }}}=A{\hat {\mathbf {x} }}+B\mathbf {u} +Lv({\hat {x}}_{1}-x_{1})}

donde es una función no lineal del error entre el estado estimado y la salida , y es un vector de ganancia del observador que cumple una función similar a la del observador lineal típico de Luenberger . Asimismo, sea v : R R {\displaystyle v:\mathbb {R} \to \mathbb {R} } x ^ 1 {\displaystyle {\hat {x}}_{1}} y = x 1 {\displaystyle y=x_{1}} L R n {\displaystyle L\in \mathbb {R} ^{n}}

L = [ 1 L 2 ] {\displaystyle L={\begin{bmatrix}-1\\L_{2}\end{bmatrix}}}

donde es un vector columna. Además, sea el error del estimador de estado. Es decir, . La dinámica del error es entonces L 2 R ( n 1 ) {\displaystyle L_{2}\in \mathbb {R} ^{(n-1)}} e = ( e 1 , e 2 , , e n ) R n {\displaystyle \mathbf {e} =(e_{1},e_{2},\dots ,e_{n})\in \mathbb {R} ^{n}} e = x ^ x {\displaystyle \mathbf {e} ={\hat {\mathbf {x} }}-\mathbf {x} }

e ˙ = x ^ ˙ x ˙ = A x ^ + B u + L v ( x ^ 1 x 1 ) A x B u = A ( x ^ x ) + L v ( x ^ 1 x 1 ) = A e + L v ( e 1 ) {\displaystyle {\begin{aligned}{\dot {\mathbf {e} }}&={\dot {\hat {\mathbf {x} }}}-{\dot {\mathbf {x} }}\\&=A{\hat {\mathbf {x} }}+B\mathbf {u} +Lv({\hat {x}}_{1}-x_{1})-A\mathbf {x} -B\mathbf {u} \\&=A({\hat {\mathbf {x} }}-\mathbf {x} )+Lv({\hat {x}}_{1}-x_{1})\\&=A\mathbf {e} +Lv(e_{1})\end{aligned}}}

donde es el error del estimador para la primera estimación del estado. La ley de control no lineal v puede diseñarse para aplicar la variedad deslizante e 1 = x ^ 1 x 1 {\displaystyle e_{1}={\hat {x}}_{1}-x_{1}}

0 = x ^ 1 x 1 {\displaystyle 0={\hat {x}}_{1}-x_{1}}

De modo que la estimación sigue el estado real después de un tiempo finito (es decir, ). Por lo tanto, la función de conmutación del control del modo deslizante x ^ 1 {\displaystyle {\hat {x}}_{1}} x 1 {\displaystyle x_{1}} x ^ 1 = x 1 {\displaystyle {\hat {x}}_{1}=x_{1}}

σ ( x ^ 1 , x ^ ) e 1 = x ^ 1 x 1 . {\displaystyle \sigma ({\hat {x}}_{1},{\hat {x}})\triangleq e_{1}={\hat {x}}_{1}-x_{1}.}

Para alcanzar la variedad deslizante, y siempre deben tener signos opuestos (es decir, para esencialmente todos ). Sin embargo, σ ˙ {\displaystyle {\dot {\sigma }}} σ {\displaystyle \sigma } σ σ ˙ < 0 {\displaystyle \sigma {\dot {\sigma }}<0} x {\displaystyle \mathbf {x} }

σ ˙ = e ˙ 1 = a 11 e 1 + A 12 e 2 v ( e 1 ) = a 11 e 1 + A 12 e 2 v ( σ ) {\displaystyle {\dot {\sigma }}={\dot {e}}_{1}=a_{11}e_{1}+A_{12}\mathbf {e} _{2}-v(e_{1})=a_{11}e_{1}+A_{12}\mathbf {e} _{2}-v(\sigma )}

donde es la colección de errores del estimador para todos los estados no medidos. Para asegurar que , sea e 2 ( e 2 , e 3 , , e n ) R ( n 1 ) {\displaystyle \mathbf {e} _{2}\triangleq (e_{2},e_{3},\ldots ,e_{n})\in \mathbb {R} ^{(n-1)}} σ σ ˙ < 0 {\displaystyle \sigma {\dot {\sigma }}<0}

v ( σ ) = M sgn ( σ ) {\displaystyle v(\sigma )=M\operatorname {sgn} (\sigma )}

dónde

M > max { | a 11 e 1 + A 12 e 2 | } . {\displaystyle M>\max\{|a_{11}e_{1}+A_{12}\mathbf {e} _{2}|\}.}

Es decir, la constante positiva M debe ser mayor que una versión escalada de los errores máximos posibles del estimador para el sistema (es decir, los errores iniciales, que se supone que están acotados de modo que M puede elegirse lo suficientemente grande; al). Si M es suficientemente grande, se puede suponer que el sistema logra (es decir, ). Porque es constante (es decir, 0) a lo largo de esta variedad también. Por lo tanto, el control discontinuo puede reemplazarse con el control continuo equivalente donde e 1 = 0 {\displaystyle e_{1}=0} x ^ 1 = x 1 {\displaystyle {\hat {x}}_{1}=x_{1}} e 1 {\displaystyle e_{1}} e ˙ 1 = 0 {\displaystyle {\dot {e}}_{1}=0} v ( σ ) {\displaystyle v(\sigma )} v eq {\displaystyle v_{\text{eq}}}

0 = σ ˙ = a 11 e 1 = 0 + A 12 e 2 v eq v ( σ ) = A 12 e 2 v eq . {\displaystyle 0={\dot {\sigma }}=a_{11}{\mathord {\overbrace {e_{1}} ^{{}=0}}}+A_{12}\mathbf {e} _{2}-{\mathord {\overbrace {v_{\text{eq}}} ^{v(\sigma )}}}=A_{12}\mathbf {e} _{2}-v_{\text{eq}}.}

Entonces

v eq scalar = A 12 1 × ( n 1 )  vector e 2 ( n 1 ) × 1  vector . {\displaystyle {\mathord {\underbrace {v_{\text{eq}}} _{\text{scalar}}}}={\mathord {\underbrace {A_{12}} _{1\times (n-1) \atop {\text{ vector}}}}}{\mathord {\underbrace {\mathbf {e} _{2}} _{(n-1)\times 1 \atop {\text{ vector}}}}}.}

Este control equivalente representa la contribución de los otros estados a la trayectoria del estado de salida . En particular, la fila actúa como un vector de salida para el subsistema de error. v eq {\displaystyle v_{\text{eq}}} ( n 1 ) {\displaystyle (n-1)} x 1 {\displaystyle x_{1}} A 12 {\displaystyle A_{12}}

[ e ˙ 2 e ˙ 3 e ˙ n ] e ˙ 2 = A 2 [ e 2 e 3 e n ] e 2 + L 2 v ( e 1 ) = A 2 e 2 + L 2 v eq = A 2 e 2 + L 2 A 12 e 2 = ( A 2 + L 2 A 12 ) e 2 . {\displaystyle {\mathord {\overbrace {\begin{bmatrix}{\dot {e}}_{2}\\{\dot {e}}_{3}\\\vdots \\{\dot {e}}_{n}\end{bmatrix}} ^{{\dot {\mathbf {e} }}_{2}}}}=A_{2}{\mathord {\overbrace {\begin{bmatrix}e_{2}\\e_{3}\\\vdots \\e_{n}\end{bmatrix}} ^{\mathbf {e} _{2}}}}+L_{2}v(e_{1})=A_{2}\mathbf {e} _{2}+L_{2}v_{\text{eq}}=A_{2}\mathbf {e} _{2}+L_{2}A_{12}\mathbf {e} _{2}=(A_{2}+L_{2}A_{12})\mathbf {e} _{2}.}

Por lo tanto, para garantizar que el error del estimador para los estados no medidos converja a cero, el vector debe elegirse de modo que la matriz sea Hurwitz (es decir, la parte real de cada uno de sus valores propios debe ser negativa). Por lo tanto, siempre que sea observable , este sistema se puede estabilizar exactamente de la misma manera que un observador de estado lineal típico cuando se ve como la matriz de salida (es decir, " C "). Es decir, el control equivalente proporciona información de medición sobre los estados no medidos que pueden mover continuamente sus estimaciones asintóticamente más cerca de ellos. Mientras tanto, el control discontinuo fuerza a que la estimación del estado medido tenga un error cero en un tiempo finito. Además, el ruido de medición simétrico de media cero blanco (por ejemplo, ruido gaussiano ) solo afecta la frecuencia de conmutación del control v y, por lo tanto, el ruido tendrá poco efecto en el control de modo deslizante equivalente . Por lo tanto, el observador de modo deslizante tiene características similares al filtro de Kalman . [12] e 2 {\displaystyle \mathbf {e} _{2}} ( n 1 ) × 1 {\displaystyle (n-1)\times 1} L 2 {\displaystyle L_{2}} ( n 1 ) × ( n 1 ) {\displaystyle (n-1)\times (n-1)} ( A 2 + L 2 A 12 ) {\displaystyle (A_{2}+L_{2}A_{12})} e 2 {\displaystyle \mathbf {e} _{2}} A 12 {\displaystyle A_{12}} v eq {\displaystyle v_{\text{eq}}} v = M sgn ( x ^ 1 x ) {\displaystyle v=M\operatorname {sgn} ({\hat {x}}_{1}-x)} v eq {\displaystyle v_{\text{eq}}}

La versión final del observador es así

x ^ ˙ = A x ^ + B u + L M sgn ( x ^ 1 x 1 ) = A x ^ + B u + [ 1 L 2 ] M sgn ( x ^ 1 x 1 ) = A x ^ + B u + [ M L 2 M ] sgn ( x ^ 1 x 1 ) = A x ^ + [ B [ M L 2 M ] ] [ u sgn ( x ^ 1 x 1 ) ] = A obs x ^ + B obs u obs {\displaystyle {\begin{aligned}{\dot {\hat {\mathbf {x} }}}&=A{\hat {\mathbf {x} }}+B\mathbf {u} +LM\operatorname {sgn} ({\hat {x}}_{1}-x_{1})\\&=A{\hat {\mathbf {x} }}+B\mathbf {u} +{\begin{bmatrix}-1\\L_{2}\end{bmatrix}}M\operatorname {sgn} ({\hat {x}}_{1}-x_{1})\\&=A{\hat {\mathbf {x} }}+B\mathbf {u} +{\begin{bmatrix}-M\\L_{2}M\end{bmatrix}}\operatorname {sgn} ({\hat {x}}_{1}-x_{1})\\&=A{\hat {\mathbf {x} }}+{\begin{bmatrix}B&{\begin{bmatrix}-M\\L_{2}M\end{bmatrix}}\end{bmatrix}}{\begin{bmatrix}\mathbf {u} \\\operatorname {sgn} ({\hat {x}}_{1}-x_{1})\end{bmatrix}}\\&=A_{\text{obs}}{\hat {\mathbf {x} }}+B_{\text{obs}}\mathbf {u} _{\text{obs}}\end{aligned}}}

dónde

  • A obs A , {\displaystyle A_{\text{obs}}\triangleq A,}
  • B obs [ B [ M L 2 M ] ] , {\displaystyle B_{\text{obs}}\triangleq {\begin{bmatrix}B&{\begin{bmatrix}-M\\L_{2}M\end{bmatrix}}\end{bmatrix}},} y
  • u obs [ u sgn ( x ^ 1 x 1 ) ] . {\displaystyle u_{\text{obs}}\triangleq {\begin{bmatrix}\mathbf {u} \\\operatorname {sgn} ({\hat {x}}_{1}-x_{1})\end{bmatrix}}.}

Es decir, al aumentar el vector de control con la función de conmutación , el observador de modo deslizante se puede implementar como un sistema LTI. Es decir, la señal discontinua se considera como una entrada de control para el sistema LTI de 2 entradas. u {\displaystyle \mathbf {u} } sgn ( x ^ 1 x 1 ) {\displaystyle \operatorname {sgn} ({\hat {x}}_{1}-x_{1})} sgn ( x ^ 1 x 1 ) {\displaystyle \operatorname {sgn} ({\hat {x}}_{1}-x_{1})}

Para simplificar, este ejemplo supone que el observador en modo deslizante tiene acceso a una medición de un solo estado (es decir, salida ). Sin embargo, se puede utilizar un procedimiento similar para diseñar un observador en modo deslizante para un vector de combinaciones ponderadas de estados (es decir, cuando la salida utiliza una matriz genérica C ). En cada caso, el modo deslizante será la variedad donde la salida estimada sigue a la salida medida con error cero (es decir, la variedad donde ). y = x 1 {\displaystyle y=x_{1}} y = C x {\displaystyle \mathbf {y} =C\mathbf {x} } y ^ {\displaystyle {\hat {\mathbf {y} }}} y {\displaystyle \mathbf {y} } σ ( x ) y ^ y = 0 {\displaystyle \sigma (\mathbf {x} )\triangleq {\hat {\mathbf {y} }}-\mathbf {y} =\mathbf {0} }

Véase también

Notas

  1. ^ El 'chatter' o 'chattering' es el fenómeno indeseable de oscilaciones que tienen una frecuencia y amplitud finitas. El chattering es un fenómeno perjudicial porque conduce a una baja precisión de control, un alto desgaste de las piezas mecánicas móviles y altas pérdidas de calor en los circuitos de potencia. Para más detalles, véase Utkin, Vadim; Lee, Jason Hoon (julio de 2006), Chattering Problem in Sliding Mode Control Systems , vol. 10.1109/VSS.2006.1644542., pp. 346–350
  2. ^ Otras técnicas de modulación de tipo pulso incluyen la modulación delta-sigma .

Referencias

  1. ^ ab Zinober, ASI, ed. (1990). Control determinista de sistemas inciertos . Londres: Peter Peregrinus Press. ISBN 978-0-86341-170-0.
  2. ^ Zeinali M.; Notash L. (2010). "Control adaptativo de modo deslizante con estimador de incertidumbre para manipuladores robóticos". Revista internacional de teoría de mecanismos y máquinas . 45 (1): 80–90. doi :10.1016/j.mechmachtheory.2009.08.003.
  3. ^ Zeinali, Meysar (2018). Control de modo deslizante adaptativo continuo de primer orden para manipuladores robóticos con convergencia de trayectorias en tiempo finito al modo deslizante real. 15.º Taller internacional sobre sistemas de estructura variable y control de modo deslizante. Universidad Tecnológica de Graz, Austria.
  4. ^ Utkin, Vadim I. (1993). "Principios de diseño de control de modo deslizante y aplicaciones a accionamientos eléctricos". IEEE Transactions on Industrial Electronics . 40 (1): 23–36. CiteSeerX 10.1.1.477.77 . doi :10.1109/41.184818. 
  5. ^ "Navegación autónoma y evitación de obstáculos con embarcaciones no tripuladas en situaciones simuladas de mar agitado - Universidad de Villanova"
  6. ^ Mahini; et al. (2013). "Una configuración experimental para la operación autónoma de buques de superficie en mares agitados". Robotica . 31 (5): 703–715. doi :10.1017/s0263574712000720. S2CID  31903795.
  7. ^ abcd Khalil, HK (2002). Sistemas no lineales (3.ª ed.). Upper Saddle River, NJ: Prentice Hall . ISBN 978-0-13-067389-3.
  8. ^ Filippov, AF (1988). Ecuaciones diferenciales con lados derechos discontinuos . Kluwer. ISBN 978-90-277-2699-5.
  9. ^ Perruquetti, W.; Barbot, JP (2002). Control de modo deslizante en ingeniería . Marcel Dekker Tapa dura. ISBN 978-0-8247-0671-5.
  10. ^ Li, Yun; et al. (1996). "Enfoque automatizado de algoritmo genético para el diseño de sistemas de control de modo deslizante". Revista Internacional de Control . 64 (3): 721–739. CiteSeerX 10.1.1.43.1654 . doi :10.1080/00207179608921865. 
  11. ^ Utkin, Vadim; Guldner, Jürgen; Shi, Jingxin (1999). Control de modo deslizante en sistemas electromecánicos . Filadelfia, PA: Taylor & Francis, Inc. ISBN 978-0-7484-0116-1.
  12. ^ ab Drakunov, SV (1983). "Un filtro adaptativo cuasi-óptimo con parámetros discontinuos". Automatización y control remoto . 44 (9): 1167–1175.
  13. ^ Drakunov, SV (1992). "Observadores de modo deslizante basados ​​en un método de control equivalente". [1992] Actas de la 31.ª Conferencia IEEE sobre decisión y control. págs. 2368-2370. doi :10.1109/CDC.1992.371368. ISBN 978-0-7803-0872-5.S2CID 120072463  .
  • Zinober, Alan SI, ed. (1994). Estructura variable y control de Lyapunov . Apuntes de clase sobre control y ciencias de la información. Vol. 193. Londres: Springer-Verlag. doi :10.1007/BFb0033675. ISBN. 978-3-540-19869-7.
  • Edwards, C.; Spurgeon, S. (1998). Control de modo deslizante. Teoría y aplicaciones . Londres: Taylor and Francis. ISBN 978-0-7484-0601-2.
  • Sabanovic, Asif; Fridman, Leonid ; Spurgeon, Sarah (2004). Sistemas de estructura variable: desde los principios hasta la implementación . Londres: Instituto de Ingenieros Eléctricos. ISBN 0-86341-350-1.
  • Edwards, C.; Fossas Colet, E.; Fridman, L. (2006). Avances en estructura variable y control de modo deslizante . Berlín: Springer Verlag. ISBN 978-3-540-32800-1.
  • Bartolini, G.; Fridman, L.; Pisano, A.; Usai, E. (2008). Teoría moderna de control de modo deslizante: nuevas perspectivas y aplicaciones . Berlín: Springer Verlag. ISBN 978-3-540-79016-7.
  • Fridman, L.; Barbot, J.-P.; Plestan, F. (2016). Tendencias recientes en el control de modo deslizante . Londres: The Institution of Engineering and Technology. ISBN 978-1-78561-076-9.
  • Shtessel, Y.; Edwards, C.; Fridman, L.; Levant, A. (2014). Control y observación de modos deslizantes . Basilea: Birkhauser. ISBN 978-0-81764-8923.
  • Sira- Ramirez, Hebertt (2015). Control de modo deslizante. El enfoque de modulación delta-sigma . Basilea: Birkhauser. ISBN 978-3-319-17256-9.
  • Fridman, L.; Moreno, J.; Bandyopadhyay, B.; Kamal Asif Chalanga, S.; Chalanga, S. (2015). Algoritmos anidados continuos: la quinta generación de controladores de modo deslizante. En: Avances recientes en modos deslizantes: del control a la mecatrónica inteligente, X. Yu, O. Efe (Eds.), págs. 5–35 . Estudios en sistemas, decisión y control. Vol. 24. Londres: Springer-Verlag. doi :10.1007/978-3-319-18290-2_2. ISBN 978-3-319-18289-6.
  • Li, S.; Yu, X.; Fridman, L.; Man, Z.; Wang, X. (2017). Avances en sistemas de estructura variable y control de modo deslizante: teoría y aplicaciones . Estudios en sistemas, decisiones y control. Vol. 24. Londres: Springer-Verlag. ISBN. 978-3-319-62895-0.
  • Ferrara, A. ; Incremona, GP; Cucuzzella, M. (2019). Control de modo deslizante avanzado y basado en optimización . SIAM. doi :10.1137/1.9781611975840. ISBN 978-1611975833. Número de identificación del sujeto  198313071.
  • Steinberger, M.; Horn, M.; Fridman, L., eds. (2020). Sistemas de estructura variable y control de modo deslizante . Estudios en sistemas, decisiones y control. Vol. 271. Londres: Springer-Verlag. doi :10.1007/BFb0033675. ISBN . 978-3-030-36620-9.

Lectura adicional

  • Drakunov SV, Utkin VI. (1992). "Control de modo deslizante en sistemas dinámicos". Revista Internacional de Control . 55 (4): 1029–1037. doi :10.1080/00207179208934270. hdl : 10338.dmlcz/135339 .
Retrieved from "https://en.wikipedia.org/w/index.php?title=Sliding_mode_control&oldid=1192371664"