Controlabilidad

Propiedad del sistema dinámico

La controlabilidad es una propiedad importante de un sistema de control y juega un papel crucial en muchos problemas de control, como la estabilización de sistemas inestables mediante retroalimentación o el control óptimo.

Controlabilidad y observabilidad son aspectos duales del mismo problema.

En líneas generales, el concepto de controlabilidad denota la capacidad de mover un sistema en todo su espacio de configuración utilizando únicamente ciertas manipulaciones admisibles. La definición exacta varía ligeramente según el marco o el tipo de modelos aplicados.

Los siguientes son ejemplos de variaciones de nociones de controlabilidad que se han introducido en la literatura sobre sistemas y control:

  • Controlabilidad del Estado
  • Controlabilidad de salida
  • Controlabilidad en el marco del comportamiento

Controlabilidad del Estado

El estado de un sistema determinista , que es el conjunto de valores de todas las variables de estado del sistema (aquellas variables caracterizadas por ecuaciones dinámicas), describe completamente el sistema en un momento dado. En particular, no se necesita información sobre el pasado de un sistema para ayudar a predecir el futuro, si se conocen los estados en el momento presente y se conocen todos los valores actuales y futuros de las variables de control (aquellas cuyos valores se pueden elegir).

La controlabilidad completa del estado (o simplemente controlabilidad si no se da otro contexto) describe la capacidad de una entrada externa (el vector de variables de control) para mover el estado interno de un sistema desde cualquier estado inicial a cualquier estado final en un intervalo de tiempo finito. [1] : 737 

Es decir, podemos definir informalmente la controlabilidad de la siguiente manera: si para cualquier estado inicial y cualquier estado final existe una secuencia de entrada para transferir el estado del sistema de a en un intervalo de tiempo finito, entonces el sistema modelado por la representación del espacio de estados es controlable. Para el ejemplo más simple de un sistema LTI continuo, la dimensión de fila de la expresión del espacio de estados determina el intervalo; cada fila contribuye con un vector en el espacio de estados del sistema. Si no hay suficientes vectores de este tipo para abarcar el espacio de estados de , entonces el sistema no puede lograr controlabilidad. Puede ser necesario modificar y aproximar mejor las relaciones diferenciales subyacentes que estima para lograr controlabilidad. incógnita 0 {\displaystyle \mathbf {x_{0}}} incógnita F {\displaystyle \mathbf {x_ {f}}} incógnita 0 {\displaystyle \mathbf {x_{0}}} incógnita F {\displaystyle \mathbf {x_ {f}}} incógnita ˙ = A incógnita ( a ) + B ( a ) {\displaystyle {\dot {\mathbf {x}}}=\mathbf {A} \mathbf {x} (t)+\mathbf {B} \mathbf {u} (t)} incógnita {\displaystyle \mathbf {x}} A {\displaystyle \mathbf {A}} B {\displaystyle \mathbf {B}}

Controlabilidad no significa que un estado alcanzado pueda mantenerse, sino simplemente que puede alcanzarse cualquier estado.

La controlabilidad no significa que se puedan crear caminos arbitrarios a través del espacio de estados, sino sólo que existe un camino dentro del intervalo de tiempo finito prescrito.

Sistemas lineales continuos

Consideremos el sistema lineal continuo [nota 1]

incógnita ˙ ( a ) = A ( a ) incógnita ( a ) + B ( a ) ( a ) {\displaystyle {\dot {\mathbf {x}}}(t)=A(t)\mathbf {x} (t)+B(t)\mathbf {u} (t)}
y ( a ) = do ( a ) incógnita ( a ) + D ( a ) ( a ) . {\displaystyle \mathbf {y} (t)=C(t)\mathbf {x} (t)+D(t)\mathbf {u} (t).}

Existe un control de estado en tiempo a estado en tiempo si y solo si está en el espacio de columnas de {\estilo de visualización u} incógnita 0 estilo de visualización x_{0}} a 0 estilo de visualización t_{0}} incógnita 1 estilo de visualización x_{1}} a 1 > a 0 estilo de visualización t_{1}>t_{0}} incógnita 1 ϕ ( a 0 , a 1 ) incógnita 0 {\displaystyle x_{1}-\phi (t_{0},t_{1})x_{0}}

Yo ( a 0 , a 1 ) = a 0 a 1 ϕ ( a 0 , a ) B ( a ) B ( a ) yo ϕ ( a 0 , a ) yo d a {\displaystyle W(t_{0},t_{1})=\int _{t_{0}}^{t_{1}}\phi (t_{0},t)B(t)B(t)^{T}\phi (t_{0},t)^{T}dt}

donde es la matriz de transición de estado , y es el Gramiano de Controlabilidad . ϕ {\estilo de visualización \phi} Yo ( a 0 , a 1 ) {\ Displaystyle W (t_ {0}, t_ {1})}

De hecho, si es una solución entonces un control dado por haría la transferencia deseada. η 0 estilo de visualización {\eta_{0}} Yo ( a 0 , a 1 ) η = incógnita 1 ϕ ( a 0 , a 1 ) incógnita 0 {\displaystyle W(t_{0},t_{1})\eta =x_{1}-\phi (t_{0},t_{1})x_{0}} ( a ) = B ( a ) yo ϕ ( a 0 , a ) yo η 0 {\displaystyle u(t)=-B(t)^{T}\phi (t_{0},t)^{T}\eta _{0}}

Tenga en cuenta que la matriz definida anteriormente tiene las siguientes propiedades: Yo {\estilo de visualización W}

d d a Yo ( a , a 1 ) = A ( a ) Yo ( a , a 1 ) + Yo ( a , a 1 ) A ( a ) yo B ( a ) B ( a ) yo , Yo ( a 1 , a 1 ) = 0 {\displaystyle {\frac {d}{dt}}W(t,t_{1})=A(t)W(t,t_{1})+W(t,t_{1})A(t)^{T}-B(t)B(t)^{T},\;W(t_{1},t_{1})=0}
  • Yo ( a 0 , a 1 ) {\ Displaystyle W (t_ {0}, t_ {1})} satisface la ecuación
Yo ( a 0 , a 1 ) = Yo ( a 0 , a ) + ϕ ( a 0 , a ) Yo ( a , a 1 ) ϕ ( a 0 , a ) yo {\displaystyle W(t_{0},t_{1})=W(t_{0},t)+\phi (t_{0},t)W(t,t_{1})\phi (t_{0},t)^{T}} [2]

Condición de rango para controlabilidad

El gramiano de controlabilidad implica la integración de la matriz de transición de estados de un sistema. Una condición más simple para la controlabilidad es una condición de rango análoga a la condición de rango de Kalman para sistemas invariantes en el tiempo.

Consideremos un sistema lineal de tiempo continuo que varía suavemente en un intervalo de : Σ {\estilo de visualización \Sigma} [ a 0 , a ] {\estilo de visualización [t_{0},t]} R {\displaystyle \mathbb {R}}

incógnita ˙ ( a ) = A ( a ) incógnita ( a ) + B ( a ) ( a ) {\displaystyle {\dot {\mathbf {x}}}(t)=A(t)\mathbf {x} (t)+B(t)\mathbf {u} (t)}
y ( a ) = do ( a ) incógnita ( a ) + D ( a ) ( a ) . {\displaystyle \mathbf {y} (t)=C(t)\mathbf {x} (t)+D(t)\mathbf {u} (t).}

La matriz de transición de estado también es suave. Introduzca la función con valores de matriz nxm y defina ϕ {\estilo de visualización \phi} METRO 0 ( a ) = ϕ ( a 0 , a ) B ( a ) {\displaystyle M_{0}(t)=\phi (t_{0},t)B(t)}

METRO a ( a ) Estilo de visualización M_{k}(t)} = . d a METRO 0 d a a ( a ) , a 1 {\displaystyle {\frac {\mathrm {d^{k}} M_{0}}{\mathrm {d} t^{k}}}(t),k\geqslant 1}

Considere la matriz de funciones matriciales obtenida al enumerar todas las columnas de , : METRO i Estilo de visualización M_{i}} i = 0 , 1 , , a {\displaystyle i=0,1,\lpuntos ,k}

METRO ( a ) ( a ) := [ METRO 0 ( a ) , , METRO a ( a ) ] {\displaystyle M^{(k)}(t):=\left[M_{0}(t),\ldots ,M_{k}(t)\right]} .

Si existe un y un entero no negativo k tal que , entonces es controlable. [3] a ¯ [ a 0 , a ] {\displaystyle {\bar {t}}\en [t_{0},t]} rango METRO ( a ) ( a ¯ ) = norte {\displaystyle \operatorname {rango} M^{(k)}({\bar {t}})=n} Σ {\estilo de visualización \Sigma}

Si también varía analíticamente en un intervalo , entonces es controlable en cada subintervalo no trivial de si y sólo si existe a y un entero no negativo k tal que . [3] Σ {\estilo de visualización \Sigma} [ a 0 , a ] {\estilo de visualización [t_{0},t]} Σ {\estilo de visualización \Sigma} [ a 0 , a ] {\estilo de visualización [t_{0},t]} a ¯ [ a 0 , a ] {\displaystyle {\bar {t}}\en [t_{0},t]} rango METRO ( a ) ( a i ) = norte {\displaystyle \operatorname {rango} M^{(k)}(t_{i})=n}

Los métodos anteriores pueden ser complejos de comprobar, ya que implican el cálculo de la matriz de transición de estado . Otra condición equivalente se define a continuación. Sea , y para cada , defina ϕ {\estilo de visualización \phi} B 0 ( a ) = B ( a ) {\displaystyle B_{0}(t)=B(t)} i 0 {\displaystyle i\geq 0}

B i + 1 ( a ) Estilo de visualización B_{i+1}(t)} = A ( a ) B i ( a ) d d a B i ( a ) . {\displaystyle A(t)B_{i}(t)-{\frac {\mathrm {d}}{\mathrm {d} t}}B_{i}(t).}

En este caso, cada uno se obtiene directamente de los datos. El sistema es controlable si existe un y un entero no negativo tal que . [3] B i Estilo de visualización B_{i}} ( A ( a ) , B ( a ) ) . {\displaystyle (A(t),B(t)).} a ¯ [ a 0 , a ] {\displaystyle {\bar {t}}\en [t_{0},t]} a {\estilo de visualización k} rango ( [ B 0 ( a ¯ ) , B 1 ( a ¯ ) , , B a ( a ¯ ) ] ) = norte {\displaystyle {\textrm {rango}}(\left[B_{0}({\bar {t}}),B_{1}({\bar {t}}),\ldots ,B_{k}({\bar {t}})\right])=n}

Ejemplo

Consideremos un sistema que varía analíticamente en matrices y ( , ) {\displaystyle (-\infty,\infty)}

A ( a ) = [ a 1 0 0 a 3 0 0 0 a 2 ] {\displaystyle A(t)={\begin{bmatrix}t&1&0\\0&t^{3}&0\\0&0&t^{2}\end{bmatrix}}} , Entonces , y dado que esta matriz tiene rango 3, el sistema es controlable en cada intervalo no trivial de . B ( a ) = [ 0 1 1 ] . {\displaystyle B(t)={\begin{bmatrix}0\\1\\1\end{bmatrix}}.} [ B 0 ( 0 ) , B 1 ( 0 ) , B 2 ( 0 ) , B 3 ( 0 ) ] = [ 0 1 0 1 1 0 0 0 1 0 0 2 ] {\displaystyle [B_{0}(0),B_{1}(0),B_{2}(0),B_{3}(0)]={\begin{bmatrix}0&1&0&-1\\1&0&0&0\\1&0&0&2\end{bmatrix}}} R {\displaystyle \mathbb {R}}

Sistemas continuos lineales invariantes en el tiempo (LTI)

Consideremos el sistema lineal continuo invariante en el tiempo.

incógnita ˙ ( a ) = A incógnita ( a ) + B ( a ) {\displaystyle {\dot {\mathbf {x} }}(t)=A\mathbf {x} (t)+B\mathbf {u} (t)}
y ( a ) = do incógnita ( a ) + D ( a ) {\displaystyle \mathbf {y} (t)=C\mathbf {x} (t)+D\mathbf {u} (t)}

dónde

incógnita {\displaystyle \mathbf {x}} es el "vector de estado", norte × 1 {\displaystyle n\times 1}
y {\displaystyle \mathbf {y}} es el "vector de salida", metro × 1 {\displaystyle m\times 1}
{\displaystyle \mathbf {u}} es el "vector de entrada (o control)", a × 1 {\displaystyle r\times 1}
A {\displaystyle A} es la "matriz de estados", n × n {\displaystyle n\times n}
B {\displaystyle B} es la "matriz de entrada", n × r {\displaystyle n\times r}
C {\displaystyle C} es la "matriz de salida", m × n {\displaystyle m\times n}
D {\displaystyle D} es la matriz "de alimentación continua (o de alimentación hacia adelante)". m × r {\displaystyle m\times r}

La matriz de controlabilidad está dada por n × n r {\displaystyle n\times nr}

R = [ B A B A 2 B . . . A n 1 B ] {\displaystyle R={\begin{bmatrix}B&AB&A^{2}B&...&A^{n-1}B\end{bmatrix}}}

El sistema es controlable si la matriz de controlabilidad tiene rango de fila completo (es decir, ). rank ( R ) = n {\displaystyle \operatorname {rank} (R)=n}

Sistemas discretos lineales invariantes en el tiempo (LTI)

Para un sistema de espacio de estados lineal de tiempo discreto (es decir, variable en el tiempo ), la ecuación de estado es k Z {\displaystyle k\in \mathbb {Z} }

x ( k + 1 ) = A x ( k ) + B u ( k ) {\displaystyle {\textbf {x}}(k+1)=A{\textbf {x}}(k)+B{\textbf {u}}(k)}

donde es una matriz y es una matriz (es decir, son entradas reunidas en un vector). La prueba de controlabilidad es que la matriz A {\displaystyle A} n × n {\displaystyle n\times n} B {\displaystyle B} n × r {\displaystyle n\times r} u {\displaystyle \mathbf {u} } r {\displaystyle r} r × 1 {\displaystyle r\times 1} n × n r {\displaystyle n\times nr}

C = [ B A B A 2 B A n 1 B ] {\displaystyle {\mathcal {C}}={\begin{bmatrix}B&AB&A^{2}B&\cdots &A^{n-1}B\end{bmatrix}}}

tiene rango de fila completo (es decir, ). Es decir, si el sistema es controlable, tendrá columnas que son linealmente independientes ; si las columnas de son linealmente independientes , cada uno de los estados es alcanzable al proporcionar al sistema las entradas adecuadas a través de la variable . rank ( C ) = n {\displaystyle \operatorname {rank} ({\mathcal {C}})=n} C {\displaystyle {\mathcal {C}}} n {\displaystyle n} n {\displaystyle n} C {\displaystyle {\mathcal {C}}} n {\displaystyle n} u ( k ) {\displaystyle u(k)}

Derivación

Dado el estado en un tiempo inicial, denotado arbitrariamente como k = 0, la ecuación de estado da entonces y así sucesivamente con sustituciones hacia atrás repetidas de la variable de estado, obteniéndose finalmente x ( 0 ) {\displaystyle {\textbf {x}}(0)} x ( 1 ) = A x ( 0 ) + B u ( 0 ) , {\displaystyle {\textbf {x}}(1)=A{\textbf {x}}(0)+B{\textbf {u}}(0),} x ( 2 ) = A x ( 1 ) + B u ( 1 ) = A 2 x ( 0 ) + A B u ( 0 ) + B u ( 1 ) , {\displaystyle {\textbf {x}}(2)=A{\textbf {x}}(1)+B{\textbf {u}}(1)=A^{2}{\textbf {x}}(0)+AB{\textbf {u}}(0)+B{\textbf {u}}(1),}

x ( n ) = B u ( n 1 ) + A B u ( n 2 ) + + A n 1 B u ( 0 ) + A n x ( 0 ) {\displaystyle {\textbf {x}}(n)=B{\textbf {u}}(n-1)+AB{\textbf {u}}(n-2)+\cdots +A^{n-1}B{\textbf {u}}(0)+A^{n}{\textbf {x}}(0)}

o equivalentemente

x ( n ) A n x ( 0 ) = [ B A B A n 1 B ] [ u T ( n 1 ) u T ( n 2 ) u T ( 0 ) ] T . {\displaystyle {\textbf {x}}(n)-A^{n}{\textbf {x}}(0)=[B\,\,AB\,\,\cdots \,\,A^{n-1}B][{\textbf {u}}^{T}(n-1)\,\,{\textbf {u}}^{T}(n-2)\,\,\cdots \,\,{\textbf {u}}^{T}(0)]^{T}.}

Al imponer cualquier valor deseado del vector de estado en el lado izquierdo, esto siempre se puede resolver para el vector apilado de vectores de control si y solo si la matriz de matrices al comienzo del lado derecho tiene rango de fila completo. x ( n ) {\displaystyle {\textbf {x}}(n)}

Ejemplo

Por ejemplo, considere el caso en el que y (es decir, solo una entrada de control). Por lo tanto, y son vectores. Si tiene rango 2 (rango completo), y entonces y son linealmente independientes y abarcan todo el plano. Si el rango es 1, entonces y son colineales y no abarcan todo el plano. n = 2 {\displaystyle n=2} r = 1 {\displaystyle r=1} B {\displaystyle B} A B {\displaystyle AB} 2 × 1 {\displaystyle 2\times 1} [ B A B ] {\displaystyle {\begin{bmatrix}B&AB\end{bmatrix}}} B {\displaystyle B} A B {\displaystyle AB} B {\displaystyle B} A B {\displaystyle AB}

Supongamos que el estado inicial es cero.

En el momento : k = 0 {\displaystyle k=0} x ( 1 ) = A x ( 0 ) + B u ( 0 ) = B u ( 0 ) {\displaystyle x(1)=A{\textbf {x}}(0)+B{\textbf {u}}(0)=B{\textbf {u}}(0)}

En el momento : k = 1 {\displaystyle k=1} x ( 2 ) = A x ( 1 ) + B u ( 1 ) = A B u ( 0 ) + B u ( 1 ) {\displaystyle x(2)=A{\textbf {x}}(1)+B{\textbf {u}}(1)=AB{\textbf {u}}(0)+B{\textbf {u}}(1)}

En el momento todos los estados alcanzables están en la línea formada por el vector . En el momento todos los estados alcanzables son combinaciones lineales de y . Si el sistema es controlable, entonces estos dos vectores pueden abarcar todo el plano y puede hacerse así durante el tiempo . La suposición de que el estado inicial es cero es meramente por conveniencia. Claramente, si se puede llegar a todos los estados desde el origen, entonces se puede llegar a cualquier estado desde otro estado (simplemente un cambio de coordenadas). k = 0 {\displaystyle k=0} B {\displaystyle B} k = 1 {\displaystyle k=1} A B {\displaystyle AB} B {\displaystyle B} k = 2 {\displaystyle k=2}

Este ejemplo es válido para todos los positivos , pero el caso de es más fácil de visualizar. n {\displaystyle n} n = 2 {\displaystyle n=2}

Analogía por ejemplo denorte= 2

Considere una analogía con el sistema del ejemplo anterior. Usted está sentado en su automóvil en un plano infinito y mirando hacia el norte. El objetivo es llegar a cualquier punto del plano conduciendo una distancia en línea recta, detenerse por completo, girar y conducir otra distancia, nuevamente, en línea recta. Si su automóvil no tiene dirección, entonces solo puede conducir en línea recta, lo que significa que solo puede conducir en línea recta (en este caso, la línea norte-sur, ya que comenzó mirando hacia el norte). La falta de dirección sería análoga a cuando el rango de es 1 (las dos distancias que recorrió están en la misma línea). C {\displaystyle C}

Ahora bien, si su automóvil tuviera dirección, podría conducir fácilmente a cualquier punto del plano y este sería el caso análogo a cuando el rango de es 2. C {\displaystyle C}

Si cambiamos este ejemplo, la analogía sería volar en el espacio para alcanzar cualquier posición en el espacio 3D (sin tener en cuenta la orientación de la aeronave ). Se permite: n = 3 {\displaystyle n=3}

  • volar en línea recta
  • girar a la izquierda o a la derecha en cualquier cantidad ( guiñada )
  • Dirigir el avión hacia arriba o hacia abajo en cualquier cantidad ( Inclinación )

Aunque el caso tridimensional es más difícil de visualizar, el concepto de controlabilidad sigue siendo análogo.

Sistemas no lineales

Sistemas no lineales en forma afín al control

x ˙ = f ( x ) + i = 1 m g i ( x ) u i {\displaystyle {\dot {\mathbf {x} }}=\mathbf {f(x)} +\sum _{i=1}^{m}\mathbf {g} _{i}(\mathbf {x} )u_{i}}

son accesibles localmente si la distribución de accesibilidad abarca el espacio, cuando es igual al rango de y R viene dado por: [4] x 0 {\displaystyle x_{0}} R {\displaystyle R} n {\displaystyle n} n {\displaystyle n} x {\displaystyle x}

R = [ g 1 g m [ a d g i k g j ] [ a d f k g i ] ] . {\displaystyle R={\begin{bmatrix}\mathbf {g} _{1}&\cdots &\mathbf {g} _{m}&[\mathrm {ad} _{\mathbf {g} _{i}}^{k}\mathbf {\mathbf {g} _{j}} ]&\cdots &[\mathrm {ad} _{\mathbf {f} }^{k}\mathbf {\mathbf {g} _{i}} ]\end{bmatrix}}.}

Aquí, se define la operación de corchete de Lie repetida mediante [ a d f k g ] {\displaystyle [\mathrm {ad} _{\mathbf {f} }^{k}\mathbf {\mathbf {g} } ]}

[ a d f k g ] = [ f j [ f , g ] ] . {\displaystyle [\mathrm {ad} _{\mathbf {f} }^{k}\mathbf {\mathbf {g} } ]={\begin{bmatrix}\mathbf {f} &\cdots &j&\cdots &\mathbf {[\mathbf {f} ,\mathbf {g} ]} \end{bmatrix}}.}

De hecho, la matriz de controlabilidad para sistemas lineales de la sección anterior se puede derivar de esta ecuación.

Controlabilidad nula

Si un sistema de control discreto es controlable nulo, significa que existe un controlable tal que para algún estado inicial . En otras palabras, es equivalente a la condición de que exista una matriz tal que sea nilpotente. u ( k ) {\displaystyle u(k)} x ( k 0 ) = 0 {\displaystyle x(k_{0})=0} x ( 0 ) = x 0 {\displaystyle x(0)=x_{0}} F {\displaystyle F} A + B F {\displaystyle A+BF}

Esto se puede demostrar fácilmente mediante la descomposición controlable-incontrolable.

Controlabilidad de salida

La controlabilidad de la salida es el concepto relacionado con la salida del sistema (denotada por y en las ecuaciones anteriores); la controlabilidad de la salida describe la capacidad de una entrada externa para mover la salida desde cualquier condición inicial a cualquier condición final en un intervalo de tiempo finito. No es necesario que exista alguna relación entre la controlabilidad del estado y la controlabilidad de la salida. En particular:

  • Un sistema controlable no es necesariamente controlable en cuanto a la salida. Por ejemplo, si la matriz D  = 0 y la matriz C no tiene un rango de fila completo, algunas posiciones de la salida quedan ocultas por la estructura limitante de la matriz de salida y, por lo tanto, son inalcanzables. Además, aunque el sistema se puede mover a cualquier estado en un tiempo finito, puede haber algunas salidas que sean inaccesibles para todos los estados. Un ejemplo numérico trivial utiliza D = 0 y una matriz C con al menos una fila de ceros; por lo tanto, el sistema no puede producir una salida distinta de cero a lo largo de esa dimensión.
  • Un sistema controlable por salida no es necesariamente controlable por estado. Por ejemplo, si la dimensión del espacio de estados es mayor que la dimensión de la salida, entonces habrá un conjunto de posibles configuraciones de estado para cada salida individual. Es decir, el sistema puede tener dinámicas cero significativas , que son trayectorias del sistema que no son observables desde la salida. En consecuencia, poder llevar una salida a una posición particular en un tiempo finito no dice nada sobre la configuración de estado del sistema.

Para un sistema lineal de tiempo continuo, como el ejemplo anterior, descrito por las matrices , , , y , la matriz de controlabilidad de salida A {\displaystyle A} B {\displaystyle B} C {\displaystyle C} D {\displaystyle D} m × ( n + 1 ) r {\displaystyle m\times (n+1)r}

[ C B C A B C A 2 B C A n 1 B D ] {\displaystyle {\begin{bmatrix}CB&CAB&CA^{2}B&\cdots &CA^{n-1}B&D\end{bmatrix}}}

tiene rango de fila completo (es decir, rango ) si y solo si el sistema es controlable por salida. [1] : 742  m {\displaystyle m}

Controlabilidad bajo restricciones de entrada

En sistemas con autoridad de control limitada, a menudo ya no es posible mover ningún estado inicial a ningún estado final dentro del subespacio controlable. Este fenómeno es causado por restricciones en la entrada que podrían ser inherentes al sistema (por ejemplo, debido a la saturación del actuador) o impuestas al sistema por otras razones (por ejemplo, debido a preocupaciones relacionadas con la seguridad). La controlabilidad de sistemas con restricciones de entrada y estado se estudia en el contexto de la alcanzabilidad [5] y la teoría de viabilidad . [6]

Controlabilidad en el marco conductual

En el enfoque teórico de sistemas conductuales de Willems (véase personas en sistemas y control ), los modelos considerados no definen directamente una estructura de entrada-salida. En este marco, los sistemas se describen mediante trayectorias admisibles de un conjunto de variables, algunas de las cuales podrían interpretarse como entradas o salidas.

Un sistema se define entonces como controlable en este contexto, si cualquier parte pasada de un comportamiento (trayectoria de las variables externas) se puede concatenar con cualquier trayectoria futura del comportamiento de tal manera que la concatenación esté contenida en el comportamiento, es decir, sea parte del comportamiento admisible del sistema. [7] : 151 

Estabilizabilidad

Un concepto ligeramente más débil que el de controlabilidad es el de estabilización . Se dice que un sistema es estabilizable cuando se puede lograr que todas las variables de estado incontrolables tengan una dinámica estable . Por lo tanto, aunque algunas de las variables de estado no se puedan controlar (como se determinó mediante la prueba de controlabilidad anterior), todas las variables de estado seguirán estando limitadas durante el comportamiento del sistema. [8]

Conjunto alcanzable

Sea T ∈ Т y x ∈ X (donde X es el conjunto de todos los estados posibles y Т es un intervalo de tiempo). El conjunto alcanzable desde x en el tiempo T se define como: [3]

R T ( x ) = { z X : x T z } {\displaystyle R^{T}{(x)}=\left\{z\in X:x{\overset {T}{\rightarrow }}z\right\}} , donde xyoz denota que existe una transición de estado de x a z en el tiempo T.

Para sistemas autónomos el conjunto alcanzable viene dado por:

I m ( R ) = I m ( B ) + I m ( A B ) + . . . . + I m ( A n 1 B ) {\displaystyle \mathrm {Im} (R)=\mathrm {Im} (B)+\mathrm {Im} (AB)+....+\mathrm {Im} (A^{n-1}B)} ,

donde R es la matriz de controlabilidad.

En términos del conjunto alcanzable, el sistema es controlable si y sólo si . I m ( R ) = R n {\displaystyle \mathrm {Im} (R)=\mathbb {R} ^{n}}

Demostración Tenemos las siguientes igualdades:

R = [ B   A B . . . . A n 1 B ] {\displaystyle R=[B\ AB....A^{n-1}B]}
I m ( R ) = I m ( [ B   A B . . . . A n 1 B ] ) {\displaystyle \mathrm {Im} (R)=\mathrm {Im} ([B\ AB....A^{n-1}B])}
d i m ( I m ( R ) ) = r a n k ( R ) {\displaystyle \mathrm {dim(Im} (R))=\mathrm {rank} (R)}

Considerando que el sistema es controlable, las columnas de R deberían ser linealmente independientes . Por lo tanto:

d i m ( I m ( R ) ) = n {\displaystyle \mathrm {dim(Im} (R))=n}
r a n k ( R ) = n {\displaystyle \mathrm {rank} (R)=n}
I m ( R ) = R n {\displaystyle \mathrm {Im} (R)=\mathbb {R} ^{n}\quad \blacksquare }

Un conjunto relacionado con el conjunto alcanzable es el conjunto controlable, definido por:

C T ( x ) = { z X : z T x } {\displaystyle C^{T}{(x)}=\left\{z\in X:z{\overset {T}{\rightarrow }}x\right\}} .

La relación entre alcanzabilidad y controlabilidad es presentada por Sontag: [3]

(a) Un sistema lineal discreto n-dimensional es controlable si y sólo si:

R ( 0 ) = R k ( 0 ) = X {\displaystyle R(0)=R^{k}{(0)=X}} (Donde X es el conjunto de todos los posibles valores o estados de x y k es el paso de tiempo).

(b) Un sistema lineal de tiempo continuo es controlable si y sólo si:

R ( 0 ) = R e ( 0 ) = X {\displaystyle R(0)=R^{e}{(0)=X}} para todos e>0.

si y solo si para todo e>0. C ( 0 ) = C e ( 0 ) = X {\displaystyle C(0)=C^{e}{(0)=X}}

Ejemplo Sea el sistema un sistema discreto invariante en el tiempo de n dimensiones a partir de la fórmula:

ϕ ( n , 0 , 0 , w ) = i = 1 n A i 1 B w ( n 1 ) {\displaystyle \phi (n,0,0,w)=\sum \limits _{i=1}^{n}A^{i-1}Bw(n-1)} (Donde (tiempo final, tiempo inicial, variable de estado, restricciones) se define como la matriz de transición de una variable de estado x desde un tiempo inicial 0 a un tiempo final n con algunas restricciones w). ϕ {\displaystyle \phi }

De ello se deduce que el estado futuro está en si y sólo si está en , la imagen de la función lineal , definida como: R k ( 0 ) {\displaystyle R^{k}{(0)}} I m ( R ) {\displaystyle \mathrm {Im} (R)} R {\displaystyle R}

R ( A , B ) [ B   A B . . . . A n 1 B ] {\displaystyle R(A,B)\triangleq [B\ AB....A^{n-1}B]} ,

¿Qué mapas,

u n X {\displaystyle u^{n}\mapsto X}

Cuando y nos identificamos con una matriz cuyas columnas están en ese orden. Si el sistema es controlable el rango de es . Si esto es cierto, la imagen de la función lineal es todo . En base a eso, tenemos: u = K m {\displaystyle u=K^{m}} X = K n {\displaystyle X=K^{n}} R ( A , B ) {\displaystyle R(A,B)} n × n m {\displaystyle n\times nm} B ,   A B , . . . . , A n 1 B {\displaystyle B,\ AB,....,A^{n-1}B} [ B   A B . . . . A n 1 B ] {\displaystyle [B\ AB....A^{n-1}B]} n {\displaystyle n} R {\displaystyle R} X {\displaystyle X}

R ( 0 ) = R k ( 0 ) = X {\displaystyle R(0)=R^{k}{(0)=X}} con . X R n {\displaystyle X\in \mathbb {R} ^{n}}

Véase también

Notas

  1. ^ Un sistema lineal invariante en el tiempo se comporta de la misma manera pero con los coeficientes constantes en el tiempo.

Referencias

  1. ^ por Katsuhiko Ogata (1997). Ingeniería de control moderna (3.ª ed.). Upper Saddle River, Nueva Jersey: Prentice-Hall. ISBN 978-0-13-227307-7.
  2. ^ Brockett, Roger W. (1970). Sistemas lineales de dimensión finita . John Wiley & Sons. ISBN 978-0-471-10585-5.
  3. ^ abcde Eduardo D. Sontag, Teoría del control matemático: sistemas deterministas de dimensión finita.
  4. ^ Isidori, Alberto (1989). Sistemas de control no lineales , p. 92–3. Springer-Verlag, Londres. ISBN 3-540-19916-0 . 
  5. ^ Claire J. Tomlin; Ian Mitchell; Alexandre M. Bayen; Meeko Oishi (2003). "Técnicas computacionales para la verificación de sistemas híbridos" (PDF) . Actas del IEEE . 91 (7): 986–1001. CiteSeerX 10.1.1.70.4296 . doi :10.1109/jproc.2003.814621 . Consultado el 4 de marzo de 2012 . 
  6. ^ Jean-Pierre Aubin (1991). Teoría de la viabilidad . Birkhauser. ISBN 978-0-8176-3571-8.
  7. ^ Jan Polderman; Jan Willems (1998). Introducción a la teoría de sistemas matemáticos: un enfoque conductual (1.ª ed.). Nueva York: Springer Verlag. ISBN 978-0-387-98266-3.
  8. ^ Brian DO Anderson; John B. Moore (1990). Control óptimo: métodos cuadráticos lineales . Englewood Cliffs, NJ: Prentice Hall. ISBN 978-0-13-638560-8.
  • Función de MATLAB para comprobar la controlabilidad de un sistema Archivado el 10 de febrero de 2012 en Wayback Machine
  • Función de Mathematica para comprobar la controlabilidad de un sistema
Retrieved from "https://en.wikipedia.org/w/index.php?title=Controllability&oldid=1248578965"