Contrôle Optimal Garanti

Soutenu par Dimitri Asseray

Tuteur : Sébastien Lagrange

Résumé

Mots clés : contrôle optimal, contrôle garanti, méthode de tirs garantie, intégration numérique, VNODE-LP, analyse par intervalles

Le sujet de ce projet est d'obtenir un algorithme qui détermine le contrôle optimal et garanti d\'un système dynamique. L'objectif est de pouvoir l'embarquer afin de déterminer le contrôle en temps réel. Le contexte de ce projet est la volonté de faire revenir à  son point de départ un planeur envoyé dans la stratosphère par un ballon.

Le problème d'optimisation qui se pose est formulé par une équation à  minimiser regroupant les critères d'optimisation choisis. Ces critères sont contraints par le modèle mathématique du système qui est représenté par des équations différentielles. Les différentes méthodes existantes permettant de résoudre ce genre de problème sont des procédés itératifs basés sur des approximations (une discrétisation temporelle mais aussi des espaces de contrôles ou des états du système sont opérées). La propagation des erreurs peut ainsi être observée et la solution numérique diverge peu à  peu de la véritable solution. Il n'y a pas de moyen de quantifier et donc de contrôler cette divergence. Le système dynamique n'évolue pas de manière optimale. Afin de contrer ce problème, des outils d'intégration numérique vont être utilisés tel que VNODE-LP.

L'enjeu de ce projet est de déterminer une procédure qui permet d'encadrer le contrôle optimal et ainsi de connaître les erreurs engendrées. Cet algorithme doit utiliser peu de ressources et les temps de calculs doivent être assez court afin de pouvoir l'embarquer sur un système dynamique mobile.

Rapports

Méthode de tirs garantie

Soit le système dynamique suivant :

$\dot{x}(t) = f(x(t),u(t),t)$



et la fonctionnelle de coà»t traduisant les critères d'optimalité :

$J = h(x(t_f),t_f) + \int_{t_0}^{t_f} g(x(t),u(t),t) \, d\mathrm{t}$



En posant l'hamiltonien qui est une fonction qui va prendre en compte les critères d'optimisation au cours du temps et les contraintes du modèle mathématique du système :

$H = g(x(t),u(t),t) + p(t) \times \dot{x}(t)$

Le principe repose sur le fait de créer un système d'équations prenant en compte le modèle mathématique du système et les critères d'optimalité qui soit autonome, c'est à  dire qu'il n'y a plus de paramètres; le contrôle est exprimé en fonction des variables d'état de ce nouveau système.
Pour ce faire $u(t)$ est exprimé en fonction de $x(t)$ et de $p(t)$ gràące à  une condition que doit respecter tout contrôle optimal : $\dfrac{\partial H^*}{\partial u} = 0$. S'il est possible de déterminer une fonction $a$ de telle sorte que :

$u(t) = a(x(t),p(t)) \qquad \forall t \in [t_0,t_f]$

alors le système autonome comprenant les contraintes dynamiques (le modèle mathématique) et les critères d'optimalités peut être déterminé :

$\left. \begin{array}{lclcl} \dot{x} &=& f(x(t),p(t),t)&=&\dfrac{\partial H}{\partial p}\\[0.5cm] \dot{p} &=& - \dfrac{\partial H}{\partial x} \end{array}\right\}\qquad\forall t \in [t_0,t_f] \label{eq_systeme_sans_u}$

$x(t_0) = [x_0]\,, \qquad \dfrac{dh(x(t_f),t_f)}{dx} - p(t_f) = 0$

L'expression de $p_f$ est déterminée gràące aux conditions à  $t = t_f$. Le temps à  atteindre est donné, $\delta t$ est donc nul.
Le problème de ce système est qu'une partie des conditions limites est connue. En $t = t_0$, seul $x_0$ est connu et en $t= t_f$ c'est la relation entre $p_f$ et $x_f$ qui est connu.

Afin de déterminer la solution au problème de Cauchy précédent, la méthode de tirs garantie va être adoptée. Un vecteur d'intervalles, de la même dimension que celle des états, $[p_0]$ va être utilisé comme valeur initiale du système. Au fil des itérations, il va être bissecté afin d'obtenir une liste de $[p_0^*]$ qui mènent aux trajectoires optimales.

Principe de la méthode de tirs garantie

La figure précédente est un schéma explicatif de cette procédure. La première itération de l'algorithme commence par intégrer jusqu'à  $t_f$ qui est fixé le système autonome avec $[x_0]$ et un intervalle $[p_0]$. On obtient $[x_f]$ et $[p_f]$, les vecteurs d'intervalles qui encadrent les fonctions solutions $x(t)$ et $p(t)$ à  $t=t_f$. Si $[p_f]$ contient des points respectant l'équation $p_f = \dfrac{dh(x_f,t_f)}{dx}$, alors $[p_0]$ est bissecté jusqu'à  ce que sa taille soit satisfaisante, c'est à  dire qu'elle respecte une précision donnée en entrée de l'algorithme.
Au terme de la procédure, on obtient une liste de $[p_0^*]$ qui contiennent $p_0^*$ et qui entraîneront l'évaluation du ou des contrôles optimaux gràące à  l'expression de $u$.

Le modèle dynamique : le planeur

Afin d'optimiser le contrôle du planeur, il faut déterminer son modèle mathématique. Pour le moment quelques hypothèses seront émises afin de simplifier le problème :

  • Les mouvements latéraux sont ignorés C'est à  dire que l'avion ne "glisse" pas sur ses côtés. Ses mouvements sont considérés dans le plan représenté par l'axe colinéaire avec la vitesse et l'axe colinéaire avec la force appelée la portance.

  • L'influence des bruits tels que le vent est négligée.

  • La Terre est considérée comme plate au vu de la hauteur de vol face au rayon de la planète. Ainsi la force de Coriolis n'est pas prise en compte.
schéma du planeur

Dans ce système dynamique les contrôles sont les angles d'attaque $\alpha$ et de virage $\nu$.

$ \left\{ \begin{array}{lcl} \dot{V} &=& -\dfrac{1}{m}D-g(z)\sin(\gamma)\\[0.5cm] \dot{\gamma} &=& \dfrac{L}{mV}\cos(\nu)-\dfrac{g(z)}{V}\cos(\gamma)\\[0.5cm] \dot{\chi} &=& \dfrac{L}{mV}\dfrac{\sin(\nu)}{\cos(\gamma)}\\[0.5cm] \dot{x} &=& V\cos(\gamma)\cos(\chi)\\ \dot{y} &=& V\cos(\gamma)\sin(\chi)\\ \dot{z} &=& V\sin(\gamma) \end{array}\right.$


avec :
  • $V$ : La vitesse du planeur en m/s.

  • $\gamma$ : L'angle de vol en radian.

  • $\chi$ : L'angle avec le Nord en radian.

  • $x$, $y$, $z$ : Les coordonnées spaciales en mètre.

  • $D$ : (Drag) la force de traînée en Newton.

  • $L$ : (Lift) la force de portance. C'est la force qui permet au planeur de voler en Newton.

  • $g(z)$ : l'accélération normale de pesanteur en m/$s^2$.