Calcul de variation et contrôle optimal

Simulez un problème scalaire de contrôle optimal linéaire quadratique à horizon fini. Le calculateur résout numériquement une équation de Riccati, déduit la commande optimale et affiche l’évolution de l’état, de la commande et du gain de coûtate associé.

Calculateur interactif

Modèle pris en charge : minimisation de J = ∫(q x² + r u²)dt + qf x(T)² sous la dynamique x’ = a x + b u, avec retour optimal u(t) = -(b P(t) / r) x(t).

Coefficient dynamique a

Coefficient de commande b

Pondération d’état q

Pondération de commande r

Pondération terminale qf

Horizon T

État initial x0

Nombre de pas temporels

Série mise en avant

Le calcul s’effectue par discrétisation d’Euler : Riccati en arrière, système en avant.

Ce calculateur pédagogique traite un problème scalaire LQR à horizon fini. Pour des systèmes multidimensionnels, contraintes d’état, commandes bornées ou termes non linéaires, il faut employer des solveurs plus avancés.

Guide expert du calcul de variation et du contrôle optimal

Le calcul de variation et le contrôle optimal constituent deux piliers de l’analyse mathématique appliquée. Le premier cherche une fonction qui rend extrême une quantité intégrale, tandis que le second ajoute une dynamique, des variables de commande et souvent des contraintes physiques. Dans les deux cas, l’objectif est de déterminer une trajectoire ou une stratégie qui minimise un coût, maximise une performance ou équilibre plusieurs critères antagonistes. En ingénierie, ces outils interviennent dans la robotique, l’aéronautique, l’économie quantitative, l’énergie, la biomécanique et la finance algorithmique.

Quand on parle de calcul de variation, on considère souvent un fonctionnel de la forme :

J[x] = ∫ L(t, x(t), x'(t)) dt

Le problème consiste à trouver la fonction x(t) qui rend J minimal ou maximal, sous certaines conditions aux bords. La condition nécessaire classique est l’équation d’Euler-Lagrange, qui transforme un problème infini-dimensionnel en équation différentielle. C’est une étape fondamentale dans les lois de mouvement, les géodésiques, l’optique ou la mécanique lagrangienne.

Le contrôle optimal généralise cette logique en introduisant une commande u(t) qui agit sur un système dynamique :

x'(t) = f(t, x(t), u(t)), avec J = Φ(x(T)) + ∫ g(t, x(t), u(t)) dt

On ne cherche plus seulement la meilleure courbe, mais la meilleure action au cours du temps pour piloter un système vers une cible. Cette formulation est essentielle pour limiter l’énergie d’un moteur, réduire les écarts de température dans un bâtiment, stabiliser un drone ou optimiser une trajectoire spatiale.

Pourquoi ce domaine est-il si important en pratique ?

Dans les applications industrielles modernes, la performance dépend rarement d’une seule variable. Il faut souvent réduire la consommation tout en maintenant la stabilité, préserver le confort tout en minimisant les coûts d’exploitation, ou atteindre une cible sans dépasser des contraintes de sécurité. Le calcul de variation et le contrôle optimal permettent précisément d’encoder ce compromis dans une fonction de coût structurée.

En robotique, on minimise le temps, l’énergie ou les à-coups de mouvement.
En aéronautique, on cherche des trajectoires économes en carburant et robustes aux perturbations.
Dans les réseaux électriques, on équilibre production, stockage et demande.
En santé, on planifie des protocoles thérapeutiques ou des trajectoires biomécaniques réalistes.
En économie, on optimise des décisions intertemporelles avec contraintes dynamiques.

Le lien entre calcul de variation et principe du maximum

Le calcul de variation fournit l’intuition de base : une solution optimale ne peut pas être améliorée par une petite variation admissible. Dans le contrôle optimal, cette idée mène au principe du maximum de Pontryagin. On introduit un Hamiltonien combinant la dynamique, la commande et une variable adjointe, parfois appelée coûtate. Le système optimal satisfait alors un ensemble couplé d’équations d’état, d’adjoint et de condition de minimisation en u.

H(t, x, u, λ) = g(t, x, u) + λ f(t, x, u)

Pour de nombreux problèmes, ces conditions sont nécessaires et, dans certains contextes convexes, elles sont aussi très proches des conditions suffisantes. Elles représentent le socle théorique derrière de nombreux solveurs numériques modernes.

Comprendre le cas LQR utilisé par le calculateur

Le calculateur présenté ci-dessus se concentre sur un modèle pédagogique mais très influent : le Linear Quadratic Regulator ou LQR. On considère un système linéaire scalaire :

x'(t) = a x(t) + b u(t)

et un coût quadratique :

J = ∫[q x(t)² + r u(t)²]dt + qf x(T)²

Cette structure est particulièrement utile, car elle admet une solution analytique ou semi-analytique via l’équation de Riccati. Le résultat clé est que la commande optimale est proportionnelle à l’état :

u(t) = -(b P(t) / r) x(t)

où P(t) satisfait une équation différentielle de Riccati avec condition terminale P(T) = qf. Plus q est élevé, plus l’algorithme pénalise les écarts de l’état ; plus r est élevé, plus il hésite à utiliser une commande forte ; plus qf est élevé, plus il cherche à terminer proche de zéro à l’instant final.

Dans un langage opérationnel, q mesure l’importance de l’erreur d’état, r mesure le coût d’action, et qf contrôle l’exigence terminale. Le réglage de ces coefficients change fortement le compromis entre agressivité, robustesse et dépense d’énergie.

Méthode de calcul numérique

Pour résoudre le problème, on suit généralement une procédure en deux temps. D’abord, on résout l’équation de Riccati en remontant le temps depuis T vers 0. Ensuite, on simule la dynamique du système vers l’avant en appliquant la loi de commande optimale. Cette stratégie est simple, stable pour des pas raisonnables et parfaitement adaptée à un outil éducatif.

Choisir les paramètres du système et les pondérations du coût.
Discrétiser l’intervalle temporel [0, T] en N pas.
Fixer la condition terminale P(T) = qf.
Intégrer l’équation de Riccati à rebours.
Calculer la commande optimale à chaque pas.
Simuler l’état x(t) vers l’avant.
Évaluer le coût total et interpréter les courbes.

Cette logique se retrouve dans des méthodes plus avancées comme le tir simple, le tir multiple, les collocations orthogonales ou la programmation dynamique. Le choix de la méthode dépend du niveau de non-linéarité, de la présence de contraintes, de la dimension du système et des exigences de calcul en temps réel.

Comparaison des approches de résolution

Méthode	Type de problème	Taille de discrétisation courante	Atout principal	Limite principale
Euler / Runge-Kutta + tir	Petits systèmes, problèmes pédagogiques	100 à 10 000 pas	Simple à implémenter, interprétation claire	Sensible à l’initialisation de l’adjoint
Collocation directe	Problèmes non linéaires avec contraintes	50 à 2 000 nœuds	Transforme le problème en NLP structuré	Peut devenir lourd en grande dimension
Programmation dynamique	Faible dimension d’état	10³ à 10⁶ points de grille	Fournit une politique globale	Subit la malédiction de la dimension
LQR / Riccati	Systèmes linéaires, coût quadratique	100 à 5 000 pas sur horizon fini	Très rapide, solution élégante et robuste	Hypothèses structurelles plus restrictives

Quelques ordres de grandeur utiles

Dans les applications réelles, le contrôle optimal produit souvent des gains mesurables. Les chiffres ci-dessous sont des ordres de grandeur couramment rapportés dans la littérature technique et dans les retours d’expérience industriels. Ils dépendent évidemment de la qualité du modèle, du niveau de contrainte et de la stratégie de référence comparée.

Secteur	Indicateur optimisé	Gain typique observé	Horizon de décision courant
HVAC et bâtiments intelligents	Consommation énergétique	5 % à 20 %	12 à 48 heures
Contrôle de trajectoire automobile	Écart de suivi et confort	Réduction de 20 % à 60 % de l’erreur RMS selon le scénario	2 à 10 secondes glissantes
Aérospatial et mission design	Carburant ou impulsion totale	2 % à 15 % sur certaines phases optimisées	Minutes à plusieurs jours
Procédés industriels continus	Énergie et respect de contraintes	3 % à 12 % de réduction des coûts opératoires	Minutes à heures

Comment interpréter les résultats du calculateur

Une fois le calcul lancé, trois sorties sont particulièrement importantes :

L’état x(t) : il montre si le système converge vers la cible et à quelle vitesse.
La commande u(t) : elle indique l’effort de pilotage consenti pour corriger l’état.
Le gain P(t) : il reflète la sensibilité optimale de la commande au cours du temps.

Si vous augmentez q, vous verrez généralement une décroissance plus rapide de l’état, au prix d’une commande plus intense. Si vous augmentez r, la commande devient plus prudente, ce qui peut allonger le temps de retour. Si qf est très grand, la trajectoire finale se resserre fortement à l’approche de l’horizon. Enfin, si a est positif et important, le système est naturellement instable ou divergent, ce qui exige une correction plus énergique.

Erreurs fréquentes lors d’un calcul de variation ou de contrôle optimal

Choisir des pondérations q et r sans cohérence d’échelle physique.
Utiliser un pas de temps trop grand, ce qui dégrade la précision numérique.
Oublier les contraintes de saturation de commande dans un modèle de production.
Confondre stabilité nominale et robustesse face au bruit ou aux incertitudes.
Interpréter un optimum local comme une solution globale dans un problème non convexe.

Dans les projets avancés, il est recommandé de normaliser les variables, de tester plusieurs discrétisations, d’étudier la sensibilité aux paramètres et de comparer la solution obtenue avec une stratégie de référence simple. Cette discipline évite les conclusions trompeuses et renforce la crédibilité de l’optimisation.

Quand faut-il dépasser le modèle LQR ?

Le LQR est remarquable pour sa clarté et sa puissance, mais il ne suffit pas toujours. Si votre système contient des non-linéarités marquées, des contraintes dures sur l’état ou la commande, des retards, des commutations hybrides ou des objectifs multi-phases, il faut migrer vers des modèles plus riches. Les approches de type MPC (Model Predictive Control), collocation directe, SQP, méthodes pseudospectrales ou apprentissage par renforcement avec contraintes peuvent alors prendre le relais.

Dans le monde industriel, l’enjeu n’est pas seulement de trouver une commande optimale théorique, mais une commande calculable, robuste et exploitable. C’est pourquoi la qualité du modèle, la vitesse du solveur et la capacité à gérer les contraintes réelles sont aussi importantes que l’élégance mathématique.

Sources académiques et institutionnelles recommandées

Conclusion

Le calcul de variation et le contrôle optimal forment une boîte à outils intellectuelle indispensable pour quiconque conçoit des systèmes dynamiques performants. Le premier fournit les principes de stationnarité et les équations nécessaires, le second étend ces idées à la prise de décision dynamique sous contraintes. Le calculateur ci-dessus vous donne un aperçu concret de cette logique à travers un problème LQR à horizon fini : on pénalise simultanément l’erreur d’état et l’effort de commande, on résout l’équation de Riccati, puis on applique la commande optimale pour obtenir une trajectoire stabilisée. C’est une porte d’entrée idéale avant d’aborder les problèmes non linéaires, les contraintes explicites et les méthodes numériques avancées utilisées dans les applications de pointe.

Calcul De Variation Et Controle Optimal