Allocation stratégique d'actifs : une approche par reinforcement learning pour l’ALM

  • 15 views

  • 0 comments

  • 0 favorites

  • actuview actuview
  • 1245 media
  • uploaded December 19, 2024

Dans un contexte économique au 31/12/2022 marqué par des taux d'intérêt élevés, les assureurs historiques font face à l'inertie de leur poche obligataire, ce qui les met en difficulté pour proposer des taux de valorisation de fonds euros alignés sur les taux de marché actuels. Cette étude vise à proposer une solution alternative à la stratégie d’allocation actuelle Fixed-Mix d’un assureur vie possédant à la fois des contrats euros et en unité de compte. Ce travail explore l'application du Reinforcement Learning (RL), pour optimiser la stratégie d’allocation d'actifs dans le cadre de l'Asset-Liability Management (ALM) sous Solvabilité II fournissant un outil flexible dans le pilotage de sa stratégie d’allocation d’actifs en adéquation avec ses besoins. Dans un premier temps, après avoir introduit le cadre de travail dont l’ensemble des outils nécessaires à cette étude, l’algorithme de RL retenu, le Deep Deterministic Policy Gradient (DDPG), est implémenté dans le modèle ALM. Quatre stratégies d'allocations d'actifs, élaborées à partir du DDPG, sont mises à l'épreuve, chacune visant à optimiser (maximiser ou minimiser selon leur nature) des métriques financières ou réglementaires telles que la Present Value of Future Profits (PVFP), le SCR de marché, le taux de rendement des actifs (TRA), et la richesse latente. Les stratégies sont évaluées en comparaison avec la stratégie Fixed-Mix de référence par rapport aux différentes métriques définies précédemment. L'étude inclut également une série d'analyses de sensibilité pour tester la robustesse et la flexibilité du modèle DDPG pour diverses configurations d’entrainement et de scénarios économiques. Ces analyses permettent d'examiner l'effet du nombre d'épisodes d'entraînement, des modifications apportées à la structure de récompense, et des sensibilités économiques sur la performance et la stabilité du modèle. Il s’agira, à l’issue de l’ensemble de ces tests, de retenir l’allocation candidate la plus optimale, permettant une amélioration significative des métriques ciblées tout en démontrant une capacité d'adaptation aux fluctuations des conditions économiques et réglementaires.

Tags:

0 Comments

There are no comments yet. Add a comment.