$$ \newcommand{\esp}[1]{\mathbb{E}\left(#1\right)} \newcommand{\var}[1]{\mbox{Var}\left(#1\right)} \newcommand{\deriv}[1]{\dot{#1}(t)} \newcommand{\prob}[1]{ \mathbb{P}\!(#1)} \newcommand{\eqdef}{\mathop{=}\limits^{\mathrm{def}}} \newcommand{\by}{\boldsymbol{y}} \newcommand{\bc}{\boldsymbol{c}} \newcommand{\bpsi}{\boldsymbol{\psi}} \def\pmacro{\texttt{p}} \def\like{{\cal L}} \def\llike{{\cal LL}} \def\logit{{\rm logit}} \def\probit{{\rm probit}} \def\one{{\rm 1\!I}} \def\iid{\mathop{\sim}_{\rm i.i.d.}} \def\simh0{\mathop{\sim}_{H_0}} \def\df{\texttt{df}} \def\res{e} \def\xomega{x} \newcommand{\argmin}[1]{{\rm arg}\min_{#1}} \newcommand{\argmax}[1]{{\rm arg}\max_{#1}} \newcommand{\Rset}{\mbox{$\mathbb{R}$}} \def\param{\theta} \def\setparam{\Theta} \def\xnew{x_{\rm new}} \def\fnew{f_{\rm new}} \def\ynew{y_{\rm new}} \def\nnew{n_{\rm new}} \def\enew{e_{\rm new}} \def\Xnew{X_{\rm new}} \def\hfnew{\widehat{\fnew}} \def\degree{m} \def\nbeta{d} \newcommand{\limite}[1]{\mathop{\longrightarrow}\limits_{#1}} \def\ka{k{\scriptstyle a}} \def\ska{k{\scriptscriptstyle a}} \def\kel{k{\scriptstyle e}} \def\skel{k{\scriptscriptstyle e}} \def\cl{C{\small l}} \def\Tlag{T\hspace{-0.1em}{\scriptstyle lag}} \def\sTlag{T\hspace{-0.07em}{\scriptscriptstyle lag}} \def\Tk{T\hspace{-0.1em}{\scriptstyle k0}} \def\sTk{T\hspace{-0.07em}{\scriptscriptstyle k0}} \def\thalf{t{\scriptstyle 1/2}} \newcommand{\Dphi}[1]{\partial_\pphi #1} \def\asigma{a} \def\pphi{\psi} \newcommand{\stheta}{{\theta^\star}} \newcommand{\htheta}{{\widehat{\theta}}} $$


English



1 Les données

Notre objectif est ici d’étudier la dynamique de la pandémie en France en utilisant les données hospitalières fournies par Santé Publique France.

Les données utilisées sont :

Les trois séries sont représentées ci-dessous:

La ``première vague’’ survenue début avril est bien sûr très nette sur chacune des trois séries. On observe ensuite une décroissance rapide jusqu’à juillet, mais ce qui se passe ensuite n’est pas aussi évident en regardant les données telles quelles.

Une moyenne mobile sur 7 jours permet d’une part de supprimer la composante périodique hebdomadaire. Une échelle semi-log permet d’autre part de mieux visualiser la tendance générale :

Ce graphique permet de bien mettre en évidence différents régimes dans la dynamique. Les trois séries semblent en effet présenter une succession de phases de croissance et de décroissance exponentielle (i.e. visuellement linéaire avec une échelle semi-log). Nous allons voir qu’un tel modèle ajuste très bien les données.



2 Modélisations séparées des hospitalisations, des réanimations et des décès

Pour chacune des trois séries, nous allons considérer ici un modèle de la forme

\[ \dot{X_j}(t) = k_j(t) X_j(t) \ \ ; \ \ j=1,2,3\]\(k_j\) est une fonction continue linéaire par morceaux. Ce modèle suppose qu’il existe des instants de rupture \(\tau_{j,1}, \tau_{j,2}, \ldots, \tau_{j,K-1}\) tel que

\[ k_j(t) = k_{j,0} + a_j t + \sum_{k=1}^{K-1} h_{jk} ( t - \tau_k) \times \one \{t\geq \tau_k \}\]

Lorsque \(k_j\) est une fonction constante positive (resp. négative), \(X_j\) est une fonction exponentielle croissante (resp. décroissante).

Le graphique ci-dessous montre que de très bons ajustements sont obtenus avec \(K=4\) segments. Pour chacune des trois séries, la moyenne mobile est représentée en magenta, l’incidence prédite par le modèle est en noir et un intervalle de confiance à 90% pour l’incidence prédite est en gris clair.

Les trois fonctions de taux \((k_1, k_2, k_3)\) estimées (et leur intervalles de confiance à 90%) sont représentées ci-dessous.

On remarque que ces trois fonctions de taux ont sensiblement le même comportement :

On peut également remarquer que les dynamiques des deux premières séries (hospitalisations et admissions en unité de soins intensifs) sont très bien estimées. En particulier, le modèle confirme bien la croissance exponentielle observée depuis mi-juillet pour ces deux séries.

Si la série des décès semble également remonter depuis le mois d’aout, la croissance est moins nette que pour les deux autres séries et s’effectue avec un retard d’environ un mois. Nous verrons dans la section suivante qu’un modèle joint permet de mettre en évidence une diminution de la létalité depuis environ juillet-août.



3 Modélisation jointe des hospitalisations/réanimations et des décès

L’objectif ici est de construire un modèle qui décrit les échanges et interactions entre individus infectés, individus hospitalisés (ou admis en réanimaton) et patients décédés:

\[ \begin{aligned} \dot{I}(t) &= k(t) \, I(t) \\ \dot{H}(t) &= I(t) - \nu(t) H(t) - \mu H(t) \\ \dot{L}(t) &= \nu(t) H(t) - \lambda L(t) \\ \dot{D}(t) &= \lambda L(t) \end{aligned} \],

Ce modèle permet d’approximer le nombre de patients qui rentrent à l’hopital et le nombre de patients décédés le jour \(j\), respectivement par \(I(t_j)\) et \(\dot{D}(t_j) = \lambda L(t_j)\).

Il est fréquemment avancé par les médecins qu’une meilleure prise en charge des patients a permis une diminution de la létalité de la COVID-19. Cette hypothèse mérite d’être testée en considérant un taux \(\nu\) qui dépend du temps. Un modèle de type logistique permet par exemple de supposer que le taux \(\nu\) passe d’une valeur initiale \(\nu_1\) à une valeur finale \(\nu_2\): \[ \nu(t) = \nu_1 + \frac{\nu_2 - \nu_1}{1+ e^{-\alpha (t - \gamma)}}\]

Le graphique ci-dessous montre les ajustements obtenus avec \(K=4\) segments. Pour chacune des deux séries, la moyenne mobile est représentée en magenta, l’incidence prédite par le modèle est en noir et un intervalle de confiance à 90% pour l’incidence prédite est en gris clair.

Dans le graphique ci-dessous, la fonction de taux \(k\), estimée à partir du modèle joint pour la série des hospitalisations/réanimations et représentée à gauche, est tout à fait cohérente avec les fonctions de taux estimées dans la section précédente pour chacune des séries, et confirme en particulier la croissance exponentielle actuelle du nombre d’hospitalisations. Le nombre de décès semble également croitre de façon exponentielle, malgré une diminution de la létalité.