Principe de l'approximation d'opérateur

Section 13.1 Principe de l'approximation d'opérateur

On va rapidement dans cette section introduire le principe de l'approximation d'opérateur différentielle.

Soit une EDP (ici temporelle, mais elle peut être elliptique):

\begin{equation} \left\{\begin{array}{l} G_{\boldsymbol{\mu}}(u(x)) =\partial_t u(x) + \mathcal{L}_{\boldsymbol{\mu}}(u(x))=0\quad \mbox{ on }\Omega, \\ u(x)=g(x)\quad \mbox{ on }\partial\Omega, \\ u(t=0,x)=u_0(x) \end{array}\right.\tag{13.1} \end{equation}

De façon très formelle on peut supposer que si il ya une unique solution a notre EDP, il existe un opérateur bijectif

\begin{equation*} G^+(): L^p(\Omega) \times L^q(\partial \Omega)\times V_{\boldsymbol{\mu}}\rightarrow L^{p_t}\left([0,T],L^{p_s}(\Omega)\right) \end{equation*}

avec \(V_{\boldsymbol{\mu}}\) un espace des paramètres qui peut être fonctionnel tel que

\begin{equation*} G^+(a(t,x))=u(t,x) \end{equation*}

avec \(a(t,x)=(u_0,g,\boldsymbol{\mu})\) et donc qui correspond à l'opérateur inverse de notre EDP. L'idée de l'approximation d'opérateur est de construire un réseau de neurones \(G_{\theta}^{+}\) qui va approcher \(G^+\text{.}\) En pratique on ne peut pas espérer le faire sur l'ensemble des fonctions \(a\) dans \(L^p\text{.}\) On se restreint donc a une sous-classe de fonction indéxée par une mesure \(/nu\text{.}\) On cherche donc a minimiser

\begin{equation*} \parallel G^{+} - G_{\theta}^+\parallel = \mathbb{E}_{a\sim \nu} [\parallel G^{+}(a) - G_{\theta}^+(a)\parallel_{L^p}]=\int_A \parallel G^{+}(a) - G_{\theta}^+(a)\parallel_{L^p} \end{equation*}

En pratique on utilisera systématiquement une Mmthode de Monte-Carlo pour approcher notre espérance.\\ Si on y arrive, cela permettrait d'obtenir un processus rapide de construction d'une solution qualitativement raisonnable à partir des paramètres, des conditions initiales et conditions limites de l'EDP. Par exemple dans le cas de l'équation \(-\Delta u=f\) cet opérateur inverse est donné par

\begin{equation*} u(x)=\int_{\Omega}G(x,y)f(y)dy \end{equation*}

avec \(G\) le noyau de Green. Cet opérateur est un opérateur intégral, nonlocal, probablement très compliqué à déterminer en dehors d'équation linéaire, sur des géométries simples. On essaye directement d'unifier un petit peu les différentes approches utilisées selon le type de représentation spatiale utilisée (l'architecture du réseau sera centrale) dans ce cas et le type de fonction de coût utilisée.