Citation for this paper:
Agueh, M. & Carlier, G. (2017). Vers un théorème de la limite centrale dans
l’espace de Wasserstein?/Towards a central limit theorem in the Wasserstein
space?. Comptes Rendus Mathematique, 355(7), 812-818.
https://doi.org/10.1016/j.crma.2017.05.010
UVicSPACE: Research & Learning Repository
_____________________________________________________________
Faculty of Science
Faculty Publications
_____________________________________________________________
Vers un théorème de la limite centrale dans l’espace de Wasserstein? /Towards a
central limit theorem in the Wasserstein space?
Martial Agueh, Guillaume Carlier
July 2017
©2017 Académie des sciences. Publié par Elsevier Masson SAS. Cet article est publié en
Open Access sous licence CC BY-NC-ND (
http://creativecommons.org/licenses/by-nc-nd/4.0/
).
This article was originally published at:
http://dx.doi.org/10.1016/j.crma.2017.05.010
Contents lists available atScienceDirect
C. R.
Acad.
Sci.
Paris,
Ser. I
www.sciencedirect.comAnalyse fonctionnelle
Vers
un
théorème
de
la
limite
centrale
dans
l’espace
de
Wasserstein ?
Towards
a
central
limit
theorem
in
the
Wasserstein
space?
Martial Agueh
a,
Guillaume Carlier
b,
caUniversityofVictoria,Victoria,BC,POBox3060STNCSCVictoria,BC,V8W3R4,Canada bUniversitéParis-Dauphine,PSLResearchUniversity,CNRS,CEREMADE,75016Paris,France cINRIA,CentredeParis,équipeMOKAPLAN,France
i
n
f
o
a
r
t
i
c
l
e
r
é
s
u
m
é
Historiquedel’article :
Reçule19février2017
Acceptéaprèsrévisionle29mai2017 DisponiblesurInternetle7juin2017 Présentéparlecomitéderédaction
Lesbarycentresdansl’espacedeWassersteinconstituentunemanièrenaturelled’interpoler entreplusieursmesuresdeprobabillité,utiledansdifférentsdomainesappliquéscommele traitementd’imagesoul’apprentissagestatistique.Nousconjecturonsquecesbarycentres obéissentàun théorèmede lalimite centrale quenous démontrons dansquelques cas (très)particuliers.
©2017Académiedessciences.PubliéparElsevierMassonSAS.Cetarticleestpubliéen OpenAccesssouslicenceCCBY-NC-ND (http://creativecommons.org/licenses/by-nc-nd/4.0/).
a
b
s
t
r
a
c
t
The notion of Wasserstein barycenters is anatural way to interpolatebetween several probabilitymeasures,usefulinvariousappliedsettingslikeimageprocessingormachine learning.Weconjecturethatsuchbarycentersobeyacentrallimittheoremwhichweprove insome(very)particularcases.
©2017Académiedessciences.PubliéparElsevierMassonSAS.Cetarticleestpubliéen OpenAccesssouslicenceCCBY-NC-ND (http://creativecommons.org/licenses/by-nc-nd/4.0/).
AbridgedEnglishversion
The 2-Wasserstein space(on
R
d),P
2(
R
d)
isby definitionthespaceofBorelprobability measures onR
d havingfinitesecondmomentsandendowedwiththedistanceW2
W22
(
μ
,
ν
)
:=
inf⎧
⎪
⎨
⎪
⎩
Rd×Rd|
x−
y|
2dγ
(
x,
y),
γ
∈ (
μ
,
ν
)
⎫
⎪
⎬
⎪
⎭
,
∀(
μ
,
ν
)
∈
P
2(
R
d)
2 (1)Adressese-mail :agueh@math.uvic.ca(M. Agueh),carlier@ceremade.dauphine.fr(G. Carlier).
where
(
μ
,
ν
)
denotesthesetoftransportplansbetweenμ
andν
i.e.thesetofprobabilitymeasuresonR
d× R
dhavingμ
andν
asmarginals.Givenaninteger N,ν
1,
. . .
ν
N elements ofP
2(
R
d)
andpositiveweightsλ
= (λ
1,
. . . ,
λ
N)
∈ R
+N with Ni=1
λ
i=
1,aWassersteinbarycenterofthemeasuresν
iwithweightsλ
iisaminimizerofJλ
(
μ
)
:=
N
i=1
λ
iW22(
ν
i,
μ
).
(2)Wassersteinbarycenterswereintroducedinapreviouswork[1],whereitwasobservedthat:
– theminimizerisunique(itsexistenceisobvious)assoonasoneofthemeasures
ν
doesnotgivemasstosmallsets(i.e. BorelsetsofHausdorff dimensionatmostd−
1),inthiscase,wemaycallthisminimizerthe Wassersteinbarycenter ofthemeasuresν
iwithweightsλ
i,– ifforsome p
∈ (
1,
+∞)
,all themeasuresν
i areLp (withrespecttotheLebesguemeasure)thensoistheirbarycenter(thisfollowsfromadisplacementconvexitytypeargumentinthespiritofMcCann’sseminalwork[11]),thisalsoholds forthelimitcasep
=
1 andforp= ∞
,itisenoughthatoneofthemeasuresν
i isL∞.Wassersteinbarycenters foundvariousapplicationsinstatistics,imageprocessingandmachinelearning,andtherearefast solverstocomputethem,seeCuturi[5]andBenamouet al.[2].TheconceptofWassersteinbarycenterhasbeensignificantly extendedby BigotandKlein [3],Le GouicandLoubes[10] tothe caseofa quitegeneralBorelprobabilitymeasure m on
(P
2(
R
d),
W2)
andby Kim and Pass [9] tothe Riemannian setting. AWasserstein barycenter isthen a minimizer oftheWassersteinvariancefunctional:
Jm
(
μ
)
:=
P2(Rd)W22
(
ν
,
μ
)
dm(
ν
).
(3)Theexistenceofabarycentercaneasilybeestablishedbythedirectmethodofthecalculusofvariations(see[10])assoon as
P2(Rd) Rd|
x|
2dν
(
x)
dm(
ν
) <
+∞.
(4)Uniqueness alsoholdsprovided thatm givesastrictlypositivemasstothe setofmeasures thatvanishonsmallsets.We shallalwaysmaketheseassumptionsandthendefineunambiguously:
bar
(
m)
:=
argminP2(Rd)Jm
.
(5)If,inaddition,forsome p
∈ (
1,
∞)
,m issupportedbyP
2(
R
d)
∩
Lp(
R
d)
and P2(Rd)ν
pLp(Rd)dm
(
ν
) <
+∞
(6)thesameconvexityargumentasin[1]givesthatbar
(
m)
∈
Lp(
R
d)
.Ofcourse,(2)isaspecialcaseof(3)correspondingtoa discrete m:m=
Ni=1λ
iδ
νi,andifone ofthemeasuresν
i vanisheson smallsets, thebarycenterofthisdiscretemeasurewillbedenotedas:
bar
(
ν
1, λ
1. . . ,
ν
N, λ
N)
=
barN i=1
λ
iδ
νi:=
argminP2(Rd) N i=1λ
iW22(
ν
i, .).
(7)FollowingBigotandKlein [3],we areinterested intheasymptoticbehaviorofempirical Wassersteinbarycenters.More precisely,letusconsiderm aBorelprobabilitymeasurem on
P
2(
R
d)
suchthatforsome p∈ (
1,
∞)
andsome C>
0 Rd|
x|
2dν
(
x)
+
Rdν
(
x)
pdx≤
C for m-a.e.ν
.
(8)Consideringani.i.d.sample of(random)probability measures
ν
ˆ
1,
. . . ,
ν
ˆ
n drawnaccordingtotheprobabilitymeasurem onP
2(
R
d)
, theempirical Wassersteinbarycenter of thissample is the random (a.s.well-defined sincem gives full masstomeasuresthatvanishonsmallsets)measure
ˆ
μ
n:=
barˆ
ν
1,
1 n. . . ,
ν
ˆ
n,
1 n.
(9)In the compactlysupported case, Bigot andKlein [3]proved a lawof largenumber, extended toa generalsetting by Le GouicandLoubes[10],fortheempiricalbarycenter:
lim
n→∞W
2
2
(
μ
ˆ
n,
μ
¯
)
→
0 a.s., whereμ
¯
:=
bar(
m).
(10)Since,thanksto(8)both
μ
¯
:=
bar(
m)
andμ
ˆ
nhaveLpdensities,thereexistsauniqueoptimaltransportmapforW2betweenthetruebarycenter
μ
¯
andtheempiricalbarycenterμ
ˆ
n,wedenoteby Tˆ
n:=
Tμ¯→ ˆμn thismap,whichmaybeviewedasan L2(
μ
¯
,
R
d)
-valuedrandom variable. Since W22(
μ
ˆ
n,
μ
¯
)
= ˆ
Tn−
id2L2(μ¯), thanks to (8)and toa simple convexity argument(see[1]),onehasW2
2
(
μ
ˆ
n,
μ
¯
)
≤
2C .Thanksto(10)andLebesgue’sdominatedconvergencetheorem,wethushaveˆ
Tn−
id2L2(μ¯)→
0 a.s. andE
ˆ
Tn−
id2L2(μ¯)→
0.
(11)ItisnaturalthentoinvestigatewhetheronecangoonestepfurtherintheconvergenceofempiricalWasserstein barycen-ters throughsome centrallimit theorem.Thelawoflargenumbers ofBigotandKlein givesthat T
ˆ
n convergesa.s.to theidentity map, we believe thatan L2 estimate in O
(
1/
√
n)
andasymptoticnormality seemreasonable to conjectureforawide classofmeasures m.Proving sucha CLTeveninthe caseofa discretem seems adelicate issue,actually relatedto theregularityofsolutionsofan obstacleproblemforasystemofMonge–Ampèreequations.Letusmentionthatarelated questionconcerningtheasymptoticdistributionofthescalarquantity
√
nW2(
μ
ˆ
n,
μ
¯
)
anditsuseforstatisticaltestspurposeshasbeenconsideredintherecentworks[6]and[7].
Bydefinition,wewillsaythattheWassersteinCLTholdswhenever
√
n( ˆ
Tn−
id)
convergesindistribution(inthesepara-bleHilbertspaceL2
(
μ
¯
,
R
d)
)toacenteredGaussianN (
0,
)
foracertainpositiveself-adjointoperatoroftraceclasson L2
(
μ
¯
,
R
d)
.Thefollowinggivesapositiveanswerinafew(very)particularcases.Theorem1.TheWassersteinCLTholdsinthefollowingcases: (i) m
= (
1− λ)δ
ν0+ λδ
ν1withλ
∈ (
0,
1)
,ν
0,ν
1inP
2(
R
d
)
andν
0vanishingonsmallsets,
(ii) d
=
1,m satisfies(19)andgivesfullmasstothesetofnon-atomicmeasures, (iii) m=
Ni=1λ
iδ
νiwitheachν
ianon-degenerateGaussianonR
d.
1. Introduction
L’espace de Wasserstein(sur
R
d),P
2(
R
d)
est pardéfinition l’ensemble desmesures de probabilité surR
d,de secondmomentfini,munidelamétriqueW2 définieparleproblèmedetransportoptimalquadratique : W22
(
μ
,
ν
)
:=
inf⎧
⎪
⎨
⎪
⎩
Rd×Rd|
x−
y|
2dγ
(
x,
y),
γ
∈ (
μ
,
ν
)
⎫
⎪
⎬
⎪
⎭
,
∀(
μ
,
ν
)
∈
P
2(
R
d)
2 (12)où
(
μ
,
ν
)
estl’ensembledesplansdetransportentreμ
etν
c’est-à-direl’ensembledesmesuresdeprobabilitésurR
d×R
dayant
μ
etν
commemarginales(nousrenvoyonsauxlivresdeVillani[13] etSantambrogio[12] pouruneprésentationde lathéoriedutransportoptimal).SoitN unentierplusgrandque1,ν
1,
. . .
ν
N desélémentsP
2(
R
d)
etλ
= (λ
1,
. . . ,
λ
N)
∈ R
+Ndespoidspositifsnormaliséspar
Ni=1λ
i=
1,unbarycentredansl’espacedeWassersteindesmesuresν
iaveclespoidsλ
iestunminimiseurde Jλ
(
μ
)
:=
N i=1λ
iW22(
ν
i,
μ
).
(13)Cettenotionaétéintroduitedansnotretravailprécédent[1],danslequelnousavionsobservéque :
– le minimiseurest unique (l’existence estquant à elleévidente) dèslorsque l’une desmesures
ν
i necharge pas lesensemblespetits (i.e.lesBoréliensde dimensiondeHausdorffauplusd
−
1) ;danscecas,onappelleceminimiseurlebarycentredansl’espacedeWassersteindesmesures
ν
i aveclespoidsλ
i;– sitoutes lesmesures
ν
i sontdans Lp (parrapport àlamesurede Lebesgue)pourun certain p∈ (
1,
+∞)
,alorsilenestdemêmedeleurbarycentre(cecidécouled’unargumentdetypeconvexitépardéplacementdansl’espritdutravail pionnierdeMcCann[11]), c’estencorevalablepourlecaslimite p
=
1 etpour p= ∞
,ilsuffitquel’unedesmesuresν
i (pourlaquellelepoidsλ
i>
0 évidemment)soitdansL∞.l’espacedeWassersteinsontrelativementpopulairesdansdifférentscontextesapplicatifscommeletraitementd’imagesou l’apprentissagestatistiqueetpeuventsecalculernumériquementefficacement–voirCuturi[5]etBenamouet al.[2].
Danscettenote,nousconjecturonsque,lorsquelesmesures
ν
isontdesmesurestiréesaléatoirementetdemanièrei.i.d.selonunecertain loide probabilitém sur
P
2(
R
d)
vérifiantdesconditionsadéquates,alorsl’écartentre levrai barycentredelamesurem (voirparagraphesuivant)etlebarycentreempiriqueobéitàunthéorèmedelalimitecentrale.Celaestun raffinementquinoussemblenatureld’unrésultatdetypeloidesgrandsnombresdeBigotetKlein[3].Nousprécisonsun peulesdéfinitionsdansleparagraphesuivantetétablironslethéorèmedelalimitecentraleauparagraphe3dansquelques castrèsparticuliers.
2. Barycentreempiriqueetvraibarycentre
Lanotiondebarycentredansl’espace deWassersteinaétéétenduedemanièresignificativeaucasd’unemesure boré-liennem sur
P
2assezgénéraleparBigotandKlein[3],LeGouicetLoubes[10]danslecasde(
P
2(
R
d),
W2)
etparKimetPass[9]danslecasdel’espacedeWassersteinsurunevariétériemannienne.UnbarycentreWassersteindem est alorsun miniseurdelafonctionnelledevariance :
Jm
(
μ
)
:=
P2(Rd)W22
(
ν
,
μ
)
dm(
ν
).
(14)L’existence d’un tel barycentre s’obtientaisément par la méthode directedu calcul desvariations (voir notamment [10]) lorsque
P2(Rd) Rd|
x|
2dν
(
x)
dm(
ν
) <
+∞.
(15)L’unicitéest quantà elleassurée dès quem donne unemesurepositive auxmesures qui nechargent pasles ensembles petits.Sousceshypothèses,onpeutdoncdéfinirsansambiguité
bar
(
m)
:=
argminP2(Rd)Jm
.
(16)Sienplus,pourun p
∈ (
1,
∞)
,m estportéeparP
2(
R
d)
∩
Lp(
R
d)
et P2(Rd)ν
pLp(Rd)dm
(
ν
) <
+∞
(17)lemêmeargumentde convexitéque dans[1]permetde déduire que bar
(
m)
∈
Lp(
R
d)
.Évidemment,(13)est uncaspar-ticulier de(14)correspondant àlamesure discrètem
=
iN=1λ
iδ
νi,etsi l’unedesmesuresν
i (avecun poidsstrictementpositif)nechargepaslesensemblespetits,onnotealors :
bar
(
ν
1, λ
1. . . ,
ν
N, λ
N)
=
barN i=1
λ
iδ
νi:=
argminP 2(Rd) N i=1λ
iW22(
ν
i, .).
(18)SuivantBigotetKlein[3],nousnousintéressonsaucomportementasymptotiquedesbarycentres deWasserstein empi-riques.Plusprécisément,considéronsm unemesuredeprobabilitéboréliennesur
P
2(
R
d)
tellequ’ilexisteC>
0 telque Rd|
x|
2dν
(
x)
≤
C pour m-presque toutν
, (19)etp
∈ (
1,
∞)
telqueRd
ν
(
x)
pdx≤
C pour m-presque toutν
. (20)Considéronsmaintenantunéchantilloni.i.d.de mesuresaléatoires deprobabilité
ν
ˆ
1,
. . . ,
ν
ˆ
n tiréesselonm surP
2(
R
d)
.Le barycentrede Wassersteinempiriquede cet échantillonestlamesurealéatoire(p.s.biendéfinie puisquem estportée parlesmesuresquinechargentpaslesensemblespetits)
ˆ
μ
n:=
barˆ
ν
1,
1 n. . . ,
ν
ˆ
n,
1 n.
(21)Bigot et Klein [3] ont établi, dans un cadre à support compact, une loi des grands nombres, étendue par Le Gouic et Loubes[10]àdescasbeaucoupplusgénéraux,pourlebarycentreWassersteinempirique :
lim
n→∞W
2
2
(
μ
ˆ
n,
μ
¯
)
→
0 p.s., avecμ
¯
:=
bar(
m).
(22)Comme, grâceà (20)àla fois
μ
¯
:=
bar(
m)
etμ
ˆ
n sont Lp,ilexiste ununique transport optimal(voir[4,13,12]) pour W2entrelevraibarycentre
μ
¯
etlebarycentreempiriqueμ
ˆ
n,notonsTˆ
n:=
Tμ¯→ ˆμncetransportoptimalquel’ondoitcomprendrecomme unevariablealéatoireprenant sesvaleursdansl’espace deHilbertséparable L2
(
μ
¯
,
R
d)
.Ona W22(
μ
ˆ
n,
μ
¯
)
= ˆ
Tn−
id
2L2(μ¯),avec(19)etunargumentsimpledeconvexité(voir[1]),onaW22
(
μ
ˆ
n,
μ
¯
)
≤
2C ,desortequ’avec(22)etlethéorèmedeconvergencedominéedeLebesgue,ona
ˆ
Tn−
id2L2(μ¯)→
0 p.s. etE
ˆ
Tn−
id2L2(μ¯)→
0.
(23)Il est alorsnaturel de chercherà allerun ordre plus lointaindansla convergenceau travers d’un théorème de lalimite centrale.LaloidesgrandsnombresdeBigotetKleinénonçantqueT
ˆ
nconvergep.s.etenmoyennequadratiqueversl’identiédans L2
(
μ
¯
)
,il semble raisonnable de conjecturerune vitessede convergenceen O(
1/
√
n)
etunenormalité aymptotique de√
n( ˆ
Tn−
id)
,au moins pour certainesclasses de mesuresm. Une stratégienaturelle consiste à essayer de dériver lesconditions d’optimalité par rapport à la mesure pour appliquer un théorème d’inversion locale. Cela semble néanmoins délicat,mêmedanslecasd’unemesurem discrète,carlaconditiond’optimalitécaractérisantlebarycentreprendlaforme d’unproblèmed’obstaclepourunsystèmed’équationsdeMonge–Ampère,l’aspectfrontièrelibreduproblèmecompliquant significativementl’analyse...Mentionnonsunequestionreliéequiafaitl’objetdetravauxrécentsenstatistiques[6,7]etqui concerne l’identification de la distributionasymptotique de la quantité scalaire
√
nW2(
μ
ˆ
n,
μ
¯
)
afinde construire destestd’hypothèseoud’adéquation.
Pardéfinition,nousdironsqueleTLCdansl’espacede Wassersteinestsatisfaitsi
√
n( ˆ
Tn−
id)
convergeenloi(dansleHilbertséparableL2
(
μ
¯
,
R
d)
)versunemesuregaussiennecentréeN (
0,
)
pouruncertainopérateurauto-adjointpositifdetrace finie
sur L2
(
μ
¯
,
R
d)
.Ondonneauparagraphe suivantquelquesexemplestrèsparticuliersde validitédece TLCau sensWasserstein.3. QuelquescasdevaliditéduTLCWasserstein
Théorème3.1.LeTLCdansl’espacedeWassersteinestsatisfaitdanslescassuivants : (i) lorsquem estuneloideBernoulli,m
= (
1−λ)δ
ν0+λδ
ν1avecλ
∈ (
0,
1)
,ν
0,ν
1dansP
2(
R
d
)
etν
0nechargeantpaslesensembles
petits,
(ii) lorsqued
=
1 etquem estportéeparlesmesuresnonatomiquesetvérifie(19), (iii) lorsquem=
Ni=1λ
iδ
νioùchaqueν
iestunegaussiennenondégénérée.Démonstration. (i) Pourdeuxmesures,
ν
0 etν
1 commedansl’énoncé,lanotiondebarycentreestétroitementliéeàcelledegéodésiqueouinterpolantedeMcCannentre
ν
0 etν
1,letransportoptimaldeBrenierTν0→ν1 entreν
0etν
1 dérived’unpotentiel convexe
φ
(dont legradient estdéfini de manière uniqueν
0-presquepartout), Tν0→ν1= ∇φ
,pour t∈ [
0,
1]
,lebarycentrede
(
1−
t)δ
ν0+
tδ
ν1 coïncideavecl’interpolationdeMcCann(voir[11,1]) :ν
(
t)
:=
bar((
1−
t)δ
ν0+
tδ
ν1)
= ∇φ
t #ν
0avecφ
t:= (
1−
t)
1 2
|
x|
2
+
tφ
(observerque
∇φ
t apourinverse∇φ
t∗quiestLipschitzdèsquet∈ [
0,
1)
).Parailleurs,ilestfaciledevoirqueletransportoptimalentredeuxpoints
ν
(
t)
etν
(
s)
delagéodésique,avecs,t dans[
0,
1]
ets=
1 estdonnéparTν(s)→ν(t)
=
id+
t
−
s1
−
s(
∇φ ◦ ∇φ
∗
s
−
id).
Enparticulier,letransportoptimalT
ˆ
nentrebar(
m)
=
ν
(λ)
etlebarycentreempriqueμ
ˆ
n=
ν
(ˆλ
n)
(iciˆλ
ndésignelafréquenceempiriqued’apparitionde
ν
1 dansl’échantillonν
ˆ
1,
. . . ,
ν
ˆ
n)satisfait√
n( ˆ
Tn−
id)
=
√
n(ˆλ
n− λ)
(
1− λ)
(
∇φ ◦ ∇φ
∗ λ−
id)
etonconclutavecleTLCstandardpour√
n(ˆλ
n− λ)
.(ii) Endimension1,lebarycentred’unemesurem portéeparlesmesuresnonatomiquesestnonatomiqueetdonnépar laformuleexplicite(voirparexemple[1])
où
ρ
estn’importequellemesure nonatomiqueetTρ→ν l’uniquetransportcroissantdeρ
versν
.Enprenantρ
:=
bar(
m)
etenappliquantlaformuleprécédenteaubarycentreempirique
μ
ˆ
n,ilvientqueletransportoptimal(i.e.croissant)debar(
m)
vers
μ
ˆ
n estˆ
Tn:=
1 n n i=1 Tbar(m)→ˆνi (25)etcomme les variables aléatoires à valeursdans L2
(
bar(
m))
, Tbar(m)→ˆνi sonti.i.d. etde carré intégrable par (19), leTLCusueldanslesespacesdeHilbertséparables(voir[8])permetdeconclure.
(iii) Sanspertedegénéralité,noussupposeronsqueles
ν
i sontdesgaussiennescentréesetnotons Si=
Ki2 leurmatricede variancecovariance(Ki et Si appartiennent à
S
d++le cônedesmatricesd×
d symétriques,définies positives, onnotepar ailleurs
S
d l’espacedesmatricessymétriques etS
d+ le cônedesmatricesd×
d symétriques, semi-définies positives).Lepointimportanticiestquesi
α
∈
N:= {(
α
1,
· · · ,
α
N)
∈ R
+N;
Ni=1α
i=
1}
alorsν
(
α
)
:=
bar(
Ni=1α
iδ
νi)
estelle-mêmeunegaussiennecentréedontlamatricedevariance-covarianceS
(
α
)
estl’uniqueracinedansS
d++ del’équationmatricielle (cf.[1]) : I=
N i=1α
ii
(
S)
oùi
(
S)
:=
Ki(
KiS Ki)
− 1 2Ki.
(26)Envertudulemme 3.2ci-dessous,l’application
α
∈
N→
S(
α
)
∈
S
d++estC∞.Levraibarycentrebar(
ν
1,
λ
1. . . ,
ν
N,
λ
N)
estlamesuregaussiennecentréede variance-covarianceS
(λ)
tandisquelebarycentreempiriqueμ
ˆ
n estlamesuregaussiennecentréedevariance-covarianceS
(ˆλ
n)
oùˆλ
n estlevecteurdesfréquencesempiriques :(ˆλ
n)
i=
1
n#
{
j=
1. . . ,
n: ˆ
ν
j=
ν
i},
i=
1, . . . ,
N.
(27)LeTLCimpliqueque
√
n(ˆλ
n− λ)
convergeenloiversN (
0,
σ
)
(σ
i j:= λ
iδ
i j− λ
iλ
j).IlestbienconnuqueletransportoptimalentrelesgaussiennescentréesdevariancecovarianceS
(λ)
etS(ˆλ)
estlinéaireetexplicitementdonnéenfonctiondeˆλ
parT
(ˆλ)
=
S(ˆλ)
12(
S(ˆλ)
12S(λ)
S(ˆλ)
12)
−12S(ˆλ)
12c’estencoreuneapplicationC∞ de
ˆλ ∈
N dansS
d++etévidemmentT(λ)
=
id.Avecuneinégalitéd’accroissementsfinis,ilvient
ˆ
Tn=
T(ˆλ
n)
=
id+
T(λ)(ˆλ
n− λ) +
ε
n,
|
ε
n| ≤ |ˆλ
n− λ|
sup θ∈[λ,ˆλn]|
T(θ )
−
T(λ)
|,
desorteque√
n( ˆ
Tn−
id)
=
T(λ)
√
n(ˆλ
n− λ) +
√
nε
ncequi pardesargumentsclassiques (laméthodedelta)permetaisémentde conclureque
√
n( ˆ
Tn−
id)
convergeenloiversunedistributiongaussiennecentréeetdevariance–covarianceT
(λ)
σ
T(λ)
.2
Nousavonsutiliséci-dessuslerésultatsuivantLemme3.2.L’application
α
∈
N→
S(
α
)
∈
S
d++définieimplicitementparl’équation(26)estdeclasseC∞.Démonstration. Grâce au théorème des fonctions implicites, il suffit de montrer que pour S
∈
S
d++, Ni=1α
ii
(
S)
estinversible.Pour
θ
∈
S
d,Li:=
i(
S)(θ )
∈
S
d estlasolutionuniquede−
K−i 1S−1θ
S−1Ki−1= (
KiS Ki)
− 1 2K−1 i LiK− 1 i+
K− 1 i LiK− 1 i(
KiS Ki)
− 1 2.
(28) Définissant Li:=
K−i 1LiKi−1,
Si:=
KiS Ki,
θ
i:=
Kiθ
Ki,
ilestcommodederéécrire(28)souslaformeplusconcise
−
S−i1θ
iS−i1=
S− 1 2 i Li+
LiS −1 2 i.
(29)Supposonsque
θ
∈
S
d soitdanslenoyaudeiN=1α
ii
(
S)
i.e. Ni=1
α
iLi=
0,ilvientdoncavec(29)etquelquesmanipula-tionsélémentaires 0
=
N i=1α
iTr(
Liθ )
=
N i=1α
iTr(
Liθ
i)
= −
2 N i=1α
iTr(
S 1 2 iLiS 1 2 iLiS 1 2 i)
(30) et commeS 1 2 iLiS 1 2 iLiS 1 2i
∈
S
d+, chaque terme de cette sommeest nul, de sorteque, pourα
i>
0,commeSi∈
S
d++, on a Li=
0 etdoncθ
i=
0,sibienqueθ
=
0,cequimontrel’inversibilitécherchée.2
Note :
Cette note a été rédigée aprèsla disparition soudainedu premier auteur, Martial Agueh ; le second auteur tient à la dédieràsamémoire.
Références
[1]M.Agueh,G.Carlier,BarycentersintheWassersteinspace,SIAMJ.Math.Anal.43 (2)(2011)904–924.
[2]J.-D.Benamou,G.Carlier,M.Cuturi,L.Nenna,G.Peyré,IterativeBregmanprojectionsforregularizedtransportationproblems,SIAMJ.Sci.Comput. 37 (2)(2015)1111–1138.
[3] J. Bigot,T. Klein, Characterization ofbarycenters in the Wasserstein space byaveraging optimal transport maps,preprint, https://arxiv.org/abs/ 1212.2562,2012.
[4]Y.Brenier,Polarfactorizationandmonotone.Rearrangementofvector-valuedfunctions,Commun.PureAppl.Anal.44 (4)(1991)375–417.
[5] M.Cuturi,A.Doucet,FastcomputationofWassersteinbarycenters,in:Proceedingsofthe31stInternationalConferenceonMachineLearning(ICML-14), Beijing,China,21–26June2014,pp. 685–693.
[6] E.DelBarrio,H.Lescornel,J.-M.Loubes,AstatisticalanalysisofadeformationmodelwithWassersteinbarycenters:estimationprocedureandgoodness offittest,preprint,https://arxiv.org/abs/1508.06465,2015.
[7] J.Ebert,V.Spokoiny,A.Suvorikova,Constructionofnon-asymptoticconfidencesetsin2-Wassersteinspace,preprint,https://arxiv.org/abs/1703.03658, 2017.
[8]E.Giné,J.-R.Leòn,OnthecentrallimittheoreminHilbertspace,Stochastica4 (1)(1980)43–71.
[9]Y.-H.Kim,B.Pass,WassersteinBarycentersoverRiemannianmanifolds,Adv.Math.307(2017)640–683.
[10]T.LeGouic,J.-M.Loubes,ExistenceandconsistencyofWassersteinbarycenters,Probab.TheoryRelat.Fields(2016)1–17.
[11]R.-J.McCann,Aconvexityprincipleforinteractinggases,Adv.Math.128(1997)153–179.
[12]F.Santambrogio,OptimalTransportforAppliedMathematicians,Birkhäuser,2015.