Vitesse de convergence presque sûre de l'estimateur à noyau du mode

Vitesse de convergence presque sûre de l'estimateur à noyau du mode

C. R. Acad. Sci. Paris, t. 331, Série I, p. 637–640, 2000 Statistique/Statistics (Probabilités/Probability Theory) Vitesse de convergence presque sûr...

111KB Sizes 20 Downloads 69 Views

C. R. Acad. Sci. Paris, t. 331, Série I, p. 637–640, 2000 Statistique/Statistics (Probabilités/Probability Theory)

Vitesse de convergence presque sûre de l’estimateur à noyau du mode Joséphine LECLERC, Daniel PIERRE-LOTI-VIAUD Laboratoire de statistique théorique et appliquée, Université Paris-VI, boîte 158, 4, place Jussieu, 75252 Paris cedex 05, France Courriel : [email protected] (Reçu le 15 mars 2000, accepté après révision le 23 août 2000)

Résumé.

Nous établissons un majorant de la vitesse de convergence presque sûre de l’estimateur à noyau du mode, en utilisant des résultats de type loi du logarithme itéré.  2000 Académie des sciences/Éditions scientifiques et médicales Elsevier SAS

Rate of almost sure convergence of kernel estimators of the mode Abstract.

We obtain rate of almost sure convergence of kernel estimators of the mode, using law of the iterated logarithm type results  2000 Académie des sciences/Éditions scientifiques et médicales Elsevier SAS

1. Introduction Soit X1 , X2 , . . . , Xn une suite de variables aléatoires réelles indépendantes, de même loi, de fonction de répartition F admettant une densité f inconnue qui possède un unique mode θ. Nous nous intéressons au problème particulier de l’estimation de θ, et considérons pour cela l’estimateur à noyau du mode. Parzen [11] a proposé une méthode d’estimation du mode θ qui repose sur l’estimateur à noyau de la densité, introduit par Rosenblatt [13] et défini pour x ∈ R par : fn (x) =

  n x − Xi 1 X K , nhn i=1 hn

où {hn , n > 1} est une suite de réels strictement positifs et K est une fonction continue telle que limt→±∞ K(t) = 0. Le noyau K étant ainsi défini, il est alors clair que la fonction fn est continue, bornée et tend vers 0 lorsque |x| → +∞. Ceci nous assure de l’existence d’une variable aléatoire θn , telle que fn (θn ) = supx∈R fn (x). Comme un tel θn peut ne pas être unique, considérons la fonctionnelle o n M (g) = inf x; g(x) = sup g(y) , y∈R

Note présentée par Paul D EHEUVELS. S0764-4442(00)01688-8/FLA  2000 Académie des sciences/Éditions scientifiques et médicales Elsevier SAS. Tous droits réservés.

637

J. Leclerc, D. Pierre-Loti-Viaud

où g est une fonction sur R. Le mode empirique θn est alors défini de manière unique par θn = M (fn ) et le mode θ de f est θ = M (f ). Sous certaines conditions, Parzen [11] a démontré la convergence en probabilité de θn . Notons que Yamato [17] l’a obtenue dans le cas d’une densité multivariée, et que Nadaraya [10] et Van Ryzin [15] ont établi des résultats de convergence presque sûre dans R et Rd (d > 1) respectivement. Parzen [11] a également établi la normalité asymptotique de θn , et Konakov [5] et Samanta [14] en ont donné une version multivariée. Eddy ([3] et [4]) a amélioré le résultat de Parzen [11], en obtenant la loi limite de (θn − θ) sous des conditions moins restrictives. Romano [12] s’est affranchi des conditions globales de régularité sur la densité. Il a montré que la convergence presque sûre et la distribution limite de θn , s’obtenaient au moyen d’une hypothèse sur le comportement de f au voisinage du mode. De plus, ces deux résultats se généralisent au cas d’une suite hn aléatoire. Romano a également établi un résultat de type minimax intéressant. Enfin, Vieu [16] a obtenu une vitesse de convergence presque complète de (θn − θ). Les résultats que nous obtenons pour la vitesse de convergence presque sûre (p.s.) de θn sont présentés dans le paragraphe 2. Ils améliorent et étendent ceux de Vieu [16]. Remarquons que, compte tenu du travail effectué et des résultats analogues obtenus pour d’autres estimateurs du mode (voir [6] et [7]), nous conjecturons que nos résultats donnent la vitesse de convergence p.s. exacte. Ils sont donc une étape indispensable pour établir la loi du logarithme itéré pour l’estimateur à noyau du mode. Nous donnons l’architecture de la démonstration de nos résultats dans le paragraphe 3. La preuve complète est présentée dans [8] et [9].

2. Hypothèses et résultats Pour établir nos résultats de convergence p.s. de l’estimateur à noyau du mode, nous utilisons les hypothèses suivantes, où log2 n = log+ (log+ n) et log+ n = log(max(n, e)). Sur la densité (H.1) f admet un unique mode θ ∈ R qui vérifie : sup{t:|t−θ|>δ} f (t) < f (θ), pour tout δ > 0. (H.2) f est continue. (H.3) f est Ck au voisinage de θ, pour un k > 2, avec f (2) (θ) < 0 et f (k) (θ) 6= 0. Sur la fenêtre (H.4) {hn , n > 1} est une suite de réels strictement positifs vérifiant les conditions de Csörgö–Révész– Stute [CRS], i.e. (i) 0 < hn < 1, pour n > 1, limn→∞ hn = 0, limn→∞ nhn = ∞, (ii) limn→∞ (log(1/hn ))/ log2 n = ∞, (iii) limn→∞ nhn / log n = ∞. (H.5) hn > Ch × n−(1−ε)/5 (log n)(1−ε)/5 , où 0 < Ch < ∞ et 0 < ε < 2/7. (H.6) n−1/3 (log n)1/3 = o(hn ), quand n → +∞. Sur le noyau (H.7) K est continue sur R. (H.8) il R existe 0 < M1 < ∞ tel que K(u) = 0, pour tout |u| > M1 . (H.9) R K(u) du = 1. (H.10) K 00 existe sur R. (H.11) K 00 estR à variation bornée sur R. (H.12) Bj = R uj K(u) du est tel que Bj = 0, pour j = 1, . . . , k − 2, Bk−1 6= 0 et |Bk−1 | < +∞. Les résultats que nous obtenons sont présentés dans les deux théorèmes ci-dessous.

638

Vitesse de convergence presque sûre de l’estimateur à noyau du mode

T HÉORÈME 1. – Sous les hypothèses (H.1), (H.2), (H.3) avec k > 3, (H.4), (H.5) et (H.7)–(H.12), nous obtenons que, p.s., quand n → +∞,    −1/2  O (n/ log2 n) b n,k , si hn 6 H 3/2 |θn − θ| = h n  b n,k si hn > H O(hk−1 n ) b n,k tend vers une constante strictement positive, lorsque n → +∞. où (n/ log2 n)1/(2k+1) H T HÉORÈME 2. – Sous les hypothèses (H.1), (H.2), (H.3) avec k = 2, (H.4), (H.6)–(H.12), nous obtenons que p.s., quand n → +∞,    −1/2  O (n/ log n) b n,2 , si hn 6 H 3/2 |θn − θ| = h n  b n,2 si hn > H O(hn ) b n,2 tend vers une constante strictement positive, lorsque n → +∞. où (n/ log n)1/5 H La meilleure vitesse de convergence p.s. de (θn − θ), que nous obtenons, est donc    O (n/ log2 n)−(k−1)/(2k+1) , p.s. quand n → +∞, vitesse obtenue     pour un h de l’ordre de (n/ log n)−1/(2k+1) , lorsque k > 3. n 2 |θn − θ| =   O (n/ log n)−1/5 , p.s. quand n → +∞, vitesse obtenue pour un hn     de l’ordre de (n/ log n)−1/5 , lorsque k = 2. Remarque 1. – Vieu [16] a obtenu des vitesses de convergence p.s. en (n/ log n)−(k−1)/(2k+1) . Nos résultats améliorent donc ceux de Vieu, excepté pour k = 2, où nous retrouvons la vitesse obtenue par Vieu. D’autre part, Vieu ne considère qu’une fenêtre hn d’un certain ordre, alors que nous considérons toute une fourchette de valeurs, et déterminons ensuite l’ordre de grandeur optimale de hn . 3. Architecture de la démonstration des théorèmes 1 et 2 Dans la suite, nous posons Tn = θn − θ, et le résultat de convergence p.s. de θn vers θ, établi par Romano [12], nous permet de considérer que Tn maximise la fonction Ln (T ) = fn (θ + T ) − fn(θ), sur les T ∈ D, où D est un voisinage de 0 suffisamment petit. Afin d’obtenir la vitesse de convergence p.s. de Tn vers 0, nous écrivons       Ln (T ) = E Ln (T ) + Ln (T ) − E Ln (T ) et établissons, dans un premier temps, un développement asymptotique de E[Ln (T )], puis, dans un second temps, nous nous intéressons à l’erreur Ln (T ) − E[Ln (T )]. Pour cette dernière étude, nous utilisons notamment le corollaire 4.1 de Deheuvels et Mason [1] qui donne la vitesse de convergence uniforme p.s., de l’estimateur à noyau de la dérivée première de la densité. Finalement, nous obtenons que, p.s. quand

639

J. Leclerc, D. Pierre-Loti-Viaud

n → ∞, Tn minimise    (2)   (n/ log n)−1/2 (θ)  2f (2)  T 1 + o(1) − T hn f (θ)B1 1 + o(1) + |T | O si k = 2,   3/2  2  hn      T (−hn )k−1 (k)  f (2) (θ) + T O(1) 1 + o(1) + f (θ)Bk−1 1 + o(1) T2  2! (k − 1)!       (n/ log n)−1/2   si k > 3, + |T | O  3/2 hn où les o(1) et O(1) sont uniformes en T ∈ D. Un résultat d’analyse nous permet ensuite de traiter le problème de minimisation ci-dessus et d’obtenir, d’une part, la vitesse de convergence p.s. de Tn du théorème 2, et d’autre part, une majoration de la vitesse énoncée au théorème 1 (i.e. avec log n au lieu de log2 n). Enfin, un raffinement de l’étude de Ln (T ) − E[Ln (T )] utilisant cette majoration de la vitesse, nous permet alors d’en déduire la vitesse de convergence p.s. de Tn du théorème 1. Précisons que pour cette seconde étude de Ln (T ) − E[Ln(T )], nous utilisons, d’une part, le théorème 3.2 de Deheuvels et Mason [2] qui précise la vitesse de convergence p.s. ponctuelle de (fn − E[fn ]), et d’autre part, à nouveau le corollaire 4.1 de Deheuvels et Mason [1] qui donne, cette fois-ci, la vitesse de convergence uniforme p.s., de l’estimateur à noyau de la dérivée seconde de la densité. Références bibliographiques [1] Deheuvels P., Mason D.M., Functional laws of the iterated logarithm for the increments of empirical and quantile processes, Ann. Probab. 20 (3) (1992) 1248–1287. [2] Deheuvels P., Mason D.M., Functional laws of the iterated logarithm for local empirical processes indexed by sets, Ann. Probab. 22 (1994) 1619–1661. [3] Eddy W.F., Optimum kernel estimates of the mode, Ann. Statis. 8 (1980) 870–882. [4] Eddy W.F., The asymptotic distributions of kernel estimators of the mode, Z. Wahrscheinlichkeit. Verw. Gebiete 59 (1982) 279–290. [5] Konakov V.D., On the asymptotic normality of the mode of multidimensional distributions, Theory of Probab. Appl. 19 (1973) 794–799. [6] Leclerc J., Comportement limite fort de deux estimateurs du mode : le Shorth et l’estimateur naïf, C. R. Acad. Sci. Paris, Série I 325 (1997) 1207–1210. [7] Leclerc J., Strong limiting behavior of two estimates of the mode: the shorth and the naive estimator, Statistics and Decisions (2000) (à paraître). [8] Leclerc J., Comportement limite fort (vitesse de convergence presque sûre et loi du logarithme itéré) d’estimateurs non paramétriques du mode, Thèse de doctorat de l’université Paris-VI, 2000. [9] Leclerc J., Pierre-Loti-Viaud D., Rate of almost sure convergence of kernel estimators of the mode, (soumis). [10] Nadaraya E.A., On non-parametric estimates of density functions and regression curves, Theory Probab. Appl. 10 (1965) 186–190. [11] Parzen E., On estimating probability density function and mode, Ann. Statis. 33 (1962) 1065–1076. [12] Romano J., On weak convergence and optimality of kernel density estimates of the mode, Ann. Statis. 16 (1988) 629–647. [13] Rosenblatt M., Remarks on some non-parametric estimates of a density function, Ann. Math. Statis. 27 (1956) 832–837. [14] Samanta M., Nonparametric estimation of the mode of a multivariate density, South African Statis. J. 7 (1973) 109–117. [15] Van Ryzin J., On strong consistency of density estimates, Ann. Math. Statis. 40 (1969) 1765–1772. [16] Vieu P., A note on density mode estimation, Statis. Probab. Lett. 26 (1996) 297–307. [17] Yamato H., Sequential estimation of a continuous probability density function and mode, Bull. Math. Statis. 14 (1971) 1–12.

640