-
Notifications
You must be signed in to change notification settings - Fork 0
/
Copy pathS15 _ Implémentation critère AIC.R
94 lines (49 loc) · 2.48 KB
/
S15 _ Implémentation critère AIC.R
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
# IMPLEMENTATION DE LA PROCEDURE AIC
install.packages("powerSet") # Ensemble de parties
library(rje)
library(powerSet)
# Paramètres :
n <- 20 # nombre d'observations
p <- 20 # nombre de variables explicatives / covariables
d <- 7 # au choix
sigma2 <- 1
f_star <- rep(0, n) # le signal f*
Y <- rnorm(n, 0, sigma2) # Y est la variable à expliquer. Ici, Y est un bruit blanc gaussien (le signal f* vaut exactement zéro)
mod <- powerSet(1:p, d) # mod est de type liste, c'est l'ensemble des parties de [1,p] à 0 à d éléments ; correspond à tous les modèles possibles de taille 0 à d.
head(mod) # aperçu
# Nous trions la liste mod :
m_sorted <- list()
cpt <- 1
for (dim in 0:d) {
mod_dimension_dim <- which(lengths(mod) == dim)
for (i in mod_dimension_dim) {
m_sorted[[cpt]] <- mod[[i]]
cpt <- cpt + 1
}
}
mod <- m_sorted
# mod est maintenant "trié" (d'abord les modeles de taille 1, puis les modeles de taille 2, etc).
#_________________________________________________________________________________________________
obs_values <- c() #contient \hat{r}_{m}
for (m in mod) {
dim <- length(m)
Proj_Sm_Y <- rep(0, n)
# Projection du vecteur Y sur l'espace engendré par les colonnes I^j de l'identité, j \in m
Proj_Sm_Y[m] <- Y[m] #\hat{f}_{m}
v <- Y - Proj_Sm_Y
norme <- norm(v, type = "2")^2
obs_values <- c(obs_values, norme + (2 * dim - n) * sigma2)
}
res <- list(obs_values[which(lengths(mod) == 0)], obs_values[which(lengths(mod) == 1)], obs_values[which(lengths(mod) == 2)], obs_values[which(lengths(mod) == 3)], obs_values[which(lengths(mod) == 4)], obs_values[which(lengths(mod) == 5)], obs_values[which(lengths(mod) == 6)], obs_values[which(lengths(mod) == 7)])
boxplot(res, horizontal = FALSE, names = c("dim=0", "dim=1", "dim=2", "dim=3", "dim=4", "dim=5", "dim=6", "dim=7"), col = c("cadetblue2"))
points(0:7, col = 2, pch = 19) #risque réel pour chaque dimension
# _________________________________________________________________________________________________
# le risque min est
min(obs_values)
# et le modèle sélectionné est :
(modele_AIC <- mod[[which.min(obs_values)]])
# ref modele_AIC: which.min(obs_values)
# L'estimateur \hat{f}_{m_AIC} correspond est :
f_hat <- rep(0, n)
(f_hat[modele_AIC] <- Y[modele_AIC]) #Projection du vecteur Y sur le modèle sélectionné par la procédure AIC
(risk <- norm(f_star - f_hat, type = "2")^2) #risque associé