210 individus ont le choix entre 4 modes de
transport : avion, bus, train, voiture. On dispose de variables explicatives qui
prennent différentes valeurs selon le mode de choix de transport et d'une
variable explicative qui caractérise l'individu.
Le fichier contient 840 observations (210*4), les 4 premières observations
concernent l'individu 1, la première concerne l'avion, la seconde le bus, la
troisième le train et la quatrième la voiture. Les observations 5 à 8 concernent
l'individu 2,.....
Intitulé des variables : mode : variable de choix du mode de transport, elle prend la valeur 1 ou
0. Par exemple l'individu 1 à choisit d'utiliser sa voiture, la variable mode
prend la valeur 1 à la quatrième observation, l'individu 2 a effectué le même
choix car pour les observations 5 (individu 2, avion), 6 (individu 2, bus) et 7
(individu 2, train) la variable mode prend la valeur 0, elle prend la valeur 1
pour la 8ème observation (individu2, voiture),....
ttme
: temps d'attente (elle prend la valeur 0 pour la voiture)
invc : une composante de coût du véhicule invt : mesure en terme de salaire du temps passé à voyager gc : mesure globale du coût hinc : le revenu du ménage
Introduction au
modèle multinomial logit
modifier le
fichier de données afin d'avoir pour chaque individu le choix du mode de
transport correspondant. Créer une variable mod qui peut prendre 5 valeurs :
1 (avion), 2 (bus), 3 (train), 4 (voiture), 0 sinon puis sélectionner
pour chaque individu les observations correspondant au choix de son mode de
transport. On dispose ainsi de 210 observations.
estimer un modèle
multinomial logit en prenant dans un premier temps le mode de transport en
voiture comme référence puis, dans un second temps, le mode de transport en
avion. Les variables explicatives sont : ttme, invc, invt, gc, hinc et une
constante.
expliquer pourquoi
les résultats ne sont pas identiques.
Partie 1 Estimation d'un modèle multinomial
logit
estimer un modèle
multinomial logit qui explique le choix du mode de transport de l'individu
en fonction de son revenu (inclure une constante dans le modèle). Prendre la
voiture comme mode de transport de référence puis l'avion. Comparer les
résultats.
calculer les
probabilités estimées pour chaque mode de transport
calculer l'effet
d'une variation d'une unité du revenu sur les 4 probabilités lorsque le
niveau de probabilité initial correspond à la moyenne calculée sur les 210
individus. Vérifier que la somme de ces effets est nulle et expliquer ce
résultat.
calculer les élasticités revenu
Partie 2 Estimation d'un modèle logit
conditionnel
pour estimer le
modèle logit conditionnel il faut créer les variables ttme, invc, invt, gc
correspondant à chaque alternative. Pour chaque individu il faut au total 16
variables explicatives notées : ttair, ttbus, tttrain, ttcar, invcair,
invcbus, invctrain, invccar, invtair, invtbus, invttrain, invtcar, gcair,
gcbus, gctrain, gccar. Par exemple la variable gccar donne pour chaque
individu le coût global associé à la voiture. Créer une variable modca qui
spécifie le choix de l'individu elle peut prendre 4 valeurs : 1 (avion), 2
(bus), 3 (train), 4 (voiture).
estimer le modèle
logit conditionnel, les variables explicatives pour chaque mode de transport
sont ttme, gc, invc et invt. Prendre comme référence le mode de transport en
voiture puis le mode de transport en avion.
vérifier que les résultats
sont identiques, calculer pour chaque modèle les
probabilités estimées des 4 modes de transport.
calculer l'impact
d'une variation des différentes variables explicatives sur la probabilité de
choisir le bus (la situation de référence étant la valeur moyenne de la
probabilité).
calculer les
conséquences d'une variation de la variable gcbus sur les 4 probabilités (la
situation de référence étant la valeur moyenne des probabilités) et vérifier
que la somme des effets est nulle.
Partie 3 Estimation d'un modèle comportant
des variables explicatives associées aux alternatives et aux individus
construire un
modèle général combinant les parties 1 et 2, pour la variable de revenu
(caractéristique de l'individu) et la constante on propose une forme
multinomiale et pour les variables liées aux alternatives on propose
une forme conditionnelle.
vérifier que les
résultats sont indépendants du choix du mode de transport utilisé comme
référence.
calculer l'impact
d'une variation des variables gcbus, gcar, gctrain et hinc sur la
probabilité de choisir le bus (la situation de réference étant la valeur
moyenne de la probabilité).