Modélisation et méthodes numérique[[s -- MAT3150L]]

Fichier pour le sujet de stat (ACP) du CT1

ICI ou

Programme

Le programme de l'UE est disponible ici

Emploi du temps

L'UE se compose de 3h de CM 27h séances de TD-TP qui ont lieu le jeudi matin de 9h45 à 13h00.

Enseignants

  • Morgane BERGOT — mel
  • Frédérique BIENVENÜE — mel

Modalités d'examen

L'UE est évaluée en contrôle continu. Elle comporte 4 épreuves :

  • 22/02 – CC1 (1h30) - Épreuve de TP comptant pour 20% de la note finale
  • 04/04 – CC2 (1h30) - Épreuve de TP comptant pour 20% de la note finale
  • Un rapport comptant pour 10% de la note finale
  • (période des examens) - CT1 (1h30) - Épreuve écrite comptant pour 25% de la note finale
  • (période des examens) - CT2 (1h30) - Épreuve de TP comptant pour 25% de la note finale

En cas d'échec, vous pourrez repasser une épreuve de seconde session en juin. La note obtenue remplacera les notes de CT.

Les règles de compensation et autre sont décrites ici

Rapport à rendre pour le 8 février sur tomuss

Déposer sur Tomuss (UE Modélisation, UE-MAT3150L) un fichier au format pdf, ou au format .ipynb si erreur lors de la création du pdf (Fichier > Télécharger au format > Notebook (.ipynb))

Reprendre le fichier immo.csv dont vous aurez enlevé les 2 valeurs extrêmes, c'est-à-dire les appartements dont les surfaces sont de 190 et 196 m² : cela peut être réalisé à l'aide de la commande immo.drop(index=[2,4]).

  • Effectuer une régression linéaire par la méthode des moindres carrés : sur un même graphe, tracer le nuage de points, le point moyen, déterminer l'équation de la droite de régression, et tracer cette droite.
  • Tracer les résidus et commenter.
  • Calculer les valeurs de la variance totale, de la variance expliquée par le modèle et de la variance résiduelle, et commenter.
  • Évaluer la qualité de la régression : est-elle meilleure avec ou sans ces deux points extrêmes ? Pourquoi ?

Attention

  • Ne rendre que le notebook dédié à l'analyse statistique de ce jeu de données (sans ce qui a été réalisé en TP sur le fichier initial)
  • L'analyse descriptive unidimensionnelle des variables n'est pas demandée.

Documents de cours

Fichiers de données :

  • Surfaces et prix d'appartements vendus à Villeurbanne immo.csv;
  • Nombre de cyclistes en septembre sur la Passerelle Masaryk Cyclistes_Masaryk.csv
  • Longueurs et largeurs des sépales et des pétales de différentes variété d'iris iris.csv
  • Consommation d'alcool en France ConsoAlcool.csv
  • Pour le CT1 : ICI ou
 
 
Valid XHTML 1.0 Valid CSS Driven by DokuWiki