DataCamp Introduction to R. Il faut s'inscrire (pas beaucoup de mails de pub). Seule l'introduction est gratuite. Mais c'est très bien fait, on apprend en faisant.
Quetelet (à présent accessible aux étudiants de master)
Parfois... ça s'arrête là : pas de données, données coûteuse...
Récupération de données dans le programme de traitement
Agrégation de données de sources diverses
Nettoyage-correction des données
Modification des données : création de nouvelles variables
Analyse des données : méthodes statistiques, graphiques
Compte rendu des analyse : papier, web...
Ça n'est PAS un processus linéaire. On procède souvent par itérations. On fait plein de choses qui ne servent à rien, qui n'apportent pas d'informations. On trouve des éléments intéressants qui incitent à créer de nouvelles variables, ajouter de nouvelles données, faire des corrections etc.
La production attendu de votre part à l'issue des 2 séances :
Par groupes de 3 ou 4
produire un topo de 6000 à 9000 signes
sans parler "technique", il faut uniquement des résultats et un petit bla-bla d'analyse
en revanche, à part, dans un autre fichier, listez les grandes étapes techniques de votre démarche, copiez les programmes R ou dites-moi comment vous avez procédé si vous n'avez pas utilisé R
le sujet est libre mais devra bien entendu utiliser le fichier de données proposé
et, idéalement, intégrer des données complémentaires que vous aurez trouvées vous même
vous avez 15 jours après la 2e séance pratique pour m'envoyer par mail votre production (avec les noms des membres du groupe !!)