go back

Voir toutes les formations

Du Big data aux packages – Expert

  • Date

    jeudi 9 juin 2016

  • Tarif

    1500 €
    (Tarif susceptible de changer pour les formations intra-entreprise)

  • Code formation

    EXPERTR

  • Durée

    2 jours

R est logiciel open source extrêmement performant et gratuit. Il est multiplateforme (Windows, Unix, Mac...) et peut être installé en local ou sur un serveur de calcul.

Les besoins de traitement de grosses volumétries en entreprise ou en recherche sont plus que jamais d’actualité. Découvrez les différentes approches R pour travailler sur d'importants volumes de données. Apprenez également à produire un code lisible et efficace avec dplyr, à mettre vos productions en packages et familiarisez-vous avec la recherche reproductible et le reporting automatique pour gagner en efficacité. En somme, appréhendez comment R est devenu un incontournable de la boîte à outils du data scientist.

Programme :

Manipulation avancée de données

  • Packages plyr, dplyr et tidyr
  • Etablir une connexion avec une base SQL et exécuter une requête Opérateur %>%

Les bonnes pratiques

  • Présentation des guidelines de programmation en R
  • « Reproducible research »

Manipulation de données pour grosses volumétrie

  • Package dplyr, data.table

Calcul en parallèle

  • Utiliser toutes les capacités de sa machine

Programmation avec R – niveau avancé

  • Programmation fonctionnelle
  • Optimisation de code
  • Méta-programmation

Création de package

  • Utilisation de devtools et de roxygen2 pour la création de documentation

Industrialisation

  • Installation et configuration de RStudio server, intégration de R dans une infrastructure pré-existante
  • Public visé

    Personnes déjà initiées au langage R qui ont expérimenté le « cannot allocate vector of size », exprimant le besoin de manipuler de grosses volumétries, de passer à la vitesse supérieure.

  • Objectifs

    Utiliser R dans un contexte Big Data. Exploiter au maximum les ressources disponibles (RAM et processeur), afin de manipuler, s’approprier et valoriser un gros volume de données. Optimiser le code avec dplyr. Développer ses packages pour rationnaliser les processus métiers. Se familiariser avec la recherche reproductible (« reproducible research ») et le reporting automatique.

  • Pré-requis

    Savoir programmer une fonction R, être familier des famillles de fonctions Xapply

  • Moyens

Je veux m'inscrire à cette formation

Formation choisie : Du Big data aux packages – Expert

Dates possibles : jeudi 9 juin 2016