Aller au contenu principal

Comment installer R sur Debian/Ubuntu

Ce guide vous explique comment installer le langage de programmation R sur votre serveur Debian ou Ubuntu. R est un langage open-source largement utilisé pour le développement de logiciels statistiques, l'analyse de données et la visualisation.

Commander un serveur

Pour exécuter R et vos analyses de données, HostMyServers propose plusieurs offres :

Prérequis

  • Accès SSH root ou utilisateur avec sudo
  • Debian 11/12 ou Ubuntu 20.04/22.04/24.04
  • Minimum 1 Go de RAM (2 Go+ recommandés pour les gros calculs)

Pourquoi utiliser R ?

R est particulièrement adapté pour :

  • Analyse statistique : Tests, modèles de régression, analyse de variance
  • Visualisation de données : Graphiques publication-ready avec ggplot2
  • Machine Learning : Classification, clustering, réseaux de neurones
  • Bioinformatique : Analyse génomique, protéomique
  • Finance : Analyse de risques, modélisation financière

Étape 1 : Installation des dépendances

R étant un projet en développement actif, la dernière version stable n'est pas toujours disponible dans les dépôts Debian/Ubuntu. Nous allons donc ajouter le dépôt externe maintenu par CRAN.

Mise à jour du système

sudo apt update && sudo apt upgrade -y

Installation des outils nécessaires

sudo apt install -y dirmngr gnupg apt-transport-https ca-certificates software-properties-common

Ces paquets permettent :

  • dirmngr : Gestion des certificats et opérations réseau
  • gnupg : Gestion des clés GPG
  • apt-transport-https : Support HTTPS pour APT
  • ca-certificates : Certificats d'autorité
  • software-properties-common : Gestion des dépôts

Étape 2 : Ajout du dépôt CRAN

Ajouter la clé GPG

sudo gpg --keyserver keyserver.ubuntu.com --recv-key '95C0FAF38DB3CCAD0C080A7BDC78B2DDEABC47B7'
sudo gpg --armor --export '95C0FAF38DB3CCAD0C080A7BDC78B2DDEABC47B7' | sudo tee /etc/apt/trusted.gpg.d/cran_debian_key.asc

Ajouter le dépôt selon votre distribution

Pour Debian 11 (Bullseye)

echo "deb http://cloud.r-project.org/bin/linux/debian bullseye-cran40/" | sudo tee /etc/apt/sources.list.d/r-project.list

Pour Debian 12 (Bookworm)

echo "deb http://cloud.r-project.org/bin/linux/debian bookworm-cran40/" | sudo tee /etc/apt/sources.list.d/r-project.list

Pour Ubuntu 22.04 (Jammy)

sudo add-apt-repository "deb https://cloud.r-project.org/bin/linux/ubuntu jammy-cran40/"

Pour Ubuntu 24.04 (Noble)

sudo add-apt-repository "deb https://cloud.r-project.org/bin/linux/ubuntu noble-cran40/"

Mettre à jour la liste des paquets

sudo apt update

Étape 3 : Installation de R

Vérifier la version disponible

apt-cache policy r-base

Installer R

sudo apt install -y r-base r-base-dev

Le paquet r-base-dev inclut les outils de développement nécessaires pour compiler des packages R depuis les sources.

Vérifier l'installation

R --version

Vous devriez voir quelque chose comme :

R version 4.4.x (2024-xx-xx) -- "Pile of Leaves"
Copyright (C) 2024 The R Foundation for Statistical Computing
Platform: x86_64-pc-linux-gnu

Étape 4 : Utilisation de R

Lancer R en mode interactif

Pour une utilisation personnelle :

R

Pour installer des packages disponibles pour tous les utilisateurs :

sudo -i R

Interface R

Une fois dans R, vous verrez le prompt >. Voici quelques commandes de base :

# Afficher la version
version

# Obtenir de l'aide
help()

# Quitter R
q()

Étape 5 : Installation de packages depuis CRAN

R dispose de milliers de packages disponibles sur CRAN (Comprehensive R Archive Network).

Installer un package

Dans l'interpréteur R :

install.packages('nom_du_package')

Exemple : Installation de packages courants

# Manipulation de données
install.packages('dplyr')
install.packages('tidyr')
install.packages('data.table')

# Visualisation
install.packages('ggplot2')

# Machine Learning
install.packages('caret')
install.packages('randomForest')

# Rapports
install.packages('rmarkdown')
install.packages('knitr')

Charger un package

library(ggplot2)

Exemple pratique avec txtplot

Installons un package simple pour créer des graphiques ASCII :

# Installer le package
install.packages('txtplot')

# Charger le package
library('txtplot')

# Créer un graphique simple
txtplot(cars[,1], cars[,2], xlab = 'speed', ylab = 'distance')

Résultat :

    +----+--------+--------+-------+--------+--+
120 + * +
| |
d 100 + * +
i | * * |
s 80 + * * +
t | * * * |
a 60 + * +
n | * * * |
c 40 + * ** +
e | * * * * |
20 + * * * +
+----+--------+--------+-------+--------+--+
5 10 15 20 25
speed

Étape 6 : Installation de RStudio Server (optionnel)

RStudio Server fournit une interface web pour R.

Télécharger et installer RStudio Server

Pour Debian/Ubuntu :

# Installer les dépendances
sudo apt install -y gdebi-core

# Télécharger RStudio Server (vérifiez la dernière version sur https://posit.co/download/rstudio-server/)
wget https://download2.rstudio.org/server/jammy/amd64/rstudio-server-2024.04.2-764-amd64.deb

# Installer
sudo gdebi rstudio-server-2024.04.2-764-amd64.deb

Vérifier le statut

sudo systemctl status rstudio-server

Configurer le pare-feu

sudo ufw allow 8787/tcp
sudo ufw reload

Accéder à RStudio Server

Ouvrez votre navigateur et accédez à :

http://IP_DU_SERVEUR:8787

Connectez-vous avec vos identifiants Linux.

Configuration avancée

Définir un miroir CRAN par défaut

Créez ou éditez le fichier .Rprofile :

nano ~/.Rprofile

Ajoutez :

options(repos = c(CRAN = "https://cloud.r-project.org"))

Installer des packages système pour R

Certains packages R nécessitent des bibliothèques système :

# Pour les packages avec dépendances courantes
sudo apt install -y libcurl4-openssl-dev libssl-dev libxml2-dev libfontconfig1-dev libharfbuzz-dev libfribidi-dev libfreetype6-dev libpng-dev libtiff5-dev libjpeg-dev

Augmenter la mémoire disponible

Pour les gros calculs, vous pouvez augmenter la limite de mémoire dans R :

# Vérifier la mémoire disponible
memory.limit()

# Sous Linux, la limite est généralement la RAM disponible

Scripts R en ligne de commande

Exécuter un script R

Rscript mon_script.R

Exemple de script

Créez un fichier analyse.R :

#!/usr/bin/env Rscript

# Charger les données
data <- read.csv("donnees.csv")

# Statistiques descriptives
summary(data)

# Sauvegarder les résultats
write.csv(summary(data), "resultats.csv")

print("Analyse terminée !")

Exécutez-le :

Rscript analyse.R

Packages populaires par domaine

Data Science

PackageDescription
tidyverseCollection de packages pour la data science
dplyrManipulation de données
ggplot2Visualisation
readrImport de données
tidyrNettoyage de données

Machine Learning

PackageDescription
caretFramework ML unifié
randomForestForêts aléatoires
xgboostGradient boosting
kerasDeep learning
mlr3Framework ML moderne

Statistiques

PackageDescription
statsStatistiques de base (inclus)
lme4Modèles mixtes
survivalAnalyse de survie
forecastSéries temporelles

En cas de problème

Erreur lors de l'installation d'un package

Si vous obtenez des erreurs de compilation :

# Installer les outils de développement
sudo apt install -y build-essential

# Installer les dépendances communes
sudo apt install -y libcurl4-openssl-dev libssl-dev libxml2-dev

Package introuvable

Vérifiez que vous utilisez le bon nom de package sur CRAN.

Mémoire insuffisante

Si R manque de mémoire :

# Nettoyer l'environnement
rm(list = ls())

# Forcer le garbage collection
gc()

Vérifier les packages installés

# Lister tous les packages
installed.packages()

# Vérifier si un package est installé
"ggplot2" %in% rownames(installed.packages())

Mise à jour de R

Pour mettre à jour R vers la dernière version :

sudo apt update
sudo apt upgrade r-base r-base-dev
Attention

Après une mise à jour majeure de R, vous devrez peut-être réinstaller vos packages.