Comment installer R sur Debian/Ubuntu
Ce guide vous explique comment installer le langage de programmation R sur votre serveur Debian ou Ubuntu. R est un langage open-source largement utilisé pour le développement de logiciels statistiques, l'analyse de données et la visualisation.
Commander un serveur
Pour exécuter R et vos analyses de données, HostMyServers propose plusieurs offres :
- VPS Performance - Idéal pour les calculs intensifs
- VPS NVMe - Bon rapport qualité/prix
- Serveurs dédiés Eco - Pour les gros datasets
- Serveurs dédiés Performance - Performance maximale pour le machine learning
Prérequis
- Accès SSH root ou utilisateur avec sudo
- Debian 11/12 ou Ubuntu 20.04/22.04/24.04
- Minimum 1 Go de RAM (2 Go+ recommandés pour les gros calculs)
Pourquoi utiliser R ?
R est particulièrement adapté pour :
- Analyse statistique : Tests, modèles de régression, analyse de variance
- Visualisation de données : Graphiques publication-ready avec ggplot2
- Machine Learning : Classification, clustering, réseaux de neurones
- Bioinformatique : Analyse génomique, protéomique
- Finance : Analyse de risques, modélisation financière
Étape 1 : Installation des dépendances
R étant un projet en développement actif, la dernière version stable n'est pas toujours disponible dans les dépôts Debian/Ubuntu. Nous allons donc ajouter le dépôt externe maintenu par CRAN.
Mise à jour du système
sudo apt update && sudo apt upgrade -y
Installation des outils nécessaires
sudo apt install -y dirmngr gnupg apt-transport-https ca-certificates software-properties-common
Ces paquets permettent :
dirmngr: Gestion des certificats et opérations réseaugnupg: Gestion des clés GPGapt-transport-https: Support HTTPS pour APTca-certificates: Certificats d'autoritésoftware-properties-common: Gestion des dépôts
Étape 2 : Ajout du dépôt CRAN
Ajouter la clé GPG
sudo gpg --keyserver keyserver.ubuntu.com --recv-key '95C0FAF38DB3CCAD0C080A7BDC78B2DDEABC47B7'
sudo gpg --armor --export '95C0FAF38DB3CCAD0C080A7BDC78B2DDEABC47B7' | sudo tee /etc/apt/trusted.gpg.d/cran_debian_key.asc
Ajouter le dépôt selon votre distribution
Pour Debian 11 (Bullseye)
echo "deb http://cloud.r-project.org/bin/linux/debian bullseye-cran40/" | sudo tee /etc/apt/sources.list.d/r-project.list
Pour Debian 12 (Bookworm)
echo "deb http://cloud.r-project.org/bin/linux/debian bookworm-cran40/" | sudo tee /etc/apt/sources.list.d/r-project.list
Pour Ubuntu 22.04 (Jammy)
sudo add-apt-repository "deb https://cloud.r-project.org/bin/linux/ubuntu jammy-cran40/"
Pour Ubuntu 24.04 (Noble)
sudo add-apt-repository "deb https://cloud.r-project.org/bin/linux/ubuntu noble-cran40/"
Mettre à jour la liste des paquets
sudo apt update
Étape 3 : Installation de R
Vérifier la version disponible
apt-cache policy r-base
Installer R
sudo apt install -y r-base r-base-dev
Le paquet r-base-dev inclut les outils de développement nécessaires pour compiler des packages R depuis les sources.
Vérifier l'installation
R --version
Vous devriez voir quelque chose comme :
R version 4.4.x (2024-xx-xx) -- "Pile of Leaves"
Copyright (C) 2024 The R Foundation for Statistical Computing
Platform: x86_64-pc-linux-gnu
Étape 4 : Utilisation de R
Lancer R en mode interactif
Pour une utilisation personnelle :
R
Pour installer des packages disponibles pour tous les utilisateurs :
sudo -i R
Interface R
Une fois dans R, vous verrez le prompt >. Voici quelques commandes de base :
# Afficher la version
version
# Obtenir de l'aide
help()
# Quitter R
q()
Étape 5 : Installation de packages depuis CRAN
R dispose de milliers de packages disponibles sur CRAN (Comprehensive R Archive Network).
Installer un package
Dans l'interpréteur R :
install.packages('nom_du_package')
Exemple : Installation de packages courants
# Manipulation de données
install.packages('dplyr')
install.packages('tidyr')
install.packages('data.table')
# Visualisation
install.packages('ggplot2')
# Machine Learning
install.packages('caret')
install.packages('randomForest')
# Rapports
install.packages('rmarkdown')
install.packages('knitr')
Charger un package
library(ggplot2)
Exemple pratique avec txtplot
Installons un package simple pour créer des graphiques ASCII :
# Installer le package
install.packages('txtplot')
# Charger le package
library('txtplot')
# Créer un graphique simple
txtplot(cars[,1], cars[,2], xlab = 'speed', ylab = 'distance')
Résultat :
+----+--------+--------+-------+--------+--+
120 + * +
| |
d 100 + * +
i | * * |
s 80 + * * +
t | * * * |
a 60 + * +
n | * * * |
c 40 + * ** +
e | * * * * |
20 + * * * +
+----+--------+--------+-------+--------+--+
5 10 15 20 25
speed
Étape 6 : Installation de RStudio Server (optionnel)
RStudio Server fournit une interface web pour R.
Télécharger et installer RStudio Server
Pour Debian/Ubuntu :
# Installer les dépendances
sudo apt install -y gdebi-core
# Télécharger RStudio Server (vérifiez la dernière version sur https://posit.co/download/rstudio-server/)
wget https://download2.rstudio.org/server/jammy/amd64/rstudio-server-2024.04.2-764-amd64.deb
# Installer
sudo gdebi rstudio-server-2024.04.2-764-amd64.deb
Vérifier le statut
sudo systemctl status rstudio-server
Configurer le pare-feu
sudo ufw allow 8787/tcp
sudo ufw reload
Accéder à RStudio Server
Ouvrez votre navigateur et accédez à :
http://IP_DU_SERVEUR:8787
Connectez-vous avec vos identifiants Linux.
Configuration avancée
Définir un miroir CRAN par défaut
Créez ou éditez le fichier .Rprofile :
nano ~/.Rprofile
Ajoutez :
options(repos = c(CRAN = "https://cloud.r-project.org"))
Installer des packages système pour R
Certains packages R nécessitent des bibliothèques système :
# Pour les packages avec dépendances courantes
sudo apt install -y libcurl4-openssl-dev libssl-dev libxml2-dev libfontconfig1-dev libharfbuzz-dev libfribidi-dev libfreetype6-dev libpng-dev libtiff5-dev libjpeg-dev
Augmenter la mémoire disponible
Pour les gros calculs, vous pouvez augmenter la limite de mémoire dans R :
# Vérifier la mémoire disponible
memory.limit()
# Sous Linux, la limite est généralement la RAM disponible
Scripts R en ligne de commande
Exécuter un script R
Rscript mon_script.R
Exemple de script
Créez un fichier analyse.R :
#!/usr/bin/env Rscript
# Charger les données
data <- read.csv("donnees.csv")
# Statistiques descriptives
summary(data)
# Sauvegarder les résultats
write.csv(summary(data), "resultats.csv")
print("Analyse terminée !")
Exécutez-le :
Rscript analyse.R
Packages populaires par domaine
Data Science
| Package | Description |
|---|---|
tidyverse | Collection de packages pour la data science |
dplyr | Manipulation de données |
ggplot2 | Visualisation |
readr | Import de données |
tidyr | Nettoyage de données |
Machine Learning
| Package | Description |
|---|---|
caret | Framework ML unifié |
randomForest | Forêts aléatoires |
xgboost | Gradient boosting |
keras | Deep learning |
mlr3 | Framework ML moderne |
Statistiques
| Package | Description |
|---|---|
stats | Statistiques de base (inclus) |
lme4 | Modèles mixtes |
survival | Analyse de survie |
forecast | Séries temporelles |
En cas de problème
Erreur lors de l'installation d'un package
Si vous obtenez des erreurs de compilation :
# Installer les outils de développement
sudo apt install -y build-essential
# Installer les dépendances communes
sudo apt install -y libcurl4-openssl-dev libssl-dev libxml2-dev
Package introuvable
Vérifiez que vous utilisez le bon nom de package sur CRAN.
Mémoire insuffisante
Si R manque de mémoire :
# Nettoyer l'environnement
rm(list = ls())
# Forcer le garbage collection
gc()
Vérifier les packages installés
# Lister tous les packages
installed.packages()
# Vérifier si un package est installé
"ggplot2" %in% rownames(installed.packages())
Mise à jour de R
Pour mettre à jour R vers la dernière version :
sudo apt update
sudo apt upgrade r-base r-base-dev
Après une mise à jour majeure de R, vous devrez peut-être réinstaller vos packages.