Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
r_symposium_2018 [2018/03/21 15:12]
lblondel
r_symposium_2018 [2018/07/07 10:19] (current)
vincent_fugere
Line 16: Line 16:
 Le 10 et 11 mai 2018.  Le 10 et 11 mai 2018. 
  
-Départ le 10 à 9h00 de McGill, 1205 av. Dr Penfield, Montréal. ​+Départ le 10 à **8h30** ​de McGill, 1205 av. Dr Penfield, Montréal. ​
  
 Retour le 11 vers 17h30 à McGill, 1205 av. Dr Penfield, Montréal. Retour le 11 vers 17h30 à McGill, 1205 av. Dr Penfield, Montréal.
Line 39: Line 39:
 May 10th and 11th 2018.  May 10th and 11th 2018. 
  
-Departure on the 10th at 9h00 from McGill, 1205 Dr Penfield ave., Montreal. ​+Departure on the 10th at **8h30** ​from McGill, 1205 Dr Penfield ave., Montreal. ​
  
 Return on the 11th at 17h to McGill, 1205 Dr Penfield ave., Montreal. Return on the 11th at 17h to McGill, 1205 Dr Penfield ave., Montreal.
Line 52: Line 52:
  
 ^ ^ ^ ^
-===== Horaire | Schedule =====+===== Schedule =====
  
-À venir! | Upcoming!+__May 10th__ 
 +  * 8h30: Departure from McGill 
 +  * 10h00: Arrival at SBL 
 +  * 10h30: **Beta diversity in space and time** //by Vincent Fugère & Katrine Turgeon// 
 +  * 12h00: Lunch  
 +  * 13h00: **Geospatial analysis and cartography with R** //by Marie-Hélène Brice// 
 +  * 15h30: Coffee break 
 +  * 16h00: **Phylogenetic Comparative Methods in R** //by Pedro Henrique Pereira Braga// 
 +  * 18h15: Dinner + Social
  
 +__May 11th__
 +  * 8h00: Breakfast
 +  * 9h00: **Survival analyses with R I** //by Julie Landes//
 +  * 10h15: Coffee break
 +  * 10h45: **Survival analyses with R II** //by Julie Landes//
 +  * 12h00: Lunch
 +  * 13h00: **eDNA metabarcoding:​ From raw data to RDA** //by Alexis Carteron & Simon Morvan//
 +  * 15h45: Departure from SBL
 +
 +----
 +===== Preparation for the workshop =====
 +
 +++++ R Environment Preparation for the workshop | Please, follow the guidelines below **before** coming to the symposium, to avoid delays due to high internet traffic demand:
 + 
 +  - Update your R and RStudio to the latest versions;
 +  - Run the script below in your R console to install and update the libraries required for the workshops;
 +  - Finally, execute the following [[https://​raw.githubusercontent.com/​mhBrice/​Rspatial/​master/​script/​Rspatial_data.R|script]] to download files required for the **Geospatial analyses and cartography with R** workshop.
 +
 +<code rsplus | R Environment Preparation>​
 +#​-------------------------------------------------------------------------------#​
 +###        Install all packages for 2018 QCBS R Symposium workshops ​         ####
 +#​-------------------------------------------------------------------------------#​
 +
 +# Marie-Hélène Brice
 +# 03-05-2018
 +
 +
 +# Packages for Survival analyses with R by Julie Landes ​
 +
 +pkgs_survi <- c("​survival",​ "​eha",​ "​icenReg", ​
 +                "​MLEcens",​ "​interval",​ "​lme4",​ "​plyr", ​
 +                "​Rcpp",​ "​tidyr",​ "​lubridate",​ "​ggplot2", ​
 +                "​ggfortify",​ "​reshape2",​ "​MASS",​ "​zoo", ​
 +                "​ssym",​ "​GIGrvg",​ "​numDeriv",​ "​normalp", ​
 +                "​Formula",​ "​perm",​ "​Rcpp",​ "​coda"​)
 +
 +# For Icens
 +source("​https://​bioconductor.org/​biocLite.R"​) ## try http:// if https:// URLs are not supported
 +biocLite("​Icens"​)
 +
 +# Packages for Beta diversity in space and time by Vincent Fugère & Katrine Turgeon
 +
 +pkgs_beta <- c("​adklakedata",​
 +               "​RCurl",​
 +               "​vegan",​
 +               "​gclus",​
 +               "​RColorBrewer",​
 +               "​ade4",​
 +               "​adespatial",​
 +               "​dplyr",​
 +               "​tidyr",​
 +               "​magrittr",​
 +               "​ggplot2"​)
 +
 +# Packages for Geospatial analysis and cartography with R by Marie-Hélène Brice
 +
 +pkgs_spatial <- c("​sf",​
 +                  "​lwgeom",​
 +                  "​dplyr",​
 +                  "​RColorBrewer",​
 +                  "​raster",​
 +                  "​mapview"​)
 +
 +# Packages for Phylogenetic Comparative Methods in R by Pedro Henrique Pereira Braga
 +
 +pkgs_PhyloCompMethods <- c("​devtools", ​
 +                           "​ape",​ "​phytools",​ "​picante",​ "​geiger",​
 +                           "​apTreeshape",​ "​caper",​ "​pez",​ "​OUwie",​ "​adephylo"​)
 +
 +## try http:// if https:// URLs are not supported
 +# source("​https://​bioconductor.org/​biocLite.R"​)
 +biocLite("​ggtree"​)
 +
 +
 +# Packages for eDNA metabarcoding:​ From raw data to RDA by Alexis Carteron & Simon Morvan
 +
 +# source('​http://​bioconductor.org/​biocLite.R'​)
 +biocLite('​phyloseq'​)
 +biocLite('​dada2'​)
 +pkgs_eDNA <- c('​ggplot2',​ '​vegan',​ '​gtools'​)
 +
 +# All packages
 +
 +pkgs <- c(pkgs_survi,​ pkgs_beta, pkgs_spatial,​ pkgs_eDNA, pkgs_PhyloCompMethods)
 +
 +pkgs <- pkgs[!duplicated(pkgs)]
 +
 +
 +# Which packages you don't already have
 +
 +new.pkg <- pkgs[!(pkgs %in% installed.packages()[,​ "​Package"​])]
 +
 +# Install!
 +
 +if (length(new.pkg)) {
 +  install.packages(new.pkg,​ dependencies = TRUE)
 +
 +
 +update.packages()  ​
 +</​code>​
 +++++
 +
 +----
 ===== Résumés des ateliers ===== ===== Résumés des ateliers =====
  
Line 61: Line 172:
  
 Depuis la démocratisation du séquençage à haut débit, l'​utilisation de l'ADN comme méthode d'​identification est devenue une pratique courante. Grâce à des gènes marqueurs (ARNr 16S, ARNr 18S, ITS, etc.) et des bases de données taxonomiques,​ il est possible d’identifier les communautés présentes dans vos échantillons. Plus besoin de cultiver, isoler et identifier en fonction de la morphologie et des réactions chimiques! Cependant, le processus complet de d’identification des séquences d'ADN en unités taxonomiques exploitables peut s’avérer difficile en raison de l’évolution rapide des techniques bioinformatiques et de la profusion de méthodes disponibles. Dans cet atelier, nous vous présenterons un flux opérationnel accessible et reproductible en langage R dédié au traitement de séquences d'ADN brutes à l'aide de la librairie DADA2. Cette étape sera suivi d’une analyse et d’une visualisation de la communauté à l'aide de la librairie Phyloseq. Depuis la démocratisation du séquençage à haut débit, l'​utilisation de l'ADN comme méthode d'​identification est devenue une pratique courante. Grâce à des gènes marqueurs (ARNr 16S, ARNr 18S, ITS, etc.) et des bases de données taxonomiques,​ il est possible d’identifier les communautés présentes dans vos échantillons. Plus besoin de cultiver, isoler et identifier en fonction de la morphologie et des réactions chimiques! Cependant, le processus complet de d’identification des séquences d'ADN en unités taxonomiques exploitables peut s’avérer difficile en raison de l’évolution rapide des techniques bioinformatiques et de la profusion de méthodes disponibles. Dans cet atelier, nous vous présenterons un flux opérationnel accessible et reproductible en langage R dédié au traitement de séquences d'ADN brutes à l'aide de la librairie DADA2. Cette étape sera suivi d’une analyse et d’une visualisation de la communauté à l'aide de la librairie Phyloseq.
 +
 +[[https://​alexiscarter.github.io/​metab/​]]
  
 **Diversité bêta à travers l’espace et le temps** //par Vincent Fugère et Katrine Turgeon// **Diversité bêta à travers l’espace et le temps** //par Vincent Fugère et Katrine Turgeon//
    
 La diversité bêta représente la variation dans la composition de la communauté entre deux ou plusieurs sites. Cette dimension importante de la biodiversité lie la diversité aux échelles locale et régionale (diversité alpha et gamma) et joue un rôle important dans le fonctionnement des méta-communautés. Il est également possible de mesurer la diversité bêta à travers le temps afin de quantifier le renouvellement des espèces au sein des communautés et la stabilité de celles-ci. Bien que la notion de diversité bêta ait été amenée par Whittaker dans les années soixante, plusieurs développements méthodologiques récents permettent une meilleure caractérisation de la diversité bêta, incluant par exemple de nouvelles méthodes pour partitionner la diversité bêta en ses deux composantes principales : l’emboîtement (nestedness) et le renouvellement d’espèces (turnover). Cet atelier présentera plusieurs méthodes pour mesurer la diversité bêta à travers l’espace et le temps (contributions locales/​spécifiques à la diversité bêta, analyse de dispersion multi-variables et partitionnement de la diversité bêta). Nous espérons aussi que cet atelier montrera qu’une analyse de la diversité bêta amène une compréhension plus nuancée de la réponse d’une communauté à une perturbation anthropique. La diversité bêta représente la variation dans la composition de la communauté entre deux ou plusieurs sites. Cette dimension importante de la biodiversité lie la diversité aux échelles locale et régionale (diversité alpha et gamma) et joue un rôle important dans le fonctionnement des méta-communautés. Il est également possible de mesurer la diversité bêta à travers le temps afin de quantifier le renouvellement des espèces au sein des communautés et la stabilité de celles-ci. Bien que la notion de diversité bêta ait été amenée par Whittaker dans les années soixante, plusieurs développements méthodologiques récents permettent une meilleure caractérisation de la diversité bêta, incluant par exemple de nouvelles méthodes pour partitionner la diversité bêta en ses deux composantes principales : l’emboîtement (nestedness) et le renouvellement d’espèces (turnover). Cet atelier présentera plusieurs méthodes pour mesurer la diversité bêta à travers l’espace et le temps (contributions locales/​spécifiques à la diversité bêta, analyse de dispersion multi-variables et partitionnement de la diversité bêta). Nous espérons aussi que cet atelier montrera qu’une analyse de la diversité bêta amène une compréhension plus nuancée de la réponse d’une communauté à une perturbation anthropique.
 +
 +[[https://​github.com/​VFugere/​QCBS_betadiv]]
  
 **Analyses géospatiales et cartographie sous R** //par Marie-Hélène Brice// ​ **Analyses géospatiales et cartographie sous R** //par Marie-Hélène Brice// ​
Line 71: Line 186:
  
 Jusqu’à aujourd’hui,​ l’analyse spatiale en R a largement reposé sur le package sp et ses associés, rgdal et rgeos. Depuis peu, le package sf permet d’implémenter le standard ISO pour l'​accès et l'​échange de données spatiales, les simple features. Un des avantages de sf sur la famille sp est l'​utilisation de data.frames et la simplification des structures de données pour les géométries spatiales, rendant la manipulation plus facile et plus rapides. Durant cet atelier, nous verrons comment utiliser les différents packages de R (notamment sf) pour manipuler et analyser des objets spatiaux, puis créer de belles cartes informatives. L’atelier se propose comme un survol des fonctionnalités de R dans le domaine des analyses spatiales, avec pour objectif de rendre l'​analyse des données géographiques plus accessible à tous dans le cadre d'un flux de travail reproductible. Jusqu’à aujourd’hui,​ l’analyse spatiale en R a largement reposé sur le package sp et ses associés, rgdal et rgeos. Depuis peu, le package sf permet d’implémenter le standard ISO pour l'​accès et l'​échange de données spatiales, les simple features. Un des avantages de sf sur la famille sp est l'​utilisation de data.frames et la simplification des structures de données pour les géométries spatiales, rendant la manipulation plus facile et plus rapides. Durant cet atelier, nous verrons comment utiliser les différents packages de R (notamment sf) pour manipuler et analyser des objets spatiaux, puis créer de belles cartes informatives. L’atelier se propose comme un survol des fonctionnalités de R dans le domaine des analyses spatiales, avec pour objectif de rendre l'​analyse des données géographiques plus accessible à tous dans le cadre d'un flux de travail reproductible.
 +
 +[[https://​mhbrice.github.io/​Rspatial/​ | Présentation]]
 +
 +[[https://​mhbrice.github.io/​Rspatial/​Rspatial_script.html | Document]]
  
 **Analyses de survie** //par Julie Landes// **Analyses de survie** //par Julie Landes//
    
 Au cours de cet atelier, vous apprendrez à faire des analyses de survie avec R. Ces modèles permettent d’étudier la durée de survenue d’un événement (par exemple la mort, la première reproduction,​ l’observation d’un comportement,​…),​ et les facteurs qui affectent cette durée. Dans un premier temps, vous verrez comment mettre en forme vos données. Nous passerons ensuite par les différentes étapes des analyses de survie dans R : estimation non paramétrique de la fonction de survie, modèles de Cox et modèles de survie paramétriques. Pour les différentes étapes, vous apprendrez à interpréter et illustrer les résultats. Au cours de cet atelier, vous apprendrez à faire des analyses de survie avec R. Ces modèles permettent d’étudier la durée de survenue d’un événement (par exemple la mort, la première reproduction,​ l’observation d’un comportement,​…),​ et les facteurs qui affectent cette durée. Dans un premier temps, vous verrez comment mettre en forme vos données. Nous passerons ensuite par les différentes étapes des analyses de survie dans R : estimation non paramétrique de la fonction de survie, modèles de Cox et modèles de survie paramétriques. Pour les différentes étapes, vous apprendrez à interpréter et illustrer les résultats.
 +
  
 **Méthodes comparatives phylogénétiques en R** //par Pedro Henrique Pereira Braga// **Méthodes comparatives phylogénétiques en R** //par Pedro Henrique Pereira Braga//
Line 83: Line 203:
   * Lire et interpréter des arbres phylogénétiques;​   * Lire et interpréter des arbres phylogénétiques;​
   * Explorez certaines des méthodes comparatives phylogénétiques les plus couramment utilisées pour:   * Explorez certaines des méthodes comparatives phylogénétiques les plus couramment utilisées pour:
-   ​* ​a) Effectuer la reconstruction d’états ancestraux;​ +   * Effectuer la reconstruction d’états ancestraux;​ 
-   ​* ​b) Ajuster des modèles évolutionnistes aux traits biologiques;​ +   * Ajuster des modèles évolutionnistes aux traits biologiques;​ 
-   ​* ​c) Estimer des taux de diversification de traits; +   * Estimer des taux de diversification de traits; 
-   ​* ​d) Estimer les champs phylogénétiques des clades; +   * Estimer les champs phylogénétiques des clades; 
-   ​* ​e) Évaluer la structure phylogénétique des communautés;​+   * Évaluer la structure phylogénétique des communautés;​
   * Intégrer des différentes approches de méthodes phylogénétiques en utilisant R;   * Intégrer des différentes approches de méthodes phylogénétiques en utilisant R;
   * Devenir à l'aise de naviguer dans la littérature primaire sur les méthodes statistiques comparatives.   * Devenir à l'aise de naviguer dans la littérature primaire sur les méthodes statistiques comparatives.
  
 +[[https://​pedrohbraga.github.io/​PhylogeneticComparativeMethods/​PhyloCompMethodsMaterial.html | Workshop Tutorial]]
  
 ===== Workshop abstracts ===== ===== Workshop abstracts =====
Line 97: Line 218:
  
 With the democratisation of high-throughput sequencing, the use of DNA as an identification method has become standard practice. The marker genes (16S rRNA, 18S rRNA, ITS, etc.) can be compared to databases and give an overview of the communities present in your samples. No more cultivating,​ isolating and identifying based on morphology and chemical reactions ! However time-gaining DNA sequencing may be, the full process of turning raw DNA reads into exploitable taxonomic units can be tricky. Due to the quick turnover in bioinformatics techniques and the profusion of methods available, it can be hard to decide on a pipeline. In this workshop, we would like to present to you a complete reproducible workflow in R dedicated to the processing of raw DNA sequences using the DADA2 package, followed by community analysis and visualisation using the Phyloseq package. With the democratisation of high-throughput sequencing, the use of DNA as an identification method has become standard practice. The marker genes (16S rRNA, 18S rRNA, ITS, etc.) can be compared to databases and give an overview of the communities present in your samples. No more cultivating,​ isolating and identifying based on morphology and chemical reactions ! However time-gaining DNA sequencing may be, the full process of turning raw DNA reads into exploitable taxonomic units can be tricky. Due to the quick turnover in bioinformatics techniques and the profusion of methods available, it can be hard to decide on a pipeline. In this workshop, we would like to present to you a complete reproducible workflow in R dedicated to the processing of raw DNA sequences using the DADA2 package, followed by community analysis and visualisation using the Phyloseq package.
 +
 +[[https://​alexiscarter.github.io/​metab/​]]
  
 **Beta diversity in space and time** //by Vincent Fugère & Katrine Turgeon// **Beta diversity in space and time** //by Vincent Fugère & Katrine Turgeon//
Line 102: Line 225:
 Variation in species composition across sites is known as beta diversity. This important dimension of biodiversity,​ which links local-scale (alpha) diversity to regional (gamma) diversity, is increasingly recognized as a key factor influencing metacommunity functioning and as an important target for conservation action. Beta diversity can also be measured over time, indicating species turnover in community composition within sites and providing a convenient measure of community stability. Although beta diversity indices have been available since Whittaker’s seminal monograph in 1960, there has been many recent methodological developments to improve the quantification of beta diversity, including novel tools to investigate the long-standing problem of partitioning beta diversity into community nestedness and species replacement/​turnover. This workshop will explore these tools and describe common methods to measure temporal and spatial beta diversity (Local/​Species contribution to beta diversity, PERMDISP on incidence and abundance-based dissimilarity indices, and beta diversity decomposition). By doing so, we also hope to illustrate how beta diversity analyses can refine our understanding of human impacts on ecological communities. Variation in species composition across sites is known as beta diversity. This important dimension of biodiversity,​ which links local-scale (alpha) diversity to regional (gamma) diversity, is increasingly recognized as a key factor influencing metacommunity functioning and as an important target for conservation action. Beta diversity can also be measured over time, indicating species turnover in community composition within sites and providing a convenient measure of community stability. Although beta diversity indices have been available since Whittaker’s seminal monograph in 1960, there has been many recent methodological developments to improve the quantification of beta diversity, including novel tools to investigate the long-standing problem of partitioning beta diversity into community nestedness and species replacement/​turnover. This workshop will explore these tools and describe common methods to measure temporal and spatial beta diversity (Local/​Species contribution to beta diversity, PERMDISP on incidence and abundance-based dissimilarity indices, and beta diversity decomposition). By doing so, we also hope to illustrate how beta diversity analyses can refine our understanding of human impacts on ecological communities.
  
-**Geospatial ​analysis ​and cartography with R** //by Marie-Hélène Brice//+[[https://​github.com/​VFugere/​QCBS_betadiv]] 
 + 
 +**Geospatial ​analyses ​and cartography with R** //by Marie-Hélène Brice//
  
 The processing and analysis of spatial data under R goes back more than a decade ago. With a wide range of packages, R enables advanced geospatial statistics, modeling and visualization. But, why use R to manipulate spatial objects when there are very powerful and specialized tools (like ArcGIS or QGIS)? The answer lies in task automation and reproducibility of the entire workflow (importation,​ modification of geometry, statistical analysis, cartography,​ exportation). The processing and analysis of spatial data under R goes back more than a decade ago. With a wide range of packages, R enables advanced geospatial statistics, modeling and visualization. But, why use R to manipulate spatial objects when there are very powerful and specialized tools (like ArcGIS or QGIS)? The answer lies in task automation and reproducibility of the entire workflow (importation,​ modification of geometry, statistical analysis, cartography,​ exportation).
  
 Until recently, spatial analysis in R has largely relied on the package sp and its helper packages, rgdal and rgeos. Recently, the sf package allows R users to implement the ISO standard for access and manipulation of spatial vector data, simple features. One of the advantages of sf over the sp family is the use of data.frames and the simplification of data structures for spatial geometries, making spatial data handling easier and faster. During this workshop, we will see how to use the different packages of R (notably sf) to manipulate and analyze spatial objects and create nice and informative maps. The workshop is intended as an overview of R's functionalities in the field of spatial analysis, with the aim of making the analysis of geospatial data more accessible to all within the framework of a reproducible workflow. Until recently, spatial analysis in R has largely relied on the package sp and its helper packages, rgdal and rgeos. Recently, the sf package allows R users to implement the ISO standard for access and manipulation of spatial vector data, simple features. One of the advantages of sf over the sp family is the use of data.frames and the simplification of data structures for spatial geometries, making spatial data handling easier and faster. During this workshop, we will see how to use the different packages of R (notably sf) to manipulate and analyze spatial objects and create nice and informative maps. The workshop is intended as an overview of R's functionalities in the field of spatial analysis, with the aim of making the analysis of geospatial data more accessible to all within the framework of a reproducible workflow.
 +
 +[[https://​mhbrice.github.io/​Rspatial/​ | Slides]]
 +
 +[[https://​mhbrice.github.io/​Rspatial/​Rspatial_script.html | Document]]
  
 **Survival analyses with R** //by Julie Landes// **Survival analyses with R** //by Julie Landes//
  
 During this workshop, you will learn how to perform survival analyses with R. These models allow to study the time to an event of interest (e.g. death, first reproduction,​ observation of a behavior,​…),​ and the factors that affect this time. First, you will learn how to organize and format your data. Then, we will go through the different steps of survival analyses: non-parametric estimation of the survival function, Cox’s models and parametric models. For each step, you will learn how to interpret and to illustrate the results. During this workshop, you will learn how to perform survival analyses with R. These models allow to study the time to an event of interest (e.g. death, first reproduction,​ observation of a behavior,​…),​ and the factors that affect this time. First, you will learn how to organize and format your data. Then, we will go through the different steps of survival analyses: non-parametric estimation of the survival function, Cox’s models and parametric models. For each step, you will learn how to interpret and to illustrate the results.
 +
  
 **Phylogenetic Comparative Methods in R** //by Pedro Henrique Pereira Braga// **Phylogenetic Comparative Methods in R** //by Pedro Henrique Pereira Braga//
Line 126: Line 256:
   - Integrate different approaches of phylogenetic methods using R;   - Integrate different approaches of phylogenetic methods using R;
   - Be comfortable navigating primary literature in statistical comparative methods.   - Be comfortable navigating primary literature in statistical comparative methods.
 +
 +[[https://​pedrohbraga.github.io/​PhylogeneticComparativeMethods/​PhyloCompMethodsMaterial.html | Workshop Tutorial]]
  
  
 +----
  
 ---- ----