Partager mes trouvailles
Avec le vocabulaire actuel, je dirai que je suis un “data scientist”, i.e. un scientifique qui joue avec les données. Ce site web est ma modeste participation à la science ouverte… J’y propose des articles de blog avec des scripts R dedans, souvent avec de la cartographie et des analyses spatiales.
Il y a aussi des choses en lien avec les sciences marines, la modélisation des données spatialisées, un peu de modèles Bayésiens, quelques réalisations avec R-shiny et d’autres choses à partager…
Certains scripts sont des compléments à mes publications scientifiques.
Projets open-source
J’ai quelques projets personnels open-source.
En tant qu’ancien chercheur, j’ai décidé de partager mes scripts R dans des packages R. Je ne peux pas dire qu’ils respectent tous les standards de développement de packages, mais au moins le code est disponible. Jetez un coup d’oeil par ici :
- {SDMSelect} : 1. Procédures de sélection de covariables dans les GLM et GAM. 2. Modélisation de la distribution des espèces.
- {GeoDist} : 1. Calcul des distances entre des points lorsqu’il y a des obstacles entre eux. 2. Modifications des fonctions de {geoR} pour intégrer des matrices de distances personnalisées.
J’utilise également Hugo pour ce site web, ce qui m’a fait travailler sur mon propre template :
- hugo-statnmap-theme : Le présent site web, multilingue, avec surlignage de code, une fonction “voir aussi”, carte twitter, le pliage de code….
- hugo-future-imperfect : template rendu multilingue, avec du “code folding”.
D’autres projets sont disponibles sur mon compte Github.
Qui suis-je ?
Je suis responsable de production chez ThinkR, une entreprise où nous répondons à toutes vos interrogations avec R, en proposant formation, développement, installation et consultance dans tout ce qui tourne autour de R.
Je suis un scientifique dans l’âme, je suis d’ailleurs ingénieur agronome et j’ai un doctorat en biologie marine. Mais l’analyse de données et R m’ont un peu détournés de mes objectifs d’origine. J’ai quitté le monde de la recherche en biologie marine pour rejoindre ThinkR.
Du coup, je continue de partager mes connaissances au travers des formations et des développements open-source. Je fais toujours de l’analyse et de la visualisation de données, principalement dans des missions d’accompagnement et de partage des bonnes pratiques de développement. Et j’adore ça !
Je joue régulièrement avec les cartes, mais je n’ajuste plus vraiment de modèles. Ceci dit, j’ai donc toujours de la matière pour remplir ce blog et vous faire partager mes trouvailles et autres astuces. Sur R principalement !
Si vous êtes curieux sur ce qu’on peut faire avec les outils de cartographie sans travailler sur des données géographiques, faîtes un tour sur ma catégorie “geohacking”.
Bonne lecture !
Jeff Leek, on simplystatistics.org
If every method in every stats journal was implemented in a corresponding R package (easy), was required to have a companion document that was a tutorial on how to use the software (easy), included a reference to how to cite the paper if you used the software (easy) and the paper/tutorial was posted to the relevant message boards for the communities of interest (easy) that journal would see a dramatic bump in its impact factor.