Rust my Node.js

Si vous êtes développeur Node.js, vous vous confronterez tôt ou tard au développement d'addons natifs ... et à tout un lot de nouveaux problèmes : le langage C++ en lui même, mais également API V8, build system ou dépendance aux versions de V8. Pourtant dès que vous avez besoins de multi-threading, d'accès aux ressources machine ou même simplement pour réutiliser des librairies existantes vous n'y coupez pas. Ce billet vise à vous faire découvrir comment le langage Rust permet de rendre vos modules natifs "fast & safe".

Une histoire de Node

J'aime beaucoup le runtime Node.js :

un écosystème impressionnant grâce à npm, qui se trouve être un excellent outil de gestion de dépendance, de sandboxing de projet et de publication de librairie ;
la communauté javascript est très prolifique, ce qui permet également de trouver beaucoup de librairies intéressante via npm ;
le runtime est très performant pour créer des API web et de manière générale, pour tout cas d'usage consommateur d'I/O ;
le modèle de gestion de l'asynchronisme proposé par l'event-loop, mimant la webAPI JS, est également une force.

Tout ceci est supporté par une architecture robuste, rendue possible principalement grâce au moteur ECMAScript V8 et la librairie libuv.

Node.js architecture

Node.js est donc un runtime C/C++ qui exécute du code Javascript. Cependant Javascript est un langage conçu initialement pour être exécuté dans un navigateur web. Pour des raisons de sécurité un certain nombre d'actions ne sont pas possible depuis un navigateur et de fait ne font pas parties des spécifications et API javascript. Par exemple l'accès direct au système de fichier ou aux périhériques réseaux ...

Node.js fournit donc une API permettant d'accéder à certaines des ces fonctionnalités pour réaliser de réelles applications serveur en Javascipt. En réalité, ces modules sont des programmes C++ qui expose des bindings Javascript grâce à l'API de V8. Ceci est "masqué" par Node.js quand vous utilisez des modules tels que fs ou net. Cepedant cette API ne pouvant être exhaustive, et pour ouvrir le champ des possibles, Node.js permet également de faire des addons C++ et d'exposer vos propres bindings.

Lorsque l'on développe une application pour Node.js nous pouvons donc faire du code Javascript ou du code C++ packagé sous forme d'addon.

Que sont ces addons ?

Des « dynamically-linked shared objects », écrits en C++, en utilisant l’api V8 api, qui peuvent être importé par la fonction require() ;
des modules compilés dépendant de V8 et donc dépendants de la version de Node et de l'architecture du processeur.

Depuis Node 8, il existe n-api, une abstraction indépendante de la version de V8.

Un addon doit donc être compilé pour chaque version de Node et chaque architecture. En général, il suffit de prévoir le build de l'addon dans le script npm postinstall de son projet.

A quoi ça sert ?

Réutiliser du code C ou C++ existant dans votre base de code d'entreprise ;
utiliser des librairies binaires : statiques (.a) ou dynamiques (.so / .dylib / .dll), potentiellement des librairies tierces non libres ;
viser des performances natives, ce qui peut être intéressant pour certains algorithmes ;
avoir accès aux ressources systèmes, non accessibles depuis Javascript (I/O, ports séries, GPU …) ;
utiliser des worker threads pour des algorithmes plus intéressants en multi-threading (il est possible, depuis Node 10.5, de faire du multi-threading en Javascript, mais cela reste expérimental et limité) ;
typer statiquement une librairie.

Les anti-patterns

A ce stade, on pourrait être tenter de réaliser toute son application sous forme d'addon ! Ce n'est pas le but et il y a quelques anti-patterns à connaitre :

vouloir ré-écrire l'event-loop : Node a été conçu pour ça, libuv est "battle tested" ;
faire des I/O intensif : là encore, c'est la force de libuv ;
uniquement typer un programme : si le côté dynamique de Javascript vous dérange, d'autres approches sont plus productives :
- Js as a Bytecode : avoir un langage typé statiquement qui compile vers Javascript, tel que OCaml + Js_of_ocaml, F# + Fable, ou Purescript. Ces compilateurs apportent beaucoup d'optimisations et ces langages sont plus sûrs que C++ ;
- Webassembly : quand vous êtes dans un langage ne disposant pas d'un bon compilateur vers JS mais disposant d'un compilateur WASM (ex : Rust). C'est d'ailleurs l'objectif de WASM, servir d'assembleur pour le web et d'éviter le passage par JS. De plus Node.js peut tout à fait charger un module WASM.

Donc je peux utiliser Javascript et C++ en même temps Large amount of code

C++ est un langage qui cumule beaucoup de problématiques : unsound, unsafe, manque d'outillage ... Néanmoins c'est un langage parfois utile pour faire des programmes bas niveau performant.

A titre personnel, j'utilise Rust pour ce type de besoins. Les avantages de Rust, de manière synthétique sont :

un langage Memory Safe ;
un compilateur qui bloque la plupart des erreurs de runtime ;
un interfaçage facile avec C/C++ ;
la programmation générique ;
un système de type ML, incluant types algébriques et filtrage par motifs ;
pas de rammasse miette ;
pas d'allocation / désallocation manuelle de mémoire ;
pas de segmentation fault ;
pas de data race ;
un outillage impressionant ;
compile vers des applications natives, des librairie Rust ou C, du webassembly ou même des addon Node.js

Effectivement, le projet Neon Bindings permet de compiler une librairie Rust vers un addon natif Node et de l'utiliser directement depuis votre code Javascript.

Vous pouvez découvrir Neon avec ces quelques exemples : https://github.com/oteku/rust-my-node

fibo-sync : comparer les performances d'un calcul couteux (ici un fibonacci naïf) en Javascript et Rust ;
- Sur des petits calculs (node fibo-sync.js --value 1), Javascript est plus performant : c'est assez logique nous sommes dans le cas où le coût d'appel d'un addon est supérieur au coût du calcul ;
- sur de gros calculs (node fibo-sync.js --value 45), on a un gain notable ;
- il est aisé, grace au type JsResult de Neon, de passer des erreurs du code Rust au code Javascript (node fibo-sync.js --value 50) ;
fibo-async : dans un programme Node.js, on prend l'habitude découper un algorithme couteux en code asynchrone pour ne pas bloquer l'event loop. Neon offre un trait Task qui permet faciliter la création de code asynchrone dans vos addons et de ne pas bloquer la callstack JS (node fibo-async.js --value 45) ;
foldersize : sert à montrer comment un addon permet de bénéficier de librairies Rust existantes pour les réutiliser au sein d'un programme Node (node foldersize.js)

Ce billet a été rédigé pour servir de pilote au talk Rust my node présenté lors de Lambda Lille#14 et d'un BBL Zenika