17 novembre 2017

Utilisation d’un “combiner” dans un job Hadoop MapReduce

Pour augmenter l’efficacité d’un job MapReduce, en plus du cache distribué, on peut s’aider de combiners. Brièvement, dans un job MapReduce: Lors de la phase Map, les mappers génèrent des paires de clé/valeur. Lors de la phase shuffle/sort, ces paires sont réparties et ordonnées sur un ou plusieurs nœuds en fonction de la valeur de…

Continuer à lire

10 novembre 2017

Utilisation du “distributed cache” dans un job Hadoop MapReduce

Lors de l’exécution d’un job MapReduce, il peut être nécessaire de consulter des données régulièrement de façon à les utiliser pour les traitements effectués par le mapper ou le reducer. Par exemple, on peut avoir la nécessité de mettre en place un dictionnaire et y accéder pendant l’exécution du mapper et du reducer. Hadoop possède…

Continuer à lire

Quelques découvertes, trucs et astuces sur .NET en général

Month: novembre 2017

Utilisation d’un “combiner” dans un job Hadoop MapReduce

Utilisation du “distributed cache” dans un job Hadoop MapReduce