Utilisation d’un “combiner” dans un job Hadoop MapReduce
Pour augmenter l’efficacité d’un job MapReduce, en plus du cache distribué, on peut s’aider de combiners. Brièvement, dans un job MapReduce: Lors de la phase Map, les mappers génèrent des paires de clé/valeur. Lors de la phase shuffle/sort, ces paires sont réparties et ordonnées sur un ou plusieurs nœuds en fonction de la valeur de…