Évolutivité et flexibilité
Avec EMR, vous pouvez rapidement exécuter votre module dans un cluster composé de plusieurs groupes d'instances. Ainsi, par exemple, vous pouvez utiliser des instances à la demande dans un groupe pour une puissance de traitement garantie, ainsi que des instances ponctuelles dans un autre groupe pour que vos travaux soient exécutés plus rapidement et à moindre coût. En outre, les clusters EMR sont évolutifs à tout moment, afin que les algorithmes soient toujours exécutés dans un environnement sur mesure. En outre, EMR permet d'utiliser différentes couches de stockage, HDFS ou EMRFS. Dans le premier cas, les données sont stockées à l'intérieur de HDFS dans le Core Node de vos clusters, évitant ainsi de stocker ces données de manière permanente. Dans le second cas, vous pouvez stocker les données sur S3 en tant que couche de données pour les applications fonctionnant sur votre cluster, ce qui vous permet de séparer le calcul et le stockage, et de conserver les données en dehors du cycle de vie de votre cluster.