Apache Spark para Ciência de Dados
O Apache Spark é uma plataforma de código aberto para processamento distribuído de grandes conjuntos de dados. Ele foi originalmente desenvolvido na Universidade de Berkeley e agora é mantido pelo Apache Software Foundation. O Spark fornece uma API em várias linguagens, incluindo Scala, Java, Python e R, que permite aos desenvolvedores criar aplicativos para