Cloudera a été cofondée en 2008 par le mathématicien Jeff Hammerbach, diplômé de Harvard et un ancien de la Bear Stearns puis de Facebook, où il était chargé de l'analyse de données et du développement de programmes permettant un meilleur ciblage publicitaire[3]. Les autres cofondateurs sont Christophe Bisciglia, ex-employé de Google, Amr Awadallah, ex-employé de Yahoo qui travailla aussi sur Hadoop, Mike Olson, PDG de Cloudera, qui a vendu en 2006 Sleepycat à Oracle[4]. L'architecte en chef est Doug Cutting, à l'origine de Lucene et de Hadoop.
En octobre 2018, Cloudera et Hortonworks annoncent la fusion de leurs activités dans une nouvelle entité détenue à 60 % par les actionnaires de Cloudera et à 40 % par ceux de Hortonworks[5].
CDH contient les principaux éléments, de base du framework Hadoop (MapReduce et HDFS), ainsi que d'autres composants orientés vers les entreprises qui assurent la sécurité, la haute disponibilité, et l'intégration avec le matériel et les autres logiciels (HDFS & MapReduce, Impala, Apache Spark, HBase, Accumulo, Apache Kafka)[réf. nécessaire].
En Cloudera a annoncé le projet de Cloudera Impala, un moteur de requête distribué open source pour Apache Hadoop.