Windows

Red Hat, Hortonworks prep OpenStack pro Hadoop

PySpark Installation | Configure Jupyter Notebook with PySpark | PySpark Tutorial | Edureka

PySpark Installation | Configure Jupyter Notebook with PySpark | PySpark Tutorial | Edureka
Anonim

Spojením světů velkých dat a cloud computingu společně vytváří společnost Mirantis Red Hat, Hortonworks a Hadoop integrátor společně s vývojem softwaru program, nazvaný Savanna, který usnadní nasazení aplikace Apache Hadoop na cloudové službě OpenStack.

Software "umožní Hadoopovi využít architektury pro ukládání dat, které OpenStack nabízí," řekl generální ředitel společnosti Adrian Ionel Mirantis. "Podniky budou mít mnohem jednodušší způsob, jak nasadit a používat Hadoop v měřítku."

Mirantis zahájil projekt počátkem tohoto měsíce a daroval kód Nadaci OpenStack. OpenStack je sada softwaru s otevřeným zdrojovým kódem navržená tak, aby nabízely sdílené služby výpočetní, úložné a síťové služby na vyžádání. Apache Hadoop je rámec pro zpracování dat pro analýzu velkého množství dat na více serverech v clusteru. Oba soubory softwaru jsou stále častěji testovány a nasazovány organizacemi.

[Další informace: Nejlepší televizní vysílání]

"Oblak poskytuje ekonomickou nízkonákladovou infrastrukturu, která se snadno zvětšuje. což je velmi důležité ve světě Hadoop, protože mnohé z těchto projektů se rychle otáčejí uvnitř obchodních jednotek a nemusí nutně mluvit s lidmi v oblasti IT, "řekl Shaun Connolly, viceprezident pro strategii společnosti Hortonworks. Savanna bude pracovat s jakoukoliv standardní distribucí Hadoop, ne jen s vlastní distribucí společnosti Hortonworks.

Savanna poskytne snadný způsob instalace clusteru Hadoop na cloud OpenStack. Administrátoři mohou určit topologii clusteru, počet uzlů, požadovaný hardware a další atributy. Projekt připravuje Savanna jako součást balíku OpenStack, který je dostupný buď rozhraním API (aplikační programovací rozhraní), nebo prostřednictvím grafického rozhraní, které je k dispozici pro palubní desku OpenStack.

Software bude v průběhu času nabízet další funkce, jako je auto -scaling, schopnost naplánovat spuštění implementace Hadoop a schopnost spravovat více clusterů Hadoop. Savanna také bude moci přerozdělit nevyužitou výpočetní sílu na mřížku OpenStack pro pracovní zatížení Hadoop. A společnost Savanna bude poskytovat integrační bod pro software pro správu a správu softwaru Hadoop, zejména Apache Ambari.

Tým očekává, že bude mít demonstrace softwaru připravena na summit Hadoop v červnu.

Savanna je pozoruhodný v tom, že ukazuje, jak jsou podniky stále více závislé na softwaru s otevřeným zdrojovým kódem. "Začínáme vnímat velké projekty, jako je Hadoop a OpenStack, aby se integrovali, protože je to obrovské úsilí v podnikání, abychom dospěli k jednotné otevřené infrastruktuře," říká Ionel.

Joab Jackson pokrývá podnikový software a obecnou technologii zprávy pro IDG News Service. Sledujte Joab na Twitteru @ @ Joab_Jackson. Joabova e-mailová adresa je [email protected]