Windows

Hadoop získává další vyhledávání s MapR, Cloudera release

HDInsight: Fast Interactive Queries with Hive on LLAP | Azure Friday

HDInsight: Fast Interactive Queries with Hive on LLAP | Azure Friday
Anonim

Uživatelé platformy pro zpracování dat Hadoop mají nyní další dva nástroje, které jim pomohou seřadit své hory informací.

Nová distribuce M7 MapR odstraňuje vrstvy Hadoop JVM pro zvýšení výkonu

Hadoop distributor MapR integroval vyhledávání LucidWorks do své vlastní distribuce. Společnost Cloudera mezitím zahájila první úplnou verzi svého open-source impala SQL dotazovacího stroje pro Hadoop.

"[

]" Použití vyhledávání jako uživatelského rozhraní pro velké údaje je velmi zajímavé. Hledání je vhodné pro využití mnoha různých typů informací, zejména nestrukturovaných informací, "řekl Jack Norris, hlavní marketingový ředitel společnosti MapR. "Vidíme některé zajímavé aplikace s vyhledávači v jejich jádru, a to i v případě, že by typický uživatel o nich nezamýšlel jako vyhledávač."

LucidWorks Search je komerční verze open source Apache Lucene / Solr plná -textový vyhledávač. S novou integrací MapR může vyhledávací služba LucidWorks Search prohledávat data buď v systémech souborů Hadoop File Systems (HDFS) nebo v souborech jiných systémů souborů.

Vyhledávání LucidWorks nabízí snímky a zrcadla pro vysokou dostupnost a eliminuje většinu práce potřebné nainstalujte Lucene / Solr od začátku. Nabízí také nativní podporu pro další zdroje dat, grafické uživatelské rozhraní a bezpečnostní rámec.

Vyhledávač by mohl být použit v dynamické webové aplikaci pro rychlé načtení fotografií, inzerce, doporučení produktů a dalších informací, které lze použít k naplnění webových stránek za běhu. "Toto není náhrada datových skladů s nižšími náklady. Jedná se o využívání nových zdrojů dat a dělání některých věcí, které mají dramatický dopad na podnikání, "uvedl Norris.

MapR a LucidWorks spolupracují od roku 2011, kdy společně uzavřeli marketingovou dohodu. Začátkem tohoto roku vydali konektor, který usnadňuje používání Lucene / Solr s distribucí MapR Hadoop.

LucidWords Search pracuje s distribucí distribuce M7 MapR v beta verzi. Kromě podpory LucidWorks Search byla edice M7 přepracována tak, aby eliminovala kompaktní kontroly nebo kontroly konzistence pozadí a výkonnost při překročení rychlosti.

Také tento týden společnost Cloudera vydala verzi 1.0 modulu Cloudera Impala, Hadoop. SQL je jazyk jazyka rozhraní používaný v systémech správy relačních databází (RDMS) a je dobře známý správci databází.

Impala byla navržena tak, aby spouštěla ​​dotazy rychleji než úl Hadoop, protože nepoužívá rámec MapReduce, který vyžaduje výsledky vyhledávání, které mají být zapsány na disk. Místo toho mohou uživatelé dotazovat data uložená přímo v HDFS a HBase. Uživatelé mohou dotazovat data buď interaktivně nebo prostřednictvím dávkových procesů.

Společnost Cloudera nejprve vydala verzi tohoto stroje v říjnu jako beta verzi. Od té doby byl software testován firmami, jako jsou 37signály a Expedia.

Impala je základní součástí balíčku Cloudera Enterprise RTQ (Real-Time Query) pro platformu Cloudera Hadoop. Impala lze stáhnout bez poplatku

Aktualizováno 6. května k opravě informací o technologii Cloudy Impala