Windows

Velké data 3 Vs - koncepty a modely

How great leaders inspire action | Simon Sinek

How great leaders inspire action | Simon Sinek

Obsah:

Anonim

Termín "data" není pro nás nový. Je to jedna z hlavních věcí, které se vyučují při výběru informačních technologií a počítačů. Pokud si můžete vzpomenout, data jsou považována za surovou formu informací. Ačkoli už tam po desetiletí je termín Big Data v dnešní době buzz. Jak je zřejmé z termínu, zatížení a množství dat, je Big Data a může být zpracováno různými způsoby pomocí různých metod a nástrojů pro získání požadovaných informací. Tento článek hovoří o pojmech Big Data s využitím 3 V udaného Dougem Laneyem, průkopníkem v oboru datového skladování, který je považován za iniciátor pole Infonomics (Information Economics).

Než budete pokračovat, možná budete chtít přečíst naše články o Základy velkých dat a velké využití dat, abyste pochopili podstatu. Mohli by se připojit k tomuto příspěvku pro další vysvětlení konceptu Big Data

Údaje velkého data 3 Vs

Údaje, v jejich obrovské podobě, nahromaděné různými prostředky, byly řádně uloženy v různých databázích dřívějších a po nějaké době byly vyhozeny. Když se objevila koncepce, že čím více dat, tím jednodušší je zjistit - různé a relevantní informace - pomocí správných nástrojů, společnosti začaly ukládat data po delší dobu. Je to jako přidání nových úložných zařízení nebo použití cloud pro ukládání dat v jakékoli podobě, jakou byla data získána: dokumenty, tabulky, databáze a HTML atd. Je pak uspořádáno do správných formátů pomocí nástrojů schopných zpracovávat obrovské kousky Data

POZNÁMKA: Rozsah velkých dat není omezen na data, která shromažďujete a ukládáte ve svých prostorách a cloud. Může to zahrnovat data z jiných zdrojů, včetně, ale nikoliv výlučně, položek veřejně dostupné.

3D model velkých dat vychází z následujícího V:

  1. Hlasitost: odkazuje na správu ukládání dat
  2. Veličina: odkazuje na rychlost zpracování dat
  3. Variant: odkazuje se na seskupování dat různých, zdánlivě nesouvisejících datových sad

Následující odstavce vysvětlují Big Data modelování tím, že podrobněji mluví o každé dimenzi (každý V)

A] Objem velkých dat

Když mluvíme o Big Data, člověk by mohl chápat objem jako obrovskou sbírku surových informací. I když to platí, jedná se také o náklady na ukládání dat. Důležitá data mohou být uložena v prostorách i v cloudu, což je flexibilní volba. Musíte ale ukládat vše a všechno?

Podle whitepaper vydané Meta Group, když se objem dat zvyšuje, části dat začnou vypadat zbytečně. Dále uvádí, že by měl být zachován pouze tento objem údajů, který podniky zamýšlejí používat. Jiné údaje mohou být zlikvidovány, nebo pokud se podniky zdráhají zbavit "údajně nedůležitých údajů", mohou být vyřazeny z nevyužívaných počítačových zařízení a dokonce i na pásky, aby podniky nemusely platit za ukládání těchto údajů. > Používal jsem "údajně nevýznamné údaje", protože i já se domnívám, že jakákoliv data mohou být v budoucnu vyžadována jakoukoli službou - dříve či později - a proto musí být uchovávána dostatečně dlouho, než víte, že jsou data skutečně nedůležité. Osobně jsem odložil starší data na pevné disky od dávných dob a někdy i na DVD. Hlavní počítače a cloud storage obsahují data, která považuji za důležitá a vědí, že budu používat. Mezi těmito daty existuje i druh dat, které mohou po několika letech skončit na starém HDD. Výše uvedený příklad je jen pro vaše pochopení. To nebude odpovídat popisu Big Data, protože částka je mnohem méně ve srovnání s tím, co podniky vnímají jako velké údaje.

B

] Rychlost velkých dat Rychlost zpracování dat je důležitým faktorem když mluvíme o konceptech Big Data. Existuje mnoho webových stránek, zejména e-commerce. Google již připustil, že rychlost, s jakou je zatížení stránky zásadní pro lepší hodnocení. Kromě žebříčku poskytuje rychlost i uživatelům pohodlí při nakupování. Totéž platí pro data zpracovávaná pro další informace.

Zatímco mluvíme o rychlosti, je nezbytné vědět, že je nad rámec prosté vyšší šířky pásma. Kombinuje snadno použitelné údaje s různými analytickými nástroji. Snadno použitelné údaje znamenají nějaké domácí úkoly pro vytvoření struktur dat, které lze snadno zpracovat. Následující rozměr - Variety, rozšiřuje další světlo na to.

C> Rozmanitost velkých dat

Když jsou spousty dat a množství dat, je důležité je uspořádat tak, aby analytické nástroje mohly snadno zpracovat data. K dispozici jsou také nástroje pro organizaci dat. Při ukládání mohou být data nestrukturovaná a jakékoli formy. Je na vás, abyste zjistili, jaký vztah má s vámi další data. Jakmile zjistíte vztah, můžete vyzdvihnout příslušné nástroje a převést data do požadované formy pro strukturované a tříděné úložiště.

Shrnutí

Jinými slovy, 3D model Big Data je založen na třech rozměrech: data USABLE že máte; řádné značení dat; a rychlejší zpracování. Pokud jsou tyto tři pečlivě ošetřeny, vaše data mohou být snadno zpracovávána nebo analyzována, aby zjistila, co chcete.

Výše ​​uvedené vysvětluje oba koncepty a 3D model Big Data. Články spojené v druhém odstavci prokazují dodatečnou podporu, pokud jste novým konceptem.

Chcete-li něco přidat, napište komentář