Setup Menus in Admin Panel

Co jsou to big data?

Věděli jste, že 90 % všech dat, která jsou dnes na světě dostupná, bylo vytvořeno v posledních letech? Díky množství nových informaci a komunikačních technologiích, celosvětový objem dat neuvěřitelně narostl a nabízí dříve neznámé možnosti. Big data je názvem pro tento objem strukturovaných a nestrukturovaných dat, které vzhledem ke své velikosti nemohou být zpracovány konvenčním softwarem nebo hardwarem.

Tyto objemy dat jsou, mimo jiné, vytvářeny s každým z našich kliknutí na internetu. To může být například jen platba na Amazonu, vyhledávací příkaz na Googlu, aktivita na sociálních sítích jako je Instagram nebo Facebook apod.

Velké množství dat však samo o sobě big data netvoří. Pouze analýza a zpracování těchto objemů dat, např. společností, big data charakterizuje. V roce 2001 analytik Doug Lane vytvořil definici velkých dat pomocí svého 3-V modelu, který je dodnes uznávaný. Podle Lanea mají big data tyto tři následující charakteristiky:

  • Objem („Volume“): Společnosti sbírají velký objem dat z různých zdrojů. Tyto zdroje zahrnují inteligentní nástroje (anglicky „intelligent devices“, IoT) jako jsou mobilní telefony, videa, sociální média atd. V minulosti by nebylo možné ukládat tyto obrovské objemy dat, dnes pro tento účel existují úložné platformy.
  • Rychlost („Velocity“): Firmy jsou v dnešní době zaplaveny toky dat nebývalých rychlostí, které je třeba rychle zpracovat.
  • Různorodost („Variety“): Sesbíraná data jsou různorodá a mají širokou škálu formátů: numerická data, která jsou k dispozici ve strukturované podobě a jsou uložena v běžných databázích, stejně jako nestrukturované textové dokumenty, data z finančních transakcí nebo e-maily.

Definice

Big data

…znamená velké množství dostupných dat, která jsou analyzována a zpracována pro konkrétní účel. Podle Douga Lanea, big data charakterizuje objem, rychlost a různorodost.

Big Data vs. Small Data

Na rozdíl od velkých dat, se malá data (anglicky small data) vztahují k datům v objemu a formátu dostupnému lidem. Následující body ukazují, jak lze velká data odlišit od malých dat:  

  • Cíle: Malá data jsou používána pro určitý cíl, použití velkých dat se často vyvíjí nečekaně.
  • Umístění: Malá data jsou běžně uchovávána na jednom místě, obvykle v jednom souboru na počítači, kdežto velká data se obvykle šíří do několika souborů na rozlišných serverech umístěných v různých zemích.
  • Struktura dat: Malá data jsou často strukturována v rovné linii, zatímco velká data mohou být nestrukturovaná a mohou být získána v různých formátech z různých oblastí.
  • Příprava dat: Na přípravě malých dat se obvykle podílí pouze jeden koncový uživatel. V případě velkých dat se však často stává, že data připravuje jedna skupina lidí, jiná skupina je analyzuje, a nakonec je použije třetí skupina. Každá z těchto skupin může také sledovat jiné cíle.
  • Trvanlivost: Malá data jsou obecně uchovávána po určitou dobu po dokončení projektu. V případě velkých dat však data zůstávají uložena po neomezenou dobu.
  • Původ: Malá data jsou uložena na jednom místě po krátkou dobu a ve specifických měrných jednotkách. Velká data, na druhé straně, pochází z různých míst, zemí, společností, organizací atd.
  • Reprodukovatelnost: Malá data lze obecně zcela reprodukovat. Naproti tomu velká data pochází z mnoha různých zdrojů a jsou k dispozici v mnoha podobách, takže reprodukce není možná.
  • Kvalita: Význam informací v malých datech je jednoznačný, tato data se proto mohou popsat sama. Velká data jsou naopak mnohem složitější a můžou také obsahovat neidentifikovatelné informace, které nemají konkrétní význam. To může snížit kvalitu dat.
  • Analýza: Pro analýzu malých dat je většinou postačující pouze jeden proces, jelikož data jsou analyzována pouze z jednoho počítačového souboru. V případě velkých dat musí být data extrahována, zkontrolována, zredukována atd. v časově náročném procesu.

Jak můžete vidět z rozlišení velkých a malých dat, velká data jsou často doslova obtížně uchopitelná. 

SEE ALL Add a note
YOU
Add your Comment
 

Search Courses