Není žádným přeháněním říci, že moderní společnost běží na datech. Lidstvo denně generuje neuvěřitelné množství dat – dva a půl kvintilionu bajtů (to je 2 500 000 000 000 000 000 bajtů) – a zdá se nepravděpodobné, že by se toto číslo v blízké době snížilo. Podle nedávné zprávy Mezinárodní datové korporace (IDC) se globální trh s velkými daty a obchodní analytikou v posledních několika letech rychle rozšiřuje, přičemž globální příjmy vzrostly ze 122 miliard dolarů v roce 2015 na 189 miliard dolarů v roce 2019 a očekává se, že v roce 2022 dosáhnou 274 miliard dolarů.
S tímto rychlým rozmachem přichází významná příležitost rozvíjet své dovednosti v oblasti analýzy dat, například účastí na boot campu pro datové analytiky, který je zaměřen na ty, kteří se chtějí do tohoto oboru dostat. Digitální transformace se stala zaklínadlem moderního podnikání a talentovaní datoví analytici jsou potřeba více než kdy jindy. Kariérní příležitosti se nabízejí téměř ve všech odvětvích, od telekomunikací přes výrobu, maloobchod, bankovnictví, zdravotnictví až po fitness.
Odměny za kariéru v oblasti analýzy dat však nepřijdou bez významného školení a úsilí. Datoví analytici potřebují k úspěchu ve svém oboru specifické dovednosti a jejich kvalifikace jsou primárně technicky zaměřené; lidé v této profesi však potřebují i řadu měkkých dovedností. Neexistuje jediný způsob, jak tyto dovednosti získat. Zatímco mnoho jednotlivců se rozhoduje pro magisterské programy, rostoucí skupina studentů se začíná zapisovat do boot campů, které je lákají svou rozumnou cenou a krátkou dobou trvání. Bez ohledu na to, jakou cestou se vydáte, budete si muset osvojit řadu dovedností, abyste se stali žádaným datovým profesionálem.
Níže jsme uvedli 11 nejlepších technických a měkkých dovedností, které jsou pro datového analytika nezbytné:
Část 1: Technické dovednosti potřebné pro datové analytiky
Nejprve je důležité pochopit, co datový analytik dělá. S rizikem, že budeme uvádět zřejmé – všichni datoví analytici se zabývají, no, daty. Používají technické nástroje k analýze velkého množství surových informací a v tomto procesu vytvářejí smysluplné poznatky. Datoví analytici jsou také často zodpovědní za odstraňování poškozených dat, určování kvality dat a přípravu zpráv pro svého zaměstnavatele.
Všechny tyto úkoly, jak jste možná již uhodli, vyžadují, aby datoví analytici měli dobře rozvinutou sadu technických dovedností. Zde je několik, na které se zaměřit.
Vizualizace dat
Jak již název napovídá, vizualizace dat je schopnost prezentovat zjištění z dat pomocí grafiky nebo jiných ilustrací. Účel je jednoduchý: Usnadnit lepší pochopení poznatků založených na datech i těm, kteří nejsou vyškoleni v oblasti analýzy dat. Díky vizualizaci dat mohou datoví analytici pomoci rozhodovatelům v podniku (kteří nemusí mít pokročilé analytické vzdělání) identifikovat vzorce a pochopit složité myšlenky na první pohled. Tato schopnost vám – datovému analytikovi – umožňuje lépe porozumět situaci společnosti, sdělovat užitečné poznatky vedoucím týmů a dokonce i pozitivně ovlivňovat rozhodování společnosti.
Vizualizace dat vám dokonce může umožnit dosáhnout více, než tradičně dosahují datoví analytici. Jak poznamenává jeden autor pro SAS Insights: "Vizualizace dat změní způsob, jakým naši analytici pracují s daty. Budou od nich očekávat, že budou na problémy reagovat rychleji. A budou muset být schopni hlouběji pronikat do dat – dívat se na data jinak, nápaditěji. Vizualizace dat podpoří kreativní zkoumání dat."
Vizualizace dat se již stala nezbytnou dovedností. Podle nedávné studie provedené společností LinkedIn Learning "absolventi vysokých škol se mnohem častěji učí tvrdé dovednosti, když poprvé vstupují na trh práce. A tyto tvrdé dovednosti se točí kolem analýzy dat a vyprávění příběhů s poznatky získanými z dat." Dovednost číslo jedna, o které účastníci informovali? Uhodli jste: vizualizace dat.
Čištění dat
Jak vám řekne každý nadšenec Marie Kondo, úklid je neocenitelnou součástí dosažení úspěchu - a čištění dat není jiné! Je to jeden z nejdůležitějších kroků při sestavování funkčního modelu strojového učení a často tvoří významnou část dne každého datového analytika.
"Přestože si často myslíme, že datoví vědci tráví většinu času laděním algoritmů a modelů ML, realita je poněkud jiná," poznamenává technický spisovatel Ajay Sarangam pro Analytics Training. "Většina datových vědců tráví asi 80 procent svého času čištěním dat. Proč? Kvůli jednoduché pravdě v ML: Lepší data porážejí propracovanější algoritmy."
Se správně vyčištěnou datovou sadou mohou i jednoduché algoritmy generovat pozoruhodné poznatky. Na druhou stranu, nevyčištěná data mohou vytvářet zavádějící vzorce a vést podnik k mylným závěrům. Kvalifikace datového analytika nutně vyžaduje správné dovednosti v oblasti čištění dat - a tomu se nelze vyhnout.
MATLAB
MATLAB je programovací jazyk a multiparadigmatické numerické výpočetní prostředí, které mimo jiné podporuje implementaci algoritmů, manipulaci s maticemi a vykreslování dat. Podniky, které se zajímají o velká data, se začaly obracet na MATLAB, protože analytikům umožňuje drasticky zkrátit čas, který obvykle tráví předzpracováním dat, a usnadňuje rychlé čištění, organizaci a vizualizaci dat. MATLAB dokáže spustit libovolný model strojového učení vytvořený ve svém prostředí na více platformách.
Pochopení MATLABu není pro datové analytiky vyloženě povinnou dovedností, ale vzhledem k jeho širokému uplatnění a užitečnosti může znalost tohoto prostředí zvýšit vaši atraktivitu pro zaměstnavatele.
R
R je jedním z nejrozšířenějších a nejpoužívanějších jazyků v oblasti analýzy dat. Jeden průzkum, který provedl odborný časopis Institute of Electrical and Electronics Engineers (IEEE) Spectrum, zjistil, že R se v roce 2019 umístil na pátém místě v seznamu deseti nejpoužívanějších programovacích jazyků. Syntaxe a struktura jazyka R byly vytvořeny tak, aby podporovaly analytickou práci; ve výchozím nastavení obsahuje několik vestavěných, snadno použitelných příkazů pro organizaci dat. Tento programovací jazyk je také atraktivní pro podniky, protože dokáže zpracovat složitá nebo velká množství dat.
Vzhledem k jeho oblíbenosti a funkčnosti by se učení jazyka R mělo stát prioritou každého začínajícího datového analytika.
Python
Učení Pythonu by však mělo být pro budoucí analytiky hlavní prioritou. Tento vysokoúrovňový, univerzální programovací jazyk se v roce 2019 umístil na prvním místě v průzkumu IEEE Spectrum a to z dobrého důvodu - nabízí pozoruhodné množství specializovaných knihoven, z nichž mnohé se týkají konkrétně umělé inteligence (AI).
Použitelnost Pythonu pro vývoj umělé inteligence je obzvláště důležitá. Podle údajů zveřejněných společností Statista je trh se softwarem pro umělou inteligenci na dobré cestě k meziročnímu růstu o 154 procent a do konce roku 2020 dosáhne předpokládané výše 22,6 miliardy dolarů. Pochopení Pythonu je dovednost, kterou datoví analytici potřebují, aby se udrželi v aktuálním profesním prostředí, které se stále více zabývá umělou inteligencí. Ti, kteří mají zájem prohloubit své znalosti Pythonu, by se měli také podívat na jeho doplňkové programy, jako je Pandas (open-source nástroj pro analýzu dat, který pracuje v symbióze s programovacím jazykem Python) nebo NumPy, balíček, který pomáhá uživatelům Pythonu s úkoly vědeckých výpočtů.
SQL a NoSQL
Pokud se chcete prosadit v oblasti analýzy dat, existuje několik databázových jazyků, se kterými se budete muset seznámit - ne-li je ovládat - hned na začátku.
Prvním a nejdůležitějším z nich je Structured Query Language, známější pod zkratkou SQL. SQL byl sice vytvořen v roce 1970, ale dodnes zůstává neocenitelný. V moderní analytice je SQL stále standardním prostředkem pro dotazování a manipulaci s daty v relačních databázích.
To se může zdát neintuitivní vzhledem k tomu, že se sektor analytiky téměř neustále rozvíjí a vyvíjí. Datový vědec Josh Devlin se k tomuto zjevnému nedostatku vyjadřuje v článku pro DataQuest, kde píše: "Proč by někdo, kdo chce získat práci v oblasti dat, měl trávit čas učením tohoto 'starověkého' jazyka? Proč nevěnovat veškerý čas zvládnutí Pythonu/R nebo se zaměřit na 'sexy' dovednosti datového analytika, jako je Deep Learning, Scala a Spark? I když je znalost základů obecnějšího jazyka, jako je Python nebo R, zásadní, ignorování SQL vám mnohem více ztíží získání práce v oblasti dat."
Má pravdu. Pravdou je, že SQL má své místo ve firmách po celém světě. Jeho funkčnost a zachovaná efektivita udržují vysokou poptávku mezi společnostmi a jeho popularita nevykazuje žádné známky brzkého útlumu. Naučte se SQL; pokud ne kvůli jeho funkci, tak kvůli svým pracovním vyhlídkám. Značkové verze SQL, jako je MySQL, nabízejí příležitosti k získání hlubšího porozumění systémům správy relačních databází.
Na druhou stranu byste se měli zaměřit také na budování svých schopností s databázemi NoSQL. Jak název napovídá, systémy NoSQL neorganizují své datové sady podle relačních linií SQL. Podle této definice mohou frameworky NoSQL efektivně strukturovat své informace jakýmkoli způsobem, pokud tato metoda není relační. Proto je prakticky nemožné označit jakoukoli jednu strukturu za "standardní" framework NoSQL. Pokud však chcete získat zkušenosti se strukturami NoSQL, může být užitečné experimentovat s frameworkem, jako je MongoDB, který organizuje svou databázi podle flexibilních hierarchií namísto tabulkových relací.
Strojové učení
I když strojové učení není dovednost ve smyslu čištění dat nebo učení se programovacímu jazyku, jeho pochopení vám může pomoci stát se konkurenceschopným na trhu práce v oblasti analýzy dat.
Jak již bylo zmíněno dříve, výzkum společnosti Statista ukazuje, že umělá inteligence a prediktivní analytika představují v současné době významné oblasti investic. I když ne všichni analytici se budou zabývat projekty strojového učení, obecné porozumění souvisejícím nástrojům a konceptům vám může dát výhodu oproti konkurentům při hledání zaměstnání.
Lineární algebra a kalkulus
Pokud jde o analýzu dat, jsou pokročilé matematické dovednosti nevyhnutelné. Někteří datoví analytici se dokonce během bakalářského studia rozhodnou pro hlavní obor matematika nebo statistika, jen aby lépe porozuměli teorii, která je základem analytické praxe v reálném světě!
V analytice vystupují do popředí dva specifické obory matematického studia: lineární algebra a kalkulus. Lineární algebra má uplatnění ve strojovém a hloubkovém učení, kde podporuje vektorové, maticové a tenzorové operace. Kalkulus se podobně používá k vytváření objektivních/nákladových/ztrátových funkcí, které učí algoritmy dosahovat jejich cílů.
Může se však stát, že nebudete muset budovat robustní teoretické zázemí, než se pustíte do aplikací v reálném světě. Někteří lidé v oblasti technologií dokonce navrhují vydat se opačnou cestou. Například v článku "Mathematics for Data Science" z roku 2019 autor Towards Data Science a datový analytik Ibrahim Sharaf El Den radil zvolit přístup shora dolů.
"Naučte se kódovat, naučte se používat PyData stack (Pandas, sklearn, Keras atd.), zašpiňte si ruce budováním projektů z reálného světa, používejte dokumentaci knihoven a návody na YouTube nebo Medium," vysvětluje. "Začnete vidět širší souvislosti, všimnete si svého nedostatku teoretického zázemí, abyste skutečně pochopili, jak tyto algoritmy fungují [...] studium matematiky pro vás bude dávat mnohem větší smysl!"
Nicméně neexistuje jediný správný způsob, jak se stát datovým vědcem. Prozkoumejte a najděte si vzdělávací cestu, která vám vyhovuje!
Microsoft Excel
Zdůrazňovat důležitost znalosti Microsoft Excelu se téměř zdá směšné, když si uvědomíme, že datoví analytici mají k dispozici podstatně pokročilejší technologie. Abychom si vypůjčili citát irské obchodní spisovatelky Anne Walshové: "Zmínka o Excelu mezi techniky je často odbyta odfrknutím."
A je to pravda - Excel je ve srovnání s jinými platformami těžkopádný. Přesto tabulkový procesor společnosti Microsoft používá odhadem 750 milionů lidí na celém světě. Pojem "znalost Excelu" se často objevuje v sekci kvalifikace u pracovních nabídek zveřejněných na náborových službách, jako jsou Indeed nebo Monster. Navzdory všem svým zjevně nízkým schopnostem se Excel mezi podniky hojně využívá.
Navíc Excel, inu, exceluje v automatizaci určitých funkcí a příkazů pro lepší analýzu dat. Excel má svůj vlastní programovací jazyk VBA, který používá k vytváření maker neboli předem nahraných příkazů. Při správném nasazení může VBA ušetřit lidským analytikům spoustu času při často prováděných, opakujících se projektech, jako je účetnictví, mzdy nebo řízení projektů. Společnost Microsoft také vyvinula svůj Analysis ToolPak s ohledem na statistické modelování a analýzu dat. Jak vysvětluje centrum nápovědy společnosti, "Vy poskytnete data a parametry pro každou analýzu a nástroj použije příslušné statiscké nebo technické makrofunkce k výpočtu a zobrazení výsledků ve výstupní tabulce. Některé nástroje kromě výstupních tabulek generují také grafy."
Část 2: Klíčové měkké dovednosti, které datoví analytici potřebují
Všechny výše uvedené technické dovednosti jsou pro datové analytiky nezbytné - ale samotný technický talent vás k úspěšné kariéře nedonese. Můžete být na papíře hvězdným datovým analytikem a přesto se nikdy nezaměstnat. Důvod je jednoduchý: Technické schopnosti nejsou pro začínající datové analytiky vším. Existuje několik měkčích, na odvětví nezávislých dovedností, které datoví analytici potřebují k úspěchu. Je jich příliš mnoho, než abychom je v tomto článku snadno vyjmenovali, proto se zaměříme na dvě základní dovednosti: kritické myšlení a komunikaci.
Kritické myšlení
Nestačí se na data jen dívat; je třeba jim porozumět a rozšířit jejich důsledky nad rámec samotných čísel. Jako kritický myslitel můžete o datech přemýšlet analyticky, identifikovat vzorce a vyvozovat z informací, které máte k dispozici, praktické poznatky a informace. Vyžaduje to jít nad rámec a věnovat se přemýšlení, na rozdíl od pouhého zpracování.
Stát se kritickým myslitelem může být obtížné, ale tyto dovednosti můžete zdokonalit tím, že budete sami sebe vyzývat. Až se příště ocitnete před analytickým úkolem nebo cvičením, zkuste se zamyslet - jaký je význam vzorce, který vidíte? Co data říkají o tom, čeho bylo dosaženo? Jaké nedostatky naznačují? Při přípravě na kariéru v oblasti analýzy dat nepřehlížejte význam zdokonalování svých kritických myšlenkových dovedností.
Komunikace
Nakonec musíte být schopni vysvětlit svá zjištění ostatním. Nezáleží na tom, jestli jste nejtalentovanější a nejbystřejší datový analytik na planetě - pokud nedokážete sdělit vzorce, které vidíte, těm, kteří nemají technické znalosti, selhali jste.
Být dobrým datovým analytikem v podstatě znamená být "dvojjazyčný". Měli byste být schopni hovořit o vysoce technických bodech se svými vyškolenými kolegy a zároveň poskytovat jasná, obecná vysvětlení způsobem, který podporuje - nikoli mate - obchodně orientované osoby s rozhodovací pravomocí. Pokud to nedokážete, možná budete muset ještě pracovat na svých dovednostech datového analytika.
Prozkoumejte své možnosti!
Analýza dat by mohla být kariérou pro vás, ale abyste v tomto oboru uspěli, musíte získat potřebné dovednosti. Prozkoumejte akademické příležitosti ve svém okolí; projděte si dostupné bakalářské a magisterské programy. Pokud hledáte rychlejší a finančně dostupnější řešení, zvažte možnost přihlásit se do boot campu pro datové analytiky! Tyto několikatýdenní vzdělávací programy nabízejí studentům možnost získat důkladné znalosti v technické disciplíně dle vlastního výběru za rozumnou cenu.
Prozkoumejte své vzdělávací možnosti a začněte budovat pevné základy dovedností datového analytika. Svět analýzy dat čeká!
Související články
Cesta k vrcholu: Jak se stát seniorním datovým analytikem (a proč to stojí za to)
Sdílet na sociálních sítích:
Komentáře