Data Scientist

Kariérní průvodce BrainStation Data Scientist vám může pomoci udělat první kroky k lukrativní kariéře v oblasti datové vědy. Přečtěte si o přehledu oboru datové vědy a také o pracovní roli Data Scientist.

Staňte se datovým vědcem

Promluvte si s poradcem pro učení a zjistěte více o tom, jak vám naše bootcampy a kurzy mohou pomoci stát se datovým vědcem.



Kliknutím na Odeslat souhlasíte s naším Podmínky .



Předložit

Nepodařilo se odeslat! Obnovit stránku a zkusit to znovu?

Zjistěte více o našem Data Science Bootcampu

Děkuji!

Brzy budeme v kontaktu.



Zobrazit stránku Data Science Bootcamp

Co je datový vědec?

Data Scientists shromažďují, organizují a analyzují velké soubory velkých dat – strukturovaných i nestrukturovaných dat – za účelem vytvoření použitelných podnikových řešení a plánů založených na datech pro společnosti a další organizace. Datoví vědci, kteří spojují smysl pro matematiku, informatiku a obchod, potřebují mít jak technické dovednosti ke zpracování a analýze velkých dat, tak obchodní bystrost, aby mohli odhalit praktické poznatky skryté v těchto datech.

Data Science vs. Data Mining

Mezi datovou vědou a dolováním dat je několik rozdílů. Podívejme se blíže:

Data Science

  • Je široký obor, který má tendenci zahrnovat strojové učení, umělou inteligenci, prediktivní kauzální analýzu a preskriptivní analytiku.
  • Zabývá se všemi druhy dat, včetně strukturovaných i nestrukturovaných dat
  • Zaměřuje se na vytváření produktů zaměřených na data a přijímání rozhodnutí na základě dat
  • Zaměřuje se na vědecké studium dat a vzoru

Dolování dat

  • Je podmnožinou datové vědy, která zahrnuje čištění dat, statistickou analýzu a rozpoznávání vzorů a někdy zahrnuje vizualizaci dat, strojové učení a transformaci dat.
  • Zabývá se primárně strukturovanými daty, nikoli nestrukturovanými daty
  • Jeho cílem je převzít data z různých zdrojů a učinit je použitelnými
  • Zaměřuje se na obchodní praktiky

Co dělá datový vědec?

Data Scientist analyzuje velké soubory dat, aby odhalil vzorce a trendy, které vedou k praktickým obchodním poznatkům a pomáhají organizacím řešit komplikované problémy nebo identifikovat příležitosti pro výnosy a růst. Data Scientist může pracovat prakticky v každé oblasti a musí být zběhlý v zacházení se strukturovanými a nestrukturovanými datovými soubory. Je to multidisciplinární práce a abyste se stali datovým vědcem, musíte rozumět matematice, informatice, obchodu a komunikaci, abyste mohli svou práci efektivně vykonávat.



Přestože se konkrétní pracovní povinnosti a odpovědnosti Data Scientist budou značně lišit v závislosti na odvětví, pozici a organizaci, většina rolí Data Scientist bude zahrnovat následující oblasti odpovědnosti:

Výzkum

Datový vědec musí porozumět příležitostem a bolestem specifickým pro odvětví i jednotlivou společnost.

Příprava dat

Před tím, než bude možné nalézt jakékoli cenné poznatky, musí datový vědec definovat, které datové sady jsou užitečné a relevantní, než budou shromažďovat, extrahovat, čistit a používat strukturovaná a nestrukturovaná data z různých zdrojů.



Vytváření modelů a algoritmů

S využitím principů strojového učení a umělé inteligence musí být datový vědec schopen vytvářet a aplikovat algoritmy nezbytné pro implementaci nástrojů automatizace.

Analýza dat

Pro datového vědce je důležité, aby byl schopen rychle analyzovat svá data a identifikovat vzorce, trendy a příležitosti.

Vizualizace a komunikace

Data Scientist musí být schopen vyprávět příběhy objevené prostřednictvím dat vytvářením a organizováním esteticky přitažlivých řídicích panelů a vizualizací a zároveň musí mít komunikační dovednosti, které přesvědčí zúčastněné strany a další členy týmu, že zjištění v datech stojí za to jednat.

Nejnovější průzkum digitálních dovedností BrainStation zjistil, že datoví profesionálové trávili většinu času bojem s daty a jejich čištěním. Respondenti také dospěli k závěru, že cílem jejich práce je nejčastěji optimalizace existující platformy, produktu nebo systému (45 procent) nebo vývoj nových (42 procent).

Typy datových věd

Širší oblast Data Science zahrnuje mnoho různých disciplín, včetně:

Datové inženýrství

Navrhování, budování, optimalizace, údržba a správa infrastruktury, která podporuje data i tok dat v rámci organizace.

Příprava dat

Čištění a transformace dat.

Dolování dat

Extrahování (a někdy čištění a transformace) použitelných dat z většího souboru dat.

Prediktivní analytika

Použití dat, algoritmů a technik strojového učení k analýze pravděpodobnosti různých možných budoucích výsledků na základě analýzy dat.

Strojové učení

Automatizace tvorby analytického modelu v procesu analýzy dat, abyste se mohli učit z dat, objevovat vzorce a zmocňovat systémy k rozhodování bez velkého lidského zásahu.

Vizualizace dat

Použití vizuálních prvků (včetně grafů, map a grafů) k ilustraci poznatků nalezených v datech přístupným způsobem, aby publikum mohlo pochopit trendy, odlehlé hodnoty a vzorce nalezené v datech.

Výhody datové vědy

Společnosti ve všech odvětvích ve všech částech světa věnují stále více peněz, času a pozornosti datové vědě a chtějí do svého týmu přidat datového vědce. Výzkum ukazuje, že společnosti, které skutečně využívají rozhodování založené na datech, jsou produktivnější, ziskovější a efektivnější než konkurence.

Věda o datech je zásadní pro pomoc organizacím identifikovat správné problémy a příležitosti a zároveň pomáhá vytvořit si jasný obrázek o chování a potřebách zákazníků a klientů, výkonnosti zaměstnanců a produktů a potenciálních budoucích problémech.

Data science může firmám pomoci:

  • Dělejte lepší rozhodnutí
  • Zjistěte více o zákaznících a klientech
  • Využijte trendy
  • Předvídat budoucnost

Jak může datová věda zvýšit hodnotu pro společnost?

Věda o datech je pro podniky stále oblíbenější investicí, protože potenciální návratnost investic při odblokování hodnoty velkých dat je obrovská. Datová věda je výhodná investice, protože:

    Odstraňuje dohady a poskytuje užitečné informace.Společnosti se lépe rozhodují na základě dat a kvantifikovatelných důkazů.Společnosti lépe chápou své místo na trhu.Data science pomůže společnostem analyzovat konkurenci, zkoumat historické příklady a vytvářet doporučení založená na číslech.Lze jej využít k identifikaci nejlepších talentů.Ve velkých datech se skrývá spousta poznatků o produktivitě, efektivitě zaměstnanců a celkovém výkonu. Data lze také použít k náboru a školení talentů.Dozvíte se vše o vaší cílové skupině, klientovi nebo spotřebiteli.Všichni nyní generují a shromažďují data a společnosti, které neinvestují správně do datové vědy, jednoduše shromažďují více dat, než vědí, co dělat. Poznatky o chování, prioritách a preferencích minulých nebo potenciálních zákazníků nebo klientů jsou neocenitelné a prostě čekají, až je objeví kvalifikovaný datový vědec.

Platy pro datové vědce

Zatímco platy pro Data Scientists se velmi liší podle regionu a odvětví, průměrný plat pro Data Scientist v USA se uvádí kdekoli od 96 000 do 113 000 USD, v závislosti na zdroji. Senior Data Scientist může v průměru přinést zhruba 130 000 $.

Poptávka po datových vědcích

Data Scientists jsou velmi žádané a nedostatkové prakticky ve všech průmyslových odvětvích. Zpráva společnosti Deloitte Access Economics zjistila, že 76 procent podniků plánuje v příštích letech zvýšit výdaje na možnosti analýzy dat, zatímco IBM předpovídala 28procentní nárůst poptávky po vědě o datech na začátku dekády.

Americký úřad pro statistiku práce předpověděl 31procentní růst v oblasti datové vědy během příštích 10 let. Mezitím Zpráva o trzích a trzích zjistila, že se předpokládá, že globální trh s velkými daty vzroste do roku 2025 na 229,4 miliardy dolarů, přičemž platforma pro vědu o datech vzroste do roku 2024 o 30 procent.

Zdá se, že všude na světě se očekává, že investice do datové vědy porostou a s tím i poptávka po Data Scientists.

Jaké nástroje datoví vědci používají?

Data Scientists používají řadu různých nástrojů a programů pro činnosti včetně analýzy dat, čištění dat a vytváření vizualizací.

Python je nejlepší programovací jazyk pro Data Scientists v průzkumu BrainStation Digital Skills Survey. Obecný programovací jazyk Python je užitečný pro aplikace zpracování národního jazyka a analýzu dat. R se také často používá pro analýzu dat a dolování dat. Pro těžší drcení čísel jsou oblíbené nástroje založené na Hadoopu, jako je Hive. Pro strojové učení si Data Scientists mohou vybrat ze široké škály nástrojů včetně h2o.ai, TensorFlow, Apache Mahout a Accord.Net. Vizualizační nástroje jsou také důležitou součástí arzenálu Data Scientist. Programy jako Tableau, PowerBI, Bokeh, Plotly a Infogram pomáhají Data Scientists vytvářet vizuálně přitažlivé diagramy, tepelné mapy, grafiku, bodové grafy a další.

Data Scientists by také měli být extrémně spokojeni s SQL (používaným na celé řadě platforem, včetně MySQL, Microsoft SQL a Oracle) a tabulkovými programy (typicky Excel).

Jaké dovednosti potřebují datoví vědci?

Existuje řada dovedností, které by měli rozvíjet všichni aspirující datoví vědci, včetně:

    Vynikat.Excel, nejpoužívanější nástroj pro 66 procent datových profesionálů dotázaných v průzkumu BrainStation Digital Skills Survey, je pro Data Scientists stále zásadní.SQL.Tento dotazovací jazyk je nepostradatelný při správě databází a používá ho zhruba polovina respondentů.Statistické programování.Data Scientists běžně používají Python a R ke spouštění testů, vytváření modelů a provádění analýz velkých souborů dat.Vizualizace dat.Nástroje jako Tableau, Plotly, Bokeh, PowerBl a Matplotlib pomáhají Data Scientists vytvářet působivé a dostupné vizuální reprezentace jejich zjištění.

Kariérní cesty datových vědců

Jako relativně nová profese nejsou kariérní cesty Data Scientist vytesány do kamene a mnoho lidí si k datové vědě najde cestu z prostředí informatiky, IT, matematiky a obchodu. Ale čtyři hlavní osy kariéry Data Scientist obecně jsou data, inženýrství, obchod a produkt. Mnoho multidisciplinárních rolí v datové vědě vyžaduje zvládnutí několika nebo všech těchto oblastí.

Lidé pracující v datové vědě jsou v samém popředí technologických změn, které nejvíce ovlivní budoucnost. Vzhledem k tomu, že datová věda může přispět k pokroku prakticky ve všech ostatních oblastech, Data Scientists mohou dále zkoumat vše od financí a obchodu po pojistnou matematickou statistiku, zelenou energii, epidemiologii, lékařství a farmacii, telekomunikace – seznam je prakticky nekonečný. Každé odvětví provozuje své vlastní různé typy dat a využívá je různými způsoby k dosažení různých cílů. Ať se to stane kdekoli, Data Scientists mohou vést lepší rozhodování, ať už jde o vývoj produktů, analýzu trhu, řízení vztahů se zákazníky, lidské zdroje nebo něco úplně jiného.

Nejen, že aplikace pro datovou vědu jsou široké a dotýkají se mnoha různých sektorů, ale existují i ​​různé typy datové vědy. Všechny tyto aktivity mají společné to, že se všechny snaží přeměnit data ve znalosti. Přesněji řečeno, Data Scientists používají metodický přístup k organizaci a analýze nezpracovaných dat k identifikaci vzorců, z nichž lze identifikovat nebo odvodit užitečné informace.

Vzhledem k rozsahu jejich dopadu není divu, že Data Scientists zaujímají pozice, které jsou vysoce vlivné – a velmi žádané. I když cesta k tomu stát se datovým vědcem může být náročná, pro začínající datové vědce je nyní k dispozici více zdrojů než kdy jindy a více příležitostí k vybudování kariéry, kterou chtějí.

Ale navzdory všem způsobům, jak mohou datoví vědci přispívat k různým průmyslovým odvětvím, a všem různým kariérním cestám, kterými se datoví vědci mohou ubírat, lze typy práce, kterou dělají, rozdělit do několika hlavních kategorií. Ne veškerá datová věda přesně zapadá do těchto skupin, zejména v popředí počítačové vědy, kde se neustále prolamuje nová půda – ale poskytnou vám určitou představu o tom, jak datoví vědci proměňují data ve vhled.

Statistika

V srdci datové vědy je statistika oblastí matematiky, která popisuje různé charakteristiky souboru dat, ať už jde o čísla, slova, obrázky nebo nějaký jiný druh měřitelných informací. Velká část statistik se soustředí na jednoduchou identifikaci a popis toho, co tam je – zvláště u velmi rozsáhlých souborů dat je jen vědět, co informace obsahuje a co ne, je úkolem samo o sobě. V oblasti datové vědy se tomu často říká deskriptivní analytika. Statistiky však mohou jít ještě dále a testovat, zda jsou vaše předpoklady o tom, co je v datech, správné, nebo, pokud jsou správné, zda jsou významné nebo užitečné. To může zahrnovat nejen zkoumání dat, ale také manipulaci s nimi, abyste získali jejich výrazné rysy. Existuje mnoho různých způsobů, jak toho dosáhnout – lineární regrese, logistická regrese a diskriminační analýza, různé metody vzorkování atd. – ale v konečném důsledku je každá z těchto technik o pochopení vlastností souboru dat a o tom, jak přesně jsou tyto vlastnosti odrážejí nějakou smysluplnou pravdu o světě, kterému odpovídají.

Analýza dat

Zatímco je postavena na statistice, analýza dat jde o něco dále, pokud jde o pochopení kauzality, vizualizaci a sdělování zjištění ostatním. Pokud se statistika rozhodne definovat co a kdy ze souboru dat, analýza dat se pokusí identifikovat proč a jak. Datoví analytici to dělají čištěním dat, jejich shrnutím, transformací, modelováním a testováním. Jak bylo uvedeno výše, tato analýza se neomezuje pouze na čísla. Zatímco velká část analýzy dat používá číselná data, je také možné provádět analýzu jiných typů dat – například písemné zpětné vazby od zákazníků nebo příspěvky na sociálních sítích nebo dokonce obrázky, zvuk a video.

Jedním z hlavních cílů Data Analysts je porozumět kauzalitě, kterou pak lze použít k pochopení a předpovídání trendů v celé řadě aplikací. V diagnostické analýze datoví analytici hledají korelace, které naznačují příčinu a následek, přičemž tyto poznatky lze zase použít k úpravě výsledků. Prediktivní analýza podobně hledá vzory, ale pak je dále rozšiřuje a extrapoluje jejich trajektorie mimo známá data, aby pomohla předpovědět, jak by se mohly odehrát neměřené nebo hypotetické události – včetně událostí budoucích. Nejpokročilejší formy analýzy dat si kladou za cíl poskytnout vodítko pro konkrétní rozhodnutí modelováním a předpovídáním výsledků různých voleb, aby se určil nejvhodnější postup.

Umělá inteligence a strojové učení

Jedním z velkých pokroků, k nimž v současné době dochází ve vědě o datech – a který má v budoucnu obrovský vliv – je umělá inteligence a konkrétněji strojové učení. Stručně řečeno, strojové učení zahrnuje trénování počítače k ​​provádění úkolů, o kterých bychom si obvykle mysleli, že vyžadují určitou formu inteligence nebo úsudku, jako je schopnost identifikovat objekty na fotografii. Toho se obvykle dosáhne tím, že mu poskytnete množství příkladů typu odhodlání, které síť trénujete. Jak si dokážete představit, vyžaduje to jak velké množství (obvykle strukturovaných) dat, tak schopnost přimět počítač, aby těmto datům dával smysl. Silné statistické dovednosti a programovací dovednosti jsou nutností.

Příznivé účinky strojového učení jsou prakticky neomezené, ale v první řadě je to schopnost provádět složité nebo dlouhodobé úkoly rychleji, než by kdy dokázal kdokoli, jako je identifikace konkrétního otisku prstu z úložiště milionů obrázků nebo křížové odkazy. desítky proměnných v tisících lékařských záznamů k identifikaci asociací, které by mohly nabídnout vodítka k tomu, co způsobuje onemocnění. S dostatkem dat mohou odborníci na strojové učení dokonce trénovat neuronové sítě, aby vytvářely originální obrázky, extrahovaly smysluplné poznatky z obrovského množství psaného textu, předpovídaly budoucí trendy ve výdajích nebo jiné události na trhu a přidělovaly zdroje, které závisí na vysoce komplexní distribuci, jako je energie. , s maximální účinností. Výhodou použití strojového učení k provádění těchto úkolů, na rozdíl od jiných forem automatizace, je to, že bez dozoru A.I. systém se může v průběhu času automaticky učit a zlepšovat – i bez nového programování.

Obchodní zpravodajství

Jak jste možná uhodli z dřívějšího odkazu na události na trhu, svět obchodu a financí je jedním z míst, kde strojové učení mělo jeden ze svých prvních a nejhlubších dopadů. Díky obrovskému množství dostupných číselných dat – marketingových databází, průzkumů, bankovních informací, tržeb atd., z nichž většina je vysoce organizovaná a relativně snadno se s nimi pracuje – jsou Data Scientists schopni využívat statistiky, analýzy dat a strojové učení k získání poznatků o nesčetných aspektech obchodního světa, vedení rozhodování a optimalizaci výsledků až do té míry, že se business intelligence stala oblastí datové vědy sama o sobě.

Poměrně často se vývojáři Business Intelligence nedívají pouze na data, která jsou náhodou dostupná, aby zjistili, co mohou objevit; proaktivně sledují sběr dat a vyvíjejí techniky a produkty, aby odpovídaly na konkrétní otázky a dosahovaly konkrétních cílů. V tomto smyslu jsou vývojáři a analytici Business Intelligence zásadní pro strategický rozvoj ve světě obchodu a financí – pomáhají vedení činit lepší rozhodnutí a urychlovat je, rozumět trhu, identifikovat příležitosti a výzvy podniku a zlepšovat celkovou efektivitu podnikové systémy a provoz, to vše s celkovým cílem dosáhnout konkurenční výhody a zvýšit zisky.

Datové inženýrství

Poslední hlavní studijní obor, ve kterém Data Scientists často pracují, zahrnuje celou řadu různých pracovních pozic – Data Engineer, Systems Architect, Application Architect, Data Architect, Enterprise Architect nebo Infrastructure Architect, abychom jmenovali jen některé. Každá z těchto rolí má svůj vlastní soubor odpovědností, přičemž některé vyvíjejí software, jiné navrhují IT systémy a další přizpůsobují vnitřní strukturu a procesy společnosti technologii, kterou používá k plnění svých obchodních strategií. Všechny je spojuje to, že Data Scientists pracující v této oblasti používají data a informační technologie k vytváření nebo zlepšování systémů s ohledem na konkrétní funkce.

Aplikační architekt například sleduje, jak podnik nebo jiný podnik používá konkrétní technologická řešení, a poté navrhuje a vyvíjí aplikace (včetně softwaru nebo IT infrastruktury) pro lepší výkon. A Data Architect podobně vyvíjí aplikace – v tomto případě řešení pro ukládání, správu a analýzu dat. Architekt infrastruktury může vyvinout zastřešující řešení, která společnost používá k provádění každodenního podnikání, aby zajistil, že tato řešení splňují systémové požadavky společnosti, ať už offline nebo v cloudu. Datoví inženýři se zaměřují na zpracování dat, navrhování a implementaci datových kanálů, které shromažďují, organizují, ukládají, načítají a zpracovávají data organizace. Jinými slovy, definujícím rysem této široké kategorie datové vědy je to, že zahrnuje navrhování a budování věcí: systémů, struktur a procesů, kterými se datová věda provádí.

Jaké jsou nejžádanější pracovní pozice v oblasti datové vědy?

Věda o datech je obecně velmi žádanou dovedností, takže existuje mnoho příležitostí, které lze nalézt v každé oblasti a specializaci oboru. Ve skutečnosti v roce 2019 LinkedIn uvedl Data Scientist jako nejslibnější práci roku a QuantHub předpověděl akutní nedostatek kvalifikovaných Data Scientists v příštím roce.

Klíčové slovo je zde kvalifikované. Technické požadavky, které musí Data Scientist splňovat, jsou často tak specifické, že může trvat několik let zkušeností s prací v oboru, než si vybuduje potřebný rozsah kompetencí, počínaje všeobecným odborníkem a poté pomalu přidávat další a další schopnosti a schopnosti. jejich soubor dovedností.

Toto je jen několik nejběžnějších způsobů, jak to Data Scientists mohou udělat – existuje tolik potenciálních kariérních cest, kolik existuje Data Scientists, ale v každém případě kariérní postup závisí na získávání nových dovedností a zkušeností v průběhu času.

Datový analytik

Jak název napovídá, Data Analysts analyzují data – ale tento krátký název zachycuje pouze malou část toho, čeho mohou Data Analyst skutečně dosáhnout. Za prvé, data jen zřídka začínají ve snadno použitelné formě a jsou to typicky datoví analytici, kteří jsou zodpovědní za identifikaci druhu potřebných dat, jejich shromažďování a sestavení a poté je vyčistí a uspořádají – převedou je na použitelnou formu, určení toho, co soubor dat skutečně obsahuje, odstranění poškozených dat a vyhodnocení jejich přesnosti. Pak je tu samotná analýza – pomocí různých technik zkoumat a modelovat data, hledat vzory, extrahovat význam z těchto vzorů a extrapolovat je nebo modelovat. A konečně, datoví analytici zpřístupňují své poznatky ostatním tím, že prezentují data na řídicím panelu nebo databázi, ke které mají ostatní lidé přístup, a sdělují svá zjištění ostatním prostřednictvím prezentací, písemných dokumentů a tabulek, grafů a dalších vizualizací.

Profesní dráha datového analytika

Data Analyst je vynikající vstupní bod do světa Data Science; může to být vstupní pozice v závislosti na požadované úrovni odbornosti. Noví datoví analytici obvykle vstupují do oboru hned po škole – s titulem statistiky, matematiky, informatiky apod. – nebo přecházejí do analýzy dat z příbuzného oboru, jako je obchod, ekonomie nebo dokonce společenské vědy, obvykle upgradováním svého dovednosti uprostřed kariéry prostřednictvím bootcampu pro analýzu dat nebo podobného certifikačního programu.

Ale ať už jsou to čerství absolventi nebo ostřílení profesionálové, kteří provádějí změnu uprostřed kariéry, noví datoví vědci obvykle začínají prováděním rutinních úkolů, jako je získávání a manipulace s daty pomocí jazyka jako R nebo SQL, vytváření databází, provádění základních analýz a generování vizualizace pomocí programů jako Tableau. Ne každý datový analytik bude muset vědět, jak dělat všechny tyto věci – může existovat specializace, dokonce i na juniorské pozici – ale měli byste být schopni provádět všechny tyto úkoly, pokud doufáte, že pokročíte ve své kariéře. Flexibilita je v této rané fázi velkým přínosem.

To, jak pokročíte jako datový analytik, závisí do určité míry na odvětví, ve kterém pracujete – například marketing nebo finance. V závislosti na sektoru a typu práce, kterou děláte, se můžete rozhodnout, zda se budete specializovat na programování v Pythonu nebo R, stát se profesionálem v čištění dat nebo se soustředit pouze na vytváření složitých statistických modelů nebo generování krásných vizuálů; na druhou stranu se můžete také rozhodnout naučit se od všeho trochu a připravit vás na vedoucí pozici, jakmile převezmete titul Senior Data Analyst. S dostatečně širokými a dostatečně hlubokými zkušenostmi je senior datový analytik připraven převzít vedoucí roli dohlížející na tým jiných datových analytiků a nakonec se stát manažerem oddělení nebo ředitelem. S dalším školením dovedností jsou Data Analysts také v silné pozici, aby se posunuli na pokročilejší pozici Data Scientist.

Data Scientist

Vlastní datoví vědci obvykle dokážou dělat všechny věci, které mohou dělat datoví analytici, plus několik dalších věcí navíc – ve skutečnosti se správným školením a zkušenostmi může datový analytik nakonec postoupit na pozici datového vědce. Takže ano, Data Scientists by měli být schopni získávat, čistit, manipulovat, ukládat a analyzovat data – ale také rozumět různým metodám strojového učení a pracovat s nimi a být schopni programovat v Pythonu, R nebo podobném statistickém programovacím jazyce. vytvářet a vyhodnocovat pokročilejší modely.

Profesní dráha Data Scientist

Mnoho lidí vstupuje do oboru jako datoví analytici, než získají zkušenosti a další dovednosti potřebné k tomu, aby se mohli nazývat datovými vědci. Poté, od Junior Data Scientist, je dalším krokem typicky Senior Data Scientist – i když tato jednoduchá změna názvu popírá práci, kterou je potřeba k provedení tohoto přechodu; Senior Data Scientist bude mít buď vynikající znalosti prakticky všech aspektů datové vědy – A.I., datové sklady, dolování dat, cloud computing atd. – kromě toho, že budou znát obor specifické pro daný obor, jako je obchodní strategie nebo analytika zdravotnictví. nebo se budou specializovat na jednu z těchto oblastí s odborností na úrovni guru.

Stojí za zmínku, že zatímco někteří datoví vědci začínají svou kariéru v analytice a propracují se na vyšší pozice ve specializovaných oblastech, jako je psychologie, marketing, ekonomie atd., jiní začínají jako profesionálové v jedné z těchto různých oblastí, než přejdou na data. vědecká role.

Pro mnohé je Senior Data Scientist konečným kariérním cílem; to je již tak pokročilá role, že přinejmenším v oblasti datové vědy jde často o nejvyšší pozici, kterou lze dosáhnout – jednoduše se stanete lepším a schopnějším senior datovým vědcem s většími oblastmi specializace. Pro některé, zejména pro ty, kteří uplatňují obecnější přístup, je však možné dosáhnout dalšího pokroku v manažerské pozici, jako je Lead Data Scientist, řízení týmu nebo oddělení nebo dokonce Chief Data Officer, který vede datovou strategii instituce na nejvyšší úrovni. a odpovídá pouze generálnímu řediteli.

datový inženýr

To, co odlišuje datové inženýry od ostatních profesionálů pracujících v datové oblasti, je skutečnost, že navrhují a staví celé systémy – včetně infrastruktury a procesů, které společnost používá, aby z těchto dat vytěžila maximum. To znamená, že datoví inženýři jsou lidé, kteří určují způsoby, jakými mohou ostatní datoví vědci vykonávat svou práci. Jaké formy dat může podnikový systém pojmout? Jaké metody se používají ke sběru dat z prodeje a marketingu nebo výsledků průzkumu ve zdravotnictví a jejich zpřístupnění pro analýzu? Aby toho dosáhli, datoví inženýři musí být velmi dobře obeznámeni s typy práce, kterou dělají jiní odborníci na datovou vědu – správci databází, datoví analytici, datoví architekti atd. – do té míry, že datoví inženýři mohou často vykonávat každou z těchto rolí jako studna. Ale protože jsou tvůrci, datoví inženýři obvykle tráví více času prací na vývoji než jiní odborníci na datovou vědu – psaním softwarových programů, budováním relačních databází nebo vývojem nástrojů, které společnostem umožňují sdílet data mezi odděleními.

Profesní dráha datového inženýra

Stejně jako u jiných pracovních míst pracujících s daty je prvním krokem k tomu, abyste se stali datovým inženýrem, často vysokoškolské vzdělání (obvykle bakalářský nebo magisterský titul v inženýrství, informatice nebo matematice) – ale ne vždy. Někdo se spoustou zkušeností s prací v IT nebo s vývojem softwaru může zjistit, že již má všechny potřebné dovednosti, aby se stal datovým inženýrem, kromě samotných datových dovedností. V takovém případě mu může pomoci rekvalifikace některých dovedností, jako je datový bootcamp. do rychlosti. Mnoho dovedností, které datový inženýr vyžaduje (jako je SQL, UNIX a Linux, vývoj ETL nebo konfigurace IT systémů), lze rozvíjet prací v sousední oblasti; jiné (jako strojové učení nebo vytváření datových kanálů) budou vyžadovat soustředěnější učení.

Jak již bylo řečeno, většina datových inženýrů začíná svou kariéru v nějaké podoblasti počítačové vědy, než získá všechny dovednosti, které jsou zapotřebí k tomu, aby se stali juniorskými datovými inženýry – většina nabídek práce pro mladé datové inženýry skutečně vyžaduje jeden až pět let praxe. Odtud je dalším logickým krokem vedoucí datový inženýr a vedoucí datový inženýr. Ale vzhledem k tomu, že ovládají tolik aspektů IT, softwarového inženýrství a datové vědy, existuje spousta dalších pozic otevřených i pro datové inženýry – včetně Data Architect, Solutions Architect nebo Applications Architect. Pro někoho, kdo chce dělat méně praktické práce a více řídit zaměstnance, jsou k dispozici další možnosti, jako je Product Development Manager – nebo případně, s ohledem na dovednosti těch správných lidí, dokonce Chief Data Officer nebo Chief Information Officer.

Mohou datoví vědci pracovat z domova?

Stejně jako mnoho pracovních míst v oblasti technologií lze role Data Scientist často vykonávat na dálku – to však v konečném důsledku závisí na společnosti, pro kterou pracujete, a na druhu práce, kterou děláte.

Kdy mohou datoví vědci pracovat na dálku?

Pozice v oblasti datové vědy, které pracují s vysoce citlivými nebo důvěrnými daty a informacemi (což zahrnuje velké množství z nich, a to i mimo oblasti náročné na ochranu soukromí, jako je bankovnictví a zdravotnictví, protože proprietární data mohou být jedním z nejcennějších aktiv velké společnosti), zjistí, že čelí mnoha dalším omezením, pokud jde o práci na dálku. V těchto případech je pravděpodobné, že budete muset během pracovní doby pracovat v kanceláři.

Některé další faktory, které je třeba zvážit:

  • Jak tradiční je vaše společnost. Větší, starší společnosti obvykle nejsou tak přátelské na dálku – i když COVID mohl v této oblasti přinést velké změny.
  • Jak snadno můžete na dálku pracovat s ostatními spoluhráči a odděleními. Pokud je vaše práce vysoce spolupracující, je pravděpodobnější, že se budete muset dostavit osobně.
  • Data Scientists pracující na základě smlouvy – nebo dokonce na základě konzultací – mohou mít také větší flexibilitu při výběru vlastního umístění.

Kategori: Zprávy