Den v životě datového vědce

Kariérní průvodce BrainStation Data Scientist vám může pomoci udělat první kroky k lukrativní kariéře v oblasti datové vědy. Přečtěte si přehled toho, jak Data Scientists tráví dny v práci.

Staňte se datovým vědcem

Promluvte si s poradcem pro učení a zjistěte více o tom, jak vám naše bootcampy a kurzy mohou pomoci stát se datovým vědcem.



Kliknutím na Odeslat souhlasíte s naším Podmínky .



Předložit

Nepodařilo se odeslat! Obnovit stránku a zkusit to znovu?

Zjistěte více o našem Data Science Bootcampu

Děkuji!

Brzy budeme v kontaktu.



Zobrazit stránku Data Science Bootcamp

Den v životě datového vědce

Ze všech oborů zkoumaných v Brainstation’s Digital Skills Survey může datová věda zahrnovat nejširší škálu aplikací. Ale ačkoli datová věda existuje po celá desetiletí, teprve nedávno se naplno rozkvetla. Jak se dostupnost dat rozšiřovala, společnosti si uvědomily, jak důležitá může být datová věda, říká Briana Brownell, zakladatelka a generální ředitelka společnosti Pure Strategy a již 13 let působí v oboru dat. Každá společnost se nyní musí částečně zaměřit na technologie. Jen tento týden například společnost McDonald’s zaplatila odhadem 300 milionů USD za akvizici vlastní firmy zabývající se velkými daty.

Není proto divu, že konkurence pro Data Scientists je neuvěřitelně vysoká. Za pouhé dva roky se očekává nárůst poptávky o 28 procent, což odpovídá zhruba 2,7 milionu nových pracovních míst. To je více volných míst, než budou moci zaplnit noví absolventi – což znamená, že techničtí pracovníci v jiných oborech si budou muset oprášit své dovednosti a přejít na data, aby tuto poptávku uspokojili.

Náš průzkum ve skutečnosti naznačuje, že se to již děje. Zhruba čtyři z pěti datových profesionálů začali svou kariéru dělat něco jiného a 65 procent všech Data Scientists pracuje v oboru pět let nebo méně. Tento obrovský příliv nových myslí má dvojí účinek, říká Brownell; na jedné straně přichází spousta nových nápadů, říká. Když se podívám na část obsahu pocházejícího z komunity datové vědy, jsem překvapen, kolik inovací tam je. Odvrácenou stranou je však tendence znovu objevit kolo.



Vysoká poptávka po Data Scientists je skvělá, pokud jím jste (nebo uvažujete o tom, že se jím stanete), ale pro zaměstnavatele může být nábor skličující výzvou. Zde je rekvalifikace zřejmým řešením; může být nákladově efektivnější přeškolit stávajícího zaměstnance v oblasti datové vědy než vyhledávat nového.

Ale i když plánujete najmout nový datový vědecký tým, vaše organizace jako celek možná bude muset oprášit svou datovou gramotnost, varuje Brownell. Každý chce pracovat na něčem, co má dopad na jeho pracoviště, co zlepšuje životy lidí, říká. Pokud vaše firemní kultura není taková, aby [vaši datoví vědci] mohli ovlivnit, je téměř nemožné najmout. Vedení musí být schopno nejen sdělit potenciálním zaměstnancům, jak budou schopni přispět, ale také porozumět návrhům, které jejich tým vědy o datech nakonec předloží.

Bohužel, říká Brownell, nepohodlnou většinou jsou společnosti, které na věci nepřišly. Náš průzkum to potvrzuje: většina respondentů (52 procent) popsala úroveň datové gramotnosti ve svých organizacích jako základní, přičemž další nejčastější odpovědí je střední (31 procent). To naznačuje, že některé základní školení v oblasti datové vědy by mohlo být užitečné pro velkou většinu společností – zejména ve vedení.



Tato potřeba lepší datové gramotnosti – a komunikace – je zvýšena tím, jak je strukturována většina datových vědeckých týmů: jako samostatný tým, obvykle s 10 lidmi nebo méně (podle 71 procent respondentů) a často s pěti nebo méně (38 procent). ). Tyto úzké týmy si nemohou dovolit být izolovány. Jednotlivci, kteří pracují ve větších společnostech, jsou obvykle v malé skupině specifické pro datovou vědu a jejich klienti jsou interní – jiné části organizace, vysvětluje Brownell, takže je to tým, který musí fungovat v mnoha různých oblastech organizace.

Co přesně je datová věda?

Běžné vnímání (že Data Scientists drtí čísla) není příliš daleko, říká Brownell. Existuje mnoho souborů dat, z nichž je třeba získat poznatky, a to zahrnuje mnoho kroků, jako je tvorba modelu a čištění dat, a dokonce i pouhé rozhodnutí, jaká data potřebujete. V konečném důsledku je však toto úsilí zaměřeno na cíl: V jádru je potřeba s daty něco udělat.

Ostatně data nejsou vždy čísla. Zatímco většina respondentů (73 procent) uvedla, že pracuje s numerickými daty, 61 procent uvedlo, že pracuje také s textem, 44 procent se strukturovanými daty, 13 procent s obrázky a 12 procent s grafikou (a malé menšiny dokonce pracují s videem a zvukem). —6 procent a 4 procenta). Tyto výsledky průzkumu naznačují, jakým způsobem se datová věda rozšiřuje daleko za finanční tabulky a získává lidi pro takové projekty, jako je maximalizace spokojenosti zákazníků nebo sbírání cenných poznatků z hasičské hadice sociálních médií.

V důsledku toho existuje v oblasti datové vědy obrovská rozmanitost, říká Brownell. Každé odvětví má svůj vlastní pohled na to, na jakých typech dat Data Scientists pracují, jaké typy výsledků očekávají a jak to zapadá do struktury vedení jejich společnosti. V každém případě je však cílem využít data, aby pomohla společnosti činit lepší rozhodnutí. Mohlo by to být vylepšování produktů, pochopení trhu, na který chtějí vstoupit, udržení více zákazníků, pochopení jejich využití pracovní síly, pochopení toho, jak získat dobré zaměstnance – všemožné různé věci.

Data Science Jobs

V některých oblastech techniky může být to, že se stanete všeobecným odborníkem, vaší nejlepší nohou – u datové vědy tomu tak není. Zaměstnavatelé obvykle hledají dovednosti specializované na jejich odvětví. Vzhledem k tomu, že datová věda přichází v mnoha různých variantách, náš průzkum zkoumal hlouběji a zkoumal pět hlavních pracovních kategorií: datový analytik, výzkumník, obchodní analytik, manažer dat a analytiky a samotný datový vědec.

U všech těchto pracovních pozic zabere hádka s daty a čištění většinu času – ale k čemu? Nejčastěji je cílem optimalizace stávající platformy, produktu nebo systému (45 procent), případně vývoj nových (42 procent). Když jsme se ponořili hlouběji, zjistili jsme, že optimalizace stávajících řešení má tendenci připadat obchodním analytikům a datovým analytikům, zatímco vývoj nových řešení častěji připadá na datové vědce a výzkumníky.

Techniky, které Data Scientists používají, se také liší napříč specializacemi. Lineární regrese byla běžným nástrojem ve všech kategoriích, uvedlo ji 54 procent respondentů, ale když jsme se podívali na software, který lidé používají, došlo k několika překvapením.

Excel – ten tahoun manipulace s datovými sadami – je prakticky všudypřítomný, uvádí ho 81 procent všech respondentů, a je nejoblíbenějším nástrojem ve všech kategoriích kromě samotných Data Scientists (kteří se nejčastěji spoléhají na Python – a také uvedl větší sadu nástrojů než jiné kategorie). ). Proč je Excel tak nevyhnutelný, a to i v roce 2019?

Na Excelu miluji to, jak vám umožňuje vidět data a získat pro ně intuitivní pocit, vysvětlil Brownell. Používáme také hodně Pythonu a v takovém případě, když provádíte analýzu datového souboru, je skrytý; pokud specificky nenaprogramujete část svého kódu tak, aby provedla nějakou vizualizaci nezpracovaných dat, která analyzujete, nevidíte ji. Zatímco s Excelem je to přímo před vámi. To má spoustu výhod. Někdy můžete zaznamenat problémy s datovým souborem. Nevidím, že by Excel zmizel z analýzy.

To znamená, že stále existuje dlouhý seznam dalších programů používaných v této oblasti - nepřekvapivé vzhledem k jeho rozmanitosti. SQL (43 procent) a Python (26 procent) vedou v popularitě, přičemž Tableau (23 procent), R (16 procent), Jupyter Notebooks (14 procent) a několik dalších dosahují významných čísel - nemluvě o ohromných 32 procent respondentů, kteří uvedli jiné nástroje, a to i vzhledem k již tak dlouhému seznamu.

Jaká je budoucnost datové vědy?

Nakonec jsme se zeptali, jaké trendy budou formovat digitální krajinu v příštích pěti až deseti letech. Strojové učení a umělá inteligence – které mají obě aplikace v oblasti datové vědy – byly v drtivé většině vývoj, který respondenti očekávají, že bude mít největší dopad, a to 80 procent, respektive 79 procent. A to i přesto, že v současnosti s umělou inteligencí pracuje necelá čtvrtina (23 procent).

Umělá inteligence dokáže naprosto transformovat datovou vědu, potvrzuje Brownell, jehož společnost vyvíjí produkty AI. To je opravdu sláva metod učení bez dozoru. Máme tolik času, abychom se na tyto datové sady podívali, a zvláště u těch velkých je velmi obtížné udělat vše. Nástroje umělé inteligence mohou pomoci odhalit něco, co by vás možná ani nenapadlo hledat. Určitě se nám to stalo.

Další trendy Data Scientists očekávají, že budou v blízké budoucnosti dominovat: internet věcí (51 procent), blockchain (50 procent) a eCommerce (36 procent), rozšířená realita a virtuální realita (38 procent a 27 procent) a dokonce i hlasové založené zkušenosti (25 procent) – všechny významné ukázky a všechny oblasti, kde lze datovou vědu dobře využít.

Kategori: Zprávy