Otázky k pohovoru o datové vědě

Kariérní průvodce BrainStation Data Scientist vám může pomoci udělat první kroky k lukrativní kariéře v oblasti datové vědy. Čtěte dále, kde najdete přehled běžných otázek na pohovorech pro pracovní místa v oblasti datové vědy a jak na ně nejlépe odpovědět.

Staňte se datovým vědcem

Promluvte si s poradcem pro učení a zjistěte více o tom, jak vám naše bootcampy a kurzy mohou pomoci stát se datovým vědcem.



Kliknutím na Odeslat souhlasíte s naším Podmínky .



Předložit

Nepodařilo se odeslat! Obnovit stránku a zkusit to znovu?

Zjistěte více o našem Data Science Bootcampu

Děkuji!

Brzy budeme v kontaktu.



Zobrazit stránku Data Science Bootcamp

Procesy pohovorů v oblasti datové vědy se mohou lišit v závislosti na společnosti a odvětví. Obvykle zahrnují úvodní telefonické prověřování s náborovým manažerem, po kterém následuje jeden nebo několik pohovorů na místě.

Budete muset odpovědět na otázky týkající se technických a behaviorálních datových pohovorů a pravděpodobně dokončíte projekt související s dovednostmi. Před každým pohovorem byste si měli prohlédnout svůj životopis a portfolio a připravit se na případné otázky na pohovoru.

Otázky k pohovoru o datové vědě otestují vaše znalosti a dovednosti statistiky, programování, matematiky a datového modelování. Zaměstnavatelé budou hodnotit vaše technické a měkké dovednosti a to, jak dobře byste zapadli do jejich společnosti.



Připravíte-li si některé běžné otázky a odpovědi na pohovor v oblasti datové vědy, můžete do rozhovoru vstoupit s důvěrou. Existuje několik různých typů otázek Data Scientist, se kterými se můžete setkat během vašeho pohovoru o datové vědě.

Seznam otázek k pohovoru o datové vědě: Otázky související s daty

Zaměstnavatelé hledají kandidáty, kteří mají silné znalosti technik a konceptů datové vědy. Otázky týkající se pohovoru se budou lišit v závislosti na pozici a požadovaných dovednostech.

Zde je několik příkladů vzorových otázek a odpovědí na rozhovory související s daty:



Jaký je rozdíl mezi učením pod dohledem a učením bez dozoru?

Největší rozdíl mezi učením pod dohledem a učením bez dozoru spočívá v použití označených a neoznačených datových sad. Učení pod dohledem využívá výstupní a vstupní data, která jsou označena, a algoritmy učení bez dohledu nikoli. Dalším rozdílem je, že řízené učení má mechanismus zpětné vazby, zatímco učení bez dohledu nikoli. Konečně, běžně používané algoritmy učení pod dohledem zahrnují logistickou regresi, stroj podpůrných vektorů a rozhodovací stromy, zatímco algoritmy učení bez dozoru jsou shlukování k-means, hierarchické shlukování a apriori algoritmus.

Jaký je rozdíl mezi hlubokým učením a strojovým učením?

Na tuto otázku může být obtížné jednoznačně odpovědět, protože zde zjevně dochází k určitému překrývání. Začněte vysvětlením, že hluboké učení je v podstatě podpolí strojového učení a že obojí spadá pod záštitu umělé inteligence. Tam, kde strojové učení používá algoritmy k analýze dat a nakonec se učí rozhodovat na základě toho, co z dat přináší, hluboké učení tyto algoritmy vrství za účelem vytvoření umělých neuronových sítí schopných učit se a přijímat informovaná rozhodnutí.

  • Můžete poskytnout podrobné vysvětlení algoritmu rozhodovacího stromu?
  • Co je odběr vzorků? Kolik metod vzorkování znáte?
  • Jak rozlišujete mezi chybou typu I a typu II?
  • Definujte prosím lineární regresi.
  • Co znamenají pojmy p-hodnota, koeficient a r-kvadrát hodnota? Proč je každá složka významná?
  • Definujte prosím zkreslení výběru.
  • Definujte prosím statistickou interakci.
  • Můžete uvést příklad souboru dat s negaussovským rozdělením?
  • Vysvětlete vzorec binomické pravděpodobnosti.
  • Můžete vysvětlit rozdíl mezi shlukováním k-NN a k-means?
  • Jaký je váš přístup k vytvoření modelu logistické regrese?
  • Jaké je pravidlo 80/20? Jak je důležité provádět validaci modelu?
  • Definujte přesnost a vyvolání. Jak souvisí s křivkou ROC?
  • Vysvětlete prosím, jak rozlišit mezi metodami regularizace L1 a L2?
  • Jaké jsou kroky pro boj s daty a čištění dat před použitím algoritmů strojového učení?
  • Můžete vysvětlit rozdíl mezi histogramem a krabicovým grafem?
  • Jak definujete křížovou validaci?
  • Můžete vysvětlit, co je falešně pozitivní a falešně negativní? Co byste řekli, že je lepší mít: příliš mnoho falešně pozitivních nebo příliš mnoho falešně negativních výsledků?
  • Co je při navrhování modelu strojového učení důležitější: přesnost modelu nebo výkon modelu?
  • Co je podle vás lepší: 50 malých rozhodovacích stromů nebo velký?
  • Napadá vás projekt datové vědy v naší společnosti, který by vás zajímal?
  • Napadá vás prosím několik příkladů osvědčených postupů v datové vědě?

Seznam otázek pro rozhovory o datové vědě: Otázky týkající se technických dovedností

Otázky technických dovedností v pohovoru o datové vědě se používají k posouzení vašich znalostí, dovedností a schopností v oblasti datové vědy. Tyto otázky se budou týkat konkrétních pracovních povinností na pozici Data Scientist.

Otázky pro pohovor v oblasti technických dat mohou mít jednu správnou odpověď nebo několik možných řešení. Budete chtít ukázat svůj myšlenkový pochod při řešení problémů a jasně vysvětlit, jak jste dospěli k odpovědi.

Příklady otázek na pohovor s dovednostmi v oblasti technických dat:

Jaké jsou nejlepší nástroje a technické dovednosti pro datového vědce?

Data science je vysoce technický obor a vy budete chtít náborovému manažerovi ukázat, že jste zběhlí ve všech nejnovějších standardních nástrojích, softwaru a programovacích jazycích. Z různých statistických programovacích jazyků používaných v datové vědě jsou datovými vědci nejčastěji používány R a Python. Oba lze použít pro statistické funkce, jako je vytváření nelineárního nebo lineárního modelu, regresní analýza, statistické testy, dolování dat a další. Dalším důležitým nástrojem pro datovou vědu je RStudio Server, zatímco Jupyter Notebook se často používá pro statistické modelování, vizualizace dat, funkce strojového učení atd. Samozřejmostí je řada specializovaných nástrojů pro vizualizaci dat, které ve velké míře využívají Data Scientists, včetně Tableau, PowerBI , Bokeh, Plotly a Infogram. Data Scientists také potřebují spoustu zkušeností s používáním SQL a Excel.

Vaše odpověď by také měla zmínit jakékoli konkrétní nástroje nebo technické kompetence, které vyžaduje práce, pro kterou vedete pohovor. Projděte si popis práce a pokud jste nepoužili nějaké nástroje nebo programy, možná by stálo za to se s nimi seznámit před pohovorem.

Jak zacházíte s odlehlými hodnotami?

Některé typy odlehlých hodnot lze odstranit. Hodnoty nesmyslu nebo hodnoty, o kterých víte, že nemohou být pravdivé, lze vypustit. Odlehlé hodnoty s extrémními hodnotami daleko mimo zbytek datových bodů seskupených v sadě lze také odstranit. Pokud nemůžete vypustit odlehlé hodnoty, můžete znovu zvážit, zda jste zvolili správný model, můžete použít algoritmy (jako náhodné lesy), které nebudou tak silně ovlivněny odlehlými hodnotami, nebo můžete zkusit normalizovat svá data.

  • Řekněte nám prosím o originálním algoritmu, který jste vytvořili.
  • Jaký je váš oblíbený statistický software a proč?
  • Pracovali jste na projektu datové vědy, který vyžadoval podstatnou programovací složku? Co jste si ze zkušenosti odnesli?
  • Popište, jak efektivně reprezentovat data pomocí pěti dimenzí.
  • Musíte vygenerovat prediktivní model pomocí vícenásobné regrese. Jaký je váš postup pro ověření tohoto modelu?
  • Jak zajistíte, aby změny, které provádíte v algoritmu, byly zlepšením?
  • Uveďte prosím svou metodu zpracování nevyváženého souboru dat, který se používá k predikci (tj. mnohem více negativních tříd než pozitivních tříd).
  • Jaký je váš přístup k ověření modelu, který jste vytvořili pro generování prediktivního modelu kvantitativní výsledné proměnné pomocí vícenásobné regrese?
  • Máte dva různé modely se srovnatelným výpočetním výkonem a přesností. Vysvětlete prosím, jak se rozhodujete, který si pro výrobu vybrat a proč.
  • Dostanete soubor dat sestávající z proměnných, ve kterých z podstatné části chybí hodnoty. Jaký je váš přístup?

Seznam otázek k pohovoru o datové vědě: Osobní otázky

Spolu s testováním vašich znalostí a dovedností v oblasti datové vědy vám zaměstnavatelé pravděpodobně také položí obecné otázky, aby vás lépe poznali. Tyto otázky jim pomohou porozumět vašemu stylu práce, osobnosti a tomu, jak byste mohli zapadnout do jejich firemní kultury.

Otázky k rozhovoru s odborníkem na osobní údaje mohou zahrnovat:

Co dělá dobrého datového vědce?

Vaše odpověď na tuto otázku prozradí náborovému manažerovi hodně o tom, jak vidíte svou roli a hodnotu, kterou organizaci přinášíte. Ve své odpovědi byste mohli mluvit o tom, jak datová věda vyžaduje vzácnou kombinaci kompetencí a dovedností. Dobrý datový vědec potřebuje spojit technické dovednosti potřebné k analýze dat a vytváření modelů s obchodním smyslem nezbytným k pochopení problémů, které řeší, a také k rozpoznání použitelných poznatků ve svých datech. Ve své odpovědi byste také mohli diskutovat o datovém vědci, ke kterému vzhlížíte, ať už je to kolega, kterého osobně znáte, nebo bystrá osobnost z oboru.

  • Prosím, řekni mi o sobě.
  • Jaké jsou vaše nejlepší profesní vlastnosti? Jaké jsou vaše slabé stránky?
  • Je nějaký datový vědec, kterého nejvíce obdivujete?
  • Co inspirovalo váš zájem o datovou vědu?
  • Jaké jedinečné dovednosti nebo vlastnosti přinášíte, které by týmu pomohly?
  • Co vedlo k tomu, že jste se rozhodl opustit své poslední zaměstnání?
  • Jakou výši odměny od této práce očekáváte?
  • Pracujete raději sami nebo jako součást týmu Data Scientists?
  • Kde vidíte svou kariéru za pět let?
  • Jaký je váš přístup ke zvládání stresu v práci?
  • Jak najdete motivaci?
  • Jaká je vaše metoda měření úspěchu?
  • Jak byste popsal své ideální pracovní prostředí?
  • Jaké jsou vaše vášně nebo koníčky mimo datovou vědu?

Seznam otázek k pohovoru o datové vědě: Vedení a komunikace

Vedení a komunikace jsou dvě cenné dovednosti pro datové vědce. Zaměstnavatelé oceňují uchazeče o zaměstnání, kteří dokážou prokázat iniciativu, sdílet své odborné znalosti se členy týmu a komunikovat cíle a strategie datové vědy.

Zde je několik příkladů otázek pohovoru o vedení a komunikaci s daty:

Co se vám líbí na práci v multidisciplinárním týmu?

Data Scientist spolupracuje s širokou škálou lidí v technických i netechnických rolích. Není neobvyklé, že Data Scientist spolupracuje s vývojáři, designéry, produktovými specialisty, datovými analytiky, prodejními a marketingovými týmy a vrcholovými manažery, nemluvě o klientech. Takže ve své odpovědi na tuto otázku musíte doložit, že jste týmový hráč, který si vychutnává příležitost setkávat se a spolupracovat s lidmi v celé organizaci. Vyberte si příklad situace, kdy jste podávali zprávy lidem na nejvyšší úrovni ve společnosti, abyste nejen ukázali, že vám vyhovuje komunikovat s kýmkoli, ale také abyste ukázali, jak cenné byly vaše poznatky založené na datech v minulosti.

  • Napadá vás nějaká profesní situace, kdy jste měl možnost prokázat vůdcovství?
  • Jaký je váš přístup k řešení konfliktů?
  • Jaký je váš přístup k budování profesionálních vztahů s kolegy?
  • Jaký je příklad úspěšné prezentace, kterou jste uvedl? Proč to bylo tak přesvědčivé?
  • Pokud mluvíte s kolegou nebo klientem z netechnického prostředí, jak vysvětlujete složité technické problémy nebo výzvy?
  • Připomeňte si prosím situaci, kdy jste museli zacházet s citlivými informacemi. Jak jste se k situaci postavil?
  • Jak byste ze svého vlastního pohledu ohodnotili své komunikační schopnosti?

Seznam otázek pro pohovor Data Science: Behaviorální

S otázkami na behaviorální pohovor zaměstnavatelé hledají konkrétní situace, které předvádějí určité dovednosti. Tazatel chce porozumět tomu, jak jste řešili situace v minulosti, co jste se naučili a co jste schopni jeho společnosti přinést.

Příklady behaviorálních otázek v rozhovoru pro datovou vědu zahrnují:

Vzpomínáte si na situaci, kdy jste museli vyčistit a uspořádat velký soubor dat?

Studie ukázaly, že Data Scientists tráví většinu času přípravou dat, na rozdíl od data miningu nebo modelování. Takže pokud máte nějaké zkušenosti jako Data Scientist, je téměř jisté, že máte zkušenosti s čištěním a organizováním velkého souboru dat. Je také pravda, že jde o úkol, který málokoho opravdu baví. Čištění dat je ale také jedním z nejdůležitějších kroků každé společnosti. Měli byste tedy provést náborového manažera procesem, který sledujete při přípravě dat: odstranění duplicitních pozorování, oprava strukturálních chyb, filtrování odlehlých hodnot, řešení chybějících dat a ověřování dat.

  • Vzpomeňte si na datový projekt, na kterém jste pracovali, kde jste narazili na problém nebo výzvu. Jaká byla situace, jaká byla překážka a jak jste ji překonali?
  • Uveďte prosím konkrétní příklad použití dat ke zlepšení zkušeností zákazníka nebo zainteresované strany?
  • Uveďte prosím konkrétní situaci, kdy jste splnili cíl. jak jsi toho dosáhl?
  • Uveďte prosím konkrétní situaci, kdy se vám nepodařilo splnit cíl. Co se pokazilo?
  • Jaký je váš přístup k řízení a dodržování přísných termínů?
  • Vzpomenete si na dobu, kdy jste čelili konfliktu v práci? jak jste se s tím vypořádali?

Seznam dotazů na rozhovory o datové vědě od předních společností (Amazon, Google, Facebook, Microsoft)

Abychom vám poskytli představu o některých dalších otázkách, které se mohou objevit v rozhovoru, sestavili jsme seznam dotazů na rozhovory o datové vědě od některých špičkových technologických společností.

  • Jaký je rozdíl mezi podpůrným vektorovým strojem a logistickou regresí? Uveďte prosím příklady situací, kdy byste se rozhodli použít raději jeden než druhý.
  • Pokud odstranění chybějících hodnot z datové sady způsobí zkreslení, co byste udělali?
  • Když se podíváte na zdraví, zapojení nebo růst produktu, jaké metriky byste hodnotili?
  • Jaké metriky byste hodnotili, když se snažíte řešit nebo řešit obchodní problémy související s naším produktem?
  • Jak hodnotíte výkon produktu?
  • Jak poznáte, že nové pozorování je odlehlé?
  • Jak byste definovali kompromis mezi odchylkou a odchylkou?
  • Jaká je vaše metoda pro náhodný výběr vzorku z populace uživatelů produktu?
  • Jaký je váš postup pro boj s daty a čištění před použitím algoritmů strojového učení?
  • Jak byste přistupovali k nevyvážené binární klasifikaci?
  • Jak rozlišujete mezi dobrou a špatnou vizualizací dat?
  • Vytvořte prosím funkci, která ověří, zda je slovo palindrom.

Kategori: Zprávy