Деректер ғылымында алғашқы жұмысыңызды қалай алуға болады?

Деректерді талдаушы немесе деректерді талдаушы ретінде алғашқы жұмысқа қалай кірісуге болады? Егер сіз деректер туралы ғылым форумдарын айналдырсаңыз, сіз осы тақырып төңірегінде көптеген сұрақтар таба аласыз. Менің мәліметтер туралы блогымның оқырмандары (data36.com) анда-санда меннен осылай сұрайды. Мен сізге бұл туралы толықтай айта аламын!

Мен барлық негізгі сұрақтарға жауаптарымды қорытындылауды шештім!

ЖАҢА! Мен сіздерге Data Science-пен жұмысты бастауға көмектесетін жан-жақты (ақысыз) онлайн видео курсын жасадым. Қосымша ақпарат алу үшін мына жерді нұқыңыз: Деректертану бойынша маман болу үшін.

ТІРКЕУ (ТЕГІН): https://data36.com/how-to-become-a-data-scientist/

№1: Деректерді зерттеудің ең маңызды дағдылары мен құралдары қандай? Оларды қалай алуға болады?

Жақсы жаңалықтар - жаман жаңалықтар.

Мен жаманынан бастаймын. 90% жағдайда, сізді жоғары оқу орындарында үйрететін дағдылар шынайы өмір туралы мәліметтер жобаларында пайдалы емес. Мен бірнеше рет жазғанымдай, нақты жобаларда осы 4 кодтау дағдылары қажет:

  • bash / командалық жол
  • Питон
  • SQL
  • R
  • (және кейде Java)
дереккөз: KDnuggets

Сізге қайсысы пайдалы болатын 2 немесе 3 қайсысы компанияға байланысты болады ... Бірақ егер сіз біреуін білсеңіз, басқасын үйрену оңайырақ болады.

Сонымен, бірінші үлкен сұрақ: бұл құралдарды қалай алуға болады? Міне, жақсы жаңалықтар! Бұл құралдардың барлығы тегін! Бұл оларды бір тиын төлемей-ақ жүктей, орнатып, пайдалана аласыз деген сөз. Сіз тәжірибе жасай аласыз, деректер хоббиі жобасын немесе кез-келген нәрсе жасай аласыз!

Мен жақында осы құралдарды компьютерге қалай орнату туралы қадамдық мақала жаздым. Мұнда тексеріңіз.

№ 2: Қалай үйренуге болады?

Деректер ғылымын оңай және үнемді үйренудің екі негізгі әдісі бар.

1-ші: Кітаптар.

Кинда ескі мектеп, бірақ әлі де жақсы оқыту әдісі. Кітаптардан сіз интернеттегі деректерді талдау, статистика, деректерді кодтау және т.б. туралы өте бағытталған, өте егжей-тегжейлі білім ала аласыз ... Мен алдыңғы мақалада ұсынған 7 кітапты бөлектедім.

Ұсынылатын ең жақсы 7 кітап

2-ші: Онлайн вебинарлар және видео курстар.

Информатика бойынша онлайн курстар әділ бағамен ($ 10 - $ 500) келеді және олар деректерді кодтау мен бизнес-ақпаратқа дейінгі әртүрлі тақырыптарды қамтиды. Егер сіз бұған басында ақша жұмсамағыңыз келсе, мен бұл курста тегін курстар мен оқу материалдарының тізімін келтірдім.

(3-ші: Жас ғалымдардың алғашқы айлық курсы) Мен деректерді зерттеушілердің шынайы өмірден алынған мәліметтер жиынтығында өмірлік міндеттерді орындауға және шешуге ұмтылу үшін 6 апталық интернеттегі мәліметтер курсын жасадым: Кіші Дата Ғалымдардың Бірінші айы .)

№3: Қалай жаттығуға болады және нақты өмірлік тәжірибені қалай алуға болады

Бұл қиын, дұрыс па? Әрбір компания, ең болмағанда, нағыз өмірлік тәжірибесі бар адамдар болғанын қалайды ... Бірақ егер сізге алғашқы жұмысыңызды алу үшін нақты өмірлік тәжірибе қажет болса, нағыз өмірлік тәжірибені қалай аласыз? Классикалық аулау-22. Жауабы: үй жануарларының жобалары.

«Үй жануарлары жобасы» сізді қызықтыратын деректер жобасының идеясын ойлап табуды білдіреді. Содан кейін сіз оны салуды бастайсыз. Сіз бұл туралы кішкентай стартап ретінде ойлана аласыз, бірақ жобаның мәліметтер туралы бөлігіне назар аударатындығыңызға көз жеткізіп, бизнес бөлігін елемеуге болады. Сізге бірнеше идеялар беру үшін, міне, менің соңғы бірнеше жылдағы бірнеше үй жобаларым:

  • Мен жылжымайтын мүлік веб-сайтын бақылайтын сценарий құрдым және маған нақты уақыттағы ең жақсы мәмілелерді электронды пошта арқылы жібердім - осылайша мен барлық адамдарға осы мәмілелерді аламын.
  • Мен ABC, BBC және CNN-дің барлық мақалаларын тарқататын сценарий жасадым және қолданылған сөздерге сүйене отырып, дәл сол тақырыптағы мақалаларды 3 түрлі жаңалықтар порталында байланыстырдым.
  • Мен Python-да өздігінен үйренетін чат құрдым. (Бұл өте ақылды емес, өйткені мен оны әлі үйреткен емеспін.)

Шығармашылықта болыңыз! Өзіңіз үшін деректер ғылымымен байланысты үй жануарларының жобасын тауып, кодтауды бастаңыз! Егер сіз қабырғаға кодтау мәселесін тигізсеңіз - жаңа деректер тілін үйренуді бастағанда оңай болуы мүмкін - тек google және / немесе stackoverflow қолданыңыз. Тікелей ағынның қаншалықты тиімді екендігі туралы минаның бір қысқаша мысалы:

сол жағы: менің сұрағым - оң жағы: жауап (7 минут ішінде)

Уақыт белгісіне назар аударыңыз! Мен күрделі сұрақты жібердім, 7 минуттан кейін жауап алдым. Мен жасауым керек нәрсе - бұл кодты өндірістік кодыма және бумға көшіріп қою, ол жұмыс істеді!

(Ескерту: Cross Validated - бұл ақпарат туралы сұрақтарға арналған тағы бір үлкен форум.)

+1 ұсыныс:

Аздап қиын болса да, тәлімгер алуға тырысыңыз. Егер сізде сәттілік болса, сіз жақсы компанияда Data Scientist рөлінде жұмыс істейтін және аптасына немесе екі рет бір сағатты өткізіп, талқылауға немесе сабақ беруге болатын адамды таба аласыз.

№ 4: Сіз өзіңіздің алғашқы жұмысқа орналасу туралы өтінішіңізді қайда және қалай жібересіз?

Егер сіз тәлімгер таба алмасаңыз, алғашқы компанияңызды әлі де таба аласыз. Бұл сіздің ғылым туралы алғашқы жұмысыңыз болады, сондықтан мен үлкен ақшаға немесе керемет қымбат стартап атмосфераға назар аудармаңыз. Өзіңізді дамыта алатын орта іздеуге назар аударыңыз.

Көпұлтты компанияда деректерді зерттеу бойынша алғашқы жұмысыңыз бұл идеяға сәйкес келмеуі мүмкін, өйткені адамдар көбінесе заттарымен тым көп айналысады, сондықтан оларда жақсартуға көмектесетін уақыт пен / немесе уәж болмайды (әрине, әрдайым бар ерекшеліктер).

Кішкентай стартаптан бастап команданың алғашқы адамы ретінде бастау сіздің жағдайыңызда да жақсы идея емес, өйткені бұл компанияларда үлкен мәліметтер алатын адамдар жоқ.

Мен сізге 50-500 өлшемді компанияларға назар аударуға кеңес беремін. Бұл - алтынның орташа мәні. Аға ғалымдар бортта, бірақ олар сізге көмектесуге және сабақ беруге тым көп емес.

Жарайды, сіз жақсы компанияларды таптыңыз ... Қалай өтініш беруге болады? Резюменің бірнеше қағидаттары: тәжірибеңізді емес, өзіңіздің дағдыларыңыз бен жобаларыңызды бөліп көрсетіңіз (өйткені сізде әлі қағазға қоюға көп жылыңыз жоқ). Сіз қолданатын кодтау тілдерін (SQL және Python) тізімдеңіз, соларға байланысты кейбір github репо-ларыңызды байланыстырыңыз және сол тілді шынымен қолданғаныңызды көрсете аласыз.

Сондай-ақ, көп жағдайда компаниялар қосымша хат сұрайды. Әрине, бұл сіздің ынта-ықыласыңызды білдірудің жақсы мүмкіндігі, бірақ егер сіз жұмысқа қабылданған болсаңыз, алғашқы бірнеше аптаның ішінде не істер едіңіз сияқты бірнеше практикалық мәліметтерді қоса аласыз. (Мысалы, «тіркеу ағынына қарап, мен ____ веб-беті маңызды рөл атқарады деп ойлаймын. Алғашқы бірнеше апталарда мен осы гипотезаны дәлелдеу және оны тереңірек түсіну үшін ___, ___ және ___ (нақты талдаулар) жүргіздім. Бұл компанияға _____ деңгейінің жақсаруына және ақырында _____ KPI деңгейінің өсуіне ықпал етуі мүмкін. »)

Бұл сізге жұмыс сұхбатын өткізеді деп үміттенемін, онда сіз үй жануарларының жобалары туралы, мұқтаждық туралы ұсыныстарыңыз туралы аздап сөйлесе аласыз, бірақ бұл көбінесе жеке басын сәйкестендіру және кейбір шеберлік сынағы туралы болады. Егер сіз жеткілікті жаттығулар жасасаңыз, онда сіз бұны тапсырасыз ... бірақ егер сіз жүйке болсаңыз және көп жаттығғыңыз келсе, оны hackerrank.com сайтында жасай аласыз.

Қорытынды

Ал, солай. Бұл жазылған кезде оңайырақ болатынын білемін, бірақ егер сіз шын мәнінде деректерді зерттеуші болсаңыз, оны жүзеге асыру қиын болмайды. Оған сәттілік!

Егер сіз шынымен өмірді бастау кезінде кіші ғылыми маман болу дегеннің не екенін байқап көргіңіз келсе, менің 6 апталық интернеттегі мәліметтер туралы курстан қараңыз: жас ғалымдардың алғашқы айы!

Егер сіз деректер туралы көбірек білгіңіз келсе, менің блогымды (data36.com) тексеріп, және / немесе менің ақпараттық бюллетенге жазылыңыз! Менің жаңа кодтау оқулықтар сериясын жіберіп алмаңыз: SQL деректерді талдау!

Оқығаныңызға рахмет!

Мақала сізге ұнады ма? Төмендегі түймесін басу арқылы маған хабарлаңыз. Бұл басқа адамдарға оқиғаны көруге көмектеседі!

Томи Местер data36.com авторы Twitter: @ data36_com