Gaukite pirmyn duomenų moksle, mokydami vieną iš šių pelningų kalbų
Būtent tai atlieka mokslininkai: atranda informaciją, sukuria ryšius, kuria duomenų vizualizacijas ir padeda įmonėms efektyviai dirbti.
Ir gerai suprasti tinkamas programavimo kalbas yra būtina norint interpretuoti statistiką ir dirbti su duomenų bazėmis.
Pasak KDnuggets, 91% duomenų mokslininkų naudoja šias keturias kalbas.
1 kalba: R
R yra statistiškai orientuota kalba, populiari tarp duomenų gavėjų. Tai yra atviro kodo, objektyvus "S" įgyvendinimas, ir tai nėra pernelyg sunku mokytis.
Jei norite išmokti kurti statistinę programinę įrangą, R yra gera žinoma kalba. Taip pat galite manipuliuoti ir grafiškai rodyti duomenis.
Kaip dalį savo duomenų mokslo specializacijos programos, "Coursera" siūlo klasę "R", kuri ne tik moko jus, kaip programuoti kalbą, bet taip pat perteikia, kaip ją taikyti duomenų mokslo / analizės kontekste.
2 kalba: SAS
Kaip ir R, SAS pirmiausia naudojamas statistinei analizei. Tai galinga priemonė duomenų (duomenų bazių) ir skaičiuoklių duomenų transformavimui į lengvai suprantamus formatus (pvz., HTML ir PDF dokumentus), taip pat daugiau vaizdinių lentelių ir diagramų.
Iš pradžių sukūrė mokslininkai, ji tapo viena iš populiariausių visų pasaulio šalių bendrovių ir organizacijų analitinių priemonių. Tai daugiau nei didelės korporacijos programinės įrangos rūšis, ir paprastai ji netaikoma mažesnėms įmonėms ar asmenims, dirbantiems patys.
SAS mokymosi ištekliai yra išvardyti šiame dokumente .
Kalba nėra atviras šaltinis, taigi jūs tikriausiai negalėsite mokyti save nemokamai.
Kalba 3: Python
Nors "R" ir "SAS" dažniausiai laikomi "didžiausiais dviem" analitikų pasaulyje, "Python" neseniai tapo ir varžovu. Vienas iš pagrindinių jo privalumų yra bibliotekų įvairovė (pvz., "Pandas", "NumPy", "SciPi" ir kt.) Ir statistikos funkcijos.
Kadangi "Python" (pvz., "R") yra atviro kodo kalba, atnaujinimai greitai pridedami prie jo. (Su įsigytomis programomis, tokiomis kaip "SAS", turėsite palaukti kito versijos paleidimo.)
Kitas veiksnys, kurį reikia apsvarstyti, yra tai, kad Python yra lengviausias mokytis dėl jo paprastumo ir plačios galimybės naudotis kursais ir ištekliais. Ši svetainė yra puiki vieta pradėti.
Čia taip pat rasite išsamesnį "Python" mokymosi medžiagų sąrašą.
Kalba 4: SQL
Iki šiol mes ieškojome kalbų, esančių toje pačioje šeimoje, ir (daugiau ar mažiau) turi tas pačias funkcijas. SQL, kuris reiškia "Struktūrinės užklausos kalbą", yra tas, kuris keičia. Ši kalba neturi nieko bendra su statistika; jame dėmesys telkiamas į informacijos tvarkymą reliacinėse duomenų bazėse.
Tai yra plačiausiai naudojama duomenų bazės kalba ir yra atvirojo kodo, taigi siekiamiems duomenims mokslininkai tikrai neturėtų jo praleisti.
Mokymasis SQL turėtų padėti jums kurti SQL duomenų bazes, tvarkyti jose esančius duomenis ir naudoti atitinkamas funkcijas. "Udemy" siūlo mokymo kursą, kuris apima visus pagrindus ir gali būti baigtas gana greitai ir neskausmingai.
Išvada
Turėtumėte bent jau išmokti SQL ir pasirinkti bent vieną iš statistikos kalbų. Bet jei turite laiko (ir, SAS atveju, pinigus) ir norite iš tikrųjų patekti į jūsų prekyvietę, niekas sako, kad negalite išmokti visų keturių!
Neskubėkite, nesukelkite daug praktikos, išmėginkite savo įgūdžius ir mėgaukitės darbo saugumu.