Role ng Trabaho: Data Scientist

May -Akda: Roger Morrison
Petsa Ng Paglikha: 28 Setyembre 2021
I -Update Ang Petsa: 11 Mayo 2024
Anonim
What REALLY is DATA SCIENCE? From a PINOY Data Scientist
Video.: What REALLY is DATA SCIENCE? From a PINOY Data Scientist

Nilalaman


Pinagmulan: Sergey Khakimullin / iStockphoto

Takeaway:

Ang mga siyentipiko ng data ay may malawak na mga trabaho na iba-iba ng aplikasyon. Ngunit ang isang bagay na kanilang lahat ay magkakapareho ay ang pagmaneho upang magamit ang data.

Ano ang ginagawa ng isang siyentipiko ng data sa con ng artipisyal na katalinuhan at gawain sa pag-aaral ng machine? Maraming mga pros na haharapin ang mga ganitong uri ng mga proyekto araw-araw ay sasabihin na ang tanong ay uri ng mahirap sagutin nang simple. Ang isang mas mahusay na tanong ay: Ano ang hindi ginagawa ng mga siyentipiko ng data?

Ang isang data na siyentipiko ay integral sa isang proseso ng AI o ML, sa kahulugan na ang lahat ng mga proyektong ito ay nakasalalay sa malaking data o kumplikadong mga input. Ang data scientist ay ang mahahalagang karera na nakakaalam kung paano magtrabaho kasama ang data upang makagawa ng mga resulta.

Gayunpaman, may ilang mga paraan upang pag-usapan ang ginagawa ng isang siyentipiko ng data, kung ano ang mga kwalipikasyon na kailangan niya, at kung ano ang kanyang papel sa proseso.


Basahin: 6 Mga Mahahalagang Konsepto sa Agham ng Data Maaari kang Mag-master sa pamamagitan ng Online Learning

Iba't ibang mga Kahulugan, Iba't-ibang mga Tungkulin

Maraming mga eksperto na naglalarawan ng gawain ng isang siyentipiko ng data na nagsasalita tungkol dito sa malawak na termino.

"Sa mga maliliit na kumpanya o kapag nagtatrabaho sa isang bagong merkado, ang papel ng isang siyentipiko ng data ay ang pag-convert ng medyo nobela (ngunit halata) na mga mapagkukunan ng data sa mga bagay na nalulutas ang isang problema para sa isang end user, na hindi posible, dati. kung saan ang mga teknolohiyang nagtatrabaho ay hindi umiiral, ”sabi ni Antonio Hicks, isang Account Manager sa Mercury Global Partners. "Ang perpektong kandidato ay isang tao na bahagi ng matematika, bahagi ng software engineer, at bahagi ng negosyante."

Ang iba ay binigkas ang pangunahing ideyang ito, binabanggit kung ano ang kailangan ng mga siyentipiko upang matugunan ang mga modeling proyekto.


"Ang pinakamahalagang katangian ng isang kinakailangang siyentipiko ng data ay isang malalim na pag-usisa tungkol sa mundo sa kanilang paligid - kung sumasagot ba sila ng mga katanungan o mga modelo ng gusali, ang pagnanais na maunawaan ang problema sa harap nila ay susi," sabi ni Erin Akinci, Data Scientist Manager sa Asana. "Mula roon, ang karamihan sa mga tao ay mangangailangan ng mga kasanayan sa matematika at programming upang makahanap ng mga solusyon, ngunit ang mga tiyak na uri ng matematika at programming ay nag-iiba-iba depende sa lugar ng kadalubhasaan sa loob ng agham ng data."

Walang Mga bug, Walang Stress - Ang Iyong Hakbang sa Hakbang Patnubay sa Paglikha ng Software na Pagbabago ng Buhay nang Walang Pagsira sa Iyong Buhay

Hindi mo maaaring mapabuti ang iyong mga kasanayan sa pag-programming kapag walang nagmamalasakit sa kalidad ng software.

"Ang mahusay na gawaing pang-agham ay may kinalaman sa paraan ng pag-iisip ng siyentipiko tungkol sa isang problema, kaysa sa mga tool na ginagamit nila upang malutas ito," idinagdag ni Charlie Burgoyne, Tagapagtatag at CEO ng Valkyrie Intelligence. Ang Valkyrie ay isang inilapat na kumpanya sa pagkonsulta sa agham na may mga kahanga-hangang proyekto sa ilalim ng pakpak nito tulad ng Mark I, isang dedikadong kagamitan sa network na pinalalaki ang pagsasanay at pagsusuri sa neural network, pagpapabuti sa posible sa naunang mga platform ng pag-aaral ng makina na nakabase sa cloud.

"Hinihiling ng merkado ang mga siyentipiko na marunong sa pag-unlad ng Python, disenyo ng neural network at ang kakayahang muling mag-reshape ng isang imbakan ng data sa pinakabagong arkitektura ng database," sabi ni Burgoyne. "Ang mga kakayahan na, gayunpaman, ay mga talahanayan ng talahanayan para sa isang may talento na siyentipiko. Ang hindi gaanong halata ay isang kakayahan ng siyentipiko para sa labis na pag-usisa, agresibong talino sa paglikha at pagsunod sa pang-agham na pamamaraan. "

Ang Mga Kasanayan ng isang Scientist ng Data

Kaya't hanggang sa praktikal na mga set ng kasanayan, ang mga siyentipiko ng data ay nangangailangan ng ilang halaga ng pagkamalikhain at savvy hanggang sa pagpunta sa pagmomolde. Maaari rin silang makinabang ng maraming mula sa pagkakaroon ng "hard skills" tulad ng karanasan sa coding sa Python, C ++ o iba pang mga karaniwang wika na inilalapat sa mga proyekto sa ML.

"Mahalaga ang Python at C ++ at magawang pagsamahin ang mga kasanayan sa pag-coding sa pagsusuri at pagproseso ng data at mga istatistika ang mga pangunahing kasanayan na gagawing isang siyentipiko ng data bilang isang matatag na kandidato o empleyado," sabi ni Val Streif sa Pramp, isang online na platform ng panayam sa panayam para sa mga inhinyero ng software, mga developer at siyentipiko ng data. "Habang ang ilan sa mga kasanayan sa programming ay maaaring alagaan sa pamamagitan ng pagpapares ng isang scientist ng data sa isang developer, mas madali kung mayroon kang parehong mga kasanayan na pinagsama sa isa, mula sa pananaw ng isang kumpanya."

Ang iba pang mga eksperto ay nagdagdag ng R, Hadoop, Spark, Sas at Java sa listahan pati na rin ang mga teknolohiya tulad ng Tableau, Hive at MATLAB.

Ang lahat ng mga ito ay gumawa para sa isang kahanga-hangang resume, ngunit ang ilan sa mga nakaranas ng pangangalap ng mga siyentipiko ng data ay nagsabi ng iba pang mga bagay na "tao". (Isang uri ng data ng siyentipiko ay ang scientist data data ng mamamayan. Matuto nang higit pa sa The Role of Citizen Data Scientists sa Big Data World.)

"Ayon sa kaugalian, ang mga indibidwal na may magkakaibang edukasyon sa liberal arts ay gumagawa ng mahusay na mga siyentipiko ng data," sabi ni Burgoyne, na gumawa ng pagkakaiba sa pagitan ng mga inhinyero, na nasa gilid ng gusali, at siyentipiko ng data, na ang gawain ay maaaring maging mas konseptuwal. Pinagpatuloy niya:

Ang kadalubhasaan sa isang tradisyunal na patlang ng STEM na may pantulong na pokus sa mga humanities, arts o mga domain ng negosyo ay nagbubunga ng mga katangiang ito na gumawa ng isang mahusay na siyentipiko na nakatuon sa industriya. Dapat sabihin na ito ay kasinghalaga ng kakayahan ng samahan na magamit ang mga katangiang iyon at hubugin ang kanilang mainit at pamamaraan sa isang produktibong paraan. Napansin ko na kapag ang isang inisyatibo sa agham ng data ay hindi matagumpay, ang samahan ay malamang na maging sanhi ng mga siyentipiko. Ang mga siyentipiko ay hindi mga inhinyero. Hindi sila hinihimok na magpatupad at magtayo. Hinihimok sila upang matuklasan at maunawaan. Ang mga samahan na nakakaunawa sa pagkakaiba-iba na ito ay mahusay na gantimpala para sa paglilinang ng parehong mga patlang.

Tulad ng para sa kung ano ang karaniwang ginagamit ng mga siyentipiko sa kanilang sarili, na may kinalaman sa mga pangunahing layunin ng kumpanya. Ang ilang mga kumpanya ay hinahabol ang isang desentralisadong internet - ang ilan ay naglalaro sa IoT o SaaS. Ang iba ay sinusubukan na magpayunir ng "user-friendly" o "etikal" o "transparent" AI.

Sa anumang kaso, ang mga siyentipiko ng data ay malamang na i-bridging ang paghati sa pagitan ng mga mahirap na sukatan sa data na ginagamit nila, sa anupamang teknolohiya na ito ay nilalaro, at ang freewheeling na gawain ng pag-conceptualize ng pag-andar ng AI / ML.

"Nag-upa kami ng mga siyentipiko ng data upang pamahalaan ang pagkolekta at paglilinis ng data, pati na rin ang pagsasalin ng data na iyon sa makabuluhang impormasyon," sabi ni Michael Hupp, Tagapamahala ng Data Science at Analytics sa G2 Crowd. Ipinaliwanag niya:

Kadalasan nangangahulugang nangangahulugan ito ng pamamahala ng anumang mahahalagang algorithm sa pagmamaneho ng data ng data ng isang kumpanya at mahusay na magaling sa mga pangunahing tool ng analytics at wika, ngunit sa mga nakaraang taon ay nagsasama rin ng mga umuusbong na patlang tulad ng natural na pagproseso ng wika, pag-aaral ng makina, iba pang mga anyo ng pagtatasa na pinagana ng AI. Ang pinakamatagumpay na mga siyentipiko ng data ay ang mga pinagsama ang kanilang matitigas na kasanayan na may kakayahang matuto nang mabilis, at ang kakayahang epektibong makipag-usap sa mga pananaw na kanilang natuklasan upang maging makabuluhan ang kanilang negosyo.

Sa ganitong mga uri ng pananaw, mas madali para sa mga batang propesyonal o mag-aaral na malaman kung ang data ng siyentipiko ay isang mabuting papel para sa kanila, at kung paano makakuha ng mga kasanayan. Ang pag-aaral ng STEM ay nagiging mas naa-access sa mga paaralan sa buong bansa, ngunit walang kapalit ng isang pagnanasa sa coding at teknolohiya, at ang kakayahang matuto nang mabilis.