Data Scientists: Ang Bagong Bituing Bituin ng Tech World

May -Akda: Robert Simon
Petsa Ng Paglikha: 24 Hunyo 2021
I -Update Ang Petsa: 1 Hulyo 2024
Anonim
The Book of Enoch Banned from The Bible Reveals Shocking Secrets Of Our History!
Video.: The Book of Enoch Banned from The Bible Reveals Shocking Secrets Of Our History!

Nilalaman


Pinagmulan: Onradio / iStockphoto

Takeaway:

Ang papel ng siyentipiko ng data ay mabilis na nagiging pinaka hinahangad ng karera ng mundo ng teknolohiya. Tinanong namin ang nangungunang siyentipiko ng data na si Jake Porway mula sa The New York Times tungkol sa kung paano niya nakuha ang kanyang trabaho, at ang kanyang mga tip para sa tagumpay sa larangan.

Ang papel ng siyentipiko ng data ay mabilis na nagiging pinaka hinahangad na karera sa mundo ng teknolohiya. Ang mga kumpanya tulad ng Google,, Amazon at LinkedIn ay gumagamit ng mga siyentipiko ng data upang matulungan silang mapanatili ang makabagong gilid sa panahon ng digital data. At ngayon ang mga mahilig sa data at teknolohiya ay nagnanais na maging mga siyentipiko ng data sa parehong paraan na nais ng ilang mga musikero na maging mga bituin ng bato. Marahil kung bakit ang ilang mga tao ay tinutukoy ang mga siyentipiko ng data bilang bagong mga bituin ng bato sa panahon ng teknolohiya.


Sa kasamaang palad, ang papel na ito ay pa rin bago upang ang mga theres ay pa rin ng isang antas ng pagiging malalim tungkol dito, na nangangahulugang maraming mga wannabe data na siyentipiko ang nagmamaneho sa kanilang mga bus na bumaba sa maling kalsada. Nararapat ba ang mga datos na siyentipiko sa kanilang reputasyon sa rock star? Sumisid kami sa mundo ng agham ng data na may pakikipanayam kay Jake Porway, ang scientist ng data mula sa lab ng R&D sa The New York Times.

Data Scientists: Mga Bituin ng Tech ng Rock?

Kaya bakit tinukoy ang mga siyentipiko ng data bilang bagong mga bituin ng rock ng mundo ng teknolohiya? Ang pagkakatulad na ito ay talagang napupunta mas malalim kaysa sa mga data ng nerds na nais na tunog ng ultracool. Tulad ng isang rock star, ang karera ng mga siyentipiko ng data ay may kasamang pagkakaiba-iba, kalayaan sa artistikong at kakayahang umangkop. At tulad ng mga bituin ng rock sa mundo ng libangan, ang pinakamahusay na data ng mga siyentipiko ay may posibilidad na makakuha ng isang pagsunod sa mga tao mula sa lahat ng mga lakad ng industriya ng data at teknolohiya.


Ang ginagawa ng isang siyentipiko ng data ay napaka-magkakaibang; tulad ng mga musikero na gumagamit ng iba't ibang mga instrumento, tool at diskarte upang i-play ang mga estilo ng musikal na naiiba bilang jazz at metal na kamatayan, ang isang datos na siyentipiko ay namumuno din sa isang partikular na tool at larangan. Kasama rin sa istilo ng Theres. At walang tama o maling paraan ng paggawa ng trabaho - ito ay tungkol sa epekto ng trabaho sa ibang tao.

Kapag sinulat ng Beatles ang kanilang mga kanta, hindi lamang isang tao ang nagdidikta kung paano ang bawat tala sa bawat instrumento ay dapat i-play. Nagsama sila at nag-jam; sa pamamagitan ng malikhaing pagtuklas ay natagpuan nila ang mga kanta na nagtrabaho. Ang parehong para sa mga siyentipiko ng data. Kailangang madama nila ang ritmo, makapasok sa uka at magkakasundo ng isang solusyon. Posible lamang ito sa tamang dami ng artistikong kalayaan upang subukan ang anumang mga diskarte, mga tool at pamamaraan na maaaring isipin sa sandaling ito - at ang liksi na gumawa ng mga pagbabago kapag ang isang bagay ay tila walang susi.

Sa sandaling ang isang data ng siyentipiko ay nagmamay-ari ng pangunahing mga pundasyon, siya ay nagiging agpang, at nakakakuha ng kumpiyansa na magbigay ng mga solusyon sa iba pang mga larangan. Marami pa kaming napag-uusapan tungkol sa mga pangunahing pundasyong ito sa paglaon. Ang puntong dapat gawin dito ay sa sandaling master mo ang agham ng data maaari mong gawin ang papel sa anumang larangan na gusto mo, dahil ang data ay saanman.

Ang pangunahing layunin ng isang siyentipiko ng data ay upang lumikha ng napakalaking halaga para sa pinakamalaking bilang ng mga tao na posible. Habang ang isang data na siyentipiko ay gumagana sa likod ng mga eksena, hindi tulad ng pag-play sa isang malaking madla: Ang mas mahusay na gawin mo ang trabaho, mas maraming mga tao na maabot mo - at mas maraming mga gantimpala na nakikita mo.

Ang Mga Data Scientists Gumagawa Ano?

Kaya ano ang ginagawa ng mga siyentipiko ng data? Hinahayaan itong dumaan sa isang halimbawa na maaari nating maiugnay sa lahat.

Walang Mga bug, Walang Stress - Ang Iyong Hakbang sa Hakbang Patnubay sa Paglikha ng Software na Pagbabago ng Buhay nang Walang Pagsira sa Iyong Buhay

Hindi mo maaaring mapabuti ang iyong mga kasanayan sa pag-programming kapag walang nagmamalasakit sa kalidad ng software.

Hinahayaan mong sabihin na napagtanto mo sa isang araw na wala kang parehong lakas sa araw na dati mong. Kaya't itinakda mo ang iyong sarili ng isang layunin: upang magkaroon ng mas maraming enerhiya sa araw. Ngayon, iyon ay isang medyo malawak at hindi maliwanag na layunin. Kaya ang unang hakbang bilang isang siyentipiko ng data ay upang alisin ang ilan sa kalabuan at sukatin ang nasusukat na mga layunin na ito. May mga pamamaraan para dito. Hindi namin sinasadya ang mga detalye dito, ngunit hinahayaan lamang nating sabihin na hindi ka nakakakuha ng sapat na pagtulog at sa gayon ay bigyan ang iyong sarili ng sub-layunin na makakuha ng walong oras ng pagtulog bawat gabi.

Kahit na ang layuning ito ay medyo masusukat at hindi gaanong kalabuan, mayroon itong sariling mga hamon. Hindi ka maaaring magsimula ng isang timer sa sandaling makatulog ka, at kahit na magsisimula ka ng isang timer pagkatapos matulog ka sa kama, maaaring hindi ka makatulog kaagad. Bilang karagdagan, mahirap na account para sa mga oras na gumising ka sa kalagitnaan ng gabi. Sa wakas, may iba't ibang uri ng pagtulog, tulad ng malalim na pagtulog at banayad na pagtulog. Ang ilalim ay ang mahirap na masukat nang tumpak ang pagtulog at samakatuwid ay mas mahirap upang masukat ang epekto nito sa iyong mga antas ng enerhiya.

Kaya ano ang maaari mong gawin? Well, bilang isang scientist data na hahanapin mo ang pinakabagong sa teknolohiya at tuklasin na may mga aparato sa pagsubaybay sa pagtulog.At kung ginamit mo ang naturang aparato upang masukat at awtomatikong maitala ang iyong pagtulog, makakakuha ka ng mas tumpak na data tungkol sa iyong pagtulog, at kolektahin ang data na iyon sa paglipas ng panahon upang magplano ng isang graph.

Ito lamang ang maaaring magbigay sa iyo ng higit na pananaw sa kung ano ang nangyayari. Ang visual na representasyon ay magbibigay sa iyo ng kamalayan, kaliwanagan at direksyon. Magagawa mong makita kung naabot mo ang iyong layunin ng walong oras ng pagtulog sa isang gabi at, mas mahalaga, magawa mong gawin kung hindi ka.

Ito ang pangunahing trabaho ng siyentipiko ng data: na magdala ng mga bagong paraan ng pagsukat at pagpapakita ng data upang mas maraming kamalayan, kaliwanagan at direksyon ang maibigay sa mga tumitingin dito.

Ngunit ang isang mahusay na siyentipiko ng data ay hindi titigil doon. Kapag nakolekta ang data, maaari itong maisama sa anumang iba pang sinusukat na aktibidad na ginagawa mo sa buong araw. Isama ito sa iyong pagiging produktibo batay sa data mula sa iyong sistema ng pamamahala ng gawain. Isama ito sa iyong mga mood batay sa mga tweet at pag-update ng katayuan. Isama ito sa iyong kalusugan batay sa mga pagbisita sa gym o pagbaba ng timbang. Gamit ang dami ng data na magagamit at ang kadalian kung saan maaari itong makuha, ang mga posibilidad ay walang katapusang.

Paano Maging isang Scientist ng Data

Interesado sa isang karera sa agham ng data? Dahil ang agham ng data ay bago, tinanong namin ang isang nangungunang siyentipiko ng data para sa pananaw sa larangan. Si Jake Porway ay isang siyentipiko ng data sa The New York Times at ang nagtatag ng DataKind (orihinal na kilala bilang Data Walang Hangganan), na tumutugma sa mga hindi pangkalakal na nangangailangan ng agham ng data na may freelance at mga siyentipiko na pro-bono na data. Si Porway ay may background sa science sa computer at isang Ph.D. sa mga istatistika mula sa UCLA. Tumingin sa kung ano ang kailangan niyang sabihin tungkol sa kung paano makapasok sa agham ng data, kung paano magaling nang mahusay, at kung paano maiwasan ang mga pangunahing pagkakamali sa larangan.

1. Kunin ang Tamang Mga Kasanayan

Ayon kay Porway, ang pagpasok sa bukid ay kumukulo sa tatlong pangunahing bagay:

  • Praktikal na kasanayan sa pag-compute
  • Mga kasanayan sa istatistika
  • Isang pagnanais na matuto

"Kailangan mong magsulat ng mga script upang mag-scrape ng data pati na rin ang code up ang mga algorithm na iyong nilagay," sabi ni Porway. "Dapat mong malaman ang iyong pangunahing mga istatistika (at higit pa, sa isip) kung ikaw ay pagpunta sa talagang magagawang upang masuri kung ang mga modelo na youre building o algorithm na iyong isinusulat ay ginagawa kung ano ang gusto mo."

2. Gumawa ng Mga Koneksyon

Bago sumali sa The New York Times R&D lab, si Porway ay nagtrabaho sa pag-aaral ng makina at pangitain sa computer, at gumugol ng maraming oras sa pagkuha ng mga robot upang matukoy ang mga landmines at fly eroplano (gaano kahusay na?). Ito ay hanggang sa siya ay mapunta sa kanyang trabaho sa The New York Times na nakuha niya upang mapalawak sa mas malawak na mga gawain sa agham ng data, lalo na ang Project Cascade, na sumusubaybay sa mga link mula sa publikasyon sa buong social media.

Ang pinakamahalagang bagay na makukuha sa bukid, sabi ni Porway, ay upang makakuha ng pagkatuto.

"Kumuha ng isang proyekto sa agham ng data!" Sabi ni Porway. "I-download ang ilang data, kunin ang ilang R, at simulang maglaro ... Sasabihin kong mag-focus sa paggamit ng isang bagay tulad ng R sa tabi ng isang pangunahing libro ng stats upang gabayan ka sa paggalugad ng ilang mga data. Ang pag-aaral ng makina at mga kasanayan sa computing ay darating kasama na (ng kurso ito ay nakasalalay sa iyong nakaraang karanasan - kung ikaw ay isang istatistika, pumili ng ilang Python!) "

Pagkatapos nito oras upang gumawa ng ilang mga koneksyon. Inirerekomenda ni Porway ang isang lokal na pangkat ng pulong - dahil ang pagiging bahagi ng data sa komunidad ng agham ay "ang pinakamabilis na paraan upang malaman kung ano ang hindi mo alam." At sa isang patlang na patuloy na nagbabago, mahalaga.

3. Kumuha ng Laro

Si Porway ay may Ph.D. sa mga istatistika mula sa UCLA, ngunit binibigyang diin niya na hindi mo kailangan ang isa upang gumawa ng mabuting gawain.

"Maaaring makatulong ito, ngunit huwag isipin na kailangan mong umalis at gumawa ng isa pang limang taon ng paaralan upang matawag ang iyong sarili ng isang siyentipiko ng data," sabi ni Porway.

Ang agham ng data ay medyo bagong larangan. Nangangahulugan ito na ang mga nais pumasok sa bukid ay kailangang lapitan ito nang may bukas na kaisipan.

"Ang isang siyentipiko ng data sa Foursquare ay magmukhang magkakaiba mula sa isang scientist ng data sa Goldman Sachs," sabi ni Porway.

4. Bato ang Iyong Bagong Papel

Ang agham ng data ay tungkol sa paglilinaw ng mga layunin, pagsusuri ng mga pagpapalagay, pagsusuri ng ebidensya at pagtatasa ng mga konklusyon. Ngunit ang isa sa isang maliit na piraso ng puzzle na maraming mga tao ay hindi makaligtaan. Maaari mong hulaan kung ano ito? Ayon kay Porway, ang sikretong sangkap ay kritikal na pag-iisip.

"Talagang pinaghiwalay ang mga hacker mula sa tunay na mga siyentipiko, para sa akin," sabi ni Porway. "Ikaw ay namangha sa kung gaano karaming beses nakita ko ang isang tao na nagtatayo ng isang modelo at naiulat ang mga resulta nang hindi napagtanto na hindi nila naisip na kritikal ang tungkol sa kung saan nagmumula ang data o kung ang kanilang eksperimento ay dinisenyo nang tama. Dapat mong DAPAT na makapag-tanong sa bawat hakbang ng iyong proseso at bawat bilang na iyong nilalapitan. "

Ang Daan sa Malalaking Data

Sinabi ni Porway nang mapagtanto niya ang kakayahang gumamit ng malawak na dami ng data upang magkaroon ng mga machine na magturo sa kanilang sarili, pumutok ito sa kanyang isipan. Ito ang pagnanasa - at ang kanyang edukasyon at kasanayan - na nakatulong upang mapunta sa kanya ang isang nangungunang trabaho sa agham ng data. Kung nais mong i-rock ang malaking data, mangangaso ng ilang mga libro, mag-download ng ilang data at simulang maglaro sa paligid. Hindi mo alam kung ano ang magiging isang tumpok ng hilaw na data.

Para sa isang buong transcript ng pakikipanayam, pumunta sa DataScientists.Net.