Data Science o Pag-aaral ng Machine? Paano Makita ang Pagkakaiba

May -Akda: Laura McKinney
Petsa Ng Paglikha: 3 Abril 2021
I -Update Ang Petsa: 1 Hulyo 2024
Anonim
Lotus-Born Master: The Shambhala Access Code || Guru Padmasambhava, Guru Rinpoche ||
Video.: Lotus-Born Master: The Shambhala Access Code || Guru Padmasambhava, Guru Rinpoche ||

Nilalaman


Pinagmulan: Elnur / Dreamstime.com

Takeaway:

Ang agham ng data at pag-aaral ng makina ay magkakaiba sa mga pangunahing paraan. Sa ilang mga paraan, ang isa ay makikita bilang isang subset ng iba pa. Parehong mahalaga sa kasalukuyang pag-unlad ng IT.

Sa bagong mundo ng artipisyal na katalinuhan at pamamahala ng data, madali itong malito sa ilang mga termino na kadalasang ginagamit sa mundo ng IT.

Halimbawa, ang data sa agham at pag-aaral ng makina ay may maraming dapat gawin sa bawat isa. Hindi kataka-taka na maraming mga tao na may lamang kaalaman sa mga disiplina na ito ang magkakaroon ng problema sa pag-isip kung paano sila naiiba sa isa't isa.

Narito ang pinakamahusay na paraan upang paghiwalayin ang agham ng data mula sa pag-aaral ng makina, bilang isang prinsipyo at bilang diskarte sa teknolohikal.

Data Science at Machine Learning: Malawak at Makitid na Pamantolohiya

Una sa lahat, ang agham ng data ay talagang isang malawak, overarching kategorya ng teknolohiya na sumasaklaw sa maraming iba't ibang uri ng mga proyekto at likha. (Para sa higit pa sa kung ano ang kasangkot sa isang trabaho sa agham ng data, tingnan ang Role ng Trabaho: Data Scientist.)


Ang agham ng datos ay mahalagang kasanayan ng pagtatrabaho sa malaking data. Lumitaw ito bilang batas ng Moore at paglaganap ng mas mahusay na mga aparato sa imbakan na humantong sa napakalaking dami ng data na nakolekta ng mga kumpanya at iba pang mga partido. Pagkatapos, ang mga malalaking platform ng data at tool tulad ng Hadoop ay nagsimulang muling tukuyin ang computing sa pamamagitan ng pagbabago kung paano gumagana ang pamamahala ng data. Ngayon, na may cloud at containerization pati na rin ang mga bagong modelo, ang malaking data ay naging isang pangunahing driver ng mga paraan na tayo ay nagtatrabaho at nabubuhay.

Sa pinakasimpleng anyo nito, ang agham ng data ay ang paraan na pinamamahalaan namin ang data na iyon, mula sa paglilinis nito at pinuhin ito upang magamit ito sa anyo ng mga pananaw.

Ang kahulugan ng pag-aaral ng makina ay mas makitid. Sa pag-aaral ng makina, kinukuha ng mga teknolohiya ang data at inilalagay ito sa mga algorithm, upang gayahin ang mga proseso ng kognitibo ng tao na inilarawan bilang "pag-aaral." Sa madaling salita, ang pagkuha ng data at sinanay dito, ang computer ay nakapagbibigay ng sariling mga resulta , kung saan ang tila teknolohiya ay natutunan mula sa mga proseso na inilagay ng mga programmer.


Data Science at Machine Learning Skills Sets

Ang isa pang paraan upang maihambing ang data sa agham at pag-aaral ng makina ay ang pagtingin sa iba't ibang mga kasanayan na pinaka-mahalaga para sa mga propesyonal sa alinman sa mga larangan na ito.

Walang Mga bug, Walang Stress - Ang Iyong Hakbang sa Hakbang Patnubay sa Paglikha ng Software na Pagbabago ng Buhay nang Walang Pagsira sa Iyong Buhay

Hindi mo maaaring mapabuti ang iyong mga kasanayan sa pag-programming kapag walang nagmamalasakit sa kalidad ng software.

Mayroong isang pangkalahatang pinagkasunduan na nakikinabang ang mga siyentipiko ng malalim na kasanayan sa pagsusuri at matematika, karanasan sa kamay kasama ang mga teknolohiya sa database, at kaalaman sa mga programming language tulad ng Python o iba pang mga pakete na ginagamit para sa pag-parse ng malaking data.

"Ang sinumang interesado sa pagbuo ng isang malakas na karera sa (data science) ay dapat makakuha ng mga pangunahing kasanayan sa tatlong kagawaran: analytics, programming at domain kaalaman," sulat ni Srihari Sasikumar sa Simplilearn. "Ang pagpunta sa isang antas ng mas malalim, ang mga sumusunod na kasanayan ay makakatulong sa iyo na mag-ukit ng isang angkop na lugar bilang isang siyentipiko ng data: Malakas na kaalaman ng Python, SAS, R (at) Scala, karanasan sa kamay sa coding ng SQL database, kakayahang magtrabaho kasama ang hindi nakaayos na data mula sa iba't ibang mga mapagkukunan tulad ng video at social media, nauunawaan ang maraming mga pag-andar ng analitikal (at) kaalaman sa pag-aaral ng makina. "

Sa panig ng pag-aaral ng makina, madalas na binabanggit ng mga eksperto ang mga kasanayan sa pagmomolde ng data, kaalaman at kaalaman sa istatistika, at mas malawak na mga kasanayan sa pagprograma bilang kapaki-pakinabang na tool sa toolkit ng machine learning engineer.

Paano Makita ang Pag-aaral ng Machine

Ang susi dito ay ang lahat ng mga uri ng mga bagay ay binubuo ng data science work, ngunit hindi ito pag-aaral ng makina maliban kung mayroon kang isang mahigpit na regimen na naka-set upang matulungan ang computer na matuto mula sa mga input nito.

Kapag nasa lugar na ito, gumagawa ito para sa ilang mga nakakagulat na may kakayahang mga system na maaaring magkaroon ng malawak na epekto sa ating buhay.

"Karamihan sa kung ano ang ginagawa namin sa pag-aaral ng makina ay nangyayari sa ilalim ng ibabaw," ang tagapagtatag ng Amazon na si Jeff Bezos ay naiulat na sinabi, itinuro ang ilan sa mga aplikasyon ng mga ganitong uri ng mga system. "Ang pag-aaral ng makina ay nagtutulak ng aming mga algorithm para sa pagtataya ng demand, pagraranggo sa paghahanap ng produkto, produkto at deal na mga rekomendasyon, mga pagkakalagay sa paninda, pag-alis ng pandaraya, pagsasalin, at marami pa. Kahit na hindi gaanong nakikita, ang karamihan sa epekto ng pag-aaral ng makina ay magiging sa ganitong uri - tahimik ngunit makabuluhang pagpapabuti ng mga pangunahing operasyon. "

Isa sa mga pinaka-kapaki-pakinabang na halimbawa dito ay ang paglitaw ng neural network - ito ay karaniwang at tanyag na pamamaraan ng pag-set up ng mga proseso ng pag-aaral ng machine.

Sa pinaka batayang anyo nito, ang neural network ay binubuo ng mga layer ng mga artipisyal na neuron. Ang bawat indibidwal na artipisyal na neuron ay may katumbas na pag-andar na katumbas ng isang biological neuron - ngunit sa halip na mga synapses at dendrites, mayroon itong mga input, isang pag-andar ng pag-activate at panghuling output.

Ang neural network ay ginawa upang kumilos tulad ng isang utak ng tao, at ang mga propesyonal sa pag-aaral ng machine ay madalas na gumagamit ng modelong ito upang lumikha ng mga resulta ng pagkatuto ng makina.

Gayunpaman, hindi iyon ang tanging paraan upang gawin ang pag-aaral ng makina. Ang ilan pang mga mas maingat na proyekto sa pag-aaral ng makina ay kasama lamang ang pagpapakita ng isang computer ng isang malawak na hanay ng mga litrato (o paglalagay nito sa iba pang mga hilaw na data), pag-input ng mga ideya sa pamamagitan ng proseso ng paggamit ng pinangangasiwaang pag-aaral ng makina at label ng data, at ang pagkakaroon ng computer sa huli ay maaring magkakaiba sa pagitan ng iba't ibang mga hugis o item sa isang visual na larangan. (Para sa mga pangunahing kaalaman sa pagkatuto ng makina, tingnan ang Pag-aaral ng Machine 101.)

Dalawang Disiplina ng Pagputol

Sa konklusyon, ang pag-aaral ng makina ay isang mahalagang bahagi ng agham ng data. Ngunit ang agham ng data ay kumakatawan sa vaster na hangganan at ang con kung saan nagaganap ang pagkatuto ng makina.

Sa isang paraan, maaari mong sabihin na ang pag-aaral ng makina ay hindi mangyayari nang walang malaking data. Ang malaking data mismo ay hindi lumikha ng pag-aaral ng makina, bagaman - sa halip, pagkatapos na magkasama kaming pinagsama-sama ng maraming data na halos hindi namin alam kung ano ang gagawin dito, ang mga nangungunang pag-iisip ay dumating sa mga prosesong ito ng bio-simulate bilang isang napakalaking paraan ng pagbibigay ng mga pananaw.

Ang isa pang magandang bagay na dapat tandaan dito ay ang agham ng data ay maaaring mailapat sa dalawang pangunahing paraan - maaari nating yakapin ang pag-aaral ng makina at artipisyal na katalinuhan, na ipaalam sa amin ang mga computer na maiisip, o maaari nating ibalik ang agham ng data sa isang mas nakatuon na diskarte ng tao ang computer ay nagtatanghal ng mga resulta at kami bilang mga tao ay gumawa ng mga pagpapasya.

Iyon ang nangunguna sa ilang mga dalubhasa, kasama na ang ilan sa mga nangungunang tagabuo ngayon, upang tumawag para sa mas masigla na accounting ng mga paraan kung saan ginagamit namin ang mga teknolohiyang ito.

"Ang AI (ay may kakayahan na higit pa kaysa sa halos alam ng sinuman at ang rate ng pagpapabuti ay may kakayahang umunlad," ang Elon Musk ay sinipi na sinasabi, habang binabalaan ang pag-aaral ng makina at mga programa ng AI ay nangangailangan ng pangangasiwa.

Sa anumang kaso, ang parehong data science at machine learning ay mga pangunahing bahagi ng pag-unlad na ginagawa natin bilang mga lipunan na ginagawa sa teknolohiya ngayon.