I-embed ang Analytics Kahit saan: Paganahin ang Citizen Data Scientist

May -Akda: Lewis Jackson
Petsa Ng Paglikha: 12 Mayo 2021
I -Update Ang Petsa: 23 Hunyo 2024
Anonim
15 Best Sites to Apply for Data Encoder Jobs
Video.: 15 Best Sites to Apply for Data Encoder Jobs

Takeaway: Tinatalakay ng Host Rebecca Jozwiak ang kababalaghan ng naka-embed na analytics at data ng mamamayan ng mga siyentipiko kasama sina Dr. Robin Bloor, Dez Blanchfield at David Sweenor.



Dapat kang magparehistro para sa kaganapang ito upang matingnan ang video. Magrehistro upang makita ang video.

Rebecca Jozwiak: Mga kababaihan at mga ginoo, kumusta at maligayang pagdating sa Hot Technologies. "I-embed Kahit saan: Paganahin ang Citizen Data Scientist" ang aming paksa ngayon. Pinupunan ko para sa iyong karaniwang host, ito ay Rebecca Jozwiak na pinupunan para kay Eric Kavanagh. Oo, mainit ang taong ito. Lalo na ang salitang "siyentipiko ng data" ay nakakakuha ng maraming pansin kahit na ginamit namin ang tawag sa kanila na mga pangalan ng pagbubutas tulad ng "estadistika" o "eksperto sa analytics," medyo nakikipag-tackle sa parehong uri ng mga aktibidad ngunit nakakakuha ito ng isang bagong bagong pangalan at ito ay nakakakuha ng maraming pansin. Lubos silang kanais-nais na magkaroon sa lugar ng trabaho, kapaki-pakinabang sa samahan, at nais ng lahat. Ngunit ang mga ito ay: 1) mahal, 2) mahirap hanapin. Alam mo, ang lahat ay nasa buong balita tungkol sa kakulangan sa kasanayan ng siyentipiko ng data, oo, ngunit nag-aalok pa rin sila ng napakalaking halaga sa samahan at ang mga tao ay uri ng pag-clamoring upang malaman kung paano makukuha ang halagang iyon nang hindi kinakailangang i-drop ang dime, kaya sa magsalita


Ngunit ang mabuting balita ay nakikita natin ang mga tool at software na lumalabas na uri ng compensating para sa kakulangan na iyon. Mayroon kaming automation, pag-aaral ng makina, naka-embed na analytics, na kung ano ang matututunan natin tungkol sa ngayon, at ito ay uri ng naibangon sa bagong term na ito, "ang scientist data data ng mamamayan," at ano ang ibig sabihin nito? Hindi, hindi ito iyong bihasang siyentipiko ng data, maaaring maging iyong gumagamit ng negosyo, iyong dalubhasa sa BI, isang tao mula sa IT, isang taong may background ngunit marahil hindi kinakailangan ang kadalubhasaan.Ngunit kung ano ang ginagawa nito, ang mga tool na ito at software, ay nagbibigay sa mas maraming mga tao ng pag-access sa mga matalinong solusyon kahit na hindi nila alam ang malalim na coding. Ngunit nakakatulong lamang ito na mapabuti ang pangkalahatang pagganap kapag binigyan mo ang lahat ng kaunti pang pag-access sa pag-iisip na iyon. Hindi mo kailangang magkaroon ng pagsasanay na kinakailangang magkaroon ng uri ng pag-usisa na maaaring humantong sa magagandang pananaw para sa iyong kumpanya.


Tinatalakay na sa amin ngayon ay ang aming sariling Robin Bloor, pinuno ng analyst sa Bloor Group, isa sa mga mailap na mga siyentipiko ng data, si Dez Blanchfield ay tumatawag, at pagkatapos ay mayroon kaming David Sweenor mula kay Dell Statistica ay bibigyan kami ng isang pagtatanghal ngayon. At kasama ko itong ipapasa kay Robin Bloor.

Robin Boor: Okay, salamat sa pagpapakilala na iyon. Uri ako ng pag-iisip tungkol dito sa isang makasaysayang con. Ang tinitingnan natin dito ay isa sa mga disenyo ni Leonardo da Vinci para sa isang uri ng glider na maaaring ilagay sa kanya ng isang tao. Wala akong ideya kung ito ay talagang gumagana. Hindi ako papasok, kailangan kong sabihin. Gayunman, da Vinci, sa tuwing naiisip ko ang tungkol kay da Vinci, iniisip ko siya bilang isa sa mga pinaka matanong at analytical na mga tao na dati nang umiiral. At malinaw na kung titingnan mo lamang ang glider na ito ay dinisenyo batay sa isang pakpak ng isang ibon at mayroon siyang isang paraan o pinag-aralan ng isa pa ang mga paglipad ng mga ibon upang mabuo ito.

Kung kukuha tayo ng makasaysayang pananaw - talagang tinignan ko ito - ang analytics ay marahil ang pinakalumang aplikasyon ng matematika. Mayroong mga census sa petsang iyon hanggang sa mga panahon ng Babilonya. Alam namin ang tungkol dito dahil sa karaniwang may ilang mga cuneiform tablet na may data tulad nito. Hindi alam kung mayroong anumang bagay na bumalik. Ngunit ang maliwanag na bagay ay nakuha mo ang iyong sarili na isang sibilisasyon na may isang malaking populasyon ng mga tao, talagang nangangailangan ito ng pagpaplano at sulit na malaman kung ano ang iyong pinaplano at kung ano talaga ang mga kinakailangan ng mga taong iyon.

At iyon ang uri kung saan ito nagsimula at narito rin kung saan nagsimula ang pag-compute dahil ang mga unang computer, ang maagang mechanical computer, ay sa palagay ko, ang una ay ang census na nilikha ni Hollerith, na naging IBM, naniniwala ako. Ang lahat ng ito ay sumulong. Nagkaroon ng ilang uri ng pagkakasali sa pagitan ng marahil sa mga 1970 at sa kasalukuyan, kung saan mayroong isang malaking bilang ng iba pang mga aplikasyon at analytics, maaari mong sabihin, kumuha ng isang upuan sa likod. Oo, nagkaroon ng analytics na nangyayari - nangyayari ito sa mga malalaking organisasyon, lalo na sa mga bangko at kumpanya ng seguro, at talagang General Electric at telco at mga bagay na tulad nito - ngunit hindi ito karaniwang ginagamit sa buong negosyo at ngayon nagsisimula itong masanay sa pangkalahatan sa buong negosyo. At binago nito ang laro, talaga. Ang unang bagay na naisip ko na iguguhit ko ang pansin ay ang data pyramid, na gusto ko lalo. Ito ay, ang ibig kong sabihin, iginuhit ko ang isa sa mga 20 taon na ang nakakaraan - hindi bababa sa 20 taon na ang nakakaraan - upang subukan at maunawaan, talaga, sa oras na iyon, sinubukan kong maunawaan ang BI at ang ilan sa mga naunang pagmimina ng data na ginagawa. Ang tinukoy ko dito ay ang ideya ng data at ang mga halimbawa ay mga senyas, pagsukat, pag-record, mga kaganapan, transaksyon, kalkulasyon, pagsasama-sama, mga indibidwal na punto ng impormasyon. Maaari mong isipin ang mga ito bilang mga molekula ng impormasyon, ngunit sila ay mga indibidwal na puntos. Nagiging impormasyon ito sa lalong madaling makakakuha ng con. Ang naka-link na data, nakabalangkas na data, database, visualization ng data, plotters, schemers, at ontologies - lahat sila ay kwalipikado sa aking isip bilang impormasyon sapagkat ang iyong nagawa ay pinagsama-samang maraming magkasama at lumikha ng isang bagay na higit pa sa isang punto ng data, isang bagay na talagang may hugis, isang hugis ng matematika.

Sa itaas na mayroon tayong kaalaman. Maaari nating, sa pamamagitan ng pagsusuri ng impormasyon, matututuhan natin na may iba't ibang mga pattern at maaari nating magamit ang mga pattern na iyon sa pamamagitan ng pagbabalangkas ng mga patakaran, patakaran, patnubay, pamamaraan, at pagkatapos ay kukuha ito ng anyo ng kaalaman. At halos lahat ng mga programa sa computer, kahit anong ginagawa nila, ay may kaalaman sa isang uri, dahil nagtatrabaho sila laban sa data at nag-aaplay ng mga patakaran sa kanila. Mayroon kaming tatlong mga patong na ito at may pagtaas ng pagpipino na nagpapatuloy sa pagitan ng mga layer. At sa kaliwang bahagi ng diagram na ito ay ipinakita mo ang mga bagong data na pumapasok, kaya maraming mga bagay na ito ay static. Ang data ay naiipon, ang impormasyon ay natipon at ang kaalaman ay maaaring lumago. Sa tuktok, mayroon kaming "Pag-unawa" at mapanatili ko, kahit na ito ay isang pilosopikal na argumento, ang pag-unawa ay nakatira lamang sa mga tao. Kung nagkamali ako tungkol doon, lahat tayo ay papalitan ng mga computer sa isang oras sa oras. Ngunit sa halip na magkaroon ng debate, magpapatuloy ako sa susunod na slide.

Nang tiningnan ko ito, ang nakawiwiling bagay, ito ay isang bagay kamakailan, ang kagiliw-giliw na bagay ay subukan at malaman kung ano talaga ang analytics. At sa huli sa pamamagitan ng pagguhit ng iba't ibang mga diagram at nagtatapos sa isang katulad nito, napunta ako sa konklusyon, sa aktwal na katunayan, ang pag-unlad ng analytics ay talagang pag-unlad ng software na may isang kakila-kilabot na halaga ng mga pormula sa matematika. Ang pagsaliksik ng analitikal ay medyo naiiba sa pag-unlad ng software sa kamalayan na talagang kumuha ka ng maraming, maraming iba't ibang mga modelo at mag-imbestiga sa kanila upang makabuo ng bagong kaalaman tungkol sa data. Ngunit kapag nabuo mo na ito, ipinatupad ang alinman sa inaakala kong suporta ng pasibo sa pasya, na ang impormasyon ay pinakain lamang sa isang gumagamit; suporta ng interactive na desisyon, na kung saan ay mga bagay tulad ng OLAP, kung saan ang gumagamit ay bibigyan ng isang nakaayos na hanay ng data na maaari nilang siyasatin at ibigay ang mga bagay para sa kanilang sarili gamit ang iba’t ibang magagamit na mga tool. Ang daming visualization ay ganyan. At pagkatapos ay mayroon kaming automation kung maaari mo lamang i-on ang ilang mga pananaw na analitikal na natipon ka sa isang set ng mga patakaran na maipapatupad, hindi mo kailangan ng isang tao na makasama. Iyon ang uri ng paraan na tiningnan ko ito nang gawin ko ang lahat. At iba't ibang mga bagay na nagsimula na mangyari sa akin. Kapag ang isang lugar ng aktibidad, dapat nating sabihin, sa sandaling ang isang domain ng data ay talagang mined, lubusan na mined, lubusang ginalugad sa bawat posibleng direksyon, sa kalaunan ay naging crystallized BI lamang ito. Ang kaalaman na naimbento ay nagsisimula upang maging kaalaman na nagpapaalam sa iba't ibang mga gumagamit sa iba't ibang paraan, at pinatataas ang kanilang kakayahan, sana, na talagang gawin ang gawaing kanilang ginagawa.

Isa sa mga bagay na napansin ko at tiningnan ko ang predictive analytics ng halos limang taon, ngunit ang mga nahuhulaan na analytics ay nagiging BI, sa kahulugan na ito ay nagiging kapaki-pakinabang na impormasyon upang mapakain sa mga tao at tulad ng naituro ko na, mayroong awtomatikong pag-uulat ng BI, BI explorative, BI, ibang-iba na mga gradasyon nito at ang mga nahuhulaan na analytics ay talagang pupunta sa lahat ng tatlong direksyon. At ang proseso ng analytical na itinuro ko ay hindi naiiba sa pag-unlad ng software, na ginagawa lamang ng iba't ibang mga tao na may bahagyang magkakaibang mga kasanayan. Ipagpalagay ko na dapat kong bigyang-diin na ang mga kasanayan na kinakailangan upang makagawa ng isang talagang mahusay na siyentipiko ng data ay tumagal ng mga taon upang makuha. Hindi nila madaling makuha at hindi isang malaking bilang ng mga tao ang magagawa nito, ngunit iyon ay sapagkat kasama nito ang pag-unawa sa matematika sa isang napaka sopistikadong antas upang malaman kung ano ang wasto at kung ano ang hindi wasto. Ang mga pagpapaunlad ng Analytics, pagtuklas ng bagong kaalaman, pagtatanim ng analytics, tungkol ito sa pagpapatakbo ng kaalaman. Iyon ang uri ng backdrop na nakikita ko sa kabuuan ng analytics. Napakalaki nitong lugar at marami, maraming mga sukat dito, ngunit sa palagay ko naaangkop ang pangkalahatan sa lahat.

Pagkatapos ay may pagkagambala sa negosyo, tulad ng nabanggit ko na mayroong isang bilang ng mga samahan, ang mga kumpanya ng parmasyutiko ay isa pa, na mayroon sa kanilang DNA mayroon silang mga analytics. Ngunit maraming mga samahan na talagang wala ito sa kanilang DNA, at mayroon na silang kakayahan, ngayon ang software at ang hardware ay mas mura kaysa sa dati, ngayon mayroon silang kakayahang magsamantala. Sasabihin ko ang isang bilang ng mga bagay. Ang unang bagay ay ang analytics ay, sa maraming mga pagkakataon na ito ay R&D. Maaari ka lamang mag-aplay ng mga analytics sa isang tukoy na lugar ng samahan at maaaring tila pangmatagalan na ikaw ay sa isang paraan o ibang pagsusuri sa mga order ng customer muli mula sa iba't ibang mga pananaw, pagsali dito sa iba pang data. Ngunit ang analytics ay talagang lumilikha ng posibilidad na tingnan ang organisasyon nang buo at upang masuri ang anumang partikular na aktibidad na nangyayari sa loob ng samahan at buong kadena ng mga aktibidad. Ngunit kapag talagang lumipat ka sa lugar na iyon, mapanatili kong pananaliksik at pag-unlad ito. At mayroong isang katanungan na tinanong ako ng ilang beses, na kung saan, "Magkano ang dapat gastusin ng isang kumpanya sa analytics?" At sa palagay ko ang pinakamahusay na paraan upang mag-isip tungkol sa pagbibigay ng sagot sa iyon ay mag-isip ng analytics bilang R&D , at itanong lamang, "Well magkano ang gugugol mo sa R&D sa lugar ng kahusayan ng negosyo?"

At ang mga negosyong hindi kasama ng analytics, maraming bagay na hindi nila alam. Una sa lahat, hindi nila alam kung paano ito gagawin. Karaniwan kung sila ay talagang pupunta sa isang paraan o ibang magpatibay ng analytics sa loob ng samahan - talagang talagang wala silang pagpipilian ngunit pumunta sa isang consultant na makakatulong sa kanila sa paggawa nito dahil, imposible o talagang mahirap para sa karamihan mga negosyo na talagang umarkila ng isang siyentipiko ng data, paghahanap ng isa, nagbabayad para sa isa, at talagang nagtitiwala sa kanila na gawin ang nais mong gawin. Napakahirap. Ang karamihan sa mga negosyo ay hindi alam kung paano mag-upa o turuan ang mga kawani upang aktwal na gawin ang gawaing ito, at ang dahilan para sa mga iyon ay wala pa sa kanilang DNA, kaya hindi ito bahagi ng kanilang mga natural na proseso ng negosyo. Ito feed sa susunod na punto. Hindi nila alam kung paano ito gagawing proseso ng negosyo. Pinakamahusay na paraan upang gawin iyon, sa pamamagitan ng paraan, ay upang kopyahin kung ano ang mga kumpanya ng parmasyutiko at mga kumpanya ng seguro, tignan lang, at ilang mga kumpanya sa health care center, tingnan lamang ang paraan na ginagamit nila ang analytics at kopyahin ito. Dahil ito ay isang proseso ng negosyo. Hindi alam kung paano ito i-pulis o i-audit ito. Iyon talaga, lalo na ngayon na isang kakila-kilabot na mga kumpanya ng software ang lumikha ng mga produkto na awtomatiko ang isang kakila-kilabot na maraming analytics. Ang punto tungkol sa pag-awdit ay mahalaga, kapag mayroon kang isang pagkonsulta o isang tao sa site na maaasahan upang maunawaan kung ano ang mga resulta ng anumang pagkalkula ng analitikal, iyon ay isang uri ng pagpipilian na kailangan mong gawin, ngunit kung inilalagay mo ang talagang malakas na mga tool na analitikal ang mga kamay ng mga taong hindi maunawaan nang wasto ang mga analytics, malamang na tumalon sila sa mga konklusyon na maaaring hindi tama. At tulad ng sinabi ko, ang mga kumpanya ay hindi alam kung paano badyet para dito.

Ito ang mga lasa ng analytics, tatakbo na lang ako. Ang analytics ng statistika at istatistika ng istatistika ay makabuluhang naiiba upang mahulaan ang analytics, na ang karamihan sa pamamagitan ng paraan ay angkop sa kurba. Ang pag-aaral ng makina ay naiiba sa mga bagay na iyon, ang path analytics at serye ng oras, na kung saan ay karaniwang ginagawa sa mga stream ng katayuan ay naiiba muli. Ang graphic analytics ay naiiba muli, at ang mga analytics at semantikong analytics ay naiiba muli. Itinuturo lamang nito na ito ay isang napaka bagay na multi-genre. Hindi, hindi ka magsisimulang gumawa ng mga analytics, nagsisimula kang tumingin sa mga problema na mayroon ka at hanapin ang iba't ibang mga tool at iba't ibang lasa ng analytics na angkop sa mga iyon. At sa wakas, ang net net. Dahil sa ebolusyon ng hardware at software, sa aking palagay ang analytics ay nasa pagkabata nito. Marami pa, marami pang darating at makikita natin itong magbukas sa mga darating na taon. Sa palagay ko maipapasa ko ang bola kay Dez ngayon.

Dez Blanchfield: Oo, pag-usapan ang isang matigas na kilos na dapat sundin, Robin. Bisitahin ko nang maikli ang paksang ito mula sa isa sa aking mga paboritong anggulo, na siyang anggulo ng tao. Maraming pagbabago ang nagaganap sa ating pang-araw-araw na buhay. Isa sa mga pinakadakilang pagkagambala sa ating pang-araw-araw na buhay, na sa kasalukuyan ay nakikita ko, ay ang pang-araw-araw na gawain lamang. Ang pag-upo at pagsisikap na gawin ang trabahong inupahan mong gawin, at ang pagtaas ng inaasahan na pupunta ka mula sa isang pang-araw-araw na tao sa isang superhero at ang dami ng impormasyong umaagos sa paligid ng mga samahan at napakabilis, ito ay isang makabuluhang hamon at higit pa at marami pa tayong kinakailangang magbigay ng mas mahusay at mas mahusay na mga tool sa mga tao upang subukan at makayanan ang daloy ng kaalaman at impormasyon at sa gayon ay naisip kong subukan at darating ito mula sa kaunting isang masayang anggulo . Ngunit, palagi itong tinatamaan sa akin kung paano namin nakuha ang mataas na kaisipan o flash mobs at iba pa, iyon ang uri ng pagmamaneho sa amin patungo sa kung ano ang pinag-uusapan natin bilang analytics ngunit talagang ang pinag-uusapan natin ay ang pagbibigay ng impormasyon na magagamit sa mga tao, at nagpapahintulot sa kanila na makihalubilo dito at gawin ito sa paraang natural at naramdaman itong normal.

At sa katunayan, ito ay nagpapaalala sa akin ng isang video sa YouTube ng isang bata, maliit na sanggol, na nakaupo sa sahig at nakaupo doon na naglalaro kasama ang isang iPad at iniikot at pinaputok at pinipiga at pinalabas ang mga imahe at naglalaro sa screen, ang data doon. At pagkatapos ay inalis ng magulang ang iPad at naglalagay ng magazine, isang ed magazine sa kandungan ng bata. At marahil ang batang ito ay hindi hihigit sa dalawang taong gulang. Sinimulan ng bata na subukan at mag-swipe sa screen ng magazine, at kurutin at pisilin at hindi tumugon ang magazine. Itinaas ng bata ang daliri nito at tiningnan ito at iniisip, "Hmm, hindi sa palagay ko ay gumagana ang aking daliri," at iniikot ang sarili sa braso at iniisip, "Ah hindi, gumagana ang daliri ko ay nararamdaman ko ang aking braso at iyon maganda ang hitsura, "at pinipiga nito ang daliri, at ang daliri ay nakikipag-usap at tumutugon. Oo. Pagkatapos ay sinusubukan nitong makipag-ugnay muli sa magasin, at mababa at narito, hindi ito kurot at pisilin at mag-scroll. Pagkatapos ay inalis nila ang magazine at ibinalik ang iPad sa kandungan nito, at biglaang gumagana ang bagay. At kaya narito ang isang sanggol na sumabay at sanay na gumamit ng isang analitikal na tool o isang live streaming tool para sa libangan at hindi ito magagawa kung paano dapat magtrabaho ang isang magazine at kung paano i-flip ang mga pahina.

At iyon ay isang kawili-wiling konsepto sa kanyang sarili. Ngunit kapag iniisip ko ang tungkol sa kaalaman na gumagalaw sa mga samahan, at ang paraan ng pag-agos ng data at ang paraan ng pag-uugali ng mga tao, madalas kong iniisip ang konsepto na ito ng natutunan ng mga tao na maging isang flash mob, na kung saan ay isang kaganapan kung saan, at kung saan ginagawa ng social media mas madaling gawin ito, isang ideya tulad ng kung saan pupunta sa lugar na ito sa oras at petsa at pagkilos na ito, o panoorin ang video na ito at alamin ang mga sayaw na ito, o magsuot ng kulay na sumbrero at ituro sa hilaga sa isang oras. At itinutulak mo ito sa pamamagitan ng iyong network, at palagiang isang buong pagkarga ng mga tao, daan-daang mga ito, lumiko sa parehong lugar nang sabay-sabay gawin ang parehong bagay at mayroong ganitong kadahilanan, tulad nito, "Banal na baka, iyon ay talagang kamangha-manghang! "Ngunit talagang ito ay isang napaka-simpleng ideya, at isang simpleng konsepto na itinulak lamang sa pamamagitan ng aming mga network at nakuha namin ang kinalabasan na ito na isang nakamamanghang nakamamanghang at naririnig na kamangha-manghang bagay. At kapag iniisip mo ang tungkol sa isang samahan, ang paraang nais nating kumilos ang mga tao at ang paraan na nais natin silang harapin ang mga sistema ng impormasyon at mga kostumer, madalas na simple, isang ideya o isang konsepto o isang kaugalian sa kultura o pag-uugali na sinusubukan nating ipasa sa pamamagitan at bigyan ng kapangyarihan ang mga tool at impormasyon.

At sinusuportahan ang lahat na ito ng mantra na mayroon ako ng higit sa dalawa at kalahating dekada at iyon ay, kung hindi mahahanap ng iyong kawani kung ano ang kailangan nilang gawin ang kanilang trabaho, maging mga kasangkapan o impormasyon ito, palagi nila itong muling paganahin ang gulong. At sa gayon ito ay isang patuloy na pagtaas ng hamon ngayon, kung saan marami tayong kaalaman at maraming impormasyon at mga bagay na mabilis na gumagalaw, na nais nating pigilan ang mga tao na muling likhain ang gulong. At kapag iniisip namin ang tungkol sa aming kapaligiran sa pagtatrabaho, bumalik sa anggulo ng mga tao, na kung saan ay isa sa aking mga paborito, nagulat ako nang kami ay nagulat na ang mga cubicle ay hindi isang kasiya-siyang kapaligiran para sa magagandang kinalabasan, o nag-linya kami ng mga bagay na tulad ng nakakatakot mga larawan dito, at hindi ito nagbago nang marami, ibinaba lamang ang mga pader at tinawag silang bukas na mga puwang sa pagtatrabaho. Ngunit sa gitna ng dilaw na loop sa paligid nila, mayroong dalawang tao na nagpapalitan ng kaalaman. At gayon pa man, kung titingnan mo ang natitirang silid ay silang lahat ay nakaupo roon nang walang pasubali na nakalulugmok doon, na inilalagay ang impormasyon sa isang screen. At mas madalas kaysa sa hindi, hindi talaga pagpapalitan ng kaalaman at data, at mayroong maraming mga kadahilanan para sa. Ngunit ang pakikihalubilo sa gitna ng sahig sa kaliwa doon sa dilaw na bilog, mayroong dalawang tao na nakikipag-chat sa malayo roon, nagpapalitan ng kaalaman, at marahil sinusubukan na makahanap ng isang bagay, sinusubukan mong sabihin, "Alam mo ba kung nasaan ang ulat na ito, kung saan ako mahahanap ang data na ito, anong tool ang ginagamit ko upang gawin ang bagay na ito? "At marahil hindi ito nagtrabaho kaya wala silang nakuha, at gumala sa buong palapag, sinira ang panuntunan ng puwang ng opisina ng cubicle at ginawa ito nang personal.

At mayroon kaming magkaparehong mga kapaligiran sa paligid ng tanggapan na pinagtawanan namin ang kasiyahan, ngunit ang katotohanan ay sila ay lubos na makapangyarihan at epektibo. At ang isa sa aking mga paborito ay ang mobile o naayos na platform ng analytics na tinatawag na water cooler, kung saan ang mga tao ay bumangon doon at chit-chat sa paligid doon at magpalitan ng kaalaman, at ihambing ang mga ideya at magsagawa ng analytics habang nakatayo sa water cooler, swap na mga ideya. Napakahusay na konsepto nila kapag iniisip mo ang mga ito. At kung maaari mong isalin ang mga ito sa iyong mga system at tool, nakakakuha ka ng isang kamangha-manghang kinalabasan. At nakuha namin ang lahat ng oras na paborito, na kung saan ay ang pinakamalakas na sentro ng pamamahagi ng data ng tanggapan ng opisina, kung hindi man kilala bilang pagtanggap sa desk. At kung hindi ka makahanap ng isang bagay, saan ka pupunta? Well lumakad ka sa harap ng opisina at pumunta ka sa pagtanggap at sasabihin, "Alam mo ba kung saan ang x, y, z ay?" At nangahas kong sinuman na sabihin sa akin na hindi nila nagawa iyon kahit isang beses sa isang bago trabaho o sa isang punto sa oras kung kailan hindi lamang nila mahanap ang isang bagay. At kailangan mong tanungin ang iyong sarili, bakit nangyari ang mga ito? Dapat itong maging sa isang lugar sa intranet o ilang tool o anupaman. Dapat itong madaling mahanap.

At kaya pagdating sa data at analytics at mga tool na ibinigay namin sa aming mga kawani upang gawin ang kanilang trabaho at ang paraan ng pakikipag-ugnay ng mga tao sa mga trabaho, nakuha ko ang pananaw na bago ang paglitaw ng mga tool sa analytics at malaking platform ng data , o "pagproseso ng data" na tawagin din ito sa lumang paaralan, pag-uulat at pagbabahagi ng kaalaman ay malayo sa pabago-bago o pakikipagtulungan o bukas, at kapag iniisip mo ang tungkol sa uri ng mga sistema na inaasahan nating gawin ng mga tao ang kanilang mga trabaho, mayroon kaming klasikal, ano tinawag ng mga tao ang legacy ngayon, ngunit ang katotohanan ay ang legacy lamang ang nakuha at narito pa rin ngayon, at samakatuwid ay hindi talaga ito pamana. Ngunit ang tradisyonal na mga sistema ng HR at mga sistema ng ERP - pamamahala ng mapagkukunan ng tao, pagpaplano ng mapagkukunan ng negosyo, pamamahala ng data ng negosyo, at mga sistema na ginagamit namin upang pamahalaan ang impormasyon upang magpatakbo ng isang kumpanya. Ito ay walang humpay na natahimik.At mula sa tuktok na dulo, ang mga simpleng platform tulad ng mga intranets ng departamento, sinusubukan na makipag-usap kung nasaan ang mga bagay at kung paano makuha ang mga ito at kung paano makihalubilo sa kaalaman sa paligid ng lugar. Pop-up namin iyon sa aming intranet. Ito ay kasing ganda ng mga tao na gumawa ng oras at pagsisikap na ilagay ito doon, kung hindi, maiiwan lang ito sa iyong ulo. O nakakuha ka ng data na nakaupo sa ilalim ng kadena ng pagkain, sa mga corporate SAN at lahat ng nasa pagitan, kaya ang mga network ng lugar ng imbakan ay puno ng mga file at data, ngunit alam kung saan hahanapin ito.

Mas madalas kaysa sa hindi, itinayo namin ang mga saradong platform ng data o mga closed system, at sa gayon ang mga tao ay nakabalik sa mga gusto ng mga spreadsheet at PowerPoints upang maipasa ang impormasyon sa lugar. Ngunit mayroong isang kawili-wiling bagay na naganap kamakailan, sa aking isip, at iyon ay ang mga aparatong mobile at internet sa pangkalahatang gawain sa ideya na ang mga bagay ay maaaring maging mas mahusay. At higit sa lahat sa espasyo ng consumer. At ito ay isang kagiliw-giliw na bagay na araw-araw na buhay sinimulan naming magkaroon ng mga bagay tulad ng internet banking. Hindi namin kailangang pumunta sa isang aktwal na bangko upang makipag-ugnay sa kanila, magagawa natin ito sa pamamagitan ng telepono. Orihinal na clunky ngunit pagkatapos ay dumating ang internet at mayroon kaming isang website. Alam mo, at kung gaano karaming beses ka nang napunta sa iyong bangko kani-kanina lamang? Talagang hindi ako, nagkaroon ako ng pag-uusap tungkol sa iba pang araw, at talagang hindi ko matandaan ang huling oras na nagpunta ako sa aking bangko, na kung saan ay lubos akong nabigla ng, naisip kong dapat kong maalala ito, ngunit ito ay napakahaba nakaraan hindi ko talaga maalala kung saan ako nagpunta doon. At sa gayon mayroon kaming mga gadget na ito sa aming mga kamay sa anyo ng mga mobiles at telepono, tablet at laptop, mayroon kaming mga network at pag-access sa mga tool at system, at ang puwang ng mamimili na natutunan namin na ang mga bagay ay maaaring maging mas mahusay, ngunit dahil ng mabilis na pagbabago sa puwang ng mamimili na higit na nakakapagod at pagbabago ng glacial sa loob ng negosyo at mga kapaligiran, hindi namin palaging kinuha ang pagbabagong iyon sa pang-araw-araw na buhay sa pagtatrabaho.

At gustung-gusto kong masayang ang poking sa katotohanan na hindi ka mabubuhay ng data ng stream sa hardcopy. Sa imaheng ito dito mayroong isang taong nakaupo na naghahanap ng ilang analytics na ginanap, at mayroong isang magandang graph na ginawa ng isang tao na marahil ay binayaran ng maraming pera bilang isang istatistika o isang artista, at sila ay nakaupo doon na nagsisikap na gawin analytics sa isang hardcopy at poking dito. Ngunit narito ang nakakatakot na bagay para sa akin: Ang mga taong ito sa silid ng pagpupulong na ito, halimbawa, at gagamitin ko ito bilang isang halimbawa, nakikipag-ugnay sila sa data na pangkasaysayan. At ito ay bilang matanda mula kung kailan ginawa ang bagay na iyon at pagkatapos ay ed, kaya marahil ito ay isang linggong ulat. Ngayon sila ay gumagawa ng mga pagpapasya sa hindi gaanong masamang data ngunit ang mga lumang data, na palaging maaaring masamang data. Nagpapasya sila ngayon batay sa isang bagay na makasaysayan, na kung saan ay isang masamang lugar na dapat mangyari. Nagawa naming palitan ang hardcopy na iyon ng mga gusto ng mga tablet at telepono dahil mabilis kaming nagtrabaho sa espasyo ng mga mamimili, at ngayon namin ito nagtrabaho sa puwang ng negosyo, na ang tunay na oras ay mga pananaw ay tunay na halaga ng oras.

At kami ay nakakakuha ng mas mahusay at mas mahusay sa na. At dinadala ako sa punto na itinaas ni Robin nang mas maaga, iyon ang konsepto ng scientist data ng mamamayan at ang drive ng konseptong ito. Para sa akin, ang isang mamamayang data scientist ay mga regular na tao lamang na may tamang mga kasangkapan at impormasyon sa mga gusto ng isang iPad. Hindi nila kailangang gawin ang mga matematika, hindi nila kailangang malaman ang mga algorithm, hindi nila kailangang malaman kung paano ilapat ang mga algorithm at pamamahala ng data, kailangan lang nilang malaman kung paano gamitin ang interface. At ibalik ako sa aking pagpapakilala at ang konsepto ng sanggol na nakaupo roon kasama ang isang iPad kumpara sa isang magasin, kumpara sa isang iPad. Ang bata ay maaaring napakabilis, matalinong malaman kung paano gamitin ang interface ng isang iPad upang sumisid sa impormasyon at makipag-ugnay dito, kahit na maaaring isang laro o streaming media o isang video. Ngunit hindi ito makakakuha ng parehong tugon o pakikipag-ugnay mula sa magazine bar at pag-flash lang ng pahina pagkatapos ng pahina, na hindi masyadong nakakaengganyo, lalo na kung ikaw ay isang sanggol na lumaki sa mga iPads. Hindi nakakagulat, ang mga tao ay maaaring tumingin at matuto nang mabilis kung paano magmaneho ng mga tool at mga bagay na kung bibigyan lang natin sila, at kung bibigyan natin sila ng isang interface tulad ng mga mobile device at partikular na mga tablet at smartphone na may sapat na mga screen, at lalo na kung maaari kang makipag-ugnay ang mga ito sa touch, na may mga paggalaw ng daliri, lahat ng bigla mong makuha ang konsepto na ito ng isang mamamayan ng siyentipiko ng data.

Isang tao na maaaring mag-aplay ng agham ng data na may tamang mga tool, ngunit nang hindi talaga kailangang malaman kung paano ito gagawin. At sa aking isipan ay marami ito, tulad ng sinabi ko, ay hinimok ng impluwensya ng mamimili, na lumipat at nagbago sa demand at enterprise. Ang isang pares ng talagang mabilis na mga halimbawa. Kami, marami sa atin ang magsisimulang gumawa ng mga bagay sa aming mga blog at website, tulad ng ilagay sa maliit na mga ad o pagtingin sa pagsubaybay at paggalaw, ginamit namin ang mga tool tulad ng Google Analytics at kami ay nagising sa katotohanan na sa aming mga blog at maliit na website , maaari naming ilagay ang maliit na piraso ng code doon at bibigyan kami ng Google ng mga real-time na mga pananaw sa kung sino ang bumibisita sa website, kailan at saan at paano. At sa totoong oras maaari naming makita ang mga tao na tumama sa website, dumaan sa mga pahina at mawala. At medyo nakakagulat. Gustung-gusto ko pa rin ang paggawa nito, kapag sinubukan kong ipaliwanag ang real-time na analytics sa mga taong pinapabayaan ko ito upang ipakita lamang sa kanila ang isang website na naka-plug ang Google Analytics, at aktwal na nakikita ang live na pakikipag-ugnayan sa mga tao na pumapasok sa mga website at tanungin sila, "Akala mayroon kang mga uri ng pananaw sa iyong negosyo sa real time. "

Kumuha ng isang halimbawa ng tingi, at marahil isang parmasyutiko, sa palagay ko ay tinatawag mo itong isang tindahan ng gamot sa Amerika, isang parmasya kung saan ka naglalakad at bumili ng lahat mula sa mga tablet ng sakit ng ulo hanggang sa sun cream at mga sumbrero. Sinusubukang patakbuhin ang samahan na walang impormasyon sa real-time ay isang nakakatakot na konsepto ngayon alam natin kung ano ang nalalaman natin. Halimbawa, maaari mong masukat ang trapiko sa paa, maaari kang maglagay ng mga aparato sa paligid ng tindahan na may isang nakangiting mukha sa isang tabi ng screen dahil masaya ka, at isang hindi maligayang mata sa malayo at kanan at ilang magkakaibang lilim sa gitna. At mayroong isang platform na tinatawag na "Maligaya o Hindi" sa mga araw na ito, kung saan lumalakad ka sa isang shop at maaari kang maglagay ng maligayang mukha o isang malungkot na mukha, depende sa iyong live na feedback sa sentimento ng customer. At maaari itong maging interactive sa totoong oras. Maaari kang makakuha ng live na presyo na hinihimok ng demand. Kung maraming mga tao doon, maaari mong itaboy nang kaunti ang mga presyo, at magagawa mo ang pagkakaroon ng stock at sabihin sa mga tao, halimbawa - ang mga airline, halimbawa, sasabihin sa mga tao kung gaano karaming mga upuan ang magagamit na ngayon sa website kapag ikaw muling pag-book ng flight, hindi ka lamang random na mag-dial in at umaasa na maaari mong i-up at makakuha ng flight. Live na data ng HR, maaari mong sabihin kung ang mga tao ay nag-i-orasan at nag-orasan. Ang pagkuha, kung nakakuha ka at nakakuha ka ng live na data, magagawa mo ang mga bagay tulad ng paghihintay ng isang oras at bakod laban sa presyo ng dolyar ng Estados Unidos upang bumili ng iyong susunod na pagkarga ng stock at magkaroon ng isang trak ng mga bagay na nakabukas.

Kapag ipinakita ko sa mga tao ang Google Analytics at isinalin ko ang uri ng anekdota, sa sandaling ito ng Eureka, ang sandaling ito "a-ha!", Ang lightbulb na ito ay napunta sa kanilang isip tulad ng, "Hmm, nakikita ko ang maraming mga lugar kung saan magagawa ko iyon . Kung mayroon lamang akong mga tool at kung mayroon lamang akong access sa kaalamang iyon. ”At nakikita natin ito ngayon sa social media. Sinuman na isang masigasig na gumagamit ng social media maliban sa pagpapakita lamang ng mga larawan ng kanilang agahan, ay may posibilidad na tingnan kung gaano karaming kagustuhan ang nakukuha nila at kung gaano karaming trapiko ang nakukuha nila at kung gaano karaming mga kaibigan ang kanilang nakuha, at ginagawa nila iyon sa kagaya ng, sabihin, bilang isang tool sa analytics. Maaari kang pumunta sa .com upang magamit ang tool, ngunit nag-type ka sa Google Analytics dot com, o mag-click sa tuktok na kanang pindutan at hilahin ang menu at gawin ito, nakakakuha ka ng mga magagandang, live na mga grapiko na nagsasabi sa iyo kung gaano karaming mga tweet sa iyo. ginagawa ang iyong sarili at kung gaano karaming mga pakikipag-ugnay sa kanila. At mga real-time na analytics lamang sa iyong personal na social media. Isipin kung mayroon kaming mga kagustuhan ng Google Analytics at at LinkedIn at, ang mga eBay stats na darating sa iyo, ngunit sa iyong kapaligiran sa trabaho.

Ngayon nakuha namin ang live na uri ng web at mobile sa aming mga daliri, ito ay nagiging isang konsepto ng kuryente. At sa gayon nagaganyak sa akin ang aking konklusyon, at iyon ay madalas na natagpuan ko na ang mga samahan na gumamit ng mga tool at teknolohiya nang maaga, nakakamit nila ang isang makabuluhang kalamangan sa kanilang mga kakumpitensya na maaaring hindi man lang nahuli ng mga kakumpitensya. At nakita namin na ngayon ay may salungatan ng siyentipiko ng data ng mamamayan. Kung maaari nating kunin ang mga tao na may mga kasanayan, ang kaalaman na inupahan namin ang mga ito, at maaari nating bigyan sila ng tamang mga tool, lalo na ang kakayahang makita ang data ng real-time at tuklasin ang data at malaman kung saan ito nang hindi naglalakad sa paligid ng mga cubicle at magtanong nang malakas, kinakailangang pumunta at tumayo sa mas cool na tubig upang gumawa ng ilang mga comparative analytics sa mga tao o pumunta at tanungin ang pagtanggap kung nasaan ang index. Kung magagawa nila iyon sa kanilang mga daliri at maaari nilang dalhin ito sa kanilang mga pagpupulong sa kanila at umupo sa isang boardroom flicking sa pamamagitan ng mga screen sa real time kaysa sa hardcopy, lahat ng biglaang binigyan tayo ng kapangyarihan ng aming mga tauhan na hindi kailangan maging aktwal data ng mga siyentipiko, ngunit upang aktwal na gumamit ng agham ng data at magdala ng mga kamangha-manghang mga resulta para sa mga organisasyon. At sa palagay ko ang tipping point na talagang naipasa namin ngayon kung saan ang consumer ay hinihimok sa negosyo, ang hamon ay kung paano natin ibibigay ang negosyong iyon, at iyon ang temang nahuhulaan ko sa talakayan ngayon. At kasama iyon, puputulin ko ang aking piraso at ibigay upang marinig kung paano natin malulutas iyon. David, sa iyo.

David Sweenor: Sige, salamat sa iyo maraming mga tao, at salamat Robin. Alam mo, Robin, sumasang-ayon ako sa iyong orihinal na pagtatasa. Ang proseso ng analytic, ito ay hindi naiiba talaga kaysa sa pag-unlad ng software. Sa palagay ko ang hamon sa loob ng isang samahan ay talagang, alam mo, marahil ang mga bagay ay hindi rin tinukoy nang mabuti, marahil mayroong isang exploratory na sangkap dito, at isang malikhaing sangkap dito. At alam ni Dez, sumasang-ayon ako sa iyo, maraming muling pagsasaayos ng gulong, at alam mo, walang isang organisasyon na pinapasukan ko ngayon, tanong mo, mabuti, bakit mo ito ginagawa? Bakit nagpapatakbo ang negosyo sa ganitong paraan? At madali itong tanungin, at maraming beses kung nasa loob ka ng isang samahan, mahirap baguhin. Gustung-gusto ko ang pagkakatulad, ang consumerization ng mga bagay. At kaya hindi na kapag pumunta ako sa paliparan at nais na baguhin ang aking upuan - ginagawa ko ito sa aking cellphone. Hindi ko kailangang pumunta sa ahente sa booth, at panoorin na ang uri ng ahente ay nag-type ng isang bagay sa isang monochrome monitor sa loob ng 15 minuto upang mabago ang aking takdang-upuan. Mas gusto ko lang gawin ito sa aking telepono, at sa gayon ito ay isang kagiliw-giliw na pag-unlad.

Ngayon, medyo pag-uusapan natin ang tungkol sa kolektibong katalinuhan. Para sa mga hindi nakakaalam, ang Statistica ay isang nangungunang antas ng analytics, na ito ay nasa loob ng higit sa 30 taon. Kung titingnan mo ang alinman sa mga pahayagan sa labas ng industriya ng analyst, palaging lumalabas ito sa tuktok bilang isa sa pinaka madaling maunawaan at madaling gamitin na advanced na pakete ng software ng analytics. Kaya't ginugol namin ang mga nakaraang taon na nagtatrabaho sa isang konsepto na tinatawag na kolektibong intelektwal, at dadalhin namin ito sa susunod na antas. Nais kong simulan ang pag-uusap na ito: kung paano magawa ang trabaho sa iyong samahan?

At may dalawang larawan dito. Ang isa sa kaliwa ay isang imahe mula pa noong 1960, at hindi ko sinimulan ang aking karera noong 1960, ngunit ang imahe sa kanan ay - iyon ay isang pabrika ng semiconductor kung saan nagsimula akong magtrabaho. At nagtatrabaho ako sa itim na gusali, itim na rooftop up sa itaas na kaliwa. Ngunit gumawa sila ng mga bagay na semiconductor. Ito ay isang kamakailang larawan mula sa Mga Larawan sa Google. Ngunit kung bumalik ka sa imahe ng 1960 sa kaliwa, napaka-kawili-wili. Mayroon kang mga taong ito na nakaupo sa isang linya, at ginagawa nila, alam mo, ang mga integrated circuit at semiconductors. Ngunit mayroong isang standardisasyon, mayroong isang karaniwang paraan upang gawin ang mga bagay, at mayroong maayos na proseso. Alam mo, marahil dahil ang mga taong ito ay lahat ay nakaupo sa isang bukas na kapaligiran, marahil mayroong ilang pakikipagtulungan. Sa palagay ko, nawala kami ng kaunti sa loob ng kaalaman sa paggawa.

Kapag nakaupo ako sa gusaling iyon sa itaas na kaliwa, kung nais kong makipagtulungan sa isang tao, hindi ito bukas. Mayroong mga tanggapan na ito, marahil ang ilan sa mga koponan ay malayo, o marahil ay kailangan kong maglakbay sa buong campus na ito; 25 minutong lakad ito, at kailangan kong makipag-usap sa isang tao sa gusali sa mismong kanan. Sa palagay ko nawalan tayo ng isang bagay. At sa gayon, alam mo, nagkaroon ako ng parehong pag-iisip na, bakit ang mga tao - kung gaano karaming mga tao ang patuloy na muling pinapanatili ang gulong sa loob ng iyong samahan? Sa palagay ko, alam mo, ang mga organisasyon sa kabuuan ay gumawa ng isang mahusay na trabaho noong 1990 at 2000s kasama ang CRM at data warehousing, at sa isang lawak ng BI. Para sa ilang kadahilanan, ang analytics ay medyo naka-haba ng kaunti. Mayroong makabuluhang pamumuhunan sa warehousing ng data, at pag-standard, at pag-normalize ng iyong data, at lahat ng ito, at CRM, ngunit ang mga analytics ay nahuli sa ilang kadahilanan. At nagtataka ako kung bakit. Marahil mayroong malikhaing - marahil ang iyong proseso ay hindi mahusay na tinukoy, marahil hindi mo alam kung anong desisyon o manlinlang ang iyong susubukan, alam mo, sa iyong negosyo upang baguhin ang mga bagay. Kapag nagpupunta tayo sa mga samahan ngayon, maraming tao ang mano-mano ang gumagawa ng mga bagay sa mano-mano mga spreadsheet.

At alam mo, tumingin ako sa isang stat kaninang umaga, sa palagay ko sinabi nito na 80, 90 porsyento ng mga spreadsheet ay may mga pagkakamali, at ang ilan sa mga ito ay maaaring maging makabuluhan. Tulad ng isa sa Whale, kung saan nawalan ng bilyun-bilyon at bilyun-bilyong dolyar ang JPMorgan Chase dahil sa mga pagkakamali sa spreadsheet. Kaya mayroon akong premise na sa palagay ko, kailangang may mas mahusay na paraan upang magawa ang mga bagay. At tulad ng nabanggit namin, mayroon kaming mga siyentipiko ng data. Ang mga taong ito ay mahal, at mahirap silang hanapin. At kung minsan sila ay medyo isang kakaibang pato. Ngunit sa palagay ko, alam mo, kung kailangan kong magbilang ng kung ano ang isang siyentipiko ng data, marahil ay may isang taong nakakaintindi ng data. Sa palagay ko ito ay isang taong nakakaintindi sa matematika, isang taong nakakaintindi sa problema. At talagang, isang tao na maaaring makipag-usap sa mga kinalabasan. At kung ikaw ay isang scientist ng data, maswerte ka ngayon sa mga araw na ito, dahil marahil ay nadoble ang iyong suweldo sa mga nakaraang taon.

Ngunit ang katotohanan ay sinabihan, maraming mga organisasyon, wala silang mga data na siyentipiko, ngunit ang iyong samahan ay may matalinong tao. Mayroon kang isang samahan, marami kang matalinong tao, at gumagamit sila ng mga spreadsheet. Alam mo, ang mga istatistika at matematika ay hindi ang kanilang pangunahing trabaho, ngunit gumagamit sila ng data upang maihatid ang pasulong sa negosyo. Talagang, ang hamon na tinutugunan namin ay, paano ka makukuha, kung masuwerteng magkaroon ka ng isang siyentipiko ng data o isang istatistika o dalawa, paano mo ito madadala, at paano mo mapapabuti ang pakikipagtulungan sa pagitan ng mga tao at ng ibang mga indibidwal sa loob ng iyong samahan? Kung titingnan natin ang uri ng kung paano nakaayos ang aming samahan, magsisimula na ako, at pupunta ako mula sa kanan pakaliwa. At alam kong pabalik-balik ito, ngunit mayroon kaming linya na ito ng mga gumagamit ng negosyo.

Ito ang karamihan sa iyong populasyon ng manggagawa sa kaalaman, at para sa mga taong ito, kailangan mong mag-embed ng mga analytics sa iyong linya ng mga aplikasyon ng negosyo. Marahil ay nakakakita sila ng analytic output sa isang call center screen o isang bagay, at sinasabi nito sa kanila ang susunod na pinakamahusay na alok na ibigay sa isang customer. Marahil ito ay isang consumer o supplier sa isang web portal, at agad itong binigyan sila ng kredito, o mga bagay na katulad nito. Ngunit ang ideya ay, kumokonsulta sila. Kung pupunta tayo sa gitna, ito ang mga trabahong may kaalaman. Ito ang mga tao na gumagawa ng mga bagay sa mga spreadsheet ngayon, ngunit ang mga spreadsheet ay madaling kapitan ng pagkakamali at sa ilang mga oras nauubusan sila ng gas. Ang mga siyentipikong datos ng mamamayan na ito, tulad ng pagtawag namin sa kanila, alam mo, kung ano ang sinusubukan naming gawin para sa kanila ay talagang pinataas ang antas ng automation.

At naririnig mo sa pamamagitan ng analytics na 80 hanggang 90 porsyento ng trabaho ay nasa piraso ng prep prep ng data, at hindi ito ang tunay na matematika, ngunit ito ang prep data. Sinusubukan naming i-automate na, gawin mo iyan, at mayroon kaming mga wizards at template at reusable na mga bagay, at hindi mo na kailangang magkaroon ng kaalaman sa pinagbabatayan na imprastraktura sa loob ng iyong kapaligiran. At pagkatapos kung titingnan namin sa kaliwang kaliwa, mayroon kaming mga siyentipiko na data. At tulad ng nabanggit ko, ang mga ito ay sa maikling supply. At kung ano ang sinusubukan nating gawin upang mas maging produktibo sila, ay pinahihintulutan silang lumikha ng mga bagay na magagawa ng mga datos na mamamayan ng data. Isipin ito tulad ng isang bloke ng Lego, kaya ang mga data na siyentipiko ay maaaring lumikha ng isang magagamit muli asset na maaaring magamit ng isang data sa siyentipiko ng mamamayan. Itayo ito nang isang beses, kaya hindi namin kailangang panatilihing muling maayos ang gulong.

At pagkatapos din, ang mga taong ito ay maaaring nag-aalala tungkol sa kung makakagawa tayo ng mga bagay sa database, at pag-gamit ng mga umiiral na mga pamumuhunan sa teknolohiya na ginawa ng iyong kumpanya. Alam mo, hindi makatuwiran sa araw na ito at edad upang ma-shuffle ang data papunta sa buong mundo. Kaya kung titingnan natin ang Statistica, tulad ng nabanggit ko, ito ay isang platform na malapit nang matagal. At ito ay isang napaka-makabagong produkto. Ang pagsasama ng data, walang data na mapagkukunan na hindi namin ma-access. Mayroon kaming lahat ng mga pagtuklas ng data at paggunita ng mga bagay na nais mong asahan; magagawa natin ito sa totoong oras. At marahil mayroon ito - sa palagay ko ay may higit sa 16,000 mga pag-andar ng analytical sa loob ng tool ng software, upang mas maraming matematika kaysa sa dati kong gagamitin o maintindihan, ngunit narito kung kailangan mo ito.

Mayroon kaming kakayahang pagsamahin ang parehong mga panuntunan sa negosyo at analytic workflows upang talagang makagawa ng isang desisyon sa negosyo. Malayo ka lang, narito ang isang algorithm, narito ang isang daloy ng trabaho, ngunit mayroon kang mga alituntunin sa negosyo na lagi mong dapat pakikitungo. Ligtas kami sa pamamahala. Kami ay ginagamit sa maraming mga kliyente sa parmasyutiko, na ang FDA ay tiwala sa amin. Alam mo, patunay lamang sa puding na mayroon tayong mga kontrol at kakayahan sa pag-audit na tatanggapin ng mga ito. At pagkatapos ay sa wakas, alam mo, kami ay bukas at nababaluktot at extensible, kaya kailangan mong lumikha ng isang platform na iyon, nais mong maging produktibo ang iyong data na siyentipiko, nais mong maging produktibo ang iyong data ng mamamayan ng mamamayan, nais mong maging produktibo upang maibahagi ang mga analytic output na ito sa mga manggagawa sa loob ng iyong samahan.

Kung titingnan natin ito, narito ang isang halimbawa ng ilan sa mga visualization. Ngunit na maipamahagi ang iyong analytic output sa mga gumagamit ng linya ng negosyo, kaya ang unang halimbawa sa kaliwa, iyon ay isang diagram ng analyt ng network. At marahil ikaw ay isang investigator ng pandaraya, at hindi mo alam kung paano nagawa ang mga koneksyon na ito, at maaaring maging mga tao ito, maaaring maging mga nilalang ito, maaari itong maging mga kontrata, kahit ano talaga. Ngunit maaari mong manipulahin ito gamit ang iyong mouse, at makihalubilo sa ito upang maunawaan talaga - kung ikaw ay isang investigator ng pandaraya, upang maunawaan ang isang nauna nang listahan ng kung sino ang dapat mag-imbestiga, tama, dahil hindi ka makakausap sa lahat, kaya mayroon kang bigyang importansya.

Kung titingnan namin ang imahe sa kanang bahagi doon, para sa isang mahuhulaan na dashboard ng pagpapanatili, ito ay isang talagang kawili-wiling problema. Marahil ikaw ay may-ari ng isang paliparan, at mayroon kang mga scanner ng katawan na naroon. Ang mga scanner ng katawan na ito, kung pupunta ka sa isang paliparan, mayroong ilang mga sangkap doon na mayroong halos isang siyam na buwan na istante ng buhay. At ang mga bagay na ito ay talagang, mahal. Kung mayroon akong maramihang mga punto ng pagpasok, maraming mga scanner sa aking paliparan, bilang isa na nais kong siguraduhin na naaangkop ako ng mga kawani sa bawat isa sa mga pintuang-bayan, at para sa mga bahagi na nasa scanner, hindi ko nais na mag-order din sa kanila. maaga, at nais kong magkaroon sila bago ito masira. Mayroon kaming kakayahan, marahil kung nagmamay-ari ka ng isang paliparan, upang mahulaan kung kailan masisira ang mga bagay na ito at mahuhulaan ang mga antas ng kawani.

Kung titingnan namin ang ibabang kanan, ito ay kung ikaw ay nasa isang kapaligiran sa pagmamanupaktura, ito ay isang representasyong grapiko lamang sa daloy ng pagmamanupaktura. At medyo mahirap makita, ngunit mayroong pula at berdeng mga ilaw sa trapiko sa iba't ibang mga sektor na proseso, at kaya kung ako ay isang inhinyero, mayroong napaka sopistikadong matematika na pumapasok doon, ngunit maaari kong mag-drill down sa partikular na sektor ng proseso at tingnan ang ang mga parameter, at pag-input na, marahil ay nagdudulot na hindi mapigilan. Kung titingnan natin ang ating scientist data data, ang aming layunin ay talagang gawing madali para sa scientist data ng mamamayan. Mayroon kaming mga wizards at template, at isang bagay na sa palagay ko ay talagang kawili-wili, mayroon ba tayong automated data na tseke ng kalusugan ng data. At talagang kung ano ang ginagawa nito, nakabuo ito ng mga smarts.

Nabanggit ko ang data prep - nangangailangan ng isang malaking halaga ng oras, na pareho sa pagsasama ng data at paghahanda nito. Ngunit ipagpalagay nating mayroon akong aking data, maaari ko itong patakbuhin sa pamamagitan ng data na ito sa pagsusuri sa kalusugan, at tseke ito para sa invariance, at sparseness, at outliers, at lahat ng mga bagay na ito, pinupuno nito ang mga nawawalang halaga at marami itong matematika na hindi ko Hindi ko maintindihan, kaya kong matanggap ang alinman sa mga default, o kung ako ay mas matalino, maaari kong baguhin ito. Ngunit ang punto ay, nais naming i-automate ang proseso na iyon. Ang bagay na ito ay ginagawa tungkol sa 15 iba't ibang mga tseke at kinalabasan sa isang nalinis na hanay ng data. Ang ginagawa namin ay ginagawang mas madali para sa mga tao na lumikha ng mga workflows na ito.

Narito ang pinag-uusapan natin tungkol sa pakikipagtulungan sa pagitan ng mga datos ng agham at siyentipiko ng mamamayan ng data. Kung titingnan namin ang mga imaheng ito sa kanan, nakikita namin ang data prep workflow na ito. At marahil ito ay napaka sopistikado, marahil ito ay lihim na sarsa ng iyong kumpanya, hindi ko alam, ngunit alam namin na ang isang tao sa loob ng iyong samahan ay maaaring ma-access ang isa o higit pa sa mga data na silos na mayroon kami. Kailangan namin ng isang paraan upang, numero uno, kunin ang mga ito at paghiwalayin ang mga ito, at bilang dalawa, marahil mayroong espesyal na pagproseso na nais naming gawin, na lampas ito sa aming data sa kalusugan ng data, at lihim na sarsa ng iyong kumpanya. Maaari akong lumikha ng daloy ng trabaho na ito sa loob ng aming samahan, at gumuho ito bilang isang node. Nakikita mo ang arrow na tumuturo, ito ay isang node lamang, at maaari kaming magkaroon ng isang daang mga bagay na ito sa loob ng isang samahan. Ang ideya ay, mayroon kaming mga tao na nakakaalam ng isang bagay tungkol sa isang tiyak na puwang, maaari silang lumikha ng isang daloy ng trabaho, at ang ibang tao ay maaaring magamit muli. Sinusubukan naming i-minimize ang muling paghihinala ng gulong.

At maaari naming gawin ang parehong bagay sa mga analytic na modelong workflows. Sa kasong ito sa kanan, ang daloy ng trabaho na ito, marahil mayroong 15 iba't ibang mga algorithm, at nais kong pumili ng pinakamahusay para sa gawain. At hindi ko kailangang maunawaan bilang isang scientist data data ng mamamayan kung ano ang nangyayari sa spider web gulo doon, ngunit bumagsak lamang ito sa isang node, at marahil na ang node ay nagsasabing lamang, "kalkulahin ang marka ng panganib sa kredito." "Kalkulahin ang pagkakataon ng impeksyon sa kirurhiko sa site, "ano ang mayroon ka. "Kalkulahin ang posibilidad ng isang bagay na isang mapanlinlang na transaksyon." Bilang isang siyentipiko ng data ng mamamayan, maaari kong gamitin ang napaka sopistikadong matematika na binuo ng ibang tao, marahil ang isa sa mga data na siyentipiko na ito ay binuo sa loob ng aking samahan.

Mula sa isang pananaw sa agham ng data, alam mo, nakipag-usap ako sa mga siyentipiko ng data na mahilig magsulat ng code, at nakausap ko ang mga siyentipiko ng data na ayaw sumulat ng code. At masarap iyon, kaya mayroon kaming isang napaka-visual, graphic na interface ng gumagamit. Maaari naming kunin ang aming data, maaari naming gawin ang aming awtomatikong pagsusuri sa kalusugan ng data, at baka gusto kong sumulat ng code. Gusto ko si Python, gusto ko ang R, ngunit ang ideya ay, ang mga siyentipikong datos na ito, ang mga ito ay sa maikling supply, at gusto nila ang code sa isang partikular na wika. Wala kaming partikular na kagustuhan sa kung anong wika ang nais mong mag-code, kaya kung nais mong gawin R, gawin R; kung nais mong gawin ang Python, gawin ang Python. Magaling iyon. Kung nais mong sumabog ang iyong analytics sa Azure, sumabog ang iyong analytics sa ulap. At kaya ang layunin dito ay talagang mag-alok ng kakayahang umangkop at mga pagpipilian upang gawin ang iyong mga siyentipiko ng data bilang produktibo hangga't maaari.

Ngayon ang mga siyentipiko ng data, sila ay mga matalinong tao, ngunit marahil hindi sila espesyalista sa lahat ng bagay, at marahil mayroong ilang mga puwang sa magagawa nila. At kung titingnan mo sa loob ng industriya, maraming iba't ibang mga merkado ng analitiko na mayroon doon. Ito ay isang halimbawa ng, marahil kailangan kong gawin ang pagkilala sa imahe at wala akong kasanayan na iyon, marahil ay lumabas ako sa Algorithmia at kumuha ng algorithm ng pagkilala sa imahe. Siguro lumabas ako sa Apervita at kumuha ng isang napaka espesyal na algorithm sa pangangalaga ng kalusugan. Siguro nais kong gumamit ng isang bagay sa aklatan ng pag-aaral ng Azure machine. Marahil ay nais kong gumamit ng isang bagay sa katutubong platform ng Statistica.

Muli, ang ideya dito ay nais naming magamit ang pandaigdigang komunidad ng analytics. Dahil hindi ka magkakaroon ng lahat ng mga kasanayan sa loob ng iyong apat na pader, kaya paano tayo makalikha ng software - at ito ang ginagawa namin - na nagpapahintulot sa iyong mga siyentipiko ng data na gumamit ng mga algorithm mula sa iba't ibang mga merkado. Matagal na naming ginagawa ito sa R ​​at Python, ngunit ito ay nagpapalawak na sa mga app marketplaces na mayroon doon. At ang parehong nakikita mo dito sa tuktok ng ito, gumagamit kami ng H2O sa Spark, kaya maraming mga analytic algorithm doon. Hindi mo kailangang pagtuunan ng pansin ang paglikha ng mga ito mula sa simula, hayaan itong gamitin ang mga ito na nakatira sa bukas na mapagkukunan na komunidad, at nais namin na ang mga taong ito ay maging produktibo hangga't maaari.

Ang susunod na hakbang, matapos na makuha namin ang aming data ng mga mamamayan ng siyentipiko at aming data na siyentipiko, kung paano mo isusulong at ipinamahagi mo ang mga pinakamahusay na kasanayan? Mayroon kaming teknolohiya sa loob ng aming software na nagbibigay-daan sa iyo upang ipamahagi ang analytics kahit saan. At ito ay higit pa sa isang view ng pamamahala ng modelo, ngunit hindi na ako nakagapos ng apat na pader o isang tiyak na pag-install sa loob ng Tulsa o Taiwan o California, o kung ano ang mayroon ka. Ito ay isang pandaigdigang platform, at marami kami, maraming mga customer na na-deploy sa paggamit nito ng maraming site.

At talagang, ang mga pangunahing bagay ay, kung gumawa ka ng isang bagay sa Taiwan at nais mong kopyahin ito sa Brazil, mahusay iyon. Pumunta doon, kunin ang mga magagamit na template, kunin ang mga workflows na gusto mo. Sinusubukan nitong likhain ang mga pamantayang iyon, at ang karaniwang paraan ng paggawa ng mga bagay, kaya hindi namin ginagawa ang iba't ibang mga bagay sa lahat ng dako. At ang iba pang pangunahing sangkap ng ito, ay talagang nais nating dalhin ang matematika kung saan nakatira ang data. Hindi mo kailangang i-shuffle ang data sa pagitan, alam mo, California at Tulsa at Taiwan at Brazil. Mayroon kaming teknolohiya na nagpapahintulot sa amin na dalhin ang matematika sa data, at magkakaroon kami ng isa pang Hot Technology webcast sa paksang iyon.

Ngunit tinawag namin ang arkitektura na ito, at narito ang isang sneak peek, Native Distributed Analytics Architecture. Ang pangunahing ideya sa likod nito ay mayroon kaming isang platform, Statistica, at mai-export ko ang isang analytic workflow bilang isang atom. At maaari akong gumawa ng isang modelo, o isang buong daloy ng trabaho, upang hindi mahalaga. Ngunit maaari kong likhain ito, at i-export ito sa isang wika na naaangkop sa target na platform. Sa kaliwang bahagi nito, maraming tao ang gumawa nito, ngunit nagmarka sila sa mapagkukunan ng sistema. Mabuti iyon, maaari tayong gumawa ng pagmamarka at magagawa natin ang pagbuo ng modelo sa database, upang maging kawili-wili.

At pagkatapos ay sa kanang bahagi, mayroon kaming Boomi. Ito ay isang kasamang teknolohiya, nagtatrabaho kami sa lahat ng ito. Ngunit maaari din nating kunin ang mga workflows na ito, at mahalagang dalhin ito kahit saan sa mundo. Anumang bagay na mayroong isang IP address. At hindi ko kailangang mag-install ng Statistica sa pampubliko o pribadong ulap. Anumang bagay na maaaring magpatakbo ng isang JVM, maaari naming patakbuhin ang mga analytic workflows, data prep workflows, o mga modelo lamang sa alinman sa mga target na platform. Nasa sa aking pampubliko o pribadong ulap, maging ito sa aking traktor, kotse, tahanan, sinag, aking internet ng mga bagay, mayroon kaming teknolohiya na nagbibigay-daan sa iyo upang dalhin ang mga daloy ng trabaho kahit saan sa mundo.

Suriin natin. Alam mo, mayroon kaming linya ng mga gumagamit ng negosyo, kaya ang mga taong ito, mayroon kaming teknolohiya na pahintulutan silang ubusin ang output sa isang format na komportable sila. Mayroon kaming mga siyentipiko ng mamamayan ng data, at kung ano ang sinusubukan naming gawin ay mapabuti ang pakikipagtulungan, gawin silang bahagi ng isang koponan, di ba? At kaya nais namin na ang mga tao ay tumigil sa muling pagbuo ng gulong. At mayroon kaming mga siyentipiko na data, maaaring magkaroon ng isang puwang ng kasanayan doon, ngunit maaari silang mag-code sa isang wikang nais nila, maaari silang pumunta sa mga merkado ng analytic at gumamit ng mga algorithm doon. At sa ganito, paano mo hindi maisip na ang lahat ay kamangha-mangha sa ito? Ito ay perpekto, ito ang ginagawa namin. Nagtatayo kami ng magagamit na mga daloy ng trabaho, nagbibigay kami ng mga tagubilin sa mga tao, binibigyan namin sila ng mga bloke ng Lego upang mabuo nila ang mga makapangyarihang kastilyo na ito at anumang nais nilang gawin. Upang mabuo ito, mayroon kaming isang platform na nagbibigay kapangyarihan sa linya ng mga gumagamit ng negosyo, siyentipiko ng data ng mamamayan, siyentipiko ng mga programmer data, mayroon kaming - maaari naming matugunan ang anumang uri ng kaso ng paggamit ng IoT edge, at pinagana namin ang paniwala ng kolektibong intelihensiya. Dahil dito, sa palagay ko marahil ay buksan natin ito para sa mga katanungan.

Robin Bloor: Ayos lang. Sa palagay ko ang una - ang ibig kong sabihin, maging matapat, ang ibig kong sabihin ay nai-briefed ako ni Dell Statistica dati, at sa totoo lang talagang nagulat ako sa mga bagay na hindi ko alam na nagdala ka sa pagtatanghal . At kailangan kong sabihin na ang isang bagay, ito ay isang bagay na naging bugbear para sa akin sa loob ng pag-ampon ng analytics, alam mo ba, ang pagkuha ng mga tool ay hindi, alam mo? Mayroong isang kakila-kilabot na tool sa labas, may mga bukas na mapagkukunan ng mapagkukunan, at iba pa at iba pa, at mayroong iba't ibang, kung ano ang tawag ko, mga semi-platform. Ngunit sa palagay ko ang pagkakaiba mo, lalo akong napahanga sa ilan sa mga daloy ng trabaho.

Ngunit ang pagkakaiba ay parang nagbibigay ka ng pagtatapos. Ito ay tulad ng analytics ay isang sopistikadong proseso ng negosyo na nagsisimula sa pagkuha ng data at pagkatapos ay dumadaan ito sa isang buong serye ng mga hakbang, depende sa kung gaano kalakas ang data, at pagkatapos ay maaari itong mag-sangay sa isang buong serye ng iba't ibang mga pag-atake sa matematika sa data. At pagkatapos ay lumitaw ang mga resulta sa isang paraan o sa iba pa at ang mga kailangang maging aksyon. Mayroong napakalaking halaga ng analytics na nalaman ko kung saan nagagawa ang maraming mahusay na gawain ngunit wala itong aksyon. At mukhang may kakila-kilabot ka sa mga kinakailangan. Hindi ko alam kung gaano kalawak ito, ngunit mas malawak ito kaysa sa inaasahan ko. Ako ay hindi kapani-paniwalang humanga doon.

Nais kong magkomento sa mga spreadsheet. May sinabi ka na, ngunit isa sa mga bagay na napansin ko, at napansin ko sa mga nakaraang taon, ngunit ito ay naging mas maliwanag pa, ay mayroong isang kakila-kilabot na mga spreadsheet na mga sistema ng anino at talagang naiisip ko ang spreadsheet, ang ibig kong sabihin, ito ay isang kamangha-manghang tool noong ipinakilala ito at naging kamangha-mangha mula pa sa maraming iba't ibang paraan, ngunit ito ay isang pangkalahatang tool, hindi talaga ito angkop para sa layunin. Tiyak na hindi ito napakahusay sa BI con at sa palagay ko ay kakila-kilabot sa analytics con. At naisip ko kung mayroon kang ilang puna upang sabihin, sabihin, mga halimbawa kung saan, alam mo, ang Statistica ay nag-flush, labis na paggamit ng spreadsheet, o anumang puna na nais mong gawin tungkol dito?

David Sweenor: Sa palagay ko, alam mo na, maaari kang tumingin ng mga sikat na pagkakamali sa spreadsheet. Ang Google o anumang search engine na iyong ginagamit ay babalik sa isang resulta ng mga resulta. Hindi ko akalain, alam mo, magpapalitan kami ng mga spreadsheet. Hindi iyon ang aming hangarin, ngunit maraming mga organisasyon na pinupuntahan ko, mayroong isang pares ng mga ito ng mga wsheards ng spreadsheet o ninjas o anumang nais mong tawagan sila, ngunit mayroon silang mga napaka sopistikadong mga spreadsheet na ito at kailangan mong mag-isip, kung ano ang mangyayari kapag ang mga ito ang mga tao ay nanalo sa lotto at hindi sila bumalik? At kung ano ang sinusubukan naming gawin ay, alam namin na mayroong mga spreadsheet upang maari nating maipamamalas ang mga iyon, ngunit sa palagay ko kung ano ang sinusubukan naming gawin ay bumuo ng isang visual na representasyon ng iyong daloy ng trabaho upang maunawaan at maibahagi ito sa ibang mga tao . Ang mga spreadsheet ay medyo mahirap, medyo mahirap ibahagi. At sa sandaling maipasa mo sa akin ang iyong spreadsheet sa akin, binago ko na ito, at wala na kaming pag-sync at nakakakuha kami ng iba't ibang mga sagot. Ang sinusubukan naming gawin ay maglagay ng ilang mga bantay sa paligid nito at gawing mas mahusay ang mga bagay. At ang mga spreadsheet ay talagang kahila-hilakbot sa pagsasama-sama ng maraming mga hanay ng data, alam mo? Nahulog sila doon. Ngunit hindi namin papalitan ang mga ito, pinapansin namin sila at mayroon kaming mga tao na nagsisimulang magbago dahil kung mayroon kaming isang node na nagsasabing "kalkulahin ang peligro" iyon ang sinusubukan na gawin ng taong gumagamit ng spreadsheet. Kaya't wala na ang mga iyon.

Robin Bloor: Oo, ibig sabihin, sasabihin ko iyan, alam mo, mula sa isa sa mga pananaw na tinitingnan ko ang mga bagay, sasabihin ko na ang mga spreadsheet ay mahusay para sa paglikha ng impormasyon. Mas mahusay din sila para sa paglikha ng mga isla ng kaalaman, ngunit masama talaga sila sa pagbabahagi ng kaalaman. Wala silang mekanismo para gawin iyon, at kung magpasa ka ng isang spreadsheet sa isang tao, hindi tulad ng mababasa mo ito tulad ng isang artikulo na ipinaliwanag nang eksakto kung ano ang kanilang ginagawa. Hindi lang doon. Sa palagay ko, alam mo, ang bagay na higit na nagpahanga sa akin tungkol sa pagtatanghal at tungkol sa mga kakayahan ni Statistica, tila hindi ito kapani-paniwalang agnostiko. Ngunit nakuha nito ang thread na ito. Narito ba ako sa pag-aakala na maaari mong tingnan ang isang end-to-end na daloy ng trabaho sa kabuuan, alam mo, mula sa pagkuha ng data sa lahat ng paraan hanggang sa paglalagay ng mga resulta sa partikular na mga aplikasyon ng BI o kahit na tumatakbo ang mga aplikasyon?

David Sweenor: Oo, talagang. At mayroon itong kakayahan na end-to-end at ginagamit ng ilang mga organisasyon na buo, at wala akong ilusyon na ang anumang kumpanya ngayon ay bumili ng lahat mula sa isang tindero. May halo kami. Ang ilang mga tao ay gumagamit ng Statistica para sa lahat at ginagamit ito ng ilang mga tao para sa mga modeling workflows, ginagamit ito ng ilang mga tao para sa mga work prepows ng data. Ang ilang mga tao ay gumagamit nito upang ipamahagi ang daan-daang mga ulat sa inhinyero sa mga inhinyero. At sa gayon mayroon kaming lahat sa pagitan. At ito ay talagang end-to-end at ito ay, alam mo, isang agnostic platform, na kung mayroong algorithm na nais mong gamitin sa R ​​o Python, Azure, Apervita, anuman, alam mo, gamitin ang mga iyon. Napakaganda, maging produktibo, gumamit ng alam mo, gamitin kung ano ka komportable at mayroon kaming mga mekanismo upang matiyak na ang mga ito ay kontrolado at maririnig at lahat ng uri ng mga bagay.

Robin Bloor: Gusto ko lalo na ang aspeto nito. Ibig kong sabihin, hindi ko alam kung makapagsalita ka sa kabila ng sinabi mo sa yaman ng kung ano ang nasa labas. Ibig kong sabihin, tiningnan ko ito ngunit hindi ko ito tiningnan sa isang komprehensibong paraan at tiyak na mayroong isang malawak na halaga ng mga aklatan ng Python sa aming mga aklatan ngunit mayroon ka bang maari mong maidagdag sa larawang iyon? Dahil sa palagay ko ito ay isang napaka-kagiliw-giliw na bagay, alam mo, ang ideya na magkakaroon ka ng mga sangkap na mapagkakatiwalaan, dahil alam mo ang iba't ibang mga tao na lumikha sa kanila at iba't ibang mga tao na gumagamit ng mga ito na maaari mong i-download. Alam mo, maaari mo bang mapayaman ang sinabi mo tungkol dito?

David Sweenor: Oo, sa palagay ko ang ilan sa mga merkado ng app, alam mo, ang mga merkado ng algorithm na nandoon. Halimbawa, alam mo, Dr. John Cromwell sa Unibersidad ng Iowa, siya ay binuo ng isang modelo na mahuhulaan, na ginagamit sa real time habang pinatatakbo tayo, ay magbibigay sa iyo ng isang marka kung makakakuha ka ng impeksyon sa kirurhiko site. At kung ang sapat na marka ay kukuha sila ng interbensyon mismo sa operating room. Iyon ay napaka-interesante. Kaya marahil ay may isa pang ospital na hindi gaanong kalaki. Buweno, ang Apervita ay isang merkado ng kalusugan ng app para sa analytics. Maaari ka ring makahanap ng isa sa maraming mga palengke ng app na ito, maaari kang makahanap ng isa at muling magamit ang mga ito, at ang transaksyon ay nasa pagitan mo at kung sino ang nagmamay-ari nito, ngunit maaari ka ring maghanap ng isa o maaari mong sabihin, "Narito kung ano ang kailangan ko. "Sa palagay ko ito ay gumagamit ng pandaigdigang pamayanan dahil lahat ay espesyalista sa mga araw na ito, at hindi mo alam ang lahat. Sa palagay ko ang R at Python ay isang bagay ngunit ang ideyang ito ng, "Nais kong gawin ang pagpapaandar na ito, maglagay ng isang spec sa labas ng isa sa mga lugar ng merkado ng app na ito at magkaroon ng isang tao na bumuo para sa iyo." At maaari nilang gawing pera ang, na napaka-kawili-wili at ibang-iba kaysa purong bukas na modelo ng mapagkukunan.

Robin Bloor: Lahat tama. Pa rin, ipapasa ko ang bola kay Dez. Nais mo bang sumisid, Dez?

Dez Blanchfield: Ganap at nais kong manatili sa isang spreadsheet na bagay para sa isang sandali lamang dahil sa palagay ko nakuha nito ang tamang gist ng maraming pinag-uusapan natin. At gumawa ka ng isang puna, Robin, tungkol sa paglipat mula sa uri ng mga lumang spreadsheet sa kanilang pisikal na form sa electronic form. Nagkaroon kami ng isang kagiliw-giliw na bagay na maganap kung saan, alam mo, kapag ang mga spreadsheet ay orihinal na isang bagay na sila ay mga sheet lamang ng papel na may mga hilera at haligi at mano-mano nais mong isulat ang mga bagay, kung gayon gusto mo ng kapangyarihan at kalkulahin ang mga ito, alinman sa pamamagitan ng paggawa off ito sa tuktok ng iyong ulo o sa ilang iba pang aparato. Ngunit mayroon pa rin tayong pagkakataon na magkaroon ng mga pagkakamali sa mga pagkakamali sa pagsulat ng sulat o dislexia, at ngayon ay pinalitan ito ng mga typo. Ang panganib ay sa mga spreadsheet ang profile ng peligro ay mas mabilis at mas malaki, ngunit sa palagay ko ang mga tool tulad ng Statistica ay baligtarin ang peligro ng peligro.

Madalas kong iguhit ang larawang ito sa isang whiteboard ng isang tao na stick stick sa tuktok, bilang isang tao, at pagkatapos ay isang koleksyon ng mga ito sa ilalim, sabihin natin, isipin ang sampu sa mga ito sa ilalim ng whiteboard na iyon, at gumuhit ako ng pyramid kung saan ang punto ng pyramid's sa iisang tao at paanan ng pyramid ay ang koleksyon ng mga tao. At ginagamit ko ito upang mailarawan ang ideya na kung ang isang tao sa itaas ay nagkakamali ng isang spreadsheet at ibinabahagi ito sa sampung tao, at ngayon mayroon kaming sampung kopya ng error. Mag-ingat ka sa iyong mga macros at maging maingat sa iyong Visual Basic kung lilipat ka na. Dahil kapag nagtatayo kami ng mga elektronikong tool tulad ng mga spreadsheet ito ay napakalakas, ngunit malakas din ito sa isang mabuti at masamang paraan.

Sa palagay ko ang mga tool tulad ng Statistica ay nagdadala tungkol sa kakayahang maiiwasang ang profile na peligro at iyon ay maaari mo na ngayong makarating sa puntong nakuha mo ang maraming mga tool na magagamit sa indibidwal na tao at habang sila ay pumunta mula sa maraming mga tool sa tuktok ng ang piramide at pagkatapos ay hanggang sa pinakadulo kung saan ang punto ng pyramid na ngayon ay invertid ay ang aktwal na tool, kung mayroon kaming isang pangkat ng mga tao na nagtatayo ng mga tool at mga algorithm na iyon. At ang data ng siyentipiko ay hindi kailangang maging isang dalubhasa sa mga analytics ng rehistro sa kanilang data. Maaaring gamitin nila ang tool, ngunit maaari kang magkaroon ng lima o anim na istatistika at isang kumilos at isang scientist ng data at ilang mga matematiko na nagtatrabaho sa tool na iyon, ang module na iyon, algorithm na iyon, na plug-in at iba pa sa spreadsheet parlance, kaya isipin na ang bawat spreadsheet na nai-publish na maaari mong gamitin ay talagang isinulat ng mga espesyalista na sinubukan ang macros, sinubukan ang Visual Basic, siguraduhin na nagtrabaho ang mga algorithm, kaya kapag nakuha mo ito maaari ka lamang pop data sa ito ngunit hindi mo talaga masira ito at samakatuwid ay mas mahusay na makontrol.

Sa palagay ko maraming ginagawa ang mga tool sa analytics na iyon. Sa palagay ko darating ang punto na iyon, nakikita mo ba na sa larangan ngayon, nakikita mo ba ang paglipat mula sa mga spreadsheet na potensyal na maaaring magtulak ng mga pagkakamali at pagkakamali at peligro, hanggang sa kung saan ang mga tool na iyong itinatayo kasama ang iyong mga platform ngayon, sa pagtuklas ng data na tumpak sa totoong oras at ang mga taong nagtatayo ng mga module at algorithm ay inaalis o binabawasan ang profile na peligro? Nakikita ba ang serbisyo ng kostumer na sa isang tunay na diwa o sa palagay mo ay nangyayari lang ito at hindi nila ito napagtanto?

David Sweenor: Alam mo, sa palagay ko may ilang mga paraan upang sagutin ito. Ngunit ang nakikita natin ay, alam mo, sa anumang samahan, at nabanggit ko na ang mga analytics na sa palagay ko ay maaaring lumayo mula sa isang pananaw sa pamumuhunan sa korporasyon, uri ng ginawa namin sa warehousing ng data at CRM. Ngunit kung ano ang nakikita natin, kaya, kinakailangan ng maraming upang baguhin ang isang samahan, upang makuha ang kawalang-kilos na samahan. Ngunit ang nakikita natin ay ang mga tao na kumukuha ng kanilang mga spreadsheet, kumukuha ng kanilang mga daloy ng trabaho, at binanggit ko ang seguridad at pamamahala, "Well, marahil mayroon akong isang spreadsheet," "Well, maaari kong i-lock ito at maaari kong bersyon na kontrolin ito." marami kaming nakikita na mga samahan, siguro nagsisimula lang sila doon. At kung nagbago ito, mayroong isang daloy ng trabaho at nagtatapos ako sa pagpunta, numero uno, kung sino ang nagbago nito? Bakit nila ito binago. Kapag binago nila ito. At maaari rin akong mag-set up ng isang daloy ng trabaho na hindi ko ilalagay ang bagong spreadsheet na ito sa paggawa maliban kung ito ay napatunayan at napatunayan ng isa, dalawa, tatlo, gayunpaman maraming mga partido na nais mong tukuyin sa iyong daloy ng trabaho. Sa palagay ko ay nagsisimula na ang mga tao, at ang mga organisasyon ay nagsisimulang gumawa ng mga hakbang sa sanggol doon, ngunit marahil ay iminumungkahi kong mayroon kaming mahabang paraan.

Dez Blanchfield: Sa katunayan at sa palagay ko ay binubuo ka ng parehong mga kontrol sa seguridad at pamamahala doon, pagkatapos ay maaaring awtomatikong i-map ang workload na iyon at lahat ng bagay hanggang sa punong opisyal ng peligro, na ngayon ay isang bagay. Maaari mong simulan upang makontrol kung paano ma-access ang mga tool at system at kung sino ang gumagawa ng kung ano sa kanila, kaya napakalakas. Sa palagay ko ang iba pang mga bagay na pumapasok sa ito ay ang mga uri ng mga tool na ibinibigay mo, para sa akin, ipahiram sa pag-uugali ng tao nang higit pa sa mga tradisyonal na mga spreadsheet na pinag-uusapan natin, kung mayroon akong silid na puno ng mga tao na may parehong dashboard at pag-access sa parehong data na maaari silang makakuha ng ibang view at, bilang isang resulta, makakuha ng bahagyang magkakaibang mga pananaw mula sa parehong impormasyon, na nababagay sa kanilang mga pangangailangan upang maaari silang makipagtulungan. Kami ay may higit pang pananaw at pakikipag-ugnayan ng tao sa negosyo at proseso ng paggawa ng desisyon, kumpara sa lahat ng pagpunta sa parehong pulong na may parehong PowerPoint, at ang parehong mga spreadsheet na na-out, lahat ng parehong nakapirming data.

Nakikita mo ba ang isang paglipat sa pag-uugali at kultura sa mga samahan na nag-uuri ng iyong mga tool ngayon kung saan nakikita nila na nagaganap, kung saan hindi tulad ng limang mga tao sa silid na tinitingnan ang parehong spreadsheet na sinusubukan lamang na pasalita ito at gumawa ng mga tala dito , ngunit ngayon sila ay talagang nakikipag-ugnay sa mga dashboard at mga tool sa real time, kasama ang visualization at analytics sa kanilang mga daliri at nakakakuha ng isang ganap na magkakaibang daloy sa pag-uusap at pakikipag-ugnayan, hindi lamang sa mga pagpupulong ngunit pangkalahatang pakikipagtulungan sa paligid ng samahan? Dahil magagawa nila ito ng totoong oras, dahil maaari silang magtanong ng mga katanungan at makakuha ng isang tunay na sagot. Ito ba ang isang kalakaran na nakikita mo sa ngayon o hindi pa nangyari?

David Sweenor: Hindi, sa palagay ko siguradong nagsimula ito sa landas at sa palagay ko ang napaka-kagiliw-giliw na bagay ay, alam mo, kung kukuha tayo ng halimbawa ng isang pabrika, halimbawa. Marahil ang isang tao na nagmamay-ari ng isang partikular na sektor ng proseso sa loob ng pabrika na nais nilang tingnan at makihalubilo sa data na ito sa isang tiyak na paraan. At marahil sa akin, na tinatanaw ang lahat ng mga proseso, marahil ang isang ito sa ilalim, marahil nais kong tingnan ito sa lahat ng bagay. Sa palagay ko ang nakikita natin ay, numero uno, nagsisimula ang mga tao na gumamit ng isang pangkaraniwang hanay ng mga visualizations o karaniwang mga visualizations sa loob ng kanilang mga samahan, ngunit iniayon din sa papel na nasa kanila. Kung ako ay isang proseso ng engineer, marahil iyon ay isang kakaibang pananaw kaysa sa isang taong tumitingin mula sa isang pananaw sa supply chain, at sa palagay ko ay mahusay ito sapagkat kailangang itugma ito at kailangang tingnan ito sa mga lens na kailangan mong gawin ang iyong trabaho.

Dez Blanchfield: Sa palagay ko bumababa ang proseso ng desisyon, matalino at bilis, upang talagang gumawa ng matalino at tumpak na mga pagpapasya ay tumataas din nang mabilis, hindi ba? Dahil kung mayroon kang real-time na analytics, real-time na mga dashboard, kung nakuha mo ang mga tool sa Statistica sa iyong mga kamay hindi mo na kailangang tumakbo sa buong palapag upang magtanong at magtanong sa isang tao tungkol sa isang bagay, nakuha mo na sa hard copy. Maaari kang uri ng pakikipagtulungan, makipag-ugnay at talagang gumawa ng mga pagpapasya sa mabilisang at makuha agad ang kalalabasan. Na sa palagay ko ang ilan sa mga kumpanya ay hindi pa nakakaunawaan, ngunit kapag ginawa nila ito ay magiging sandaling ito eureka na, oo, maaari pa rin tayong manatili sa aming mga cubicle at magtrabaho sa bahay, ngunit maaari tayong makipag-ugnay at makipagtulungan at mga pagpapasyang iyon ginagawa namin habang nagtutulungan kaming maging mga resulta agad. Tingnan, sa palagay ko ito ay hindi kapani-paniwala na marinig kung ano ang sasabihin mo sa ngayon at inaasahan kong inaasahan kung saan ito pupunta. At alam kong marami kaming mga katanungan sa Q&A, kaya tatakbo ako pabalik sa Rebecca upang maipasok ang ilan sa mga maaari upang makarating kami sa mga mabilis na magagawa mo. Maraming salamat.

Rebecca Jozwiak: Salamat Dez, at oo Dave, mayroon kaming kaunting mga katanungan mula sa madla. At salamat Dez at Robin sa iyong mga pananaw din. Alam ko na ang partikular na kalahok na ito ay kailangang bumagsak nang tama sa tuktok ng oras, ngunit siya ay uri ng pagtatanong, nakikita mo ba ang mga departamento ng impormasyon ng impormasyon ay uri ng paglalagay ng higit na prayoridad sa mga sopistikadong mga kontrol sa data kaysa sa uri ng pagiging komportable sa pagbibigay ng mga tool sa ang mga manggagawa sa kaalaman? Ibig kong sabihin, iyon ba - sige.

David Sweenor: Oo, sa palagay ko nakasalalay ito sa samahan. Sa palagay ko ang isang bangko, isang kumpanya ng seguro, marahil ay mayroon silang iba't ibang mga priyoridad at paraan ng paggawa ng mga bagay, kumpara sa isang organisasyon sa marketing. Sa palagay ko sasabihin ko na depende lang ito sa industriya at pag-andar na tinitingnan mo. Iba't ibang mga industriya ay may iba't ibang mga pagtuon at diin.

Rebecca Jozwiak: Okay mabuti, na may katuturan. At pagkatapos ay nais malaman ng isa pang dumalo, ano ang makina sa likod ng Statistica? Ito ba ay C ++ o ang iyong sariling mga bagay?

David Sweenor: Sa totoo lang, hindi ko alam kung makakakuha ako ng tiyak na ito sa loob na ito ay nasa loob ng 30 taon at nabuo ito bago ang aking oras ngunit mayroong isang pangunahing aklatan ng mga analytic algorithm na ang mga Statistica algorithm na tatakbo. At nakita mo dito na maaari rin nating patakbuhin ang R, maaari nating patakbuhin ang Python, maaari tayong sumabog sa Azure, maaari tayong tumakbo sa Spark sa H2O, kaya't hulaan kong sasagutin ko ang tanong na iyon sa mga tuntunin ng, ito ay iba't ibang mga makina. At depende sa aling algorithm na iyong pinili, kung ito ay isang Statistica na tatakbo nito tulad nito, kung pumili ka ng isa sa H2O at Spark, ginagamit nito iyon, at sa gayon iba-iba ang mga ito.

Rebecca Jozwiak: Mabuti. Ang isa pang dumalo na uri ng nagtanong partikular na tumuturo sa slide na ito, nais na malaman, uri ng, paano nalalaman ng data ng siyentipiko ng mamamayan kung aling magagamit ang mga template na gagamitin? At sa palagay ko ay gagawa ako ng isang mas malawak na tanong mula doon. Iyon, ano ang iyong nakikita kapag pumapasok ang mga linya ng negosyo o mga analyst ng negosyo at nais nilang gamitin ang mga tool na ito, gaano kadali para sa kanila ang pumili at tumakbo?

David Sweenor: Sa palagay ko sasagutin ko iyon at kung maaari mong gamitin, kung pamilyar ka sa Windows, ito ay isang platform na nakabase sa Windows, kaya pinutol ko ang tuktok ng mga screenshot na ito, ngunit nakuha nito ang Windows ribbon. Ngunit paano nila nalalaman kung ano ang dapat gamitin sa daloy ng trabaho? Mukhang ang Windows Explorer, kaya mayroong isang istraktura ng puno at maaari mo itong mai-configure at i-set up ito subalit nais ng iyong samahan na i-set up ito. Ngunit maaaring, magkakaroon ka lamang ng mga folder na ito at ilalagay mo ang mga magagamit na template na ito sa loob ng mga folder na ito. At sa palagay ko marahil ay may isang tatak ng pangalan ng iyong kumpanya ay maaaring magpatibay, sabihin dito ang "kalkulahin ang profile ng peligro," narito ang "kumuha ng data mula sa mga mapagkukunang ito" at pangalanan mo sila kahit anong gusto mo. Ito ay isang libreng folder, i-drag mo lamang ang mga tala sa iyong canvas. Kaya, medyo madali.

Rebecca Jozwiak: Mabuti. Baka isang demo sa susunod. Pagkatapos ng isa pang dumalo na uri ng nagdadala, at ito ang pinag-uusapan mo at ni Robin at Dez hanggang sa mga kawastuhan, lalo na sa isang spreadsheet, ngunit ang basura sa / basura ay lumabas, at nakikita niya ito na maging mas kritikal pagdating sa sa analytics. Uri ng pagbanggit na, alam mo, ang maling paggamit ng data ay maaaring humantong sa ilang mga kapus-palad na desisyon. At nagtataka siya kung ano ang iyong mga pananaw sa pagbuo ng mas maraming mga hindi magagaling na algorithm, sa palagay ko, ginamit niya ang salitang, "labis na labis" na paggamit ng mga analytics. Alam mo, ang isang tao ay pumapasok, natutuwa sila, nais nilang gawin ang mga advanced na analytics na ito, nais nilang patakbuhin ang mga advanced algorithm na ito, ngunit marahil hindi sila sigurado. Kaya ano ang gagawin mo upang uri ng pangalagaan laban doon?

David Sweenor: Oo, kaya sa palagay ko sasagutin ko ito hangga't maaari, ngunit sa palagay ko ang lahat ay bumababa sa mga tao, proseso at teknolohiya. Mayroon kaming teknolohiya na makakatulong sa paganahin ng mga tao at tumutulong na paganahin ang anumang proseso na nais mong ilagay sa loob ng iyong samahan. Sa halimbawa ng isang kupon sa isang tao, marahil hindi ito kritikal, at kung digital ito ay talagang walang gastos, marahil mayroong isang antas ng mga kontrol sa seguridad at baka hindi tayo nagmamalasakit. Kung hinuhulaan ko ang mga impeksyong kirurhiko sa site, marahil nais kong maging mas maingat tungkol doon. O kung hinuhulaan ko ang kalidad ng gamot at kaligtasan at mga bagay na ganyan, marahil nais kong maging mas maingat tungkol dito. Tama ka, basura sa / basura, kaya ang sinusubukan naming gawin ay magbigay ng isang platform na nagbibigay-daan sa iyo upang maiangkop ito sa anumang proseso na nais ng iyong samahan.

Rebecca Jozwiak: Mabuti. Mayroon akong ilang higit pang mga katanungan, ngunit alam kong medyo lumipas ang oras namin at nais ko lang sabihin sa aming mga nagtatanghal, iyon ay kahanga-hanga. At nais naming pasalamatan ang maraming Dave Sweenor mula sa Dell Statistica. Siyempre, Dr. Robin Bloor at Dez Blanchfield, salamat sa pagiging analyst ngayon. Magkakaroon kami ng isa pang webcast sa susunod na buwan kasama si Dell Statistica. Alam kong si Dave uri ng hinted tungkol sa paksa. Ito ay tungkol sa analytics sa gilid, isa pang kamangha-manghang paksa, at alam ko na ang ilang mga nakakahimok na mga kaso sa paggamit ay tatalakayin sa webcast na iyon. Kung nagustuhan mo ang nakita mo ngayon, bumalik ka nang higit sa susunod na buwan. At doon, mga tao, nagpaalam ako sa iyo. Maraming salamat. Paalam.