Mga Catalog ng Data at ang Maturation ng Market Learning Market

May -Akda: Roger Morrison
Petsa Ng Paglikha: 28 Setyembre 2021
I -Update Ang Petsa: 21 Hunyo 2024
Anonim
Tropa ng sundalo sa Marawi, ibinahagi ang aktwal na kuha ng kanilang bakbakan laban sa Maute-ISIS
Video.: Tropa ng sundalo sa Marawi, ibinahagi ang aktwal na kuha ng kanilang bakbakan laban sa Maute-ISIS

Nilalaman


Pinagmulan: Nmedia / Dreamstime.com

Takeaway:

Ang merkado ng MLDC ay lumalaki, at ang mga negosyo na naglalayong epektibong magamit ang malaking data sa pag-aaral ng makina ay dapat magkaroon ng kamalayan ng mga nangungunang pangalan sa larangan at ang kanilang mga indibidwal na ranggo.

Ito ang edad ng malaking data. Napakaraming impormasyon namin, at hinahanap ng mga negosyo ang isang hamon na pamahalaan at kunin ang halaga mula dito.

Ang daloy ng mga bata ng malaking data ay hindi lamang kalakip, dami at bilis, kundi pati na rin pagiging kumplikado. Tulad ng natukoy ng SAS sa Big Data History at Kasalukuyang Mga pagsasaalang-alang na isang kadahilanan ng mga sapa "mula sa maraming mga mapagkukunan, na ginagawang mahirap i-link, tugma, linisin at ibahin ang anyo ng data sa buong mga system." (Nais mong malaman ang higit pa tungkol sa malaking data? Suriin (Big) Datas Big Future.)

Ang paghahanap ng mahalagang pananaw ay hindi isang katanungan ng simpleng pag-iipon ng mas maraming data hangga't maaari, ngunit sa paghahanap ng tamang data. Imposibleng magtrabaho sa lahat ng ito gamit ang mga manu-manong proseso. Ito ang dahilan kung bakit parami nang parami ang mga negosyo na "pag-on sa mga katalogo ng data upang i-democratize ang pag-access sa data, paganahin ang kaalaman ng data ng tribo na mag-curate ng impormasyon, mag-apply ng mga patakaran ng data, at mabilis na buhayin ang lahat ng data para sa halaga ng negosyo."


Dito nakapasok ang larawan ng mga katalogo ng data (kung minsan ay kilala rin bilang mga katalogo ng impormasyon) sa larawan. Tulad ng tinukoy dito, binibigyan sila ng "mga gumagamit upang galugarin ang kanilang mga kinakailangang mapagkukunan ng data at maunawaan ang mga mapagkukunan ng data na ginalugad, at sa parehong oras ay tulungan ang mga organisasyon upang makamit ang higit na halaga mula sa kanilang kasalukuyang pamumuhunan." Ang isa sa mga paraan na ginagawa nito ay sa pamamagitan ng pagpapagana ng higit na higit na pag-access sa data, kabilang sa iba't ibang uri ng mga gumagamit na maaaring magamit o makapag-ambag dito.

Ang Infonomics Imperative

Napansin ang kapansin-pansing tumaas na demand para sa mga katalogo ng data sa katapusan ng 2017, tinawag sila ni Gartner na "bagong itim." Sila ay kinikilala bilang isang mabilis at matipid na solusyon "upang imbentaryo at pag-uri-uriin ang mga samahan na patuloy na ipinamamahagi at hindi naayos ang mga ari-arian ng data at i-mapa ang kanilang mga kadena na nagbibigay ng impormasyon." Ang pangangailangan para sa mga ito ay lumitaw dahil sa pagtaas ng "infonomics," na nanawagan para sa paglalapat ng parehong pagkasukat sa pagsubaybay ng impormasyon tulad ng ginagawa ng isa sa pamamahala ng iba pang mga pag-aari ng negosyo. (Para sa higit pa sa mga kadena ng suplay, tingnan kung Paano Maaaring Mapagbuti ang Pag-aaral ng Machine na Mahusay na Kakayahan ng Supply.)


Ang mga gartner ay kumukuha ng jibes kasama ng The Forrester Wave ™: Catalog ng Pag-aaral ng Data ng Machine, Q2 2018. Higit sa kalahati ng mga kalahok ng survey sa ulat na sinabi na pinaplano nila ang pagbuo ng kanilang pagpapatupad ng katalogo ng data. Malamang na sila ay higit na nahikayat ng katotohanan na ang bawat isa ay may hindi bababa sa pitong mga lawa ng data sa kanilang samahan. Tulad ng ipinaliwanag ng Gartner sa mga katalogo ng data, ang mga katalogo ng data ay partikular na kapaki-pakinabang para sa paghila "ang con, kahulugan at halaga ng data" na karaniwang naiwan sa isang hindi pa natukoy na form sa isang lawa ng data.

Iniulat ng Forrester na higit sa isang third ng mga data at mga nagpapasya sa analytics ay nakikipag-usap sa 1,000TB o higit pang data noong 2017, isang halagang naiulat sa pagitan ng 10 at 14 porsyento sa nakaraang taon. Ang pamamahala ng data sa scale na iyon ay isang lumalagong hamon, o partikular, dalawang hamon:

"1) pagsasama ng umiiral na mga proseso ng negosyo upang mapagkukunan ang data upang pag-aralan ito at ipatupad ang mga pananaw at 2) pag-sourcing, pangangalap, pamamahala, at pamamahala ng data habang lumalaki ito."

Walang Mga bug, Walang Stress - Ang Iyong Hakbang sa Hakbang Patnubay sa Paglikha ng Software na Pagbabago ng Buhay nang Walang Pagsira sa Iyong Buhay

Hindi mo maaaring mapabuti ang iyong mga kasanayan sa pag-programming kapag walang nagmamalasakit sa kalidad ng software.

Ano ang Magagawa ng Mga Catalog ng Data para sa Mga Negosyo

Kinilala ng Gartner ang mga tiyak na paraan kung saan maaaring mapagbuti ng mga katalogo ng data ang isang samahan na daloy ng impormasyon at pagiging produktibo:

  • Pagkolekta at pakikipag-usap ng up-to-date na impormasyon ng imbentaryo ng asset na magagamit sa samahan.

  • Lumilikha ng pangkaraniwang glossary ng mga term sa negosyo na tumutukoy sa semantikong interpretasyon at kahulugan ng mga data ng mga samahan, sa gayon ay nagbibigay ng mga paraan para sa pamamagitan at paglutas ng mga pantay na pagkakapantay-pantay.

  • Ang pagpapagana ng isang pabago-bago at maliksi na kapaligiran sa pakikipagtulungan upang paganahin ang negosyo at IT na mga kasamahan na magkomento, magdokumento at magbahagi ng data.

  • Nagbibigay ng transparency ng paggamit ng data sa linya ng pagsusuri at epekto.

  • Pagsubaybay, pag-awdit at pagsubaybay ng data bilang suporta sa mga proseso ng pamamahala ng impormasyon.

  • Ang pagkuha ng metadata upang mapahusay ang panloob na pagsusuri ng paggamit ng data at muling paggamit, query optimization at sertipikasyon ng data.

  • Kinokontrol ang impormasyon sa loob ng paggamit ng negosyo sa pamamagitan ng pagkuha, pakikipag-usap at pagsusuri kung ano ang umiiral na data, kung saan nanggaling, kung anong cons ito ginagamit sa, kung bakit ito kinakailangan, kung paano ito dumadaloy sa pagitan ng mga proseso at system, na may pananagutan para dito, kung ano ang ibig sabihin nito at kung anong halaga nito.

Ang pagkuha ng data na maayos na kinilala at naa-access sa mga pangunahing tao sa samahan ay mahalaga, ang ulat ng Gartner ay nagsasabi, hindi lamang para sa paghahanap ng paraan "upang gawing pera ang mga assets ng data para sa mga kinalabasan ng negosyo sa digital," ngunit upang sumunod sa mga regulasyon, kung industriya man sila tiyak na tulad ng Health Insurance Portability and Accountability Act (HIPAA) o ng isang mas pangkalahatang katangian tulad ng General Data Protection Regulation (GDPR).

Pagdaragdag sa Pag-aaral ng Machine

Ngunit walang wala sa mga drawbacks nito. Para sa mga katalogo ng data, ang problema ay ang mabagal at nakakapagod na proseso na isinama sa mano-manong pagbuo ng mga ito kasama ang lahat ng metadata na kailangang ilagay sa lugar. Dito napasok ang sangkap ng pag-aaral ng machine.

Ang mga katalogo ng data na tinasa ng Forrester ay tinatawag na MLDC dahil gagamitin nila ang kapangyarihan ng pag-aaral ng makina, isa sa mga sangkap ng AI. Tulad ng ipinaliwanag ng isang blog ng Podium Data, posible na "bumuo ng isang patuloy na sisidlan ng metadata at pagkatapos ay mag-apply ng ML / AI upang ipakita at mailantad ang potensyal na kapaki-pakinabang na mga pananaw sa paligid ng mga pinagbabatayan na mga assets ng data."

Paano Pumili

Upang matulungan ang mga organisasyon na masuri kung alin sa mga negosyo ang dapat pumili, inilapat ng Forrester ang 29 puntos ng pagsusuri sa nangungunang 12 MLDC. Nakilala ang mga namumuno sa merkado na ito bilang: IBM, Relito, Unifi Software, Alation at Collibra. Ang mga malakas na performers na natagpuan ay ang Informatica, Oracle, Data ng Waterline, Infogix, Cambridge Semantics at Cloudera. Ang Hortonworks ay nakatayo nang nag-iisa sa ranggo ng "contender."

Gayunpaman, ang isa ay hindi dapat dumaan sa pangkalahatang ranggo lamang. Ang ulat ay masisira ang mga partikular na lakas at kahinaan ng bawat isa. Alinsunod dito, kung ang isang partikular na tampok, tulad ng pananaliksik at pag-unlad, ay ang pinakamahalagang kahalagahan para sa isang samahan, maaari itong isaalang-alang ang Hortonworks bilang katumbas ng IBM at Colilbra para sa aspeto na iyon sapagkat ang tatlong ito ay nagbabahagi ng nangungunang puntos ng limang para sa kalidad na iyon, na kung saan ay dalawang puntos na mas mahusay kaysa sa Alation at Coloudera at apat na puntos na mas mahusay kaysa sa Cambridge Semantics.

Alinsunod dito, ipinapayo ng ulat ng Forrester sa mga gumagamit ng ulat nito para sa patnubay upang hindi ipagpalagay na ang nangungunang ranggo ng kumpanya ang pinakamahusay na pagpipilian para sa lahat. Dapat nilang bigyang pansin ang pagkasira ng pagtatasa upang mahanap kung ano ang nakakatugon sa kanilang mga partikular na kinakailangan.