Warehousing ng Data 101

May -Akda: Robert Simon
Petsa Ng Paglikha: 24 Hunyo 2021
I -Update Ang Petsa: 1 Hulyo 2024
Anonim
Warehousing - 10 Principles of Design and Operations
Video.: Warehousing - 10 Principles of Design and Operations

Nilalaman



Takeaway:

Nagbibigay ang warehousing ng data ng isang matatag na pundasyon para sa pagsasama ng makasaysayang, kasalukuyan at hinaharap na data, na nagpapahintulot sa isang organisasyon na makabuo ng mga ulat, magsagawa ng advanced na pagsusuri at gumawa ng ilang data mining.

Maraming mga negosyo ang patuloy na nagtitipon ng malaking halaga ng data. Ngunit upang magamit ang impormasyong iyon, ang isang functional na hanay ng mga proseso at pamamaraan ay dapat ilagay sa lugar upang maunawaan ito.

Kung ikaw ay isang developer ng bodega ng data o naririnig mo ang term na warehousing ng data sa unang pagkakataon, pag-unawa sa mga pangunahing kaalaman ng warehousing ng data - kabilang ang kahulugan nito, kung paano ginagamit at mga benepisyo na maibibigay nito - ay mahalaga.

Kapag nasuri nang maayos ang data, maaari itong magamit upang lumikha ng isang mas malinaw na larawan ng positibo at negatibong epekto na ang karaniwang mga uso at pattern sa isang negosyo. Iyon ay medyo sapat na tunog, ngunit ang pagtiyak na ang data ay kapaki-pakinabang ay isa sa mga pangunahing hamon sa warehousing ng data.


Ano ang Data Warehousing?

Ang isang bodega ng data ay isang sentralisadong imbakan ng yunit (database) na tumutukoy at nagtipon ng data at lahat ng mga malalim na detalye nito. Ang mga detalyeng ito ay maaaring magsama ng impormasyong nauugnay sa isang base ng customer ng customer, service provider, supplier, transaksyon o proseso ng negosyo sa pamamagitan ng paggamit ng isang pinagsama-samang modelo ng data. (Upang malaman ang tungkol sa pamamahala ng proseso ng negosyo, tingnan ang BPM at SOA: Paano Sila Nagtutulak sa Negosyo.)

Ang warehousing ng data ay kumukuha ng data mula sa iba't ibang mga mapagkukunan na magagamit magagamit sa isang kumpanya; ang data na ito ay maaaring masuri sa iba't ibang mga iba't ibang paraan. Ang isang bodega ng data ay isang pinagsama, walang pagbabago, pagkakaiba-iba ng oras at nakabase sa paksa na koleksyon ng impormasyon. Ang ibig sabihin nito ay dapat makamit ng isang bodega ng data ang mga sumusunod na layunin:


  • Makuha at maghatid ng access sa metadata ng negosyo
  • Pagbutihin ang kalidad ng data at i-minimize ang nabuong mga pagkakapareho ng ulat
  • Pagsasama ng data mula sa maraming iba't ibang mga mapagkukunan at magbigay para sa pagbabahagi ng data
  • Dagdagan ang bilis at pagganap ng lahat ng mga pangangailangan sa pag-uulat sa pamamagitan ng pinagsama ang makasaysayang at kasalukuyang data nang epektibo at mahusay

Mga Uri ng Data

Nagbibigay ang isang bodega ng data ng pinahusay na mga diskarte sa negosyo ng negosyo sa pamamagitan ng pagkuha ng data mula sa iba't ibang mga mapagkukunan at pinapayagan ang mga gumagamit ng negosyo na mabilis na ma-access ang mga kritikal na data mula sa isang ibinahaging lokasyon. Ang uri ng data na nakolekta sa isang bodega ng data ay nakabase sa paksa, isinama at nakilala o naka-synchronize sa loob ng isang tiyak na tagal ng oras.

Pagdating sa warehousing ng data, mayroong apat na pangunahing uri ng data:

Hindi mo maaaring mapabuti ang iyong mga kasanayan sa pag-programming kapag walang nagmamalasakit sa kalidad ng software.

Oras-Uri ng Data

Ang data na variant ng oras ay nagsisiguro na ang lahat ng impormasyon na nakaimbak sa bodega ng data ay kasalukuyang at nabuo sa real time. Ang lahat ng mga pangunahing istruktura sa bodega ng data ay naglalaman ng isang elemento ng oras sa pamamagitan ng pagbibigay ng impormasyon mula sa isang pananaw sa abot-tanaw, tulad ng nakaraang limang hanggang 10 taon.

Data-Orienteng Data

Ang data na nakatuon sa paksa ay isinaayos batay sa mga pangunahing kategorya ng paksa ng negosyo, tulad ng mga customer, benta, produkto at serbisyo. Ang orientation ng paksa ay nagbibigay ng isang simple at maigsi na pagtatasa ng mga tinukoy na isyu ng paksa sa pamamagitan ng pagtuon sa modelo at pagsusuri ng mga data na gagamitin ng mga pangunahing tagagawa ng desisyon ng samahan.

Pinagsamaang Data

Ang pinagsama-samang data ay binubuo ng maraming, halo-halong mga mapagkukunan, tulad ng mga database ng relational, mga tala sa online na transaksyon at mga flat file. Kapag matagumpay na isinama ang tinukoy na mga mapagkukunan, ang paglilinis ng data ay inilalapat. Tinitiyak nito ang pagiging pare-pareho sa mga panukalang katangian, pagbibigay ng pangalan sa mga kombensiyon, mga istruktura ng pag-encode at mga pangunahing term sa pamamagitan ng pagbabagong data.

Business Analytics at Pagbuo ng Ulat

Ang isang bodega ng data ay batay sa pagmomolde ng multidimensional na data. Ang isang modelong multidimensional data ay lumilikha ng iba't ibang mga iba't ibang mga view sa anyo ng isang kubo ng data, na nagpapahintulot sa data na maging moderated at tiningnan sa pamamagitan ng maramihang mga sukat. Ang isang bodega ng data ay isa sa mga unang hakbang na ginamit kapag ang isang organisasyon ay nagpapalawak at nagbabago. Pangunahing ginagamit ito kapag nagpasya ang isang kumpanya na magsimulang mamuhunan sa pagsusuri sa negosyo. Ang pagsusuri sa negosyo ay tumatagal ng iba't ibang mga aplikasyon sa teknolohikal at pamamaraan na ginagamit ng korporasyon upang hanapin at makilala ang mga pangangailangan ng negosyo at pagpapabuti batay sa data ng istatistika.

Ang mga analytics ng negosyo ay tumutulong sa mga organisasyon na matuklasan at kilalanin ang mga pattern na maaaring magamit upang mahulaan, humuhusay at mapabuti ang mga kinalabasan ng negosyo. Gayunpaman, ang mga resulta na natipon sa prosesong ito na talagang nabibilang, dahil ang mga ito ay ginagamit upang ipanukala ang paglikha, pagpapatupad at pamamahala ng mga bagong diskarte. (Para sa pagbabasa ng background, tingnan ang Isang Pagpapakilala sa Katalinuhan sa Negosyo.)

Ang mga solusyon sa analytic ng negosyo ay kumuha ng dami at istatistikang data na batay sa katotohanan upang masuri ang nakaraang pagganap at maghanda para sa pagpaplano ng negosyo at mga kahalili. Ang koleksyon ng data ng negosyo ay karaniwang nabuo ng mga makina o aplikasyon sa pamamagitan ng paggamit ng statistical software. Kung bakit maraming mga kumpanya ang gumagamit ng statistical software upang makagawa ng mga pagpapabuti batay sa analytics.

Statistical Software at Business Intelligence

Ang software software ay tinukoy din bilang software ng negosyo intelligence (BI). Para sa maraming mga kumpanya, walang tiyak na proseso ng pagpili ng software, habang ang iba ay sumunod sa isang pamantayan sa korporasyon o mayroon nang isang database o tool sa pag-uulat na nasa lugar na kailangan lamang maisaaktibo. Ang proseso na ginamit kapag pumipili ng naaangkop na analytical software ay nagsisimula sa paglikha ng isang diskarte sa BI at sumunod sa pangkalahatang mga kinakailangan sa negosyo na naitakda.

Ang mga tagapamahala ng negosyo at analyst ay gumaganap ng isang malaking papel sa pagpili ng naaangkop na software at tinitiyak na ang kanilang mga diskarte sa pagtatasa ng negosyo ay magsisimula sa kanila sa tamang direksyon. Ang mga negosyong tulad ng Amazon ay kilala upang subaybayan ang mga uso sa pagbili ng pag-uugali sa mga customer upang malaman ang mga saklaw ng presyo na pinaka komportable sa target na merkado. Ang mga negosyong ito ay maaaring epektibong magpasya ang mga rate ng presyo ng mapagkumpitensya nang hindi nagiging sanhi ng labis na epekto sa kanilang pangkalahatang margin ng kita. Kung walang tinukoy na diskarte sa BI, karaniwan na ang uri ng software na binili ay hindi magkakaloob ng isang samahan ng naaangkop na mga kakayahan sa pagpapasadya na kinakailangan nito.

Pagmimina ng Data

Ang pagmimina ng data ay nagsasangkot sa paghuhukay ng malalim sa data upang makagawa ng mga kapaki-pakinabang na pananaw upang makagawa ng mga katibayan at desisyon na batay sa katotohanan. Sa mga teknikal na termino, ang pagmimina ng data ay maaaring magamit upang makahanap ng mga ugnayan o mga pattern sa iba't ibang larangan mula sa loob ng mga malalaking database ng relational. Mas partikular, ito ay ang proseso ng pagsusuri ng impormasyon mula sa maraming mga pananaw at pagbubuod nito sa kapaki-pakinabang na data. Sa isang pinakamahusay na kaso na ang mga pananaw na ito ay maaaring makatulong sa isang gastos sa pagputol ng negosyo, dagdagan ang mga benta at impluwensyang iba pang mga pangunahing tagapagpahiwatig ng pagganap.

Ang pagmimina ng data ay isang malakas na teknolohiya na maaaring magamit upang matuklasan ang iba't ibang mga sukat, kategorya at mga relasyon na umiiral sa iba't ibang mga mapagkukunan at talaan ng data. Halimbawa, sa sektor ng tingi, ang pagmimina ng data ay maaaring makatulong sa isang kumpanya na makilala ang mga pattern ng benta at pag-uugali ng customer, sa gayon pinapayagan silang mapagsamantalahan ang impormasyon sa kanilang kalamangan. Ang isang kahanga-hangang halimbawa ay ang kakayahang tingian ng Merkado na matukoy kung alin sa mga mamimili ang maaaring asahan, na nagbibigay-daan sa tindahan sa mga kupon para sa mga item ng sanggol sa isang oras na ang mga magulang ay may posibilidad na magsimulang mamili para sa kanila.

Warehousing ng Data Sa isang Nutshell

Kapag pagsasama at paglalapat ng mga diskarte sa warehousing ng data, pinapayagan ng mga pamamaraan ng analytics ng negosyo ang mga organisasyon na mapahusay ang kanilang pangkalahatang mga diskarte sa negosyo at payagan ang pag-optimize sa paggawa ng desisyon sa pamamagitan ng paggamit ng BI software. Mahusay na papel ang ginagampanan ng Analytics sa anumang samahan, at maraming iba't ibang mga pamamaraan, kabilang ang data mining at iba pang iba't ibang mga pamamaraan ng analytical, ay maaaring magamit upang suportahan at makabuo ng naaangkop na mga serbisyo sa pagkolekta ng data at marketing. Ang mga bagong oportunidad at posibilidad ay ginalugad sa pamamagitan ng mga diskarte sa warehousing ng data sa pamamagitan ng pagpapabuti ng serbisyo sa customer, pinasimple ang pamamahala ng imbentaryo, cross-promosenteng mga produkto na umaangkop sa mga indibidwal na pangangailangan ng customer, at pagbibigay ng kritikal na produkto at pagsusuri ng serbisyo.

Ang warehousing ng data ay kung ano ang nagpapahintulot sa mga organisasyon na makahanap ng mga sagot sa mga kumplikadong katanungan sa malalaking hanay ng data. Thats ang lakas ng pagkolekta at pag-iimbak ng data ng digital.