Ano ang ilan sa mga pangunahing isyu upang isaalang-alang sa isang malaking diskarte sa imbakan ng data? googletag.cmd.push (function () {googletag.display (div-gpt-ad-1562928221186-0);}); T:

May -Akda: Roger Morrison
Petsa Ng Paglikha: 28 Setyembre 2021
I -Update Ang Petsa: 1 Hulyo 2024
Anonim
Ano ang ilan sa mga pangunahing isyu upang isaalang-alang sa isang malaking diskarte sa imbakan ng data? googletag.cmd.push (function () {googletag.display (div-gpt-ad-1562928221186-0);}); T: - Teknolohiya
Ano ang ilan sa mga pangunahing isyu upang isaalang-alang sa isang malaking diskarte sa imbakan ng data? googletag.cmd.push (function () {googletag.display (div-gpt-ad-1562928221186-0);}); T: - Teknolohiya

Nilalaman

T:

Ano ang ilan sa mga pangunahing isyu upang isaalang-alang sa isang malaking diskarte sa imbakan ng data?


A:

Ang isa sa mga pinakamalaking isyu na hindi pinapansin para sa malaking data storage ay ang kakayahang ma-access para sa mga koponan na nangangailangan nito. Ang data ay regular na nakaimbak nang walang dokumentasyon, sa mga lugar kung saan mahirap ma-access o kung saan ang mga nauugnay na koponan ay hindi natatakot sa katotohanan na mayroon itong lahat. Sa huli, ang malaking pag-iimbak ng data ay dapat gumawa ng isang bukas na unang diskarte kung saan ang mga koponan ay may kamalayan sa pagkakaroon nito, kung ano ang binubuo ng data at kung paano ma-access ito tulad ng mga koponan na maaaring magamit ang mga ito sa software kung kailangan nila ito.

Ang isa pang kritikal na isyu na nahanap ko ay ang kalidad ng data na iniimbak. Ang data ay dapat na naka-imbak sa pinakamataas na kalidad ng form na maaari itong umiiral sa huling lugar ng pag-iimbak nito. Ang pag-iimbak ng mababang data ng kalidad sa isang lawa ng data ay karaniwang pagmultahin, ngunit habang nagpapatuloy ito sa linya ng data ng pipeline bawat yugto ay dapat dagdagan ang kalidad ng data tulad nito na nakaimbak sa pinakamataas na kalidad ng form sa isang sistema tulad ng isang data warehouse o database ng analytics. Dagdagan nito ang kalidad ng mga system na ubusin ang resting lugar ng data.