Open-Source Big Data Analytics

May -Akda: Laura McKinney
Petsa Ng Paglikha: 1 Abril 2021
I -Update Ang Petsa: 14 Mayo 2024
Anonim
Open source Big data & analytics and Visualization Platform (KAVE) - KPMG
Video.: Open source Big data & analytics and Visualization Platform (KAVE) - KPMG

Nilalaman

Kahulugan - Ano ang ibig sabihin ng Open-Source Big Data Analytics?

Ang open-source malaking data analytics ay tumutukoy sa paggamit ng bukas na mapagkukunan ng software at mga tool para sa pagsusuri ng malaking dami ng data upang makolekta ang may-katuturang at aksyon na impormasyon na maaaring magamit ng isang samahan upang mapalawak pa ang mga layunin ng negosyo. Ang pinakamalaking manlalaro sa open-source malaking data analytics ay Apaches Hadoop - ito ang pinakalawak na ginagamit na software library para sa pagproseso ng napakalaking set ng data sa isang kumpol ng mga computer gamit ang isang ipinamamahaging proseso para sa pagkakatulad.


Isang Panimula sa Microsoft Azure at ang Microsoft Cloud | Sa buong gabay na ito, malalaman mo kung ano ang lahat ng cloud computing at kung paano makakatulong ang Microsoft Azure sa iyo upang lumipat at patakbuhin ang iyong negosyo mula sa ulap.

Ipinapaliwanag ng Techopedia ang Open-Source Big Data Analytics

Ang open-source malaking data analytics ay gumagamit ng open-source software at mga tool upang maisagawa ang malaking data analytics sa pamamagitan ng alinman sa paggamit ng isang buong platform ng software o iba't ibang mga tool na open-source para sa iba't ibang mga gawain sa proseso ng mga analytics ng data. Ang Apache Hadoop ay ang pinaka kilalang sistema para sa malalaking analytics ng data, ngunit ang iba pang mga sangkap ay kinakailangan bago magkasama ang isang tunay na sistema ng analytics.

Ang Hadoop ay ang open-source na pagpapatupad ng MapReduce algorithm na pinangunahan ng Google at Yahoo, kaya ito ang batayan ng karamihan sa mga sistema ng analytics ngayon. Maraming mga malalaking tool sa analytics ng data ang gumagamit ng bukas na mapagkukunan, kabilang ang mga matatag na sistema ng database tulad ng bukas na mapagkukunan na MongoDB, isang sopistikadong at nasusukat na database ng NoSQL na angkop para sa malaking aplikasyon ng data, pati na rin sa iba.


Ang open-source malaking data analytics serbisyo ay sumasaklaw sa:

  • Sistema ng koleksyon ng data
  • Control center para sa pangangasiwa at pagsubaybay sa mga kumpol
  • Pag-aaral ng makina at data ng aklatan ng pagmimina
  • Serbisyo ng koordinasyon ng aplikasyon
  • Compute engine
  • Balangkas ng pagpapatupad