Apache Kudu

May -Akda: Laura McKinney
Petsa Ng Paglikha: 1 Abril 2021
I -Update Ang Petsa: 14 Mayo 2024
Anonim
Intro to Apache Kudu by Asim Jalis, Galvanize
Video.: Intro to Apache Kudu by Asim Jalis, Galvanize

Nilalaman

Kahulugan - Ano ang ibig sabihin ng Apache Kudu?

Si Apache Kudu ay isang miyembro ng open-source na Apache Hadoop ecosystem. Ito ay isang bukas na mapagkukunan ng imbakan ng engine na inilaan para sa nakabalangkas na data na sumusuporta sa mababang latency random na pag-access kasama ang mahusay na mga pattern ng pag-access sa pag-access. Ito ay dinisenyo at ipinatupad upang tulay ang agwat sa pagitan ng malawak na ginagamit na Hadoop na ipinamamahaging File System (HDFS) at HBase NoSQL Database. Bagaman maaari pa ring patunayan ang mga sistemang ito, ang Apache Kudu ay maaaring magsilbi sa maraming karaniwang mga kargamento dahil maaari itong kapansin-pansing gawing simple ang kanilang arkitektura.


Isang Panimula sa Microsoft Azure at ang Microsoft Cloud | Sa buong gabay na ito, malalaman mo kung ano ang lahat ng cloud computing at kung paano makakatulong ang Microsoft Azure sa iyo upang lumipat at patakbuhin ang iyong negosyo mula sa ulap.

Ipinapaliwanag ng Techopedia si Apache Kudu

Pangunahing binuo si Apache Kudu bilang isang proyekto sa Cloudera. Karamihan sa mga kontribusyon hanggang sa ngayon ay sa pamamagitan ng mga developer na pinagtatrabahuhan ni Cloudera. Sa paglabas nito, ang mga binaries lamang ng kaginhawaan ay kasama sa mga repositori ng Cloudera, gayunpaman pinagtibay nito ang proseso ng paglabas ng mapagkukunan ng Apache Software Foundation (ASF) nang sumali sa incubator. Ito ay partikular na idinisenyo para sa mga kaso ng paggamit na nangangailangan ng mabilis na analytics sa mabilis na data. Ito ay ininhinyero upang samantalahin ang susunod na henerasyon na hardware at pagproseso ng memorya. Ito ay nagpapababa ng query sa latency ng makabuluhang para sa Apache Impala at Apache Spark. Ito ay namamahagi ng data sa pamamagitan ng pag-iimbak ng kolum ng haligi o sa pamamagitan ng pahalang na pagkahati, pagkatapos ay tumutulad sa bawat pagkahati gamit ang Raft consensus sa gayon ay nagbibigay ng mababang kahulugan ng oras-sa-pagbawi at mababang mga haba ng buntot.


Kahit na Ang Kudu ay isang produkto na idinisenyo sa loob ng conache ng Apache Hadoop ecosystem, sinusuportahan din nito ang pagsasama sa iba pang mga proyekto ng analytics ng data kapwa sa loob at labas ng ASF.

Ang Apache Kudu ay napatunayan na maging mahusay dahil maaari nitong iproseso ang mga real-time na mga pag-analisa sa trabaho sa buong isang solong layer ng pag-iimbak, kaya binibigyan ang kakayahang umangkop ng mga arkitekto upang matugunan ang isang mas malawak na iba't ibang mga kaso ng paggamit nang walang mga kakaibang workarounds.