Google File System (GFS)

May -Akda: Robert Simon
Petsa Ng Paglikha: 15 Hunyo 2021
I -Update Ang Petsa: 12 Mayo 2024
Anonim
Google File System - Paper that inspired Hadoop
Video.: Google File System - Paper that inspired Hadoop

Nilalaman

Kahulugan - Ano ang ibig sabihin ng Google File System (GFS)?

Ang Google File System (GFS) ay isang scalable na ipinamamahaging file system (DFS) na nilikha ng Google Inc. at binuo upang mapaunlakan ang mga kinakailangang pagproseso ng data ng Google. Nagbibigay ang GFS ng maling pag-tolerate, pagiging maaasahan, scalability, kakayahang magamit at pagganap sa mga malalaking network at konektadong node. Ang GFS ay binubuo ng maraming mga sistema ng imbakan na itinayo mula sa mga mababang bahagi ng mga bahagi ng kalakal ng kalakal. Ito ay na-optimize upang ma-accomodate ang Googles iba't ibang paggamit ng data at mga pangangailangan sa imbakan, tulad ng search engine, na bumubuo ng malaking halaga ng data na dapat na naka-imbak.


Ang File ng Google File System ay ginamit sa lakas ng mga off-the-shelf server habang binabawasan ang mga kahinaan sa hardware.

Kilala rin ang GFS bilang GoogleFS.

Isang Panimula sa Microsoft Azure at ang Microsoft Cloud | Sa buong gabay na ito, malalaman mo kung ano ang lahat ng cloud computing at kung paano makakatulong ang Microsoft Azure sa iyo upang lumipat at patakbuhin ang iyong negosyo mula sa ulap.

Ipinaliwanag ng Techopedia ang Google File System (GFS)

Ang GFS node cluster ay isang master na may maraming mga chunk server na patuloy na na-access ng iba't ibang mga system ng kliyente. Nag-iimbak ang data ng chunk server ng mga file ng Linux sa mga lokal na disk. Ang naka-imbak na data ay nahahati sa mga malalaking chunks (64 MB), na kung saan ay kinokopya sa network ng isang minimum ng tatlong beses. Ang malaking sukat ng tipak ay binabawasan ang overhead ng network.

Ang GFS ay idinisenyo upang mapaunlakan ang mga kinakailangang kumpol ng Google nang walang mga application ng pabigat. Ang mga file ay nakaimbak sa mga hierarchical direktoryo na kinilala ng mga pangalan ng landas. Ang Metadata - tulad ng namespace, data ng control control, at impormasyon sa pagmamapa - ay kinokontrol ng master, na nakikipag-ugnay sa at sinusubaybayan ang mga update sa katayuan ng bawat chunk server sa pamamagitan ng na-time na heartbeat s.


Kasama sa mga tampok ng GFS:

  • Ang pagpapaubaya ng fault
  • Repleksyon ng kritikal na data
  • Awtomatikong at mahusay na pagbawi ng data
  • Mataas na pinagsama-samang throughput
  • Nabawasan ang pakikipag-ugnay sa client at master dahil sa malaking sukat ng chunk server
  • Pamamahala ng pangalan at pag-lock
  • Mataas na pagkakaroon

Ang pinakamalaking kumpol ng GFS ay may higit sa 1,000 node na may kapasidad na imbakan ng disk sa TB. Maaari itong mai-access ng daan-daang mga kliyente sa isang patuloy na batayan.