Apache Nutch

May -Akda: Eugene Taylor
Petsa Ng Paglikha: 8 Agosto. 2021
I -Update Ang Petsa: 20 Hunyo 2024
Anonim
Apache Nutch 2.0 Tutorial (with Elasticsearch)
Video.: Apache Nutch 2.0 Tutorial (with Elasticsearch)

Nilalaman

Kahulugan - Ano ang ibig sabihin ng Apache Nutch?

Ang Apache Nutch ay isang produkto ng software ng software ng crawler na maaaring magamit upang maipon ang data mula sa web. Ginagamit ito kasabay ng iba pang mga tool sa Apache, tulad ng Hadoop, para sa pagsusuri ng data.


Isang Panimula sa Microsoft Azure at ang Microsoft Cloud | Sa buong gabay na ito, malalaman mo kung ano ang lahat ng cloud computing at kung paano makakatulong ang Microsoft Azure sa iyo upang lumipat at patakbuhin ang iyong negosyo mula sa ulap.

Ipinaliwanag ng Techopedia ang Apache Nutch

Ang Apache Nutch ay isang open-source na produkto na lisensyado ng Apache Software Foundation. Ang komunidad ng developer na ito ay naghahawak ng mga lisensya para sa isang hanay ng mga tool ng Apache software na maaaring pag-uri-uriin at pag-aralan ang data. Ang isa sa mga sentral na teknolohiya ay si Apache Hadoop, isang malaking tool ng analytics ng data na napakapopular sa komunidad ng negosyo.

Kasabay ng mga tool tulad ng Apache Hadoop at mga tampok para sa pag-iimbak ng file, pagsusuri at iba pa, ang papel ng Nutch ay upang mangolekta at mag-imbak ng data mula sa web sa pamamagitan ng paggamit ng mga web algorithm ng pag-crawl.


Maaaring samantalahin ng mga gumagamit ang mga simpleng utos sa Apache Nutch upang mangolekta ng impormasyon sa ilalim ng mga URL. Ang mga gumagamit ay karaniwang gumagamit ng Apache Nutch kasama ang isa pang bukas na mapagkukunan na tool, isang balangkas na tinatawag na Apache Solr, na maaaring kumilos bilang isang imbakan para sa data na nakolekta kasama ang Apache Nutch.