Pemasangan Apache Pig di Linux



Blog ini adalah panduan langkah demi langkah untuk Pemasangan Apache Pig pada persekitaran Linux. Kami akan memasang Apache Pig 0.16.0 dan menjalankannya dalam mod yang berbeza.

Dalam catatan ini, saya akan bercakap mengenai Pemasangan Apache Pig di Linux . Mari kita mulakan dengan definisi asas Apache Pig dan Pig Latin.

Babi Apache adalah alat / platform untuk membuat dan melaksanakan program Map Reduce yang digunakan dengan Hadoop. Ini adalah alat / platform untuk menganalisis set data yang besar. Anda boleh katakan, Apache Pig adalah singkatan dari MapReduce. Pengaturcara yang tidak begitu mahir di Jawa biasa bertungkus lumus mengusahakan Hadoop, terutamanya semasa menulis pekerjaan MapReduce.Jadi, ini adalah topik penting untuk dipelajari dan dikuasai .Babi Apache mempunyai bahasanya sendiri Babi Latin yang memberi kebaikan kepada pengaturcara yang lemah.





Pengenalan asas untuk Pig Latin akan membantu anda memahami dengan lebih baik:

Bahasa prosedur peringkat tinggi yang digunakan dalam platform Apache Pig disebut Babi Latin . Apache Pig menampilkan ‘Pig Latin’ yang merupakan bahasa yang lebih sederhana yang dapat berjalan di atas set data yang diedarkan pada Hadoop File System (HDFS). Di Apache Pig, anda perlu menulis skrip Babi menggunakan bahasa Latin Babi, yang akan ditukar menjadi pekerjaan MapReduce ketika menjalankan skrip Babi. Apache Pig mempunyai pelbagai pengendali yang digunakan untuk melakukan tugas seperti membaca, menulis, memproses data. Untuk mengetahui mengenai pengendali Apache Pig, pergi ke blog kami “ Pengendali di Apache Pig: Bahagian 1- Relational Operators '

Setelah anda memahami asas Apache Pig, mari kita mulakan dengan Pemasangan Apache Pig di Linux.



Pemasangan Apache Pig di Linux:

Berikut adalah langkah-langkah untuk Pemasangan Apache Pig di Linux (ubuntu / centos / windows menggunakan Linux VM). Saya menggunakan Ubuntu 16.04 dalam persediaan di bawah.

Langkah 1: Muat turun Babi tar fail.

Perintah: wget http://www-us.apache.org/dist/pig/pig-0.16.0/pig-0.16.0.tar.gz



Muat turun Babi - Pemasangan Babi - Edureka

Langkah 2: Ekstrak tar fail menggunakan perintah tar. Di bawah arahan tar, x bermaksud mengekstrak fail arkib, dengan bermaksud menapis arkib melalui gzip, f bermaksud nama fail fail arkib.

Perintah: tar -xzf babi-0.16.0.tar.gz

Perintah: ls

cara mengimbas watak dalam java

Langkah 3: Edit ' .bashrc 'Fail untuk mengemas kini pemboleh ubah persekitaran Apache Pig. Kami mengaturnya sehingga kami dapat mengakses babi dari direktori mana pun, kami tidak perlu pergi ke direktori babi untuk menjalankan perintah babi. Juga, jika ada aplikasi lain yang mencari Babi, ia akan mengetahui jalan Apache Pig dari fail ini.

Perintah: sudo gedit .bashrc

Tambahkan yang berikut di akhir fail:

# Tetapkan PIG_HOME

eksport PIG_HOME = / rumah / edureka / babi-0.16.0
eksport PATH = $ PATH: /home/edureka/pig-0.16.0/bin
eksport PIG_CLASSPATH = $ HADOOP_CONF_DIR

Juga, pastikan jalan hadoop juga ditetapkan.

Jalankan perintah di bawah untuk membuat perubahan dikemas kini di terminal yang sama.

Perintah: sumber .bashrc

Langkah 4: Periksa versi babi. Ini untuk menguji bahawa Apache Pig dipasang dengan betul. Sekiranya anda tidak mendapat versi Apache Pig, anda perlu mengesahkan sama ada anda telah mengikuti langkah di atas dengan betul.

Perintah: babi-penukaran

Langkah 5 :Periksa bantuan babi untuk melihat semua pilihan perintah babi.

pl sql tutorial untuk pemula

Perintah: khinzir

Langkah 6 :Jalankan Babi untuk memulakan cengkerang. Grunt shell digunakan untuk menjalankan skrip Pig Latin.

Perintah: babi

Sekiranya anda melihat gambar di atas dengan betul, Apache Pig mempunyai dua mod di mana ia dapat dijalankan, secara lalai memilih mod MapReduce. Mod lain di mana anda boleh menjalankan Babi adalah mod Tempatan. Izinkan saya memberitahu anda lebih lanjut mengenai perkara ini.

Mod pelaksanaan di Babi Apache:

  • Mod MapReduce - Ini adalah mod lalai, yang memerlukan akses ke kluster Hadoop dan pemasangan HDFS. Oleh kerana, ini adalah mod lalai, tidak perlu menentukan bendera -x (anda boleh laksanakan babi ATAU babi -x mapreduce ). Input dan output dalam mod ini terdapat pada HDFS.
  • Mod tempatan - Dengan akses ke satu mesin, semua fail dipasang dan dijalankan menggunakan sistem host dan fail tempatan. Di sini mod tempatan ditentukan menggunakan ‘-x flag’ ( babi -x tempatan ). Input dan output dalam mod ini terdapat pada sistem fail tempatan.

Perintah: babi -x tempatan

bermula dengan studio visual

Anda boleh melalui video di bawah ini untuk menonton Pemasangan Apache Pig di Linux:

Pemasangan Babi Apache | Pemasangan Babi di Linux | Edureka

Sekarang setelah anda selesai dengan Pemasangan Apache Pig di Linux, langkah seterusnya adalah mencuba beberapa operator Pig yang berkaitan dengan shell Pig Grunt. Oleh itu, blog seterusnya ' Pengendali di Apache Pig: Bahagian 1- Relational Operators 'Akan membantu anda menguasai operator Babi.

Setelah anda memasang Apache Pig di Linux, periksa oleh Edureka, sebuah syarikat pembelajaran dalam talian yang dipercayai dengan rangkaian lebih daripada 250,000 pelajar berpuas hati yang tersebar di seluruh dunia. Kursus Latihan Pensijilan Hadoop Data Besar Edureka membantu pelajar menjadi pakar dalam bidang HDFS, Benang, MapReduce, Babi, Hive, HBase, Oozie, Flume dan Sqoop menggunakan kes penggunaan masa nyata di domain Runcit, Media Sosial, Penerbangan, Pelancongan, Kewangan.

Ada soalan untuk kami? Sila sebutkan di bahagian komen dan kami akan menghubungi anda.