Bagaimana Menjalankan Skrip Hive?



Ini adalah tutorial bagaimana menjalankan Hive Scripts. Menjalankan skrip ini akan mengurangkan masa dan usaha yang kita lakukan untuk menulis dan melaksanakan setiap perintah secara manual.

Sebagai pakej Data Warehousing yang dibina di atas Hadoop, Apache Hive semakin digunakan untuk analisis data, perlombongan data dan pemodelan ramalan. Organisasi mencari profesional dengan pegangan tegas . Dalam catatan ini, mari kita lihat cara menjalankan Skrip Hive. Secara umum, kami menggunakan skrip untuk melaksanakan sekumpulan pernyataan sekaligus. Hive Skrip digunakan dengan cara yang sama. Ini akan mengurangkan masa dan usaha yang kita lakukan untuk menulis dan melaksanakan setiap perintah secara manual.

Skrip Hive disokong dalam versi Hive 0.10.0 dan ke atas. Oleh kerana versi Hive 0.90 dipasang dalam CDH3, kita tidak dapat menjalankan Skrip Hive dalam CDH3. Anda boleh mencuba langkah-langkah berikut dalam CDH4 kerana versi Hive 0.10.0 dipasang di dalamnya. Adakah anda mengetahui cara membuat skrip Hive? Sekiranya tidak, klik untuk mendapatkan lebih banyak penjelasan.





Master-Hive-Now

Sekarang, mari kita lihat bagaimana menulis skrip di Hive dan menjalankannya dalam CDH4:



Langkah 1: Menulis skrip Hive.

Untuk menulis Skrip Hive fail harus disimpan dengan sambungan .sql. Buka terminal dalam pengedaran Cloudera CDH4 anda dan berikan arahan berikut untuk membuat Hive Script.
Perintah: sudo gedit sample.sql

Semasa menjalankan perintah di atas, ia akan membuka fail dengan senarai semua perintah Hive yang perlu dijalankan.



Dalam skrip ini, jadual akan dibuat, dijelaskan dan data akan dimuat dan diambil dari jadual.

1. Membuat Jadual di Sarang:

Perintah: buat produk jadual (productid: int, productname: string, price: float, category: string) format baris yang dipisahkan oleh baris ditamatkan oleh ','

Di sini, produk adalah nama jadual dan {productid, productname, price, category} adalah lajur jadual ini.

Medan yang diakhiri dengan ',' menunjukkan bahawa lajur dalam fail input dipisahkan oleh simbol ','.

Secara lalai rekod dalam fail input dipisahkan oleh baris baru.

c ++ susun atur

2. Memerihalkan Jadual:

Perintah: menerangkan produk

3. Memuatkan Data ke dalam Jadual.

Untuk memuatkan data ke dalam jadual terlebih dahulu kita perlu membuat fail input yang berisi catatan yang perlu dimasukkan ke dalam tabel.

Mari kita buat fail input.

Perintah: sudo gedit input.txt

Edit isi dalam fail seperti yang ditunjukkan pada gambar.

4. Mengambil Data:

Untuk mengambil data, perintah pilih digunakan.

Perintah: Pilih * dari produk

Perintah di atas digunakan untuk mendapatkan nilai semua lajur yang terdapat dalam jadual. Skripnya harus seperti yang ditunjukkan pada gambar di bawah.

perbezaan antara c c # dan c ++

Sekarang, kita sudah selesai menulis skrip Hive. Contoh fail.sql kini boleh disimpan.

Langkah 2: Menjalankan Skrip Hive

Berikut adalah arahan untuk menjalankan skrip Hive:

Perintah: sarang –f /home/cloudera/sample.sql

Semasa menjalankan skrip, pastikan bahawa keseluruhan lokasi lokasi fail Skrip ada.

Kita dapat melihat bahawa semua arahan dilaksanakan dengan jayanya.

Ini adalah bagaimana skrip Hive dijalankan dan dijalankan dalam CDH4.

Hive adalah komponen kritikal Hadoop dan kepakaran anda dalam Hive dapat menjadikan anda pekerjaan Hadoop dengan gaji tertinggi! Edureka mempunyai kursus Hadoop yang disusun khas yang membantu anda menguasai konsep seperti MapReduce, Yarn, Pig, Hive, HBase, Oozie, Flume dan Sqoop. Klik pada butang di bawah untuk memulakan.

Ada soalan untuk kami? Sila sebutkan di bahagian komen dan kami akan menghubungi anda.

Catatan berkaitan:

pentadbir yang diperakui cloudera untuk apache hadoop

Perintah Hive

Model Data Hive