Mengapa Anda Harus Bercampur-campur Bila Anda Sudah Boleh Bergabung Di Tableau?



Pengadukan Data dalam Tableau - kaedah yang digunakan apabila terdapat data yang berkaitan dalam beberapa sumber data, yang ingin anda analisis bersama dalam satu pandangan.

Dalam dunia yang menghasilkan dan menggunakan 2.5 quintillion byte data, sehari, organisasi pasti akan mencari kaedah baru untuk mengubah dan menggabungkan data untuk mencapai kecekapan yang optimum. Salah satu kaedah menggabungkan data adalah Pengadukan Data di Tableau .

Sekarang, kerana ini berfungsi sebagai tujuan penting dalam kitaran data organisasi tertentu, ia menjadikan modul yang sangat penting . Di blog ini, kita akan membincangkan konsep berikut:





Mengapa anda memerlukan Pengadukan Data di Tableau?

Andaikan, anda adalah seorang Jadual pemaju yang mempunyai data transaksi yang disimpan di Salesforce dan data kuota yang tersimpan di Access. Data yang ingin anda gabungkan disimpan dalam pangkalan data yang berlainan, dan butiran data yang ditangkap di setiap jadual berbeza dalam dua sumber data, jadi penggabungan data adalah cara terbaik untuk menggabungkan data ini.

Pengadukan data berguna dalam keadaan berikut:



  1. Anda ingin menggabungkan data dari pangkalan data yang berbeza yang tidak disokong oleh gabungan pangkalan data.

    Gabungan pangkalan data silang tidak menyokong sambungan ke kiub (contohnya, Oracle Essbase) atau ke beberapa sambungan ekstrak sahaja (contohnya, Google Analytics). Dalam kes ini, sediakan sumber data individu untuk data yang ingin anda analisis, dan kemudian gunakan penggabungan data untuk menggabungkan sumber data pada satu helaian.

  2. Data berada pada tahap terperinci yang berbeza.

    Kadang-kadang satu set data menangkap data menggunakan pelbagai tahap perincian iaitu butiran yang lebih besar atau lebih kecil daripada set data lain.

    Sebagai contoh, anggap anda menganalisis data transaksi dan data kuota. Data transaksi mungkin menangkap semua transaksi. Namun, data kuota mungkin mengagregatkan transaksi pada tahap suku tahun. Oleh kerana nilai transaksional diambil pada tahap terperinci yang berbeza dalam setiap set data, anda harus menggunakan pencampuran data untuk menggabungkan data.



    tukar double menjadi integer java

Apakah Pengadukan Data di Tableau?

Pengadukan Data adalah ciri yang sangat kuat dalam Dewan . Ia digunakan ketika ada data yang berkaitan dalam beberapa sumber data, yang ingin anda analisis bersama dalam satu paparan. Ini adalah kaedah untuk menggabungkan data yang melengkapi tabel data dari satu sumber data dengan lajur data dari sumber data lain.

Biasanya, anda menggunakan gabungan untuk melakukan penggabungan data seperti ini, tetapi ada kalanya, bergantung pada faktor seperti jenis data dan butirannya, bila lebih baik menggunakan penggabungan data.

Bagaimana Ia Berbeza Dengan Penyatuan Data?

Pengadukan data mensimulasikan gabungan kiri tradisional. Perbezaan utama antara keduanya adalah bila gabung dilakukan berkenaan dengan pengagregatan.

Kiri bergabung

Apabila anda menggunakan gabungan kiri untuk menggabungkan data, pertanyaan dihantar ke pangkalan data di mana penggabungan dilakukan. Menggunakan gabungan kiri mengembalikan semua baris dari meja kiri dan sebarang baris dari jadual kanan yang mempunyai padanan baris yang sesuai di meja kiri. Hasil gabungan kemudian dihantar kembali ke dan digabungkan oleh Tableau.

Sebagai contoh, anggap anda mempunyai jadual berikut. Sekiranya lajur biasa adalah ID Pengguna , gabungan kiri mengambil semua data dari jadual kiri, serta semua data dari jadual kanan kerana setiap baris memiliki pencocokan baris yang sesuai di meja kiri.

Penggabungan Data - Penggabungan Data di Tableau - EdurekaPengadunan Data

Apabila anda menggunakan pencampuran data untuk menggabungkan data, pertanyaan dikirim ke pangkalan data untuk setiap sumber data yang digunakan pada lembaran. Hasil pertanyaan, termasuk data gabungan, dihantar kembali dan digabungkan oleh Tableau. Pandangan menggunakan semua baris dari sumber data utama, jadual kiri, dan baris gabungan dari sumber data sekunder, jadual kanan, berdasarkan dimensi bidang penghubung.

import sqoop dari oracle ke hdfs

Anda boleh menukar medan pautan atau menambahkan lebih banyak bidang pemautan untuk memasukkan baris data yang berbeza atau tambahan dari sumber data sekunder dalam campuran, mengubah nilai agregat.

Sebagai contoh, anggap anda mempunyai jadual berikut. Sekiranya bidang penghubung adalah ID Pengguna dalam kedua-dua jadual menggabungkan data anda mengambil semua data dari jadual kiri, dan menambah jadual kiri dengan data dari jadual kanan. Dalam kes ini, tidak semua nilai dapat menjadi bagian dari jadual yang dihasilkan kerana berikut:

  • Baris di meja kiri tidak mempunyai padanan baris yang sesuai di meja kanan, seperti yang ditunjukkan oleh nilai nol.
  • Terdapat beberapa nilai yang sesuai dalam baris di tabel kanan, seperti yang ditunjukkan oleh tanda bintang (*).

Katakan anda mempunyai jadual yang sama seperti di atas, tetapi sumber data sekunder mengandungi medan baru yang dipanggil Tujuan . Sekali lagi, jika bidang penghubung adalah ID Pengguna , menggabungkan data anda mengambil semua data dari jadual kiri, dan menambahkannya dengan data dari jadual kanan. Dalam kes ini, anda melihat nilai nol dan tanda bintang yang sama pada contoh sebelumnya selain yang berikut:

  • Kerana ia Tujuan medan adalah ukuran, anda melihat nilai baris untukTujuanbidang digabungkan sebelum data di jadual kanan digabungkan dengan data di jadual kiri.
  • Seperti contoh sebelumnya, baris di jadual kiri tidak mempunyai baris yang sesuai untuk Tujuan medan, seperti yang ditunjukkan oleh nilai nol kedua.

Bila Ganti Bergabung untuk Pengadunan

1. Data perlu dibersihkan.

Sekiranya jadual anda tidak sesuai satu sama lain dengan betul setelah bergabung, siapkan sumber data untuk setiap jadual, buat penyesuaian yang diperlukan (iaitu, ubah nama lajur, ubah jenis data lajur, buat kumpulan, gunakan pengiraan, dll.), Dan kemudian gunakan penggabungan data untuk menggabungkan data.

2. Bergabung menyebabkan pendua data.

Pendua data selepas bergabung adalah gejala data pada tahap perincian yang berbeza. Sekiranya anda melihat data pendua, bukannya membuat gabungan, gunakan penggabungan data untuk menggabungkan dimensi yang sama.

3. Anda mempunyai banyak data.

Biasanya penyertaan digabungkan untuk menggabungkan data dari pangkalan data yang sama. Gabungan dikendalikan oleh pangkalan data, yang memungkinkan bergabung untuk memanfaatkan beberapa kemampuan asli pangkalan data. Namun, jika anda bekerja dengan sekumpulan data yang besar, bergabung dapat memberikan tekanan pada pangkalan data dan mempengaruhi prestasi dengan ketara. Dalam kes ini, penggabungan data mungkin dapat membantu. Kerana Tableau menangani penggabungan data setelah data digabungkan, ada lebih sedikit data untuk digabungkan. Apabila terdapat lebih sedikit data untuk digabungkan, secara amnya, prestasi bertambah baik.

Menggabungkan Data anda di Tableau

Anda boleh menggunakan pencampuran data apabila anda mempunyai data dalam sumber data yang berasingan yang ingin anda analisis bersama dalam satu helaian. Tableau mempunyai dua sumber data terbina dalam bernama Contoh-kedai besar dan Contoh rantai kopi.mdb yang akan digunakan untuk menggambarkan penggabungan data.

Langkah 1: Sambungkan ke data anda dan sediakan sumber data

  • Sambungkan ke sekumpulan data dan sediakan sumber data di halaman sumber data. Seorang isumber data yang dibina Contoh rantai kopi.mdb ,yang merupakan fail pangkalan data MS Access, akan digunakan untuk menggambarkan penggabungan data.
  • Pergi ke Data > Sumber data baru, sambungkan ke kumpulan data kedua.Contoh ini menggunakan Contoh - Superstore sumber data. Tayam menyediakan sumber data.
  • Klik pada tab helaian untuk mula membina pandangan anda.

Langkah 2: Tentukan sumber data utama

  • Seret sekurang-kurangnya satu bidang dari sumber data utama anda ke paparan untuk menetapkannya sebagai sumber data utama. Di dalam Data tetingkap, klik sumber data yang ingin anda tetapkan sebagai sumber data utama. Dalam contoh ini, Contoh rantai kopi dipilih.
  • Tangkapan skrin berikut menunjukkan pelbagai jadual dan gabungan yang terdapat dalam fail.

Langkah 3: Tentukan sumber data sekunder

menggabungkan susun atur c ++
  • Medan yang digunakan dalam paparan dari sumber data yang bukan sumber data utama atau pautan aktif secara automatik menetapkan sumber data berikutnya sebagai sumber data sekunder. Dalam kes ini, Sample Superstore.

Langkah 4: Campurkan Data

  • Sekarang anda boleh mengintegrasikan data dari kedua sumber berdasarkan dimensi yang sama ( Nyatakan , dalam kes ini). Perhatikan bahawa gambar pautan kecil muncul di sebelah dimensi - Nyatakan. Ini menunjukkan dimensi umum antara dua sumber data.
  • Katakan anda membuat carta palang dengan Nisbah Keuntungan di Rangka Lajur dan Nyatakan di Row Shelf, carta menunjukkan bagaimana nisbah keuntungan berbeza untuk setiap negeri di kedua-dua kedai besar dan kedai kopi.

Batasan Pengadukan Data di Tableau

  1. Terdapat beberapa had pencampuran data di sekitar agregat bukan aditif, seperti PERUBATAN , dan RAWSQLAGG .
  2. Pengadukan Data menjejaskan kelajuan Permintaan dengan Butiran tinggi.
  3. Apabila anda cuba mengisih berdasarkan medan yang dikira yang menggunakan data campuran, medan yang dikira tidak disenaraikan dalam senarai lungsur Medan kotak dialog Susun.
  4. Sumber data kubus hanya dapat digunakan sebagai sumber data utama untuk menggabungkan data di Tableau. Mereka tidak dapat digunakan sebagai sumber data sekunder.

Saya harap anda semua, sekarang, mempunyai idea yang adil mengenai Pengadukan Data di Tableau dari blog ini. Lapar untuk mendapatkan lebih banyak pengetahuan? Jangan risau, video ini akan memberi anda pemahaman konsep yang lebih baik.