OLTP vs OLAP



Blog berikut membincangkan secara ringkas mengenai OLTP vs OLAP dan pelbagai kes penggunaan.

OLTP vs OLAP

OLTP dikatakan lebih merupakan sistem transaksi dalam talian atau sistem penyimpanan data, di mana pengguna melakukan banyak transaksi dalam talian menggunakan kedai data. Ia juga dikatakan mempunyai lebih banyak bacaan / penulisan ad-hoc yang berlaku secara real time.





OLAP lebih merupakan simpanan data luar talian. Ia diaksesBeberapa kalisecara fesyen luar talian. Contohnya, fail log pukal dibaca dan kemudian ditulis kembali ke fail data. Beberapa kawasan umum di mana OLAP digunakan adalah Pekerjaan Log, Pekerjaan perlombongan data, dll.

Cassandra dikatakan lebih banyak OLTP, kerana ini adalah masa nyata, sedangkan Hadoop lebih banyak OLAP, kerana digunakan untuk analisis dan penulisan pukal.



Mengapa Mengintegrasikan OLAP & OLTP?

Sekiranya sekiranya anda mencari harga termurah untuk tempahan hotel dalam 365 hari ke depan, di sini anda mempunyai set data besar untuk Cassandra dan ingin mendapatkan cadangan pada pangkalan data masa nyata, promo dijalankan berdasarkan harga.

penukaran jenis c ++

Dalam senario seperti itu, kita harus mengulangi semua catatan dan menjaga analisis di atasnya, yang merupakan pekerjaan luar talian yang sangat besar yang harus sering dimulakan. Di sini, Hadoop mula bermain untuk pengurangan data Pukal.

Manfaat lain ialah kita dapat menjalankan satu kluster dan membatalkan menjalankan kluster Hadoop yang lain.



Manfaat ketiga ialah seseorang juga dapat mengurangkan banyak kos operasi.

Memandangkan senario, di mana, jika pengguna mahir dalam pelbagai sistem Hadoop Eco, seperti Hive, Pig Latin dan perlu mengintegrasikan data ke dalamnya, maka seseorang harus memasukkan beberapa sumber data di Cassandra dan berusaha menjalankan Peta Kurangkan pekerjaan juga.

Terdapat corak yang ketara antara OLTP & OLAP. Di OLTP, jumlah penulisan lebih sedikit, mis. Maklumat Hotel. Dengan andaian bahawa perubahan Harga berlaku setiap 5000 kali sesaat, bacaannya mungkin lebih banyak di sini. Dalam senario seperti itu, boleh ada 1 penulisan sesaat tetapi bacaannya dapat melambung hingga ratusan dan ribuan. Jadi nisbah di sini adalah sekitar 1: 1000.

Ini adalah pemerhatian yang menarik bahawa Cassandra dapat masuk ke dalam model ini dengan mudah, yang merangkumi model, di mana membaca / menulis sama. Juga, ketika datang ke OLTP, bahkan jika seseorang masuk ke dalam model konsistensi yang dapat disesuaikan dan kuat, seseorang dapat melihat jurang milidetik antara model konsisten akhirnya dan model konsisten terkuat. Oleh itu, Cassandra boleh masuk ke dalam OLTP.

Ketika datang ke OLAP, seseorang dapat melihat corak OLAP yang berbeza, yang bermaksud terdapat beberapa penulisan yang berlaku secara serentak. Di OLAP, kami membuang data dalam satu tangkapan iaitu semua fail log dimasukkan ke dalam penyimpanan data dan kemudian kami mula memprosesnya. Corak data atau corak akses adalah kebalikan dari jenis aplikasi OLTP. Di sini, Hadoop atau MapReduce akan berguna.

Ada soalan untuk kami? Sebutkannya di bahagian komen dan kami akan menghubungi anda.

Catatan berkaitan:

5 Sebab Teratas untuk Belajar Cassandra