Hva er forskjellen mellom HBase og MongoDB og Cassandra

Hovedforskjellen mellom HBase og MongoDB og Cassandra er at HBase og Cassandra er kolonneorienterte databaser mens MongoDB er en dokumentorientert database.

Store data refererer til en stor mengde data. Den har tre hovedegenskaper: volum, hastighet og variasjon. Volum refererer til mengden data mens hastighet refererer til generasjonshastigheten til data, og variasjon refererer til typen av data. De vanlige relasjonsdatabaser er ikke effektive for å lagre denne enorme mengden data. Ikke-relasjonelle databaser er løsningen på dette problemet. De kalles også NoSQL databaser. HBase, MongoDB og Cassandra er tre NoSQL databaser. Disse databasene tillater brukere å lagre en stor mengde data og få tilgang til dem tilfeldig.

Nøkkelområder dekket

1. Hva er HBase
     - Definisjon, funksjonalitet
2. Hva er MongoDB
     - Definisjon, funksjonalitet
3. Hva er Cassandra
     - Definisjon, funksjonalitet
4. Hva er likhetene mellom HBase og MongoDB og Cassandra
     - Oversikt over vanlige funksjoner
5. Hva er forskjellen mellom HBase og MongoDB og Cassandra
     - Sammenligning av nøkkelforskjeller

Nøkkelord

HBase, MongoDB, Cassandra

Hva er HBase

HBase, bygget på toppen av Hadoop-filsystemet, er et distribuert kolonneorientert databasefilsystem. Det er et åpen kildekode-prosjekt. Hensikten med å designe HBase er å få tilfeldig tilgang til en stor mengde strukturert data raskt. Det er på toppen av Hadoop filsystemet og gir lese og skrive tilgang.

Videre er HBase kolonneorientert. Rammene brukes til å sortere tabellene. Et bord i HBase er en samling av rader. En rad er en samling av kolonnefamilier, mens en kolonnefamilie er et sett med kolonner. En kolonne er et sett med nøkkelverdier par. Derfor er dette lagringsmekanismen i HBase.

I tillegg gir HBase en rekke funksjoner. Den er lineær skalerbar og gir automatisk feilstøtte. Det gir datareplikasjon på tvers av klynger. Videre integreres det med Hadoop. Videre kan brukeren bruke HBase til å utføre tilfeldig lese-, skriveoperasjoner for å få tilgang til store data og å være vert for store tabeller på råvarehardware.

Hva er MongoDB

MongoDB er en kryssplattform, dokumentorientert database. Den lagrer data i form av et JSON-stil dokument. I MongoDB er et dokument et sett med nøkkelverdige par, mens en samling er et sett med dokumenter. Det ligner på et RDBMS-bord. Dokumentene i samlingen inneholder også ulike felt.

I MongoDB inneholder hver samling flere dokumenter. Antall felt, innhold og størrelse på dokumentet kan variere fra ett dokument til et annet. Derfor er det skjema-mindre. Det er ingen komplekse sammenhenger som i relasjonsdatabaser. Dokumentsbasert spørrespråk hjelper til å utføre dynamiske spørringer i databasen. En viktig faktor når man arbeider med relasjonsdatabaser er at det er nødvendig å konvertere eller kartlegge programobjektene til databaseobjekter for å lagre dem i databasen. Men MongoDB krever ikke den konvertering. Videre bruker den internt minne til å lagre arbeidssett. Derfor har den raskere tilgang til data.

Hva er Cassandra

Cassandra er en åpen kildekode, distribuert, desentralisert database for store data. Det gir høyt tilgjengelige tjenester uten noen enkelt feilpunkt. Organisasjoner som Cisco, Facebook, Twitter og Netflix bruker Cassandra.

Det er flere fordeler med å bruke Cassandra. Det er mulig å legge til mer maskinvare for å støtte flere kunder og data. Derfor gir det skalerbarhet. Videre er det feiltolerant og tilgjengelig kontinuerlig for forretningskritiske applikasjoner. Det kan også utføre skriveoperasjoner av terabyte data raskere. Som Cassandra støtter store data, er det mulig å lagre strukturerte, halvstrukturerte og ustrukturerte data. Videre kan brukeren distribuere data på tvers av flere datasentre.

Likheter mellom HBase og MongoDB og Cassandra.

  • HBase, MongoDB og Cassandra er skjemafrie.
  • Alle bruker samme partisjoneringsmetode.
  • De er pålitelige og gir høy ytelse.
  • Videre støtter de samtidighet.

Forskjellen mellom HBase og MongoDB og Cassandra

Definisjon

HBase er en åpen kildekode, ikke-relasjonell, distribuert database som er modellert etter Googles Bigtable mens MongoDB er et gratis og åpen kildekode-plattform, dokumentorientert databasesystem. I mellomtiden er Cassandra en åpen kildekode, distribuert og desentralisert database for å administrere en stor mengde data. Dette er den grunnleggende forskjellen mellom HBase og MongoDB og Cassandra.

Database Type

En annen forskjell mellom HBase og MongoDB og Cassandra er at HBase og Cassandra er kolonneorienterte mens MongoDB er dokumentorientert.

Språk

HBase er skrevet i Java mens MongoDB er skrevet i C, C ++ og JavaScript, og Cassandra er skrevet i Java. Dette er en stor forskjell mellom HBase og MongoDB og Cassandra.

Utvikler

Apache Software Foundation utviklet HBase og Cassandra mens MongoDB Inc utviklet MongoDB. 

Triggers

En annen forskjell mellom HBase og MongoDB og Cassandra er at HBase og Cassandra har utløser, men MongoDB har ikke utløsere. 

Sekundære indekser

Også, HBase har ingen sekundære indekser, mens MongoDB har sekundære indekser og Cassandra har begrenset sekundære indekser.

Replikeringsmetode

Videre bruker HBase og Cassandra en selekterbar replikasjonsfaktor mens MongoDB bruker en master-slave replikasjonsfaktor. 

Konklusjon

HBase, MongoDB og Cassandra er tre NoSQL eller ikke-relasjonelle databasesystemer. HBase og Cassandra er kolonneorienterte databaser mens MongoDB er en dokumentorientert database. Det er forskjellen mellom HBase og MongoDB og Cassandra. De brukes til ulike applikasjoner som Big Data, Content Management, mobil og sosial infrastruktur og datahubber.

Bilde Courtesy:

1. "MongoDB-Logo-5c3a7405a85675366beb3a5ec4c032348c390b3f142f5e6dddf1d78e2df5cb5c" Av Alexander Sosluev - Egne arbeid (CC BY-SA 4.0) via Commons Wikimedia
2. "Cassandra logo" Av Apache Software Foundation (Apache License 2.0) via Commons Wikimedia