Diferența dintre RDBMS și Hadoop

diferența cheie între RDBMS și Hadoop este faptul că RDBMS stochează date structurate, în timp ce Hadoop stochează date structurate, semi-structurate și nestructurate.

RDBMS este un sistem de gestionare a bazelor de date bazat pe modelul relațional. Hadoop este un software pentru stocarea datelor și rularea aplicațiilor pe grupuri de hardware de mărfuri.

CUPRINS

1. Prezentare generală și diferență cheie
2. Ce este RDBMS?
3. Ce este Hadoop
4. Comparație de la o parte la alta - RDBMS vs Hadoop în formă tabulară
5. rezumat

Ce este RDBMS??

RDBMS reprezintă sistemul relațional de gestionare a bazelor de date bazat pe modelul relațional. În RDBMS, tabelele sunt utilizate pentru a stoca date, iar cheile și indexurile ajută la conectarea tabelelor. Un tabel este o colecție de elemente de date și ele sunt entități. Conține rânduri și coloane. Rândurile reprezintă o singură intrare în tabel. Coloanele reprezintă atributele.

De exemplu, baza de date privind vânzările poate avea entități de clienți și produse. Clientul poate avea atribute precum customer_id, nume, adresa, phone_no. Elementul poate avea atribute, cum ar fi product_id, nume etc. Cheia primară a tabelului clientului este client_id în timp ce cheia primară a tabelului de produse este product_id. Plasarea produsului_id în tabelul de clienți ca o cheie străină leagă aceste două entități. De asemenea, tabelele sunt legate una de cealaltă. Acestea asigură integritatea datelor, normalizarea și multe altele. Puține dintre RDBMS-urile comune sunt MySQL, MSSQL și Oracle. Ei folosesc SQL pentru interogare.

Ce este Hadoop?

Hadoop este un framework open source al lui Apache scris în Java. Acesta ajută la stocarea și procesarea unei cantități mari de date între clustere de computere utilizând modele simple de programare. Obiectivul principal al Hadoop este de a stoca și prelucra datele mari, care se referă la o cantitate mare de date complexe. Procesul Hadoop, care este capacitatea de a procesa un volum de date într-o anumită perioadă de timp, este ridicat.

Există patru module în arhitectura Hadoop. Acestea sunt frecvente Hadoop, YARN, Hadoop Distributed File System (HDFS) și Hadoop MapReduce. Modulul comun conține bibliotecile și utilitățile Java. De asemenea, are fisiere pentru a incepe Hadoop. Hadoop YARN efectuează programarea de locuri de muncă și gestionarea resurselor cluster.

În plus, sistemul de distribuire a fișierelor Hadoop (HDFS) este sistemul de stocare Hadoop. Utilizează arhitectura master-slave. Nodul Master este numeleNode și gestionează meta datele sistemului de fișiere. Alte computere sunt noduri slave sau Noduri de date. Ele stochează datele reale. Pe de altă parte, Hadoop MapReduce face calculul distribuit. Are algoritmi de procesare a datelor. În HDFS, nodul Master are un tracker de locuri de muncă. Aceasta rulează hărți pentru a reduce locurile de muncă pe nodurile slave. Există un Task Tracker pentru fiecare nod slave pentru a finaliza procesarea datelor și pentru a trimite rezultatul înapoi la nodul principal. În ansamblu, Hadoop oferă stocarea masivă a datelor cu o putere de procesare ridicată.

Care este diferența dintre RDBMS și Hadoop?

RDBMS vs Hadoop

RDBMS este un software de sistem pentru crearea și gestionarea bazelor de date bazate pe modelul relațional. Hadoop este o colecție de software open source care conectează mai multe computere pentru a rezolva probleme care implică o cantitate mare de date și de calcul.
 Varietatea datelor
RDBMS stochează date structurate. Hadoop stochează date structurate, semi-structurate și nestructurate.
Stocare a datelor
RDBMS stochează cantitatea medie de date. Hadoop stochează o cantitate mare de date decât RDBMS.
 Viteză
În RDBMS, citirile sunt rapide. În Hadoop, citește și scrie sunt rapide.
scalabilitate
RDBMS are scalabilitate verticală. Hadoop are scalabilitate orizontală.
Hardware
RDBMS utilizează servere high-end. Hadoop folosește hardware de marfă.
  tranzitată
Transmiterea RDBMS este mai mare. Procesul Hadoop este mai mic.

Rezumat - RDBMS vs Hadoop

Acest articol a discutat diferența dintre RDBMS și Hadoop. Diferența cheie dintre RDBMS și Hadoop este că RDBMS stochează date structurate, în timp ce Hadoop stochează date structurate, semi-structurate și nestructurate.

Referinţă:

1. Punct de instruire. "Concepte SQL RDBMS". , Tutoriale punct, 8 ianuarie 2018. Disponibil aici  
2.Tutoriale punct. "Tutorial Hadoop". , Tutoriale punct, 8 ianuarie 2018. Disponibil aici  

Datorită fotografiei:

1.'8552968000 'de Intel Free Press (CC BY-SA 2.0) prin intermediul Flickr