sql >> Databasteknik >  >> NoSQL >> HBase

Operationell databas i CDP

Redaktörens anteckning, augusti 2020:CDP Data Center kallas nu CDP Private Cloud Base. Du kan lära dig mer om det här.

Clouderas operationella databas (OpDB) i CDP levererar en skalbar OpDB i realtid, alltid tillgänglig, som serverar traditionell strukturerad data tillsammans med ny ostrukturerad data inom en enhetlig Operational and Warehousing-plattform. Cloudera levererar en operativ databas som serverar traditionell strukturerad data tillsammans med ny ostrukturerad data inom en enhetlig plattform med öppen källkod.

Den operativa databasen hjälper dig att:

Operationalisera maskininlärning/artificiell intelligens för att revolutionera sektorer som sjukvård, allmännyttiga företag, etc. 

  • Visa innehåll i realtid på webbskala.
  • Möjliggöra big data-analys för operativ och offline användning.
  • Använd som ett motståndskraftigt register.

OpDB i CDP är för närvarande tillgängligt i två formfaktorer:som ett helt säkert, semi-hanterat erbjudande i CDP Public Cloud – Data Hub, och som ett helt anpassningsbart erbjudande i CDP Data Center – liknande det som redan finns tillgängligt i CDH och HDP. Du kan välja en formfaktor baserat på din distributionsstrategi och OpDB-behov. Den operativa databasen använder ett objektlager som Amazon S3 som ett lagringslager för Apache HBase, där HF-filer skrivs till objektarkivet, men WAL skrivs till HDFS.

Den operativa databasen i CDP har följande komponenter: 

  • Apache Phoenix ett SQL-gränssnitt som körs ovanpå Apache HBase.
  • Apache HBase är designad för massiv skalbarhet, så att du kan lagra obegränsade mängder data på en enda plattform och hantera växande krav på visning av data.
  • Apache ZooKeeper tillhandahåller en distribuerad konfigurationstjänst, en synkroniseringstjänst och ett namnregister.
  • Apache Knox Gateway tillhandahåller perimetersäkerhet så att företaget med säkerhet kan utöka åtkomsten till nya användare.
  • Apache HDFS används för att skriva Apache HBase WALs.
  • Objektbutik som Amazon S3 och Microsoft ADLS Gen2 används för att lagra Apache HBase HFiles.
  • Shared Data Experience (SDX) används för säkerhets- och styrfunktioner. Säkerhets- och styrningspolicyer ställs in en gång och tillämpas på alla data och arbetsbelastningar.
  • IDBroker är ett REST API byggt som en del av Apache Knox autentiseringstjänster. Det tillåter en autentiserad och auktoriserad användare att byta ut en uppsättning autentiseringsuppgifter eller en token mot molnleverantörs åtkomsttokens.

Driftsdatabas i CDP-serien 

Den här artikeln gav dig en introduktion om OpDB om CDP och dess arkitektur. Du kan lära dig mer om varje aspekt av OpDB och ta reda på om de nya funktionerna och funktionerna i OpDB i de kommande artiklarna i den här serien. Vi kommer att uppdatera länkar till varje blogginlägg när de publiceras.

Tillgänglighet

Clouderas OpDB säkerställer att användare kan komma åt eller hämta lagrad data. Den stöder både automatisk skärning och fördefinierad skärning, tre frågemotorer och flera dataintegreringsverktyg. Den här artikeln ger en översikt över dessa funktioner och andra funktioner som säkerställer att en hög tillgänglighetsnivå uppnås.

Administration

Clouderas OpDB tillhandahåller flera administrationsverktyg och funktioner för att administrera din OpDB-arbetsbelastning. Administratörer kan distribuera OpDB som ett helt säkert, semi-hanterat erbjudande i CDP Public Cloud – Data Hub och som ett helt anpassningsbart erbjudande i CDP Data Center (liknande vad som är tillgängligt i CDH och HDP). Den här artikeln ger dig en översikt på hög nivå över vilka funktioner och verktyg som stöds för att administrera OpDB i CDP.

Hantering

Clouderas OpDB tillhandahåller hanteringsverktyg som hjälper dig att effektivt hantera dina OpDB-arbetsbelastningar. Den här artikeln ger dig en översikt över OpDB-hanteringsverktygen och funktionerna i CDP.

Tillgänglighet

Clouderas OpDB upprätthåller en hög nivå av datatillgänglighet, vilket säkerställer att nödvändig data är tillgänglig när och där det behövs, även om nodfel inträffar. Den här artikeln ger en översikt över funktioner som gör en hög tillgänglighetsnivå möjlig, till exempel hög tillgänglighet, datareplikering och felskydd.

Integritet

Clouderas OpDB tillhandahåller olika dataintegritetsfunktioner inklusive enhets- och domänintegritet, ACID-transaktioner och icke-relationell integritet. Den här artikeln ger en översikt över OpDB:s dataintegritetsfunktioner.

Programsupport

Clouderas OpDB stöder olika populära språk, ramverk och applikationer som du kan använda för att komma åt data som lagras i din OpDB. Den här artikeln ger dig en översikt över de språk, ramverk och applikationer som stöds.

NoSQL och relaterade funktioner

Eftersom Clouderas OpDB inkluderar NoSQL-databasen HBase för att lagra data, har den NoSQL-funktioner, såsom nyckelvärden, tabellliknande funktioner och flexibla datatyper. Tät integration över Hadoop-ekosystemet tillhandahålls också, inklusive HDFS, Spark och Kafka. Den här artikeln ger en översikt över dessa funktioner.

Skalbarhet

Clouderas OpDB är designad för hög skalbarhet och stöder både vertikal och horisontell skalbarhet med flexibel datatyp och ingen gräns för datastorlek. Den här artikeln ger en översikt över skalbarhetsrelaterade funktioner och verktyg som stöds.

Säkerhet

Clouderas OpDB tillhandahåller flera säkerhetslösningar på olika nivåer, vad gäller kryptering, autentisering, auktorisering och revision. Den här artikeln ger en översikt över dessa säkerhetsrelaterade funktioner och verktyg.

För mer information, gå till:Komma igång med operativ databas.


  1. Komma igång med PHP och MongoDB

  2. Fråga en array av arrayer i MongoDB

  3. Geografiskt distribuerade MongoDB Replica Sets för 100 % drifttid

  4. Installera phpredis MAC OSX