Koncept
Vad är Cloudera Operational Database (COD)?
Operational Database är en relationell och icke-relationell databas byggd på Apache HBase och är designad för att stödja OLTP-applikationer som använder big data.
Den operativa databasen i Cloudera Data Platform har följande komponenter:
- Apache Phoenix tillhandahåller en relationsmodell som underlättar massiv skalbarhet. Det utnyttjar skalbarheten och motståndskraften hos Apache HBase.
- Apache HBase tillhandahåller en icke-relationell modell utformad för massiv skalbarhet, så att du kan lagra obegränsade mängder data på en enda plattform och hantera växande krav på visning av data.
- Apache ZooKeeper tillhandahåller en distribuerad konfigurationstjänst, en synkroniseringstjänst och ett namnregister.
- Apache Knox Gateway tillhandahåller perimetersäkerhet så att företaget med säkerhet kan utöka åtkomsten till nya användare.
- Apache HDFS används för att skriva Apache HBase WALs (och HBase HFiles i vissa fall).
- Objektbutiker som Amazon S3 och Microsoft ADLS Gen2 används för att lagra Apache HBase HFiles.
- Shared Data Experience (SDX) används för säkerhets- och styrningsfunktioner. Säkerhets- och styrningspolicyer sätts en gång och tillämpas på all data och arbetsbelastning. Precis som CDP själv, är SDX byggt på community open source-projekt med Apache Ranger och Apache Atlas som är stolta över.
Atlas tillhandahåller öppna metadatahanterings- och styrfunktioner för att bygga en katalog över alla tillgångar och även klassificera och styra dessa tillgångar. SDX-lagret i CDP utnyttjar hela spektrumet av Atlas för att automatiskt spåra och kontrollera alla datatillgångar.
Ranger tillhandahåller säkerhetsnyckelhantering, med en separat inloggning för nyckeladministratörer som använder Ranger KMS-tjänsten. Apache Ranger tillhandahåller också välbehövliga säkerhetsfunktioner som kolumnmaskering och radfiltrering ur lådan. En annan viktig faktor är att åtkomstpolicyerna i Ranger kan anpassas med dynamiska sammanhang med hjälp av olika attribut som "geografisk region" eller "tid på dagen".
- IDBroker är ett REST API byggt som en del av Apache Knox autentiseringstjänster. Det tillåter en autentiserad och auktoriserad användare att byta ut en uppsättning autentiseringsuppgifter eller en token mot molnleverantörs åtkomsttokens.
CDP Operational Database Data Service
CDP Operational Database (COD) är en operativ databas med automatisk skalning i realtid som drivs av Apache HBase och Apache Phoenix. Det är en datatjänst som körs på Cloudera Data Platform (CDP). Du kan komma åt COD direkt från din CDP-konsol. COD gör att du kan skapa en ny operativ databas med ett enda klick och automatiskt skala baserat på din arbetsbelastning.
Följande är de viktigaste stegen för att komma igång med COD:
- Skapa en databas i en miljö med ett enda klick och en databas bör vara uppe och tillgänglig inom några minuter.
- Ställ in ditt lösenord för arbetsbelastning. För mer information, klicka här.
- Ladda ner och installera Apache Maven, Java, Python 3.8.
- Installera CDP Client på din maskin. För mer information, klicka här.
- Följ instruktionerna i exempelarkivet för att göra ändringar i dina maven settings-security.xml, settings.xml och pom.xml.
- Bygg och kör applikationerna.
Apache HBase
HBase är en kolumnorienterad datalagringsarkitektur som är utformad ovanpå HDFS för att övervinna dess begränsningar. Det utnyttjar de grundläggande funktionerna i HDFS och bygger på det för att ge skalbarhet genom att hantera en stor volym av läs- och skrivförfrågningar i realtid. Även om HBase-arkitekturen är en NoSQL-databas, underlättar den processen att underhålla data genom att fördela den jämnt över klustret. Detta gör det snabbt att komma åt och ändra data i HBase-datamodellen. Lär dig mer om Apache HBase.
Apache Phoenix
Apache Phoenix är ett RDBMS och ANSI SQL-gränssnitt. Apache Phoenix implementerar bästa praxis-optimeringar för att göra det möjligt för programvaruingenjörer att utveckla nästa generations datadrivna applikationer baserade på HBase. Med Phoenix kan du skapa och interagera med tabeller i form av typiska DDL/DML-satser med standard JDBC API, ODBC och Phoenix DB API.
Phoenix tillhandahåller:
- SQL och JDBC API-stöd
- Stöd för sent bundna, schema-on-read
- Tillgång till data som lagras och produceras i andra komponenter som Apache Spark och Apache Hive
Lär dig mer om Apache Phoenix.
Procedur
Hur man skapar en operativ databas
Du kan skapa en operativ databas i din registrerade miljö med CDP Operational Database (COD).
Förutsättningar
- Du måste vara inloggad i COD-miljön som ODAdmin.
- Se till att du är behörig att skapa en databas.
Steg
- Logga in på CDP:s webbgränssnitt. Till exempel CDP-konsolen.
- Välj Operational Database.
- I COD-webbgränssnittet klickar du på Skapa databas.
- Välj miljön från listan där du vill ha databasen.
- Ange ett namn för databasen i fältet Database Name.
- Klicka på Skapa databas.
Resultat
Informationssida visas som visar databasens status. Din nya databas är redo att användas när dess status blir tillgänglig.
Demo
Hur man hanterar en databasanslutning
När du har skapat en operativ databas och den är tillgänglig kan du hantera databasanslutningarna.
Förutsättningar
- Se till att en databas är tillgänglig och tillgänglig.
- Du är behörig att göra ändringar i databasen.
Steg
- I COD-webbgränssnittet, välj den databas som du vill hantera anslutningarna för.
- Under Anslut, gå in i varje flik och ändra parametrarna.
Referenser
- Cloudera-dokumentation om att skapa en COD-databas
- operativ databas i CDP
Om du är intresserad av att testa CDP Public Cloud och Operational Database, prova vår Testkörning .