Cloudera Data Platform (CDP) Data Center är en fullständigt dataplattform som förenar den senaste analysen med öppen källkod – Spark, Impala, Hive, HBase, Kafka, Hadoop och mer – till ett multifunktionsanalys- och datahanteringssystem som innehåller:
- SQL-analys med högre prestanda
- Strömbearbetning och hantering i realtid
- Granulär attributbaserad åtkomstkontroll
- Dynamisk kolumnfiltrering och radmaskering
- En 10x ökning av fil- och objektskalbarhet
Jag använde en Terraform (v0.12)-modul som distribuerar CDP Data Center på Oracle Cloud Infrastructure (OCI).
Den här mallen har stöd för att rikta in sig på befintliga VCN/Subnät för klusterdistribution. För att använda denna funktion, använd bara schemamenysystemet för att välja ett befintligt VCN-mål och välj sedan lämpliga undernät för varje klustervärdtyp.
1. Ladda ner zip-filen för antingen Cloudera Terraform-distributionen med Resource Manager .
2. Logga in på Oracle Cloud Infrastructure (OCI)
3. Välj Resurshanterare och klicka på Stackar
4. Klicka på Skapa stack .
5. På Stackinformation ladda upp zip-filen som du laddade ned i steg 1 och klicka sedan på Nästa .
6. På Konfigurera variabler sida, skriv in innehållet i en "SSH tillhandahållen nyckel" (valfritt). Obs! Om du distribuerar Cloudera Manager till ett privat undernät behöver du en VPN- eller SSH-tunnel genom en Edge Node för att komma åt klusterhantering. När du skapar en VPC måste du ange ett intervall av IPv4-adresser för VPC:n i form av ett Classless Inter-Domain Routing (CIDR)-block, till exempel 10.0.0.0/16. Klicka på Nästa .
7. Verifiera din konfiguration och klicka på Skapa.
9. Från Terraform-åtgärder menyn väljer du Planera
10. Klicka på Planera
11. Vänta en stund tills det här jobbet är klart.
12. Terraform har framgångsrikt initierats.
13. Jobbet slutfört lyckats
14. Diagram som visar vad som vanligtvis används med denna mall. Dessa resurser distribueras automatiskt mellan "Feldomäner" i en "tillgänglighetsdomän" för att säkerställa feltolerans.
Referenser
Lär dig hur du distribuerar Hadoop på Oracle Cloud Infrastructure. Tillgänglig på https://docs.oracle.com/en/solutions/learn-deploy-hadoop-oci/index.html#GUID-6BC025FF-829B-4BBD-9C80-69044F61F35B
Distribuera Hadoop enkelt på Oracle Cloud Infrastructure med hjälp av Resource Manager. Tillgänglig på https://blogs.oracle.com/cloud-infrastructure/deploy-hadoop-easily-on-oracle-cloud-infrastructure-using-resource-manager
Cloudera på Oracle Cloud Infrastructure (Terraform-distributionsmall). Tillgänglig på https://github.com/oracle-quickstart/oci-cloudera
Översikt över Resurshanteraren. Tillgänglig på https://docs.cloud.oracle.com/en-us/iaas/Content/ResourceManager/Concepts/resourcemanager.htm
CDP Datacenter. Tillgänglig på https://docs.cloudera.com/cdp/latest/overview/topics/cdpdc-overview.html