Apache Phoenix för CDH:Bästa nya funktionen för DBMS
Cloudera antar och kommer att stödja Apache Phoenix för CDH samtidigt som det integrerar det för sin Cloudera Data Platform på ett framåtriktat sätt.
Clouderas CDH-utgåvor har inkluderat Apache HBase som ger ett motståndskraftigt NoSQL DBMS för kunders operativa applikationer som vill dra nytta av kraften i big-data. Dessa applikationer har vuxit till affärsviktiga och affärskritiska applikationer som driver topplinjens intäkter och lönsamhet. Dessa applikationer inkluderar kundinriktade applikationer, e-handelsplattformar, upptäckt av risker och bedrägerier som används bakom kulisserna på banker eller betjänar AI/ML-modeller för applikationer och möjliggör ytterligare förstärkningsutbildning av samma baserat på faktiska resultat.
Men för många kunder har HBase varit en alltför skrämmande resa – vilket kräver att de lär sig
- En ny datamodell eftersom HBase är ett schema med breda tabeller som stöder miljontals kolumner men inga kopplingar och
- Använder Java API:er istället för ANSI SQL
De har bett om att kunna använda mer traditionell schemadesign som liknar den som tillhandahålls av Oracle eller MySQL och varit villiga att göra några avvägningar om flexibilitet, t.ex.
- De är villiga att använda tillhandahållna datatyper istället för att definiera sina egna
- De är villiga att ge upp flexibiliteten att ha en enda kolumn med flera typer beroende på raden i utbyte mot en enda typ i en enda rad
För att göra det möjligt för kunder att ha en enkel ingång till de andra fördelarna med Apache HBase (obegränsad utskalning, miljontals rader, schemautveckling, etc) samtidigt som RDBMS-liknande funktioner tillhandahålls (ANSI SQL, enkla kopplingar, datatyper utanför box, etc), introducerar vi stöd för Apache Phoenix på CDH.
För alla andra drar även Phoenix-baserade applikationer nytta av HBase-optimeringar bakom kulisserna, vilket gör det lättare att få bättre HBase-prestanda. Till exempel implementerar Phoenix saltning av primärnycklar – så HBase-användare behöver inte tänka igenom denna aspekt av nyckeldesign.
Dessutom kan Phoenix-baserade applikationer samexistera med HBase-applikationer – vilket innebär att du kan använda ett enda HBase-kluster för att stödja båda. Med Phoenix kan kunderna fortsätta att använda sina favoritverktyg för BI och instrumentpaneler precis som de gjorde med Hive &Impala tidigare. När de använder Phoenix kan de också välja att direkt använda Phoenix med dessa verktyg, förutom möjligheten att använda Hive/Impala, vilket eliminerar ett steg för nya implementeringar.
Ur ett säkerhets- och styrningsperspektiv (SDX), i CDH, använder Phoenix HBase ACL:er för rollbaserad åtkomstkontroll för Phoenix-tabeller. Phoenix använder också HBase-integrering i Cloudera Navigator för revisionsinformation.
Cloudera har släppt ett Phoenix 4.14.1-paket som är tillgängligt för CDH 5.16.2-kunder och ett Phoenix 5.0-paket tillgängligt för CDH 6.2+-kunder.
Befintliga HDP-kunder har redan Apache Phoenix-stöd och nästan hälften av HBase-användare som använder HDP använder för närvarande Phoenix, vilket talar för dess popularitet i HBase-användargemenskapen.
Ladda ned Apache Phoenix för CDH
Bygg verksamhetskritiska applikationer med Apache Phoenix. Ladda ner programvaran här.
Vanliga frågor om Phoenix
F) Vilka är arbetsbelastningarna som Phoenix ska användas för
Phoenix stöder samma användningsfall som HBase, främst arbetsbelastningar med låg latens och hög samtidighet. Men Phoenix gör det enklare att även utnyttja underliggande data för instrumentpaneler och BI-ändamål
F) Vad är auktoriseringsmekanismen med Phoenix?
Phoenix är beroende av HBase för auktorisering. För CDH-kunder använder detta HBase ACL:er. För HDP-kunder är detta genom HBase-Ranger-integration
F) Vad är skalbarheten hos Phoenix? Vilket är det största kända klustret?
Phoenix skalar till hundratals TB data. Den största kunden har över 0,5 PB data som hanteras av Phoenix. Mer information om användningsfall finns i PhoenixCon-arkiven och i arkiven för NoSQL-dagsvideor tidigare i år i användarnas egna ord och bilder.
F) Stöder Phoenix geospatial sekundär indexering? Vilken nivå av stöd för rumslig data?
Den har begränsat stöd för geo-spatial data. GeoMesa tillhandahåller dock ett geospatialt lager på HBase som kan stödja detta behov och integreras med kundapplikationer. Phoenix, GeoMesa såväl som JanusGraph och OpenTSDB kan alla samexistera i ett enda HBase-kluster.
F) Hur skapar och använder du ett index?
Se sidan Phoenix Secondary Indexing för mer information om indexering. Från Phoenix 4.8.0 och framåt krävs inga konfigurationsändringar för att använda lokal indexering.
F) Finns det en gräns för antalet kolumner som du kan lägga till i index?
Som i ett RDBMS är ett index i huvudsak en separat tabell med indexet och en länk till källdata. Om du indexerar alla kolumner motverkar du syftet genom att behålla två identiska tabeller. Index bör användas med omtanke eftersom det finns en del icke-trivial overhead vid skrivning (globala index) eller läsning (lokala index).