Introduktion
Pentaho Data Integration och BA Server-verktygen kommer med många olika databasdrivrutiner. Men från och med version 7 av Community Edition kommer de inte med JDBC-drivrutiner för Oracle, SQL Server eller MySQL (i Data Integration-verktyg). Följande steg beskriver hur man lägger till MySQL JDBC-drivrutiner till Pentaho.
Följ dessa instruktioner för att installera Pentaho BA Server och Data Integration Tools om verktygen ännu inte har installerats. När du har installerat Pentaho-verktygen, stäng av BA-servern och programvaran för dataintegration.
Hämta MYSQL JDBC-drivrutiner
JDBC-drivrutinerna för MySQL kallas "Connector/J"
Besök:https://dev.mysql.com/downloads/connector/j/
Rulla ner till avsnittet med nedladdningsalternativ.
Se till att "Platform Oberoende" är valt
För Windows-operativsystem ladda ner ZIP-arkivet
Logga in med ditt Oracle-webbplatskonto (eller skapa ett gratis). Eller klicka på Starta bara min nedladdning länk.
Spara ZIP-filen i en mapp:
Packa upp (dekomprimera) ZIP-arkivet:
Instruktioner för att kopiera JDBC-drivrutinerna till lämpliga mappar i Pentaho-verktygen beskrivs på nästa sida.
Observera att från och med november 2019 kommer Pentaho version 8.x-verktygen inte att fungera direkt med de nyare MySQL Connector version 8.x-drivrutinerna. Den enklaste lösningen är att använda drivrutinerna för MySQL 5.x Connector. En lösning är att använda MySQL version 8.x-drivrutinerna men använda en allmän anslutning. En del diskussion kan hittas på denna länk. Ett annat tips är att installera PDI MySql Plugin från Pentaho Marketplace i Pentaho Data Integration.
Kopiera JDBC-drivrutinsfilerna till mapparna Pentaho BA Server och Data Integration Lib
Leta reda på filen mysql-connector-java-5.1.41-bin.jar (observera att den kan ha ett lite annorlunda namn beroende på version).
Kopiera denna .jar-fil till lämplig LIB-mapp i Pentaho Community Edition-distributionen.
För Pentaho Data Integration bör målmappen vara .\Pentaho\data-integration\lib som visas nedan:
Pentaho BA-servern lagrar sina drivrutiner i mappen .\pentaho-server\tomcat\lib. Se till att en MySQL JDBC-drivrutin inte redan är installerad. Om så är fallet, behåll bara den senaste kopian av .jar-filen. Till exempel innehåller version 7.0 av Pentaho Server MySQL JDBC-drivrutinversion mysql-connector-java-5.1.17. Men den här versionen har några buggar, så se till att ta bort filen mysql-connector-java-5.1.17.jar och ersätta den med den senaste mysql-connector-java-5.1.41-bin.jar-filen.
Nu när JDBC-drivrutinerna har kopierats till lämpliga mappar, starta om Pentaho BA Server (start-pentaho) och starta verktygen för dataintegration (Spoon). Instruktioner för att skapa en databasanslutning i Pentaho Data Integration Tools finns på nästa sida.
Konfigurera en MySQL-anslutning i Pentaho Data Integration
Följ de här stegen för att skapa en ny databasanslutning till MySQL från Pentaho Data Integration-verktygen. I Pentaho Data Integration skickar många av transformationsstegen data till en databastabell. Några exempel finns i denna handledning om Pentaho Data Integration.
Innan du börjar behöver du inloggningsuppgifter till en MySQL-instans. Du kanske vill besöka min handledning om hur du ställer in en gratis MySQL-instans på GearHost eller den här handledningen om hur du installerar MySQL på Windows.
I Pentaho Data Integration väljer du vilket transformationssteg som helst som använder en databas som utdata, till exempel ett Dimension Lookup/Update, Insert/Update eller Table Output-steg. Klicka på Ny knappen bredvid anslutningsnamnet för att få fram dialogrutan Databasanslutning som visas nedan.
Ge anslutningen ett namn och välj sedan MySQL som anslutningstyp.
Ange värdnamnet på servern som kör MySQL. Om du har MySQL installerat på din lokala dator eller server, använd localhost som värdnamn . Ange databasnamnet och använd standard portnummer av 3306. Slutligen, ge MySQL-databasen Användarnamn och Lösenord .
Klicka på Test för att se till att databasanslutningen fungerar korrekt.
Om följande fel visas, se till att MySQL JDBC-drivrutinens .jar-fil har kopierats till Pentaho Data Integration lib mapp (som diskuterats på föregående sida i denna handledning). Avsluta dataintegrationsverktyget och kör det igen.
Error connecting to database [MySQLConnetion] : org.pentaho.di.core.exception.KettleDatabaseException: Error occurred while trying to connect to the database Driver class 'org.gjt.mm.mysql.Driver' could not be found, make sure the 'MySQL' driver (jar file) is installed.
Observera att från och med november 2019 kommer Pentaho version 8.x-verktygen inte att fungera direkt med de nyare MySQL Connector version 8.x-drivrutinerna. Den enklaste lösningen är att använda drivrutinerna för MySQL 5.x Connector. En lösning är att använda MySQL version 8.x-drivrutinerna men använda en allmän anslutning. En del diskussion kan hittas på denna länk. Ett annat tips är att installera PDI MySql Plugin från Pentaho Marketplace i Pentaho Data Integration.
Se till att ställa in målschemat i alla databasutdata eller dimensionssökningssteg. I MySQL kan schemat lämnas tomt för att använda standard MySQL-databasen.
Om du hade övat på att köra transformation mot H2-databasen som ett mål, brukade du göra PUBLIC till målschemat. för MySQL lämna bara målschemat tomt så att standarden kommer att användas.
Nästa sida tar upp hur man konfigurerar en ny databasanslutning och Mondrian-datakälla i Pentaho BA Server.
Konfigurera en MySQL-datakälla i Pentaho BA Server
Från startsidan för Pentaho User Console klickar du på Hantera datakällor för att visa skärmen Hantera datakällor. Det första steget från denna punkt är att skapa en ny databasanslutning till en MySQL-databas.
Klicka på kugghjulsikonen för att öppna menyn och klicka sedan på Ny anslutning... menyalternativ som visas nedan.
Ange ett namn för den nya databasanslutningen. Välj MySQL som Databastyp och klicka sedan på alternativet Native (JDBC) under Åtkomst: rubrik. Fyll i värdnamnet , Databasnamn , Portnummer , Användarnamn och Lösenord för din MySQL-databas. Om MySQL är installerat på din lokala dator eller server, använd localhost som värdnamn .
När du är klar klickar du på den blå Test för att testa databasanslutningen
Om det finns några fel, kontrollera anslutningsinformationen (värdnamn, användarnamn, lösenord etc.) och upprepa sedan testet.
Om du får ett felmeddelande angående SSL-anslutningar (din anslutning kan timeout efter några minuter), lägg till parametern useSSL med värdet false som visas nedan.
När du är klar klickar du på OK för att spara den nya databasanslutningen. Den nya databasanslutningen bör nu visas i listan:
Nu när anslutningen har skapats och testats kan en Mondrian-datakälla skapas. Dessa instruktioner finns på nästa sida.
Skapa en ny datakälla i Pentaho BA Server
I Pentaho BA Server representerar en datakälla ett Mondrian flerdimensionellt databasschema som sitter ovanpå antingen ett flerdimensionellt datalager eller en relationsdatabas. Datakällan kräver en anslutning till den underliggande databasen och en Mondrian-datamodell som ska byggas ovanpå den. Mondrians datamodell består av dimensioner och mått. Dimensioner innehåller fält som är staplade i en hierarki. Det är möjligt att ha flera olika datamodeller som är konstruerade ovanpå samma underliggande datakälla.
För att komma igång med att skapa en ny datakälla, klicka på den blå Ny datakälla knapp. Datakällasguiden startar.
Fyll i ett nytt namn för Datakällan och välj Databasanslutning . Välj databastabell(er) som källa Typ. För det här exemplet kommer vi att arbeta med ett stjärnschema så vi väljer alternativet för Rapportering och analys .
Klicka på Nästa knappen och Pentaho BA-servern kommer att fråga efter schemat för den underliggande databasen för databasanslutningen
Nästa skärm i guiden kommer att visa en lista över tabellerna som hittades i schemat från databasanslutningen.
Klicka på en av Tillgängliga tabeller och klicka sedan på högerpilen för att flytta den till Valda tabeller sida. Upprepa detta för var och en av tabellerna som kommer att inkluderas i datakällan.
Eftersom det här exemplet använder alternativet "Rapportering och analys", måste en av databastabellerna väljas som Faktatabell . När dessa ändringar har gjorts klickar du på Nästa knappen för att gå till det sista steget för att definiera kopplingar.
Obs:Om inga främmande nycklar visas, se till att du arbetar med den senaste MySQL JDBC-drivrutinen eftersom den fixar flera buggar. mysql-connector-java-5.1.17 är en äldre version som levereras med Pentaho Server 7.0. Om du uppdaterar JDBC-drivrutinen, se till att starta om Pentaho BA-servern.
För varje bordspar klickar du på Nyckelfältet i den vänstra tabellen och det tillhörande nyckelfältet i den högra tabellen. Klicka sedan på Skapa medlemskap länk. I exemplet nedan skapades en koppling mellan tabellen försäljningsfakta och sedan tabellen customer_dim med den gemensamma nyckeln customer_dim_id.
Upprepa detta för varje par nycklar. I det här exemplet finns det en faktatabell och 5 dimensionstabeller som resulterar i skapandet av 5 joins. Om du gör ett misstag, markera anslutningen och klicka på Ta bort anslutning länk.
När du är klar klickar du på Slutför knappen.
Klicka på OK för att återgå till Hantera datakällor skärm.
En ny datakälla har nu skapats med en standarddatamodell. Denna datamodell kommer dock att behöva redigeras. Instruktioner för redigering av en Mondrian-datamodell finns på nästa sida.
Redigera Mondrians datamodell för att definiera dimensioner och mått
Markera datakällan, dra ned kugghjulsikonen och välj Redigera . Detta öppnar Datakällsmodellredigeraren . Standardmodellen kopierar över alla kolumner från schemat som Dimensioner och Mått. Men denna standardmodell kommer sannolikt inte att fungera eftersom hierarkier ännu inte har definierats.
Rensa bort den befintliga datamodellen
Klicka på knappen som visas nedan för att Rensa den nuvarande modellen.
Klicka på Ja när du uppmanas att bekräfta för att rensa modellen
Modellen kommer nu att rensas bort och mått och mått kommer att visa en varning eftersom det inte finns något innehåll.
Skapa ett nytt mått
Skapa ett nytt mått genom att dra och släppa Fakta om försäljning från Tillgänglig sidan över till Åtgärder under Analys flik.
Ta bort vart och ett av dimensions-id:n och ORDER ID från måtten eftersom dessa egentligen inte är mått (de är främmande nycklar). Klicka på Customer dim id och klicka sedan på det blå X för att ta bort den. Upprepa för de andra dimensions-id:n.
Skapa KUNDdimensionen
Med måtten på plats kan dimensionerna skapas. Klicka på Dimensioner och klicka sedan på Lägg till dimension knappen som visas nedan.
Namnge den här nya dimensionen KUND (se till att använda icke-pluraliska namn för dimensionerna) och klicka på OK knappen.
KUND dimension kommer att skapas med en KUNDhierarki under sig:
Öppna Customer Dim på panelen Tillgänglig. Dra fältet COUNTRY_NAME och släpp det på CUSTOMERs hierarki enligt nedanstående. Det kan ta några försök att få det här på rätt plats.
Resultatet kommer att visa LANDENS NAMN som visas i KUNDhierarkin.
Upprepa stegen ovan för att lägga till STATE_PROVINCE och CITY till KUNDhierarkin. För vart och ett av fälten i KUNDhierarkin ändrar du typen Geografi så att den matchar. Till exempel ska COUNTRY_NAME ha Geografityp "Land" och STATE_PROVINCE ska ha Geografityp "Stat".
Skapa datumdimensionen
Klicka på posten DIMENSIONS och klicka sedan på Lägg till dimension knapp. Namnge den nya dimensionen DATUM. Klicka på namnet på DATUM-dimensionen och markera rutan för "Time Dimension":
Dra och släpp försäljningsåret, försäljningskvartalet, försäljningsmånadens namn, försäljningsdagen på året och försäljningsdatumet till DATUM
Hierarki . Välj lämplig Tidsnivåtyp för varje fält och Källkolumnsformat .
Den färdiga dimensionen DATUM bör se ut så här:
Skapa PRODUKTdimensionen
Klicka på Dimensioner och klicka sedan på Lägg till dimension knapp. Namnge den nya dimensionen PRODUKT. Dra och släpp CATEGORY_NAME, SUB_CATEGORY_NAME och PRODUCT_NAME under PRODUCT hierarkin .
Klicka på OK knappen för att stänga datakällans modellredigerare.
Logga ut från Pentahos användarkonsol, stäng av Pentaho-servern med stop-pentaho-skriptet och starta sedan om Pentaho Server.
Nu när Mondrians datamodell har skapats är den nya datakällan redo att användas för att skapa visualiseringar på en instrumentpanel eller för rapporteringsändamål.
Skapa ett enkelt diagram med hjälp av OLAP-diagramguiden
Skapa en ny instrumentpanel (eller redigera en befintlig instrumentpanel) och använd OLAP-guiden för att skapa ett nytt diagram
Nedan är MDX-frågan som genereras automatiskt av OLAP-guiden:
select NON EMPTY({Descendants([CUSTOMER].[All CUSTOMERs] ,[CUSTOMER].[CITY])}) on ROWS, NON EMPTY({Descendants([PRODUCT].[All PRODUCTs] ,[PRODUCT].[SUB CATEGORY NAME])}) on Columns from [Customer_Sales]