sql >> Databasteknik >  >> RDS >> Database

RowGen v3 automatiserar generering av databastestdata

Värdet av bra testdata för DBA:er är välkänt:

"Tester av databasintensiva applikationer har unika utmaningar som härrör från dolda beroenden, subtila skillnader i datasemantik, måldatabasscheman och implicita affärsregler. Dessa utmaningar blir ännu svårare när applikationen involverar integrerade och heterogena databaser eller konfidentiell data. Korrekt testdata som simulerar verkliga dataproblem är avgörande för att uppnå rimliga kvalitetsriktmärken för funktionell ingångsvalidering, belastning, prestanda och stresstester. ” – Ali Raza &Stephen Clyde, abstrakt från Skapa datamängder för att testa relationsdatabaser

Testning av databasoperationer, prototyp av datalager och ETL/ELT-jobb, säker outsourcing av filprover och rapporter och körning av prestandabenchmarks på DB-apparater kräver alla testdata med utseendet och känslan av produktionsdatabasen så att applikationerna som använder den testdatan nu kommer att prestera framgångsrikt med riktiga data senare. I sin bok från 2012 jämför Raza och Clyde testdatagenerering med testdataextraktion.

IRI och dess användare vet att det inte är önskvärt att använda riktiga data för testning. Den mest uppenbara anledningen idag är att verklig data riskerar att avslöja personlig identifierbar information (PII) som måste hållas konfidentiell. En utvecklare eller testare vill inte köra processer, eller testa ett databassystem och riskerar att dela kundinformation som personnummer, kreditkortsinformation, födelsedatum etc. under denna fas. För närvarande tillgängliga verkliga data kanske inte heller är tillräckligt robusta eller realistiska för att stresstesta applikationer eller databaser som kommer att behöva hantera större volymer och/eller värdeintervall.

Tyvärr skrev Raza och Clyde sin bok innan RowGen v3 släpptes, när de kan ha observerat att den genererar testdata som:

1) inte exponerar PII eftersom den innehåller nya eller randomiserade verkliga kolumnvärden
2) bibehåller den strukturella och referensintegritet som definierats i den ursprungliga DDL
3) är inte begränsad till den ursprungliga databasens datavolymer eller värdeintervall
4) kan anpassas genom generering av skript för att tillgodose komplexa krav
5) är försorterat och automatiskt bulkladdas för snabbast möjliga population
6) definieras i batch skript som har olika flexibilitet och som kan exporteras, återanvändas och modifieras efter behov

IRI RowGen v3 är den senaste utgåvan av världens snabbaste och mest robusta testdatagenerator för höga volymer för relationsdatabaser. RowGen kommer att köras från IRI Workbench GUI byggt på Eclipse, på kommandoraden eller från batchprogram, för att producera den kvalitet och kvantitet av testdata som krävs för att korrekt återspegla omfattningen, layouterna och relationerna inom produktionsdatabaser, och i sin tur, datalager och operativa datalager.

RowGen v3:s nya guide för DB Test Data, när den lanseras från IRI Workbench GUI, guidar användare genom specifikationen och automatiseringen av:

Parsering – genom att välja schemat och tabellerna som ska fyllas i, översätter RowGen databastabellbeskrivningarna och integritetsbegränsningarna till .rcl-skript som specificerar källstrukturen, beroende uppsättningar och dataskapande, i den ordning som krävs för att fylla tabellerna i rätt format, och med alla primärnycklar, unika index och främmande nyckelrelationer respekterade.

Generation – genom att bygga och köra .rcl-skripten för att skapa en testfil per tabell som kan massladdas och/eller sparas för framtida användning.

Befolkning – genom att bulkladda måltabellerna i rätt ordning med försorterade testdata som är strukturellt och referensmässigt korrekta.

Processen kan snabbt ladda enorma testdatabaser och följa både affärsregler och dataskyddslagar. Data som genereras är realistiska och robusta nog att stresstesta databasoperationer och frågeapplikationer.

RowGen v3 stöder också regel- och skriptbaserade alternativ för att styra specifika fältvärden och värdeintervallsfördelningar som tillgodoser specifika databasrestriktioner, och som bäst representerar förekomsten och förekomsten av data i produktionen. Användare kan också rita och visuellt bevisa att testvärdena överensstämmer med linjära, normaliserade, viktade eller standardfördelningar.

För mer information om RowGen v3, se www.iri.com/products/rowgen,  www.iri.com/products/rowgen/gui  eller läs de andra artiklarna i avsnittet Testdata på IRI-bloggen.


  1. 4 sätt att lista vyerna i en SQLite-databas

  2. Skapa en tabell i enanvändarläge i postgres

  3. 60 miljoner poster, välj poster från en viss månad. Hur optimerar man databasen?

  4. sql-server ogiltigt objektnamn - men tabeller listas i SSMS-tabelllistan