sql >> Databasteknik >  >> RDS >> Oracle

Värdet av data över tid

Vid det här laget vet alla att data är mycket värdefull. Stora företag använder data för att fatta beslut som förhoppningsvis driver verksamheten framåt och uppnår en högre lönsamhetsnivå. Som databasadministratörer skyddar vi data, särskilt personligt identifierbar information (PII). System hackas för att få data. Det finns mycket värde i data och du skulle behöva leva under den ökända klippan för att lära dig detta idag.

Det jag sällan läser om, och ämnet för detta blogginlägg, är hur värdet av data förändras över tid. Värdet på data bör användas för att driva din lagringspolicy.

De flesta data förlorar sitt värde ju äldre de blir. Jag arbetade nyligen med ett projekt om applikationsprestanda och de mätvärden vi fångar för att mäta den prestandan. Vissa personer i projektet ville behålla dessa mätvärden i mer än fem år. Jag talade och lät gruppen veta att fem år gamla prestationsmått har noll värde. Vår applikation förändras för mycket under åren. Vi kan inte jämföra applikationens prestanda idag med applikationens prestanda för fem år sedan. Det blir inte en jämförelse mellan äpplen och äpplen.

Alla datavärden minskar inte i samma takt. I exemplet jag gav i föregående stycke är metriska data för applikationsprestanda värda noll om fem år. Men en återförsäljare som har data som indikerar att en kund köpte blöjor för fem år sedan vet nu att kunden sannolikt kommer att köpa kläder till ett fem eller sex år gammalt barn idag. Det barnet går sannolikt i grundskolan och kan behöva skolmaterial. I det här fallet har uppgifterna om kundens köp från fem år sedan fortfarande ett visst värde. Uppgifterna är inte värdelösa. Som sagt, vi behöver inte alla datapunkter från fem år sedan. Vi behöver bara en sammanfattning av den kundens aktivitet för att dra meningsfulla slutsatser om deras nuvarande och framtida köp.

Alltför ofta ser jag att människor behandlar databassystem som en dumpningsplats. Data dumpas bara in där och väldigt få människor tänker mycket på vad de ska göra med den informationen på lång sikt. Väldigt få människor tänker mycket på hur mycket denna data är värd på lång sikt. Det finns en kostnad förknippad med att lagra dessa uppgifter. Om data har litet eller noll värde på grund av sin ålder, är det värt kostnaden för att behålla dessa data i databasen?

Det finns mildrande strategier att använda för äldre data. Databasadministratören kan flytta äldre, mindre värdefulla, data till en billigare lagringsnivå. Om data har noll värde, bör data förstöras. Många gånger behöver vi inte längre den fullständiga informationen om den gamla informationen när sammanfattningar räcker i vilket fall vi aggregerar data och lagrar resultaten. Bli sedan av med detaljerna.

Som databasadministratör är det ditt ansvar att förvalta dina data och de resurser som behövs för att vara värd för dem. Du bör alltid be om de lämpliga stegen som behövs för att ta hand om dessa uppgifter när de åldras.


  1. Lägg till dagar till ett datum i PostgreSQL

  2. SQL Server Lock Eskalering

  3. Hur kör man ett SSIS-paket från .NET?

  4. Det korrekta sättet att implementera en unik begränsning som tillåter flera NULL-värden i SQL Server