sql >> Databasteknik >  >> RDS >> Sqlserver

Vad maskininlärning betyder för databasproffs

Maskininlärningsdatabaser börjar nu bli myndiga. Detta ger enorma möjligheter för databasproffs som kan utvecklas för att dra fördel av denna förändring.

För närvarande är databasproffs, t.ex. databasadministratörer (DBA) och databasutvecklare, några av de viktigaste positionerna i alla IT-organisationer. En databasproffs är ansvarig för att skapa, hantera och tillhandahålla kontrollerad åtkomst till en databas. Att ha rätt person som DBA kan hjälpa företag att spara tid och förkorta applikationsutvecklingstiden. Men med den ökande tillgången till en enorm mängd data, utvecklas ansvaret för en databasproffs snabbt.

Flera tekniker har utvecklats som kan användas för att inte bara hantera och utforska data utan kan hjälpa till att fatta välinformerade beslut på grundval av data. Maskininlärning är en sådan teknik som har sett en kraftig ökning under det senaste decenniet. Den här artikeln ger en kort översikt över hur maskininlärning kan påverka databasyrken, och vilka är fördelarna med att ha maskininlärning som en färdighetsuppsättning.

Vad är maskininlärning?

Maskininlärning är en process för att förstå och extrahera användbara mönster från data med hjälp av olika statistiska algoritmer. Maskininlärning är vidare uppdelad i övervakad och oövervakad inlärningsteknik. Maskininlärning används för närvarande för att lösa många komplexa problem såsom klassificering av skinka och skräppost, förutsägelse av huspriser, poesigenerering, bildklassificering och så vidare.

Kommer maskininlärning att ersätta databasyrken?

En av de vanligaste missuppfattningarna om maskininlärning är att den kommer att ersätta människor på många jobb. Även om detta kan vara sant för vissa repetitiva uppgifter, kommer AI och maskininlärning i princip att komplettera den mänskliga hjärnan och inte ersätta den. För databasproffs kommer databaser med maskininlärning inte att ersätta dem, snarare kommer de att hjälpa dem enormt.

Det kommer att tillåta databasproffs att fokusera mycket mer på planering och strategiska uppgifter, eftersom det kommer att automatisera mer tråkiga och autonoma uppgifter som installation, konfiguration och regelbundna databasuppdateringar. Istället för att frukta effekterna av maskininlärning på deras jobb bör databasproffs anamma det som ett sätt att utföra mindre utmanande uppgifter mycket snabbare och mer effektivt. .

Hantera Big Data är en utmaning

På grund av den globala webbens framväxt under de senaste två decennierna finns data tillgänglig i alla former och storlekar. Faktum är att termen big data ofta används för datamängden som är enorm i volym, kommer med hög hastighet och innehåller en mängd olika innehåll.

Att hantera enorma mängder sådan ostrukturerad data har blivit en utmaning för DBA. Algoritmer som körs på databaser för maskininlärning har också visat sig fungera bra med ostrukturerad data. En enorm mängd data kan enkelt delas upp till meningsfull information via maskininlärningstekniker som lyfter fram behovet av databasproffs att skaffa sig maskininlärningsfärdigheter.

Machine Learning-databaser är här

Företag som Microsoft och Oracle har redan börjat införliva olika maskininlärningsmöjligheter i databaser. Till exempel har Microsoft Azure SQL Database en modul som föreslår och rekommenderar olika prestandaförbättringsstrategier som kan tillämpas automatiskt. På liknande sätt tillhandahåller SQL Server Query Store en plan för att identifiera frågor som orsakar prestandaflaskhalsar. Oracle 18c-databasen innehåller självläkande funktioner och kan tillämpa självkorrigeringar och uppgradera närhelst ett databasproblem uppstår. En god kunskap om maskininlärning hjälper faktiskt databasutvecklare att förstå logiken bakom de olika rekommendationerna från maskininlärningsdatabasverktyg.

Framkomsten av helt autonoma databaser

Nuvarande maskininlärningsdatabaser har begränsad kapacitet. Fokus för aktuell forskning är att utveckla helautomatiserade databaser. Skulle det inte vara trevligt att ha en databas som kan förutse de problem som kommer att uppstå och som är proaktiv nog att vidta förebyggande åtgärder i förväg? Eller skulle det inte göra livet för en databasproffs mycket lättare om databasen säkerhetskopierar sig själv automatiskt när en avgörande transaktion inträffar? Det finns många scenarier där maskininlärningsdatabaser är extremt användbara.

Till exempel gör befintliga databaser automatiska säkerhetskopieringar vid en viss tidpunkt, men inte alla databastransaktioner är värda att backa. I den här typen av scenario kan databaser för maskininlärning bli smarta nog att veta när de ska säkerhetskopieras och när de inte ska säkerhetskopieras.

Dessutom kan många databasproblem förutses i förväg. Till exempel, i de scenarier där flera användare har åtkomst till olika databasresurser, ökar sannolikheten för ett dödläge många gånger. Om detta hände skulle en maskininlärningsdatabas kunna gå över till att ge kontrollerad åtkomst till resurser och undvika ett dödläge.

Det finns flera akademiska forskargrupper som har försökt utveckla helt autonoma databaser.

Carnegie Mellon Database Research Group har utvecklat projektet OtterTune som använder maskininlärningstekniker och arbetsbelastningsdata från ett stort antal gamla databaser för att skapa modeller som automatiskt kan ställa in nya arbetsbelastningar. OtterTunes maskininlärningsdatabasen rekommenderar också automatiskt de optimala inställningarna för förbättrad genomströmning och minskad latens för nya databasapplikationer.

MIT har också utvecklat ett ramverk för databashantering med öppen källkod som heter DBSee r som förutsäger prestanda för en given uppsättning databasresurser och identifierar prestandaflaskhalsar också.

Inlärningskurva

Maskininlärning definieras ofta som skärningspunkten mellan datavetenskap och statistik. Alla med datavetenskapskunskap kan relativt snabbt bygga upp sina färdigheter i maskininlärning till en mellannivå om de utvecklar en rimlig förståelse för statistik.

Många GUI-verktyg och molnplattformar som Google AI, IBM Watson, Amazon Sagemaker, Azure ML har förenklat processen att implementera maskininlärningstekniker genom att tillhandahålla GUI-baserade dra och släpp-gränssnitt för maskininlärningsdatabaser. Användare behöver bara veta hur man använder verktyget eftersom huvuddelen av arbetet (att lägga till datauppsättningar, välja förbehandlingstekniker, träna modellen och slutligen utvärdera modellen) kan göras med några få musklick.

Om en databasproffs verkligen vill bygga en karriär inom avancerad maskininlärning måste de dock bygga en grundlig förståelse för statistik. Datavetenskapens bakgrund för en databasproffs kommer att vara mer än tillräckligt bra för att snabbt förstå de CS-relaterade begreppen maskininlärning.

Men som vi sa ovan, om en databasproffs bara är intresserad av att använda maskininlärning för att automatisera repetitiva uppgifter, kommer en kunskap om GUI-baserade maskininlärningsverktyg att vara mer än tillräckligt.

Flera karriärvägar

Framgången med maskininlärning och artificiell intelligens har fått organisationer att utveckla dedikerade datavetenskapsteam som innehåller skickliga experter på maskininlärning.

För närvarande har maskininlärningsexperter och databasexperter olika karriärvägar, men fler och fler organisationer förväntar sig att maskininlärnings- eller datavetenskapsexperter har en viss nivå av databasexpertis, och vice versa.

Med tanke på att detta för närvarande är i förändring, föredras databasproffs med kunskap om maskininlärningsfärdigheter och har bättre chanser att anställas antingen som databasproffs, eller maskininlärningsexpert eller någon med båda arbetsuppgifterna.

Slutlig dom

Tillkomsten av big data och relaterade maskininlärningstekniker kommer sannolikt att medföra avsevärda förändringar i databaspersonals jobbansvar eftersom deras fokus kommer att flyttas över till data från databasen, eftersom maskininlärningsdatabaser i allt högre grad sköter sig själva.

Maskininlärning kommer att hjälpa databasproffs att automatisera många manuella och mödosamma uppgifter och frigöra dem för att investera tid och ansträngning för att anamma färdigheter i maskininlärning och använda dem.

Att lära sig statistiken som krävs för att utvecklas från en databasproffs till en bredare databas och maskininlärning är inte direkt utan kommer att ge stor utdelning när det gäller karriärtillväxt och möjligheter.


  1. Hur man lagrar data i unicode på hindi

  2. Unik identifierare (guide) som primär nyckel i databasdesign

  3. SQL Azure:Databas XXXYYY på servern är för närvarande inte tillgänglig

  4. Installera Oracle 12c Enterprise Edition på Windows 7