sql >> Databasteknik >  >> RDS >> Database

Analysera Big Data med Microsoft Azure Tools

Big Data

Big Data beskriver den stora mängd data, antingen strukturerad eller ostrukturerad, som översvämmer ett företag dagligen. Big Data behandlar sätt att analysera, extrahera information från eller hantera datamängder som är för stora eller komplexa för att kunna hanteras av normal databehandlingsprogramvara.

Big data har följande egenskaper:

  • Volym: Mängden genererad och lagrad data
  • Sort: Typen och arten av uppgifterna
  • Hastighet: Den hastighet med vilken data genereras och bearbetas
  • Säkerthet: Datakvalitet och datavärde

Azures inflytande på Big Data

Microsoft Azure omvandlar data till handlingsbara insikter genom att använda verktyg för maskininlärning. Det låter dig kombinera all data i vilken skala som helst och att bygga och distribuera maskininlärningsmodeller i stor skala.

Med följande Azure-produkter kan avancerad analys utföras på Big Data:

  • SQL Data Warehouse
  • Datafabrik
  • Azure BLOB Storage
  • Azure Databricks
  • Azure Cosmos DB
  • Power BI

Låt oss ta en titt på var och en av dem individuellt.

SQL Data Warehouse

SQL Data Warehouse är ett molnbaserat EDW (Enterprise Data Warehouse) som använder Massively Parallel Processing (ett stort antal processorer som utför en uppsättning beräkningar parallellt) för att köra komplexa frågor över petabyte med data.

Du importerar helt enkelt big data till SQL Data Warehouse med PolyBase T-SQL-frågor (frågor som läser data från Hadoop), och kör sedan, med kraften i MPP, högpresterande analyser. Datalagret kommer då att bli den enda versionen av sanning som du kan lita på för insikter.

Data Factory

Data Factory är en molndataintegrationstjänst som sammansätter datalagring, rörelse och bearbetningstjänster till automatiserade datapipelines. Azure Data Factory är en hybrid dataintegreringstjänst som låter dig skapa, schemalägga och orkestrera ETL/ELT-arbetsflöden (extrahera, transformera, ladda).

Azure BLOB Storage

Azure BLOB-lagring är en massivt skalbar objektlagring för ostrukturerade dokument, bilder, videor och ljud. Azure BLOB-lagring är optimerad för att lagra enorma mängder ostrukturerad data (data som inte följer en viss datamodell eller definition), såsom text eller binär data, till exempel.

Azure BLOB-lagring har följande funktioner:

  • Visa dokument eller bilder direkt till en webbläsare
  • Lagra filer för distribuerad åtkomst
  • Strömmande ljud och video
  • Skriva till loggfiler
  • Lagra data för katastrofåterställning, säkerhetskopiering och återställning samt arkivering

Azure Databricks

Azure Databricks är en enkel, snabb och kollaborativ Apache Spark-baserad (öppen källkod distribuerad generellt klusterberäkningsramverk, som tillhandahåller ett gränssnitt för programmering av kluster med implicit dataparallellism) analysplattform.

Azure Cosmos DB

Azure Cosmos DB är en globalt distribuerad databastjänst. Den är utformad för att ge låg latens, elastisk skalbarhet av genomströmning, väldefinierad semantik för datakonsistens och hög tillgänglighet.

Power BI

Power BI är en svit med affärsanalysverktyg som ger insikter. Power BI gör det möjligt för dig att ansluta till mängder av datakällor, förenkla dataförberedelser, driva ad hoc-analyser, samt producera rapporter som ska konsumeras på webben och över mobila enheter.

Slutsats

Big Data har utvecklats och fortsätter att utvecklas. Med hjälp av Azure-verktyg blir Big Data mer och mer hanterbar.


  1. Databasdesign 101:Partitioner i MySQL

  2. SQL:välja rader där kolumnvärdet ändrats från föregående rad

  3. Hur lägger man en sträng till ett kolumnvärde i MySQL?

  4. Hur man automatiserar migrering från fristående MySQL till Galera Cluster med Ansible