sql >> Databasteknik >  >> NoSQL >> MongoDB

Hur man konfigurerar Java Spark sparksession samplesize

Det är spark.mongodb.input.sampleSize

SparkSession spark = SparkSession.builder()
                .master("local[2]")
                .appName("SparkReadMgToHive")
                .config("spark.sql.warehouse.dir", warehouseLocation)
                .config("spark.mongodb.input.uri", "mongodb://localhost:27017/test.testcollection")
                .config("spark.mongodb.input.sampleSize", 50000)
                .enableHiveSupport()
                .getOrCreate();



  1. Hur man sammanfogar strängar i SQL

  2. mongodb hur frågar man med nand-operatören?

  3. Hur lagrar man frågeresultat (ett enda dokument) i en variabel?

  4. Hur säger man till Mongo att sortera en samling innan man begränsar resultaten?