sql >> Databasteknik >  >> NoSQL >> MongoDB

Hur tar jag bort de tomma tweetarna med filter() i pyspark?

Om dina uppgifter så här

tweets = sc.parallelize(["title1", "", "title2", "title3", ""])

du kan använda len(x) som filtervillkor:

tweets.filter(lambda x: len(x) > 0).count()



  1. Kan mongodb användas som en inbäddad databas?

  2. Hur sorterar jag efter datum i Mongoose? (node.js)

  3. anpassad redis-klient kompilering misslyckas

  4. Senaste posten efter datum för varje artikel mongodb-grupp