sql >> Databasteknik >  >> RDS >> Mysql

Hur grupperar man efter och tar räkningen av unika och räkningen av något värde som aggregat på samma kolumn i python pandas?

Gör lite förbearbetning genom att inkludera col4==3 som en kolumn i förväg. Använd sedan aggregate

df.assign(result_col=df.col4.eq(3).astype(int)).groupby(
    ['col1', 'col2']
).agg(dict(col3='size', col4='nunique', result_col='sum'))

           col3  result_col  col4
col1 col2                        
1    4        2           2     1
     6        1           0     1

gamla svar

g = df.groupby(['col1', 'col2'])
g.agg({'col3':'size','col4': 'nunique'}).assign(
    result_col=g.col4.apply(lambda x: x.eq(3).sum()))

           col3  col4  result_col
col1 col2                        
1    4        2     1           2
     6        1     1           0

något omarrangerat

g = df.groupby(['col1', 'col2'])
final_df = g.agg({'col3':'size','col4': 'nunique'})
final_df.insert(1, 'result_col', g.col4.apply(lambda x: x.eq(3).sum()))
final_df

           col3  result_col  col4
col1 col2                        
1    4        2           2     1
     6        1           0     1


  1. Lösning för:Lagra uppdatering, infoga eller radera uttalande påverkade ett oväntat antal rader (0)

  2. Varför har vissa kommandon ingen effekt i psql?

  3. Hur väljer du en kolumn med Hibernate?

  4. Uppdatering av flera rader med olika värden