Du vill ha «MongoDB Connector for Hadoop» . exemplen .
Det är frestande att bara lägga till kod i din Reducer som, som en bieffekt, infogar data i din databas. Undvik denna frestelse. En anledning till att använda en anslutning i motsats till att bara infoga data som en bieffekt av din reducerklass är spekulativt exekvering:Hadoop kan ibland köra två av exakt samma reduceringsuppgifter parallellt, vilket kan leda till främmande infogningar och dubbletter av data.