Jag skulle lägga till massor av extra loggning, försök att logga det tillräckligt bra för att fånga felet - och att spara dessa loggar om felet kan upptäckas.
När du väl har loggar som visar felet kan du sedan isolera den problematiska koden lättare.
För detta kan du behöva logga databasfrågorna, vilket tyvärr kan vara svårt om mängden data är hög och/eller är föremål för integritetsproblem.