Även om jag inte är säker på vad som specifikt utlöser problemet (det verkar som om en öppen anslutning på något sätt kan hamna i ett trasigt tillstånd på RDS-klustersidan), verkar det som om problemet förvärras av den aggressiva anslutningspoolen och återanvändningen på klientsidan som händer i MySQL .NET Connector.
När problemet väl uppstår verkar de påverkade anslutningarna bara stanna kvar i poolen och godtyckligt plockas upp från poolen och återanvändas om och om igen. (Helt troligt relaterat till hur du ser att problemet fortsätter att uppstå slumpmässigt när det väl har börjat.)
Lägger till Anslutningslivstid=x
till anslutningssträngen, där x är tiden i sekunder som en anslutning hålls vid liv för återanvändning, verkar åtminstone minska symptomen.