à froid comme ça, je dirais qu'ils utilisent le processus inverse
une anim en 5 frames, donc 5 images : on ne recupere que ce qui est visible avec la grille de la 1ere image.
on decale la grille, on recupere ce qui est visible de la 2eme, etc...
on superpose les 5 resultats.