En estadística y en ciencias empíricas, un proceso de generación de datos es un proceso en el mundo real que "genera" los datos que nos interesan. Por lo general, los académicos no conocen el modelo real de generación de datos . Sin embargo, se supone que esos modelos reales tienen consecuencias observables. Esas consecuencias son las distribuciones de los datos en la población . Esos distribuidores o modelos se pueden representar mediante funciones matemáticas . Hay muchas funciones de distribución de datos. Por ejemplo, distribución normal , distribución de Bernoulli , distribución de Poisson , etc.