Ayuda
Ir al contenido

Dialnet


Resumen de First digit distribution in some biological data sets. Possible explanations for departures from benford'S law.

José Luis Hernández Cáceres, Luis Polo García, Carlos M. Martínez Ortiz, Luis García Domínguez

  • español

    Objetivos: Explorar si la ley del primer dígito (LPD) se cumple en datos de origen biológico.

    Materiales y Métodos: Se analizaron datos tomados de diferentes fuentes que incluían longitud de genes en bacterias, datos de incidencia de sarampión en la era pre-vacunación y valores absolutos de MEG registrados en humanos. Las frecuencias de aparición del primer dígito se comparaban con las predicciones teóricas de la LPD. Se realizaron simulaciones para modelar la propagación bidimensional de una epidemia y un modelo con cota superior aleatoria para explicar la conducta de los datos de MEG.

    Resultados: Se observó que la LPD se cumple en el caso de datos de una epidemia reportados desde un presunto sitio de propagación (incidencia de sarampión en la era pre-vacunación en Preston, Inglaterra). Sin embargo, se aprecian nocorrespondencias peculiares en el caso de la distribución de la longitud de genes en microorganismos, magneto-encefalogramas (MEG) y una epidemia promediada para una zona geográfica extensa.

    Conclusiones: Estudios de simulación mostraron que la promediación de datos en un escenario de ondas que se propagan pudiera explicar algunas de las distorsiones observadas, y esto ayudaría a comprender las características de los datos de epidemias. Un modelo con límite máximo aleatorio pudiera explicar los datos de MEG. La consideración de los datos de longitud de genes requiere de un trabajo teórico ulterior.

  • Multiple

    Aim: To explore whether the first digit law (FDL) is abided by data sets from biological origin.

    Materials and Methods: Data were collected from different sources, including gene data length for bacteria, pre-vaccination measles incidence data and absolute values from human MEG recordings. First digit frequencies were computed and compared to predictions from FDL. Simulations included a simple model for two-dimensional epidemics spread and a randomly set upper bound model aimed to explain the behaviour of MEG data.

    Results: We observed that FDL is obeyed in a case of epidemic data reported at a putative focus of spread (pre-vaccination measles incidence for Preston, England). However, peculiar departures were observed for gene length distribution in microorganisms, magneto-encephalograms (MEG), and epidemic data pooled from large geographical regions.

    Conclusions: Simulation studies revealed that averaging data on a scenario of propagating waves can explain some of the observed distortions from FDL. This could help to understand the behaviour of epidemics data. A randomly set upper bound model (RUBM) can likely explain the observed behaviour of MEG data. Explanation for gene length data behaviour requires further theoretical work.


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus