Medidas estadísticas con sensores de smartphone

Aprendiendo del ruido.

La incertidumbre es inherente a toda medición. En los instrumentos eléctricos, parte de la incertidumbre se debe al ruido (térmico, eléctrico, mecánico) presente en todo dispositivo, así como en cualquier tipo de señal, haciendo que las medidas fluctúen de forma aleatoria. Un principio físico fundamental que impone límites a la precisión de cualquier medida. Esto vale, en particular, para los múltiples sensores presentes en los teléfonos inteligentes: sensores de aceleración, velocidad angular, campo magnético, luminancia, presión, etc.

El inevitable ruido de los sensores, tan molesto en cualquier medida, puede utilizarse, sin embargo, de modo favorable, para ilustrar conceptos básicos de tratamiento estadístico de medidas.

En los cursos introductorios de laboratorio y de física experimental, es habitual realizar alguna práctica que involucra medidas repetidas de una misma magnitud física, para analizarlas estadísticamente. Como expondremos aquí, esto mismo puede realizarse a partir de una serie de medidas registradas con el acelerómetro de un smartphone.


La inmensa mayoría de los teléfonos inteligentes y tablets, cuentan con acelerómetros triaxiales incorporados, capaces de medir aceleración en tres direcciones independientes. La dirección z, en particular, es perpendicular a la pantalla. Para conocer los valores de aceleración que mide el sensor, basta con iniciar alguna app como Physics Toolbox, Androsensor o PhyPhox. Si apoyamos el dispositivo sobre una superficie horizontal, podemos apreciar que aunque el teléfono se encuentra perfectamente quieto, los valores de aceleración en z fluctúan permanentemente. Si se utiliza el seudosensor de aceleración lineal las medidas fluctúan en torno a \( 0 m/s^2 \). En cambio, si se utiliza el acelerómetro, la medida que se obtiene es la aceleración gravitatoria y se puede obervar que las medidas fluctúan en torno a \( 9,8 m/s^2 \). (Ver en este enlace por qué el sensor mide la aceleración gravitatoria aunque esté en reposo. Es un fenómeno relacionado con el principio de equivalencia de Einstein.).

Esas fluctuaciones son relativamente pequeñas como se puede comprobar grabando una serie de medidas. En la figura 1 se muestran las más de 2000 medidas registradas con un Samsung S7, durante más de 10 segundos, a razón de 200 medidas por segundo. Se trata entonces de una gran muestra de medidas repetidas de la misma magnitud física (la aceleración gravitatoria). La gráfica parece realmente suave. Una recta horizontal, acorde con el hecho de que la aceleración gravitatoria es constante.

Figura 1


Sin embargo, si hacemos un acercamiento notamos que los datos no son tan suaves como parecían. En la figura 2 se muestra la misma serie de medidas de la figura 1, pero con una escala diferente en el eje vertical, para apreciar mejor las fluctuaciones en la serie de medidas.

Figura 2


Antes de pasar a la estadística que obedece este conjunto de medidas, podemos reconocer cierto patrón que refleja un rasgo importante de cualquier medida realizada por un sistema digital. En la figura 3 se muestra la misma serie de medidas de la figura 2, pero utilizando puntos negros para destacar cada una las medidas.

Figura 3


Se puede apreciar cierta regularidad. Aunque tal vez esa regularidad sea más evidente si compactamos todas las medidas hacia la izquierda, como en la figura 4, donde las medidas parecen formar una especie de escalera, donde cada peldaño está formado por grupos de medidas iguales. La diferencia entre peldaños es la resolución del instrumento, es decir, la mínima diferencia que el sensor puede registrar.

Figura 4


Queda entonces en evidencia que las medidas no toman cualquier valor, sino que se agrupan en determinados valores específicos, como escalonados, formando un conjunto discreto. Esto es típico de los instrumentos digitales, donde una magnitud continua (como la aceleración, en este caso) es transformada por un sensor en una señal eléctrica analógica, a la que un conversor analógico-digital (CAD) se encarga de transformar en una señal digital (que solo puede tomar ciertos valores discretos).

El sensor de aceleración del Samsung S7 es un K6DS3TR, tal como se muestra en la captura de pantalla de la figura 5. La resolución dada por el fabricante (mal llamada accuracy o exactitud en esa imagen), es \( \delta = 0,0023942017 m/s^2 \), la cual, como se puede observar en la figura 4, corresponde exactamente con la diferencia que hay entre los grupos de valores (los escalones de la escalera).

Figura 5


La resolución, \( \delta \), de un instrumento digital surge del rango \( R \), del sensor, (que es la diferencia entre el valor máximo y el mínimo que es capaz de medir) y el número \( n \) de bits del CAD, que es lo que define la cantidad \( 2^n \), de valores diferentes que puede registrar el instrumento. La resolución es simplemente el cociente entre el rango y la cantidad total de valores diferentes, esto es,

\[ \delta = \frac{R}{2^n} \]

La figura 5 muestra que el acelerómetro utilizado en este caso puede medir una aceleración máxima de \( 78,4532 m/s^2 \). Como no solo mide aceleraciones positivas, si no también negativas, el rango resulta ser el doble del valor máximo, es decir, \( R = 156,9064 m/s^2 \). Por lo tanto se puede determinar que este sensor es capaz de medir \( R / \delta = 65536 \) valores diferentes. Y como \( 65536 = 2^{16} \), esto significa que se trata de un sensor de 16 bits.

Figura 6


Veamos las estadísticas asociadas a las medidas. Empezemos por contabilizar cuántas medidas hay en cada valor diferente (en cada "peldaño"). En la figura 6, la longitud de cada barra horizontal (en azul), representa la cantidad de medidas que hay para cada valor diferente. Ese gráfico de barras es lo que se denomina un histograma. Se aprecia que la mayoría de las medidas se agrupan cerca del centro, lo que significa que es más probable que las medidas se encuentren cerca del valor promedio. Podemos verificar que este conjunto de medidas se ajusta muy bien a una distribución normal de probabilidad. Esta distribución fue introducida en el siglo XIX por el gran matemático alemán Karl Friedrich Gauss, motivo por el cual también se denomina distribución gaussiana, o más coloquialmente, "campana de Gauss". La distribución normal aparece en infinidad de conjuntos y está definida por la siguiente función de densidad de probabilidad,

\[ f(x) = \frac{1}{\sigma \sqrt{2 \pi}} e^{- \frac{\left( x - m \right)^2}{2 \sigma^2}} \]

donde \( m \) es el valor medio, que corresponde al centro de la distribución y \( \sigma \) es la desviación estándar de la muestra, que está relacionada con el ancho de la "campana", es decir que cuantifica la dispersión de las medidas. Es una forma de caracterizar la precisión de un conjunto de medidas. A menor \( \sigma \), menor dispersión y por lo tanto, mayor precisión. No se debe confundir precisión con exactitud. Mientras que la precisión tiene que ver con la dispersión de las medidas, la exactitud tiene que ver con el buen ajuste de una medida al valor real.

Para una muestra de \( N \) medidas diferentes \( x_i \), de una misma magnitud, la mejor estimación del valor medio está dada por el promedio de todas las medidas,

\[ m = \frac{1}{N} \sum_{i=1}^{N} x_i \]

Mientras que la desviación estándar de la muestra es,

\[ \sigma = \sqrt{\frac{1}{N-1} \sum_{i=1}^{N} \left( x_i - m \right)^2 } \]

Aplicando estas definiciones a nuestro conjunto de medidas, obtenemos: \( m = 9,776 m/s^2 \) y \( \sigma = 0,008 m/s^2 \). Estos dos valores determinan la curva de Gauss correspondiente a estas medidas, tal como se muestra en la figura 7, junto con el histograma de las medidas. Claramente las medidas se comportan de modo gaussiano.

Figura 7


La propiedad fundamental de la distribución normal, es que el área bajo un sector de la curva, representa la probabilidad de que una medida caiga dentro de ese intervalo (ver figura 8). Por supuesto que la probabilidad de que una medida tome cualquier valor es del 100%, es decir:

\[ P \left( - \infty < x_i < + \infty \right) = \int_{- \infty}^{+ \infty} f(x) dx = 1 = 100 \% \]

De modo similar, se encuentra que el 68% de las medidas estará en el intervalo "sigma", \( [ m - \sigma , m + \sigma ] \), este es el intervalo comprendido entre  \( m - \sigma \) y \( m + \sigma \),

\[ P \left( m - \sigma < x_i < m + \sigma \right) = \int_{m - \sigma}^{m + \sigma} f(x) dx \approx 0,682 \approx 68,2 \% \]

Mientras que en el intervalo "2 sigma", \( [ m - 2 \sigma , m + 2 \sigma ] \), están el 95% de las medidas,

\[ P \left( m - 2 \sigma < x_i < m + 2 \sigma \right) = \int_{m - 2 \sigma}^{m + 2 \sigma} f(x) dx \approx 0,954 \approx 95,4 \% \]

Y el 99% de las medidas estará dentro del intervalo "3 sigma", \( [ m - 3 \sigma , m + 3 \sigma ] \),

\[ P \left( m - 3 \sigma < x_i < m + 3 \sigma \right) = \int_{m - 3 \sigma}^{m + 3 \sigma} f(x) dx \approx 0,997 \approx 99,7 \% \]

Veamos lo que ocurre con nuestro conjunto de medidas. Si sumamos todas las medidas de aceleración comprendidas dentro del intervalo "sigma", encontramos el 70,0% de las medidas. En el intervalo "2 sigma", el 95,5% de las medidas y dentro del intervalo "3 sigma", el 99,6% de las medidas. Estos resultados confirman que nuestros datos experimentales se ajustan muy bien a un modelo de distribución normal.

Figura 8


En la figura 9 se muestra otra forma de interpretar los tres intervalos mencionados. El promedio está representado por la línea negra central. El intervalo "sigma" es el comprendido entre las rectas azules. Allí se encuentran el 68% de las medidas. Análogamente están representados los intervalos "2 sigma" y "3 sigma", entre las líneas verdes y celestes, respectivamente.

Un resultado interesante es expresar estos intervalos en términos de la resolución del sensor. De este modo podemos decir que el 68% de las medidas están dentro de un intervalo de radio igual a 3 veces la resolución. Por otra parte el 99% de las medidas se encuentran dentro de un intervalo de radio igual a 10 veces la resolución.

Figura 9


Finalmente, podemos aplicar estas herramientas a otras situaciones. Por ejemplo, ver qué pasa cuando medimos la aceleración gravitatoria que hay en un avión en pleno vuelo. En este caso tomé medidas de aceleración con el mismo teléfono colocado en el piso del avión, mientras volaba suavemente, sin turbulencias, a 11 km de altitud, entre Puerto Rico y Panamá.

En este caso la muestra obtenida fue de 1500 medidas, resultando el valor medio igual a \( m = 9,65 m/s^2 \) y la desviación estándar, \( \sigma = 0,29 m/s^2 \). En la figura 10 se muestra el histograma de estas medidas junto con la curva de Gauss que le corresponde.

Se observa que con respecto al teléfono en tierra firme, la desviación estándar se incrementó casi 40 veces. Este aumento drástico en la dispersión de las medidas, (que se debe a las vibraciones mecánicas del avión), se puede apreciar claramente en toda su magnitud en la figura 11, donde se comparan los histogramas (sin normalizar) de las dos muestras consideradas.

Figura 10


Figura 11. En rojo, el histograma de las medidas de aceleración gravitatoria realizadas en tierra firme (mismo de la figura 7). En barras blancas, el histograma de las medidas de aceleración gravitatoria registradas sobre el avión.



REFERENCIAS:

  • Philip Bevington, D. Keith Robinson, Data reduction and error analysis for physical sciences.
  • David C. Baird, Experimentation. An Introduction to Measurement Theory and Experiment Design.
  • Salvador Gil, Experimentos de Física usando las TIC y elementos de bajo costo.
  • Daryl W. Preston, Eric R. Dietz, The Art of Experimental Physics.




APÉNDICE: Código Scilab con el que se realizaron las gráficas y los cálculos anteriores. (los números asignados a las figuras no corresponden con los números que tienen en el programa)

//Medidas con Samsung S7 en el avión de Puerto Rico a Panamá el 28 de octubre de 2018
Av28a=read("Av28a.txt",-1,2);
a1=Av28a(:,1);
t1=Av28a(:,2)/1000;
N1=length(a1);
m1=mean(a1);
s1=stdev(a1);
scf(1)
histplot(11,a1)
xtitle("","a (m/s^2)","n norm")
x1=8:0.01:12;
y1=(1/(s1*sqrt(2*%pi)))*(exp(-((x1-m1).^2)/(2*(s1)^2)));
plot2d(x1,y1,5)

//Cantidad de medidas en diferente entornos de la media
n1s1=0;
n1s2=0;
n1s3=0;
for i=1:N1,
    if a1(i)>m1-s1 & a1(i)        n1s1=n1s1+1;
    end,
    if a1(i)>m1-2*s1 & a1(i)        n1s2=n1s2+1;
    end,
    if a1(i)>m1-3*s1 & a1(i)        n1s3=n1s3+1;
    end,
end

n1s1=n1s1/N1;
n1s2=n1s2/N1;
n1s3=n1s3/N1;


//Medidas con Samsung S7 en Montevideo el 14 de enero de 2019
MVDa=read("MVDa.txt",-1,2);
a2=MVDa(:,1);
t2=MVDa(:,2)/1000;
N2=length(a2);
m2=mean(a2);
s2=stdev(a2);
scf(2)
histplot(11,a2,style=1)
xtitle("","a (m/s^2)","n norm")
x2=9.72:0.001:9.84;
y2=(1/(s2*sqrt(2*%pi)))*(exp(-((x2-m2).^2)/(2*(s2)^2)));
plot2d(x2,y2,5)

//Cantidad de medidas en diferente entornos de la media
n2s1=0;
n2s2=0;
n2s3=0;
for i=1:N2,
    if a2(i)>m2-s2 & a2(i)        n2s1=n2s1+1;
    end,
    if a2(i)>m2-2*s2 & a2(i)        n2s2=n2s2+1;
    end,
    if a2(i)>m2-3*s2 & a2(i)        n2s3=n2s3+1;
    end,
end

n2s1=n2s1/N2;
n2s2=n2s2/N2;
n2s3=n2s3/N2;


//Histograma para visualizar resolución digital (sin normalizar)
scf(3)
histplot(400,a2,normalization=%f,style=2)
xtitle("","a (m/s^2)","n")


//Comparativas
scf(4)
histplot(11,a1,normalization=%f)
histplot(11,a2,normalization=%f,style=5)
xtitle("","a (m/s^2)","n norm")

//Medidas crudas sin zoom
scf(5)
plot2d(t2,a2,5,rect=[0,0,12,12])
xtitle("","t (s)","a (m/s^2)")

//Medidas con zoom
scf(6)
plot2d(t2,a2,5)
xtitle("","t (s)","a (m/s^2)")

//Medidas con zoom
scf(7)
plot2d(t2,a2,5)
plot2d(t2,a2,-4)
xtitle("","t (s)","a (m/s^2)")

//Medidas con zoom
scf(8)
plot2d(t2,a2,5)
plot2d([0 12],[m2 m2])
plot2d([0 12],[m2-s2 m2-s2],2)
plot2d([0 12],[m2+s2 m2+s2],2)
plot2d([0 12],[m2-2*s2 m2-2*s2],3)
plot2d([0 12],[m2+2*s2 m2+2*s2],3)
plot2d([0 12],[m2-3*s2 m2-3*s2],4)
plot2d([0 12],[m2+3*s2 m2+3*s2],4)
xtitle("","t (s)","a (m/s^2)")


//


Más física con teléfonos inteligentes: http://fisicamartin.blogspot.com/search/label/SmarterPhysics

Y todavía más: http://smarterphysics.blogspot.com


Si te ha gustado esta nota puedes compartirla en tus redes y/o dejar un comentario.
También es bienvenida una donación equivalente al valor de una taza de café.
¡Como siempre, gracias por leerme!

DONACIÓN:
Buy Me a Coffee at ko-fi.com
Gracias por el apoyo

Comentarios

  1. Ejercicio - comparar el resultado de las dos medidas (en tierra y en el avión) con lo que pronostica la ley de gravitación universal, teniendo en cuenta los 11 km de diferencia de altura.

    Si hice bien las cuentas debería ser aprox. 0.126 m/s2 de diferencia (muy cercano a la medida).

    Gracias por otro post excelente.

    ResponderEliminar
    Respuestas
    1. Muchas gracias, Julio, por el comentario. Justamente este artículo surgió de realizar medidas de aceleración gravitatoria en diferentes situaciones y con diferentes dispositivos. La comparación de los diferentes valores de g y otros detalles interesantes los he dejado para una segunda nota. Saludos!

      Eliminar

Publicar un comentario