Big Data: ¿Podemos predecir las tendencias de la población (como la felicidad) a través de aplicaciones de salud?

Hace más de cinco años, escribí un artículo titulado Confiabilidad y validez en un mundo Web 2.0. Habló sobre las preocupaciones de recopilar datos de muestras sesgadas, sin comprender primero de qué manera, exactamente, esas muestras pueden estar sesgadas.

Ahora, con la ubicuidad de las aplicaciones, programas descargables para los teléfonos inteligentes de las personas, veo que surge el mismo problema. Los desarrolladores y emprendedores buscan datos de estas aplicaciones sin comprender los conceptos básicos de una recopilación de datos científicos buena y confiable. Y por qué es importante, especialmente cuando comienza a querer analizar todos estos "grandes datos" (un término un tanto tonto ... en epidemiología, por ejemplo, los científicos simplemente lo llaman "datos").

¿Pueden estas aplicaciones recopilar datos de salud personal sin sesgos y, de alguna manera, transformarse en algo más grande?

La respuesta corta: no, no es fácil.

Claro, hay personas que son parte de un movimiento de "yo cuantificado" - que quieren rastrear y medir cada aspecto de su salud personal (y supuestamente, salud mental). Pero esas personas son actualmente1 valores atípicos y de ninguna manera representan a la población en general.

Estas minorías pueden constituir rápidamente la mayor parte de un esfuerzo para recopilar conjuntos de datos más grandes con el fin de analizar las tendencias de salud o bienestar. Si bien los análisis resultantes pueden decirle algo sobre este grupo de personas, sería inapropiado sugerir que se generaliza al resto de la población (que, demográfica y conductualmente, puede verse y actuar de manera muy diferente).

Esto no cambiará pronto, porque la mayoría de las aplicaciones de salud las descargan las personas, las usan una o dos veces y luego las abandonan. Existe una razón por la que la mayoría de las personas dejan de usar las aplicaciones de salud, especialmente las que están diseñadas para actuar como un diario de datos. ¡Ellos están aburridos! Recopilar datos sobre usted mismo es una tarea muy aburrida para la mayoría de nosotros a la que nos comprometemos a realizarla activamente todos los días (o incluso todas las semanas).

La respuesta complicada: las aplicaciones deben ser más inteligentes y estar conectadas

Las aplicaciones de salud destinadas a recopilar datos finalmente fallan porque requieren una entrada activa por parte del usuario. Esta es la razón por la que los registros de salud personales nunca han despegado de manera significativa.2 Las personas están demasiado ocupadas viviendo sus vidas para molestarse en decirle a una aplicación3 cuáles son sus métricas diarias.

Para que las aplicaciones de salud finalmente tengan éxito donde la mayoría de los otros intentos de software de seguimiento de la salud personal han fallado, es que recopilen sus datos de forma pasiva. Eso significa que no se requiere ninguna entrada del usuario.

Por supuesto, estamos muy lejos de que tales métricas brinden datos significativos.Claro, hay dispositivos para correr que rastrean cuánto corres (de Nike, por supuesto). Pero una aplicación en ejecución es inútil si no se comunica con mi aplicación de dieta, mi aplicación de nutrición o mi aplicación de ejercicio. O mi aplicación de atención plena. Es una aplicación que mide una sola métrica en el complejo ser que soy yo. Simplemente no es mucho para continuar.

La confianza es una piedra angular clave

La adopción de dichas aplicaciones en red que comparten todos sus datos de salud también tiene otro obstáculo menos técnico: la confianza. Empresas como Facebook y Nike responden en última instancia a un solo grupo de personas: sus accionistas. Eso significa que si lo mejor para ellos es analizar sus datos en busca de cosas con las que puedan ganar dinero, lo harán.

Las empresas emergentes no son mejores, porque en lugar de accionistas, responden solo a los capitalistas de riesgo, prestamistas que solo buscan el mejor y más rápido retorno de su inversión.

¿Por qué querría confiar mi información médica (datos que podrían usarse en mi contra para denegar un seguro o fijar las tarifas de mi seguro en el futuro) a compañías que tienen poco interés en proteger mi privacidad?

Lo que nos lleva de nuevo al primer punto: una muestra sesgada. Las personas que con gusto brindan toda su información médica a empresas con fines de lucro para que la analicen, recopilen y eventualmente se relacionen con usted (incluso si dichos datos son inicialmente anonimizados) no son como la mayoría de las personas. La mayoría de nosotros todavía nos preocupamos por mantener nuestra información de salud para nosotros, al igual que la mayoría de nosotros todavía queremos mantener nuestra información financiera para nosotros.

A dónde vamos desde aquí

Intentar recopilar datos basados ​​en la población (p. Ej., Realizar una investigación epidemiológica) desde aplicaciones de salud tiene algunos problemas y oportunidades que he identificado:

  • Muestreo sesgado debido a la pequeña minoría de personas que utilizan de forma activa y continua aplicaciones de salud
  • El muestreo y el uso continuo podrían mejorarse mediante pasivo versus activo recopilación de datos
  • El muestreo y el uso podrían mejorarse aún más mediante el uso de una autoridad confiable para recopilar y almacenar datos (no una empresa con fines de lucro o una nueva empresa)
  • Las aplicaciones que se conocen entre sí e intercambian datos de salud relevantes sobre mí son la próxima generación, en lugar de la riqueza actual de aplicaciones aisladas e inconscientes (¿estúpidas?)

Creo que es genial que los desarrolladores vean un problema de salud, desarrollen una aplicación para él y la publiquen en el mundo. Pero con demasiada frecuencia, estas aplicaciones no van a ninguna parte, sin audiencia. O quedan huérfanos por los desarrolladores originales por falta de interés. Las pocas aplicaciones de salud populares que obtienen una audiencia sólida son la excepción, no la regla. E incluso cuando obtienen una aceptación generalizada, al igual que los sistemas de registros médicos electrónicos de nuestro país, no se comunican entre sí.

Si desea poder decir algo autorizado o significativo sobre los datos recopilados de una aplicación, debe demostrar que los datos provienen de una muestra representativa de la población. A falta de eso, sus datos solo nos informan sobre un pequeño grupo de la población, uno que no se parece a la mayoría de nosotros.

Notas al pie:

  1. Y será en el futuro previsible [↩]
  2. Y por qué Google finalmente cerrará su propio registro de salud personal mañana. [↩]
  3. O peor, y más comúnmente, un conjunto completo de aplicaciones que no son conscientes de los demás y no pueden intercambiar datos entre ellos [↩]

!-- GDPR -->