Las investigaciones muestran que los fumadores tienen una mayor tasa de supervivencia que los no fumadores.
¿Crees que es posible? Un informe de investigación sobre la enfermedad del fumador de hace 20 años llegó a esta conclusión: los datos mostraron que la tasa de supervivencia de los fumadores era del 76% y la tasa de supervivencia de los no fumadores era del 60%, y los fumadores vivían en promedio mucho más tiempo que los no fumadores. 20 años. Los datos no mienten.?
1. La paradoja de Simpson.
La paradoja de Simpson significa que la parte que tiene la ventaja en la comparación grupal se convierte en la parte en desventaja en la evaluación general. viceversa. Por ejemplo, supongamos que el Doctor A descubre el medicamento D. El medicamento D puede reducir la incidencia de enfermedades cardíacas. Los datos de observación de la investigación son los siguientes:
Mujeres (que no toman medicamentos): 1 persona tuvo un ataque cardíaco, 19 personas no sufrieron un ataque cardíaco y el la tasa de incidencia fue de 5;
Mujeres (tomando medicamentos): 3 tuvieron ataques cardíacos, 37 no tuvieron ataques cardíacos, tasa de incidencia 7,5;
Hombres (no tomando medicamentos): 12 sufrieron de ataques cardíacos, 28 no sufrieron ataques cardíacos, tasa de incidencia 30
Hombres (tomando medicamentos): 8 personas tuvieron ataques cardíacos, 12 personas no sufrieron ataques cardíacos, tasa de incidencia 40; >
Total (sin tomar medicamentos): 13 personas sufrieron ataques cardíacos Entre las personas, 47 personas no sufrieron un ataque cardíaco y la tasa de incidencia fue de 21,7;
Total (tomando medicamentos): 11 personas tuvieron un ataque cardíaco, 49 personas no sufrieron un ataque cardíaco y la tasa de incidencia fue de 18,3.
Conclusión de la investigación:
① Para los pacientes masculinos, después de tomar el medicamento D, el riesgo de ataque cardíaco aumentó del 30% al 40%, y el riesgo aumentó.
②Para las pacientes femeninas, después de tomar el medicamento D, el riesgo de ataque cardíaco aumentó de 5 a 7,5, y el riesgo también aumentó.
③ Resumiendo los datos, después de tomar el medicamento D, el riesgo de ataque cardíaco cambió de 21,7 a 18,3, pero el riesgo general se redujo.
La droga D es dañina para los hombres y dañina para las mujeres, pero es beneficiosa para los humanos. Los resultados son milagrosos.
2. ¿Dónde está el problema?
El problema es que los datos contienen un factor de confusión: el género. Si analizamos los datos, podemos ver que los hombres tienen una tasa de incidencia mucho mayor que las mujeres, independientemente de si toman medicamentos o no. Si aumenta el número de mujeres en la muestra que consumen drogas, la tasa de incidencia general naturalmente disminuirá. De la misma manera, si aumenta el número de hombres de la muestra que no toman medicamentos, también puede aumentar la tasa de incidencia global de la muestra.
Por lo tanto, para el medicamento D, el método de cálculo científico debe ser:
① Para las mujeres, la tasa de incidencia de no tomar el medicamento es 5 para los hombres, la tasa de incidencia de no tomar; tomando el medicamento 30; suponiendo una proporción entre hombres y mujeres de 1:1, la tasa de incidencia promedio en el grupo no medicado es 17,5.
② Para las mujeres, la tasa de incidencia de tomar medicamentos es 7,5 para los hombres, la tasa de incidencia de tomar medicamentos es 40, suponiendo que la proporción entre hombres y mujeres es 1:1, la tasa de incidencia promedio; del grupo que toma medicamentos es 23,75.
Conclusión: Después de tomar el medicamento D, la tasa de incidencia poblacional cambió de 17,5 a 23,75. Este medicamento es venenoso y no se puede comer.
3. Tasa de supervivencia de los fumadores.
Volviendo a la pregunta del inicio del artículo, ¿por qué existe tal conclusión que va en contra del sentido común?
La tasa de supervivencia de los fumadores es de 76 años, la de los no fumadores es de 60 años y la esperanza de vida media de los fumadores es 20 años más larga que la de los no fumadores.
El problema es que los datos contienen un factor de confusión: la edad. No podemos ver los datos subyacentes en el estudio, pero es probable que los fumadores de la muestra fueran, en promedio, más jóvenes que los no fumadores. De esta forma, la tasa de supervivencia de los fumadores es definitivamente mayor porque son más jóvenes. Es como buscar 100 fumadores de 20 años y no fumadores de 90 años para estudiar. Después de 10 años, existe una alta probabilidad de que 100 fumadores sigan vivos y 100 no fumadores mueran 90 veces. Entonces llegamos a la conclusión: No fumar es perjudicial para la salud.
¿Aún recuerdas la conclusión de ayer (Carta de la Academia 491)? Sin darnos cuenta, filtraremos algunas muestras, como cabrones aburridos. En el estudio de los fumadores, por supuesto, los investigadores no crearán deliberadamente situaciones tan extremas. Es probable que elijan aleatoriamente entre 20, 30, 40, 50, 60, 70, 80, 90 para seleccionar una muestra de investigación de una población de 100. años... Pero, de hecho, cuanto más envejecemos, más desequilibrada es la proporción entre fumadores y no fumadores, porque muchos fumadores ancianos han muerto, lo que hace que los fumadores sean más jóvenes que los no fumadores.
En este caso, sólo podremos obtener el resultado correcto segmentando los datos según la edad: fumar tiene un impacto negativo en la tasa de supervivencia.
①En el grupo de 20 años, la tasa de supervivencia de los fumadores es A y la tasa de supervivencia de los no fumadores es B,
②En el grupo de 30 años , la tasa de supervivencia de los fumadores es C, y la tasa de supervivencia de los no fumadores es D,
......
4.
Es necesario relacionar y ampliar los conocimientos. ¿Qué otras cosas similares podrían pasar en nuestras vidas?
Por ejemplo, el baloncesto.
A los compañeros A y B les gusta jugar baloncesto, así que cada uno busca 100 personas para jugar uno contra uno.
A encontró 50 maestros y 50 novatos, ganó 5 de 50 duelos con los maestros y ganó 25 de 50 duelos con los novatos, con una tasa de victorias total de 30.
B encontró 20 maestros y 80 novatos, ganó 1 de 20 duelos con los maestros y ganó 32 de 80 duelos contra los novatos, con una tasa total de victorias de 33.
En términos de tasa de ganancia, B tiene una tasa de ganancia más alta que A. Pero en términos de fuerza, A es mucho más fuerte que B.
Por ejemplo, inversión.
Jugar con los maestros es como operar con una tasa de ganancia baja pero una ganancia alta.
Jugar con novatos es como operar con una alta tasa de ganancias pero bajas ganancias.
¿Deberíamos buscar una tasa de ganancia estratégica o una ganancia general? La respuesta es obviamente la última.
Jim Rogers resumió su experiencia inversora en "40 pérdidas y 3 victorias". Durante su carrera inversora de medio siglo, Rogers cometió errores y fracasó muchas veces. Sin embargo, el peso de 3 victorias es mucho mayor que el de 40 derrotas. Siempre que el resultado de 3 victorias sea lo suficientemente grande, será suficiente para compensar la pérdida de 40 derrotas, permitiéndote finalmente obtener grandes beneficios.
Hay otro tema que necesita atención detrás de "40 derrotas y 3 victorias", y es el control de riesgos: porque en la vida de la mayoría de las personas, es poco probable que sus 3 victorias aparezcan continuamente. entre, así que lo que tenemos que hacer es controlar las pérdidas al mínimo, para que podamos convertir la derrota en victoria. Para decirlo sin rodeos, ya sean "40 derrotas y 3 victorias" u "80 derrotas y 1 victoria", la clave es sobrevivir cuando llegue la victoria, tenemos que asegurarnos de seguir ahí.
5. Calidad de vida.
En el nuevo año, es hora de "establecer metas y lograr el desempeño". Necesitamos darnos cuenta de que para estas metas y desempeño, "cantidad" y "calidad" son diferentes.
La "cantidad" es más fácil de medir, como la tasa de ganancias de los juegos de baloncesto, la tasa de ganancias de las transacciones, etc.
La "calidad" es más difícil de medir, como el nivel de los oponentes del baloncesto, la rentabilidad de la victoria, etc.
Sin embargo, el público siempre está acostumbrado a medir el bien o el mal por "cantidad", pero ignora la "calidad" de la vida que es la clave. La iluminación que esto trae es:
① Si somos como un compañero de clase A a quien le gusta desafiar a los expertos y elegir un camino relativamente difícil, debemos estar preparados para la posibilidad de no ser apreciados o ignorados. Esté preparado para no ser reconocido, porque nuestro desempeño (tasa de victorias) será feo.
② Si somos un jugador con capacidades limitadas y queremos ganar reconocimiento público, puede ser mejor elegir la CBA con competencia menos mixta que ir a la NBA donde hay muchos expertos, porque nuestro desempeño (datos) será más destacado.
6.
Los datos no mienten.
Los datos no mienten, pero sí las personas que los recogen e interpretan.
Por lo tanto, confíe en los datos, pero no confíe en los expertos.
Os deseo a todos una vida feliz.
Referencias:
1.Grinstead, C. M. y Snell, J. L. (1998). Introducción a la probabilidad. 2ª ed. >
p>
2.Pearl, J. (2014). Comprender la paradoja de Simposon. Estadístico estadounidense 88: 8-13.