¿Qué es la EPA?

Todos hemos oído hablar de la famosa EPA, Encuesta de Población Activa que elabora el Instituto Nacional de Estadística (INE). ¿Pero sabemos para qué sirve realmente?

Objetivo

El objetivo principal de la EPA es obtener datos de la fuerza de trabajo y de sus diversas categorías (ocupados y parados), así como de la población ajena al mercado laboral (inactivos)

De esta forma, se tienen en cuenta variables de diversa índole, como la población según el sexo, la edad, el estado civil, la nacionalidad, los estudios alcanzados, la relación con la actividad desempeñada, etc.

Además, los activos se clasifican según la rama de actividad en la que trabajan, ocupación, sector económico, situación profesional, etc. Es decir, una completa desagregación de variables que nos permiten valorar y medir en su justa medida la situación y la evolución de los activos e inactivos de nuestro mercado laboral.

Metodología

Esta encuesta se lleva realizando desde 1964, por lo que es una de las que tiene mayor solera dentro del INE. Una referencia a tener en cuenta.

También sabemos que sale a los medios de vez en cuando, ¿por qué? Pues porque su periodicidad es trimestral, de ahí que exista otro factor curioso, que no coincida con los datos mensuales que se aportan desde otras fuentes de información estadística como puede ser el Ministerio de Trabajo o las propias comunidades autónomas, a lo que hay que unir lo más importante, que siguen metodologías diferentes, ya que la EPA es una encuesta y los datos registrados en Trabajo son censales.

La EPA se aplica a una gran muestra. El INE cuenta con 65.000 familias cada trimestre, es decir, unas 200.000 personas.

El periodo de referencia de la información es la semana anterior a la entrevista y los resultados de la EPA se obtienen un mes y medio después de finalizar el trabajo de campo.

Revisión

En marzo de 2005 el INE revisó todas las series de la EPA 1996-2004 para adecuar sus resultados al incremento de la población residente en España, que estuvo muy relacionada con el gran aumento de población inmigrante.

También se han tenido en cuenta la nueva normativa europea para normalizar los procesos según el procedimiento de la oficina estadística europea EUROSTAT y la introducción de mejoras en la forma de recoger la información.

Expectación

Sin duda, la EPA, junto con otras encuestas a nivel estatal como los barómetros de opinión del CIS, suponen un buen pulso a la economía española, y en este caso, a nuestro maltrecho mercado laboral.

Los datos de la EPA son consistentes y fiables, y cuentan con una serie temporal robusta, por lo que los análisis a partir de su esta encuesta son aconsejables. Su comparabilidad con otras series de organismos internacionales como OCDE, EUROSTAT, OIT son más que interesantes.

Para mayor facilidad de los ciudadanos, el INE suele publicar una nota de prensa con los principales resultados de la EPA. Sin embargo, es aconsejable ir a los microdatos y bucear entre la información recogida. ¡Yo por lo menos lo hago!

Aquí os dejo la última nota de prensa del primer trimestre del 2012 de la EPA.

Share on Facebook

Homer Simpson y las estadísticas

Un toque de humor de una de las mejores series de la historia de la televisión

 

 

 

Share on Facebook

Curiosidades frecuentistas

Share on Facebook

Análisis de la Covarianza – ¿Para qué? ¿Cuándo utilizarlo?

ANOVA y ANCOVA

Con las técnicas ANOVA o de Análisis de la Varianza se resuelven un tipo de problemas, en cierto modo especiales, como son verificar hipótesis sobre la igualdad del comportamiento de los diferentes niveles de un factor, o contrastar la hipótesis de que varias muestras proceden de una misma población.

Si nos centramos en el problema desde el primer punto de vista, se puede contemplarlo también como el análisis del comportamiento de una variable X cuando se le somete a las distintas dosis de un factor. El acto de incluir más factores se debe a dos premisas:

1. Analizar la acción de varios factores

2. Disminuir la influencia del error al diferenciar de éste las fuentes de variación conocidas previamente.

Por explicarlo de forma general, el Análisis de la Covarianza o ANCOVA puede considerarse como un perfeccionamiento de los análisis ANOVA y reune las técnicas del ANOVA y la regresión clásica. El análisis de la Regresión tiene, en su sentido más utilizado, una variable que se hace depender linealmente de otra u otras, no aleatorias, y de un elemento aleatorio llamado error:

Y = X1 + X2 + … Xn + Error

Tiene las mismas características que el ANOVA, pero la diferencia radica en que el objeto de estudio y análisis entre ambos es el factor.

Si atendemos a las enseñanzas de Scheffe, en el ANOVA el factor, ya sea cualitativo o cuantitativo, se trata cualitativamente, mientras que en el Análisis de Regresión, todos los factores son cuantitativos y se tratan de forma explícita de forma cuantitativa. En el ANCOVA, al tratarse de una mezcla de ambos análisis, unos factores se tratan cualitativamente y otros cuantitativamente.

Normalmente, el modelo ANCOVA en su concepción más simple se suele escribir de la siguiente forma:

Y = Beta1 + Beta2X + Error

Estimaciones

La estimación de los parámetros del modelo (Beta1 y Beta2) se suele realizar a través del método de mínimos cuadrados.

Para que el modelo quede perfectamente determinado es necesario estimar la varianza de los errores (sigma2). Por lo tanto, las estimaciones (Beta1, Beta2 y Sigma2) gozan entre otras propiedades de las de insesgadez y eficiencia.

Contraste de hipótesis

De las múltiples hipótesis que normalmente se contrastan resalta la siguiente hipótesis:

Ho = La pendiente de la recta (Beta2) es significativamente distinta de cero.

Es decir, la variable X influye sobre la variable Y. En caso contrario el resultado indica que se puede prescindir de la variable X como medio para explicar la variabilidad de la variable Y. Para llevar a cabo este contraste se lleva a cabo un Análisis de la Varianza de la Regresión, a través del sistema clásico de comparaciones SCR/SCE siguiendo la distribución F(2;n-2;alfa).

Como punto importante hay que recordar que el contraste ha de basarse en la valoración del R cuadrado, que valida el ajuste y su bondad. Puede darse que exista una influencia de la variable X sobre la Y (Beta2!=0), pero hay que medir en qué cuantía dicha influencia se manifiesta. Esto se mide a través del coeficiente de determinación R-cuadrado, que varía entre 0 y 1. Cuando no existe asociación lineal entre ambas variables R-cuadrado=0 y cuando la asociación es perfecta $-cuadrado=1.

Ejemplos de utilización del ANCOVA

Imaginemos que queremos analizar el efecto que sobre el consumo de un producto, en este ejemplo de libros, tiene el nivel cultural de las personas.

En primer lugar, estableceríamos los niveles del factor A1, A2, …, At, siendo Yij el gasto en libros de la persona “ij”. El modelo de análisis sería el siguiente:

Yij = mu + Ai + eij

Imaginemos ahora que en considerásemos de partida que el nivel de ingresos de los compradores (X) pudiera también influir en la decisión de compra. Por su parte, matemáticamente podría explicarse así:

Yij = Beta1 + Beta2*Xij + eij

Si realizamos el análisis del comportamiento de los niveles culturales y de los niveles de ingresos independientemente unos de otros, tendríamos como resultado que, por muy esclarecedores que fueran, solo nos proporcionarían una visión parcial del problema en cuestión, en este caso, el análisis de una de las posibles causas de la variabilidad del consumo de libros.

Para conseguir este nuevo propósito, podríamos fundir ambos modelos en uno, de la siguiente manera:

Yij = mu + Ai +  Beta*Xij + eij

De esta forma, los resultados que se obtienen respecto de los niveles culturales vendrán matizados por la influencia del nivel de ingresos, y viceversa.

Hay que destacar que en este modelo la variable Xij no es aleatoria, por lo que recibe el nombre de “variable concomitante o COVARIABLE”. La componente “eij” es aleatoria y, por supuesto, se han de contrastar sobre ella las hipótesis de normalidad, homocedasticidad, independencia y esperanza matemática nula (N(0, sigma)).

Espero que esta sencilla puesta en escena del análisis de Covarianza haya resultado interesante.

 

Un saludo!

 

Share on Facebook

El papel de la Estadística en el Marketing moderno

Actualmente, las técnicas de Marketing invaden y saturan la vida cotidiana. Sin embargo, pocos conocen que, tras todo esto, la Estadística juega un papel importantísimo.

Según la American Marketing Asociation (AMA), el Marketing: “es una función de la organización y un conjunto de procesos para crear, comunicar y entregar valor a los clientes, y para manejar las relaciones con estos últimos, de manera que beneficien a toda la organización…”

Sin embargo, esta tradicional descripción académica de la asociación americana se ha tenido que adaptar a las nuevos cambios que la sociedad ha conocido en estas últimas décadas. Philip Kotler, uno de los grandes nombres del Marketing moderno, describe el Marketing de la siguiente forma: “El marketing se ocupa de identificar y satisfacer las necesidades humanas y sociales. Una de las definiciones más cortas de marketing es <satisfacer necesidades de manera rentable>”.

Para nuestra sociedad, la conocida como “Sociedad del Consumo“, el Marketing ya no constituye únicamente una simple función de la organización; sino que se ha convertido en una función imprescindible en muchos negocios y actividades empresariales, formando parte de la estrategia general de partida de las empresas.

La tecnología lo cambió casi todo

Debido a los enormes avances tecnológicos experimentados desde finales del siglo XX hasta el presente, los especialistas en marketing han movido ficha para adaptarse a los nuevos comportamientos y pautas sociales de forma que su actividad no se quedase desfasada con respecto a los inciertos mercados sobre los que trabajan.

Uno de los principales aspectos del Marketing lo constituye la recogida y el tratamiento de la información. Hace apenas 30 años, el tratamiento de millares de datos procedentes de clientes de diversa índole no solo se convertía en un claro objeto de deseo sino que económicamente era poco más que inviable.

Gracias a los avances tecnológicos, y en especial, gracias al desarrollo de la Informática, este problema se ha superado con creces, ya que hoy en día, los sistemas computacionales permiten un tratamiento preciso y, sobre todo rápido, de ingentes cantidades de datos.

La Estadística como base científica

Consecuentemente, la Estadística, basada tradicionalmente en el tratamiento de datos, ha adoptado con sumo gusto la utilización de software cada vez más potente. El cálculo que antes costaba varios días o incluso semanas usando una antigua máquinas de hojas perforadas, hoy en día se resuelve en cuestión de segundos o milisegundos, gracias a los potentes microprocesadores.

Además, el software estadístico ha evolucionado de forma brillante tanto en el ámbito de las licencias privadas (SPSS; SAS, STATISTICA, etcétera) como en el ámbito del desarrollo abierto (R-Cran). La integración de paquetes y motores estadísticos en aplicaciones informáticas constituye un avance sensacional en el tratamiento y exposición de la información.

Gracias al avance tecnológico, la “Minería de Datos” o Data Mining, se ha constituido hoy en día como una herramienta empleada en muchas multinacionales y grandes empresas, las cuales, explotan sus enormes bases de datos de forma estadística para averiguar hasta el más mínimo detalle que les ayude a optimizar su Marketing Mix, es decir, la gestión de su producto, sus rangos de precios, sus canales de distribución y su promoción y/o publicidad.

¿Qué aporta la Estadística al marketing?

La Estadística aporta una base científica y una metodología que justifica, entre otras cosas, la aprobación final de presupuestos para la realización de investigaciones comerciales, que en el caso de las grandes multinacionales, suelen ser de gran cuantía.

Es más, la Estadística permite optimizar las estrategias de Marketing a seguir, reduciendo el riesgo y aportando una medición real del retorno de inversión (ROI). Esto es importante, puesto que además de saber cuánto ha de invertir una empresa en sus acciones de marketing, también es necesario medir qué rentabilidad se ha obtenido con dichas acciones.

Los pequeños detalles son los que llevan al éxito

Lo cierto es que todavía, muchas empresas consideran la función de Marketing como un gasto y no como una inversión, lo cual constituye un enorme error. En épocas de crisis generalizada como la que vivimos, es todavía más tentador suprimir y dilapidar las funciones de Marketing de la empresa hasta que vengan tiempos mejores.

Lo cierto es que aquella vieja frase de “la información es poder” es cada más cierta. La diferenciación de los productos de una empresa con respecto a sus competidores ha de apoyarse en un buen sistema de información relevante y actualizado.

En Estadística, la información no sólo aporta medias y varianzas, como normalmente se suele aducir, en cierta manera de forma despectiva. Los datos pueden seguir patrones subyacentes que son definitivos para la explicación de fenómenos, y en el caso que nos ocupa, de patrones de comportamiento en el análisis de los componentes del Marketing Mix.

En muchas ocasiones, la aplicación de un análisis estadístico multivariante desentraña una serie de comportamientos que a través del ojo del especialista en marketing de la empresa a simple vista no se aprecian. En ese momento un buen analista estadístico entra a jugar con sus propias cartas.

El azar ya no tiene hueco en la actual mercadotecnia

Pese a las reticencias tradicionales que ha habido entorno al uso de la Estadística en diversos campos profesionales, poco a poco va teniendo cabida y aplicación en un sinfín de proyectos relacionados con la Sanidad, Demografía, Seguridad Social, Biología, Medicina, Investigación Social, etc.

En lo concerniente a la Investigación de Mercados, las técnicas cuantitativas utilizadas con metodologías estadísticas avanzadas garantizan un análisis objetivo, científico y mesurable, que se trasladan directamente en la obtención de mejores márgenes productivos para las empresas.

Y es que, la suerte cada vez juega un papel menos importante en la consecución de los objetivos comerciales. El escritor americano de ciencia ficción Robert Heinlein dijo una vez: “No existe la suerte. Sólo hay preparación adecuada o inadecuada para hacer frente a una estadística“. En la aplicación de las técnicas de mercadotecnia actuales no se deja lugar al azar, la Estadística ha logrado ocuparse en gran medida de él y ayuda a que la suerte juegue a favor de las acciones comerciales puestas en marcha.

Share on Facebook

Garfield y la binomial

Share on Facebook

Humor estadístico: el baile de cifras

A veces, no se saben explicar bien las cosas …

 

Share on Facebook

Biografía estadística: Karl Friedrich Gauss (1777-1855)

Comenzaré una serie de biografías de matemáticos y estadísticos directamente relacionados con el desarrollo y progreso de la Estadística, en las que intentaré no solo ceñirme a datos de su vida como científicos, sino también a anécdotas y curiosidades interesantes.

Hoy, iniciamos esta serie con un hombre cuyo apellido ha creado quebraderos de cabezas para muchos en esas largas noches de estudio de alguna asignatura estadística.

Johann Carl Friedrich Gauss nació en Brunswick (Alemania) en 1777 y murió en Göttingen (Alemania) en 1855. Ha sido catalogado como astrónomo, físico y matemático y ha sido un gran protagonista en el estudio y desarrollo del análisis matemático, la geodesia, el magnetismo, la óptica y la geometría diferencial.

Su obra maestra es Disquisitiones arithmeticae, escrita en Latín constituye un tratado de la teoría de números.

Aunque muchos estudiantes y licenciados recordamos a este personaje como “el de la distribución de la Normal”. En 1823 publicó Theoria combinationis observationum erroribus minimis obnoxiae, dedicado a la Estadística y más en concreto a la distribución normal cuya curva característica, denominada como Campana de Gauss, es muy usada en disciplinas no matemáticas donde los datos son susceptibles de estar afectados por errores sistemáticos y casuales.

Curiosidades sobre Gauss

Aprendió a leer y a utilizar calculos aritméticos con tan solo … ¡3 años!

En cierta ocasión, cuando nuestro protagonista tenía 10 años, su maestro solicitó a la clase que encontrará la suma de todos los números comprendidos entre uno y cien. Pues bien,  Gauss levantó al instante la mano y dio la respuesta correcta.

Gauss le asertó a su profesor que encontró la solución usando el álgebra. No había que ser un lince para darse cuenta de que el muchacho prometía y sería un auténtico genio.

En otro episodio, cuando Gauss todavía tenía 12 años, ¡criticó los fundamentos de la geometría euclidiana!, dedicando sus estudios e investigaciones a la geometría no euclidiana.

A los 15,  probó el binomio de Newton.

Cuando Gauss contaba 19 años, su madre preguntó a Wolfgang Bolyai, un amigo de éste, si Gauss llegaría a ser alguien. Bolyai no dudó ni un segundo en responderle: ¡El más grande de los matemáticos de Europa!, y ella se puso a llorar.

Ya un poco más maduro, con 24 años, Gauss tuvo una destacada participación en el nacimiento de la astrofísica: en el año 1.801 predijo la posición del asteroide Ceres utilizando el método de mínimos cuadrados. Consiguió demostrar que la estimación de una medida usando este método es óptima cuando los errores en las mediciones siguen una curva que él llamó “de errores” y que nosotros llamamos normal o campana de Gauss.

Gauss no se andaba con miramientos

Se dice, se cuenta, se rumorea … que en 1807 la esposa de Gauss estaba muy enferma y que el médico se encontraba en su dormitorio atendiéndola. Gauss, esperaba pacientemente en el salón cuando de repente sus ojos volvieron sobre el estudio en que había estado trabajando arduamente durante los últimos días.

Entonces, sus pensamientos volvieron a dicho proyecto y pronto le puso todo su énfasis, olvidándose por momentos de la situación tan grave de su esposa. Mientras trabajaba en ello, el médico bajó a comunicar a Gauss la triste noticia de que su mujer se estaba muriendo.

Gauss, con su mente fija en el problema, hizo un ademán al médico y dijo: “Sí, sí, pero pídale que espere un momento hasta que acabe con esto“.

Su muerte

Nunca publicaba un trabajo hasta estar totalmente seguro de que estaba elaborado de forma perfecta y no dejaba rastro de cómo obtenía sus resultados. Gauss llegó a expresarse en estos términos: “cuando se finaliza un noble edificio no deben quedar visibles los andamios”.

Su leyenda aumentó, como otros tantos grandes personajes de la Historia, tras su muerte. Se dice que tras su fallecimiento se descubrieron gran cantidad de importantes e inéditos resultados que él no había querido publicar.

Hay un rumor que corre sobre la lápida de la tumba de Gauss, que dice  su tumba fue escrita con un diagrama, que construyó él mismo, y que consta de un polígono de diecisiete lados.

Este personaje constituye para mí, sin duda alguna, una sana envidia sobre lo que una persona de origen humilde puede llegar a ser en el mundo de la Ciencia, con trabajo, tesón y … una mente privilegiada de la que yo no dispongo.

Share on Facebook

Los orígenes de la Estadística V – Designios, Providencia y desmentidos

En los últimos artículos hemos podido leer a cerca de los orígenes de la Estadística, en un contexto de avance de las ciencias matemáticas, físicas y sociales. Los expertos sitúan el final del surgimiento de la probabilidad con la publicación del Ars conjectandi.

John Arbuthnot, o como intentar meter la Providencia a calzador

Hoy os escribiré sobre John Arbuthnot, actualmente considerado con um escritor satírico, si bien, era un reputado médico de la Royal Society. Pues bien, Arbuthnot era de la opinión de que las posibilidades de que una mujer de veinte años conserve su virginidad o que un joven haya sido infectado de gonorrea se justificaban en base al análisis de probabilidad a posteriori.

Pero, me quiero centrar en un debate interesante que establecieron a cerca de la posibilidad de de que el recién nacido sea varón. Nuestro citado del día, publicó un argumento en favor de la Divina Providencia, tomado de la regularidad constante observada en los nacimientos de ambos sexos. Este argumento, empleaba dos tipos de razonamiento estadístico, de los cuáles uno de ellos es válido y en el que se postula por la “Intervención Divina” en la acción de las leyes estadísticas.

¿Interviene la Providencia en la proporción de mujeres/hombres?

Si nos vamos a la esencia de este argumento, Arbuthnot nos explica que debemos examinar tres inferencias, solo dos de las cuales serían consideradas actualmente estadísticas y cuya tercera inferencia trata de la propia naturaleza de la estabilidad estadística. De esta forma, en una población de n monedas cuyas caras están marcadas por M y F, los coeficientes binomiales en la expansión (M+F) elevado a n, dan las probabilidades de los resultados de n tiradas.

Así, el coeficiente, dividido por 2 a la n, es la probabilidad de obtener exactamente kM y (n-k)F. Al tender n a infinito, aumentan los coeficientes de cualquier término y se hacen más pequeños, por lo que, si suponemos que M es masculino y F femenino, habrá una pqeueña parte de todas las alternativas posibles, de que ocurriese, en cualquier momento dado, que un número igual de hombres y mujeres hubiesen nacido.

Además, abunda en la idea de que es muy improbables que bajo los designios del azar que los resultados nunca lleguen a los extremos, es decir, que preponderen de forma masiva los F sobre los M o viceversa. Arbuthnot afirmaba que “la regularidad constante en los nacimientos de ambos sexos no puede ser cuestión del azar“. No podía estar más equivocado.

Si bien, es muy improbable que los resultados nunca lleguen a los extremos, a diferencia de Bernoulli, Arbuthnot fue incapaz de cuantificar cuán “muy improbable” era. Bernoulli, lo hizo y demostró que la regularidad permanente observada es, exactamente, lo que debiera esperarse si la probabilidad del nacimiento de un varón fuese de 18/35. La probabilidad de obtener un resultado extremo decrece a medida que crece “n”. Es sorprendente lo que afirmaba Arbuthnot a tal efecto:

Para juzgar la sabiduría del artificio, debemos observar que los accidentes externos a los que están sometidos los hombres (quienes deben buscar el alimento en situaciones peligrosas) hacen un gran estrago entre ellos y este lote excede el del otro sexo, ocasionado por las enfermedades incidentes sobre él, como la experiencia nos muestra. Para reparar esa pérdida, la naturaleza providente, por disposición de su sabio creador, genera más hombres que mujeres y ello en una proporción casi constante.”

Supongo que a estas alturas, vuestras mentes preclaras y renacentistas habrán chocado con esta idea de forma radical y una leve sonrisa os habrá iluminado la cara. Este pensamiento basado en la fe religiosa y la providencia queda desmontado con la empírica y el razonamiento científico (como no podía ser de otra forma).

Imaginemos que la posibilidad del nacimiento de un varón fuese exactamente de 1/2, entonces, ¿cuál sería la probabilidad de que, en cualquier año dado, naciesen más varones que mujeres? Pues casi exactamente 1/2 (no penséis en el chiste de que sí o que no).

Los registros de mortalidad londinense de la época registraron 82 años sucesivos con nacimientos de varones superior al de nacimientos femininos. La probabilidad de este suceso, bajo la hipótesis de posibilidades iguales, es de 1/2 a la 82, es decir, las posibilidades son de 1 entre 483.600.000.000.000.000.000.000. Y si considerasemos que el excedente de varones se encontrara dentro de límites bastantes estrechos y que además, supiéramos que  ocurrió durante años y años, y no solo en Londres, sino en todo el mundo, la probabilidad se acerca a una cantidad infinitesimalmente pequeña. Por lo tanto, la hipótesis de posibilidades iguales debe ser rechazada.

Esta fue denominada la primera prueba de significación de una hipótesis estadística que haya sido publicada, y el inicio de un sinfín de publicaciones relacionadas con la demostración empírica de leyes de todo tipo aplicadas directamente a los problemas y sucesos de la época.

Share on Facebook

Chiste sobre matemáticas

Teorema: todos los numeros enteros son interesantes.

Demostración:

1. Supongamos que no; por tanto, existe un mínimo numero entero no interesante.

2. Este numero es, obviamente interesante, lo cual contradice el hecho de que no es interesante.

3. Por reduccion al absurdo, la suposicion de que existen numeros no interesantes es FALSA.

;)

Share on Facebook