jueves, 27 de septiembre de 2012

Distribución en el Muestreo


REPUBLICA BOLIVARIANA DE VENEZUELA
MINISTERIO DEL PODER POPULAR PARA LA EDUCACION  SUPERIOR
PROGRAMA: SISTEMA E INFORMTICA
U.C: MATEMÁTICA APLICADA







Distribución en el Muestreo







Integrantes:                                                                            Lcdo. 
Chávez Martha                                                                            Nehomar Romero
Arteaga Dania
Berrio Yorlis
Baena Tania
Chávez Martha









Santa Bárbara de Zulia, septiembre de 2012




1.-Teoría de muestreo

Muestreo: Es un procedimiento por medio del cual se estudia una parte de la población llamada muestra, con el objetivo de inferir con respecto a toda la población.
Es importante relacionar el muestreo con lo que es el censo, el cual se define como la enumeración completa de todos los elementos de la población de interés.
Uno de los propósitos de la estadística inferencial es estimar las características poblacionales desconocidas, examinando la información obtenida de una muestra, de una población. El punto de interés es la muestra, la cual debe ser representativa de la población objeto de estudio.
Se seguirán ciertos procedimientos de selección para asegurar de que las muestras reflejen observaciones a la población de la que proceden, ya que solo se pueden hacer observaciones probabilísticas sobre una población cuando se usan muestras representativas de la misma.
Una población está formada por la totalidad de las observaciones en las cuales se tiene cierto observa.
Una muestra es un subconjunto de observaciones seleccionadas de una población.
Importancia
Es la actividad por la cual se toman ciertas muestras de una población de elementos de los cuales vamos a tomar ciertos criterios de decisión, el muestreo es importante porque a través de él podemos hacer análisis de situaciones de una empresa o de algún campo de la sociedad.
Terminología básica para el muestreo
Los nuevos términos, los cuales son frecuentemente usados en inferencia estadística son:
Estadístico: Un estadístico es una medida usada para describir alguna característica de una muestra , tal como una media aritmética, una mediana o una desviación estándar de una muestra.
Parámetro: Una parámetro es una medida usada para describir alguna característica de una población, tal como una media aritmética, una mediana o una desviación estándar de una población.
Cuando los dos nuevos términos de arriba son usados, por ejemplo, el proceso de estimación en inferencia estadística puede ser descrito como le proceso de estimar un parámetro a partir del estadístico correspondiente, tal como usar una media muestral (un estadístico para estimar la media de la población (un parámetro).

2.-Distribuciones Muéstrales Media aritmética
Las muestras aleatorias obtenidas de una población son, por naturaleza propia, impredecibles. No se esperaría que dos muestras aleatorias del mismo tamaño y tomadas de la misma población tenga la misma media muestral o que sean completamente parecidas; puede esperarse que cualquier estadístico, como la media muestral, calculado a partir de las medias en una muestra aleatoria, cambie su valor de una muestra a otra, por ello, se quiere estudiar la distribución de todos los valores posibles de un estadístico.
Tales distribuciones serán muy importantes en el estudio de la estadística inferencial, porque las inferencias sobre las poblaciones se harán usando estadísticas muéstrales.
Como el análisis de las distribuciones asociadas con los estadísticos muéstrales, podremos juzgar la confiabilidad de un estadístico muestral como un instrumento para hacer inferencias sobre un parámetro poblacional desconocido.
Como los valores de un estadístico, tal como x, varían de una muestra aleatoria a otra, se le puede considerar como una variable aleatoria con su correspondiente distribución de frecuencias.
La distribución de frecuencia de un estadístico muestral se denomina distribución muestral. En general, la distribución muestral de un estadísticos la de todos sus valores posibles calculados a partir de muestras del mismo tamaño.
Suponga que se han seleccionado muestras aleatorias de tamaño 20 en una población grande. Se calcula la media muestral x para cada muestra; la colección de todas estas medias muéstrales recibe el nombre de distribución muestral de medias, lo que se puede ilustrar en la siguiente figura:
Suponga que se eligen muestras aleatorias de tamaño 20, de una población grande, y se calcula la desviación estándar de cada una. La colección de todas estas desviaciones estándar muéstrales se llama distribución muestral de la desviación estándar, y lo podemos ver en la siguiente figura: 






Ejemplo 1
Se eligen muestras ordenadas de tamaño 2, con reemplazo, de la población de valores 0, 2, 4 y 6. Encuentre:
image1171, la media poblacional.
image1172, la desviación estándar poblacional.
image1171X, la media de la distribución muestral de medias.
image1172X, la desviación estándar de la distribución muestral de medias.
Además, grafique las frecuencias para la población y para la distribución muestral de medias.

En matemáticas y estadística, la media aritmética (también llamada promedio o simplemente media) de un conjunto finito de números es el valor característico de una serie de datos cuantitativos objeto de estudio que parte del principio de la esperanza matemática o valor esperado, se obtiene a partir de la suma de todos sus valores dividida entre el número de sumandos.
Cuando el conjunto es una muestra aleatoria recibe el nombre de media muestral siendo uno de los principales estadísticos muéstrales.
Expresada de forma más intuitiva, podemos decir que la media (aritmética) es la cantidad total de la variable distribuida a partes iguales entre cada observación.
Por ejemplo, si en una habitación hay tres personas, la media de dinero que tienen en sus bolsillos sería el resultado de tomar todo el dinero de los tres y dividirlo a partes iguales entre cada uno de ellos. Es decir, la media es una forma de resumir la información de una distribución (dinero en el bolsillo) suponiendo que cada observación (persona) tuviera la misma cantidad de la variable.
También la media aritmética puede ser denominada como centro de gravedad de una distribución, el cual no está necesariamente en la mitad.
Una de las limitaciones de la media aritmética es que se trata de una medida muy sensible a los valores extremos; valores muy grandes tienden a aumentarla mientras que valores muy pequeños tienden a reducirla, lo que implica que puede dejar de ser representativa de la población.
La distribución de la probabilidad de [pic]   se llama distribución muestral de la media   y depende del tamaño de la población, el tamaño de las muestras y el método de elección de las muestras.

Se deben ver las distribuciones muéstrales de la media y la varianza con el mecanismo a partir del cual se harán finalmente inferencias de los parámetros de μ y σ. La distribución muestral de [pic] con tamaño muestral n es la distribución que resulta cuando un experimento se lleva a cabo una y otra.

Entonces esta distribución describe la variabilidad de los promedios muéstrales alrededor de la media de la población μ y también de la varianza de la muestra σ2 alrededor de la varianza de la población s2 en experimentos que se repiten.

3.-Distribución muestral Media aritmética con dos muestra

A partir de las muestras seleccionadas de una población pueden construirse variables aleatorias alternativas, de cuyo análisis se desprenden interesantes propiedades estadísticas.
Las dos formas más comunes de estas variables corresponden a las distribuciones muéstrales de las medias y de las proporciones.

Ø  Distribución muestral de las medias

Dada una población constituida por un número n de elementos, cuya mediaaritméticaes y donde la desviación típica viene dada , pueden formarse n2 muestras con reemplazamiento distintas, formadas por dos elementos de la población.
Para cada una de estas muestras es posible una media muestral, que denotaremos con el símboloimage_gallery?uuid=b3df9bac-3083-425d-bcfb-6a00893e140a&groupId=10137&t=1263991273312. Un ejemplo de la tabla de muestras de tamaño 2, tomada de la población {1, 3, 5}, con sus medias aritméticas reflejadas, sería:


A partir de la variable estadística original x de la población se puede construir una nueva variable estadísticaimage_gallery?uuid=1d635799-887f-4dbd-8e47-aa91ad4e958d&groupId=10137&t=1263991273484, que tendría como valores las medias de las muestras tomadas de la población.
 La media aritmética de esta distribución muestral de las medias se denota porimage_gallery?uuid=553855fd-fa7b-49c3-87d9-51e1086858b7&groupId=10137&t=1263991273484, y su desviación típica porimage_gallery?uuid=7214d87a-22fa-4e61-8c47-348fdb5d92b3&groupId=10137&t=1263991273500.
Parámetros de la distribución muestral de las medias de tamaño 2
Establecida una distribución muestral de las medias de tamaño 2, su esperanza matemática adopta el valor siguiente:
image_gallery?uuid=8d6c4180-e49b-4046-b257-45e22be8ea0d&groupId=10137&t=1260845747890
Siendo la media aritmética de la población, image_gallery?uuid=b3df9bac-3083-425d-bcfb-6a00893e140a&groupId=10137&t=1263991273312la media aritmética de cada muestra, image_gallery?uuid=58030850-375b-4804-8a23-3d9a60675786&groupId=10137&t=1263991273687la media aritmética de todas las medias, E [x] la esperanza matemática de la variable aleatoria x (para la población) y E [ image_gallery?uuid=1d635799-887f-4dbd-8e47-aa91ad4e958d&groupId=10137&t=1263991273484] la esperanza matemática de la variable aleatoria image_gallery?uuid=1d635799-887f-4dbd-8e47-aa91ad4e958d&groupId=10137&t=1263991273484(para la distribución muestral de las medias).
Por su parte, los valores de la varianza y la desviación típica de esta distribución muestral de tamaño 2 son:
image_gallery?uuid=5cf41f06-fd4e-442d-9e0f-3540f09fa90a&groupId=10137&t=1260845747890
Donde es la desviación típica de la población, image_gallery?uuid=d5a7d68a-225c-4b13-b0c6-9d7d4ea6e6d5&groupId=10137&t=1263991273843la desviación típica de la distribución muestral, V [x] la varianza de la variable x (población) y V [image_gallery?uuid=1d635799-887f-4dbd-8e47-aa91ad4e958d&groupId=10137&t=1263991273484] la varianza de la variable image_gallery?uuid=1d635799-887f-4dbd-8e47-aa91ad4e958d&groupId=10137&t=1263991273484(distribución muestral de las medias).

Distribución muestral de las medias de tamaño n
En una distribución muestral de las medias, la variable aleatoria mediamuestralsigue una ley normal descrita como N (,/n).
image_gallery?uuid=71010838-7ced-46fc-9ab6-62ac53a68ff4&groupId=10137&t=1260845747890
Parámetros estadísticos de una distribución muestral de las medias de tamaño n:
Ø  Distribución muestral de las proporciones
Sea una población formada por n elementos, de los cuales algunos poseen una determinada característica y otros no (llamaremos p a la proporción de los elementos que poseen la característica, y q = 1 - p a la de los restantes elementos). Entonces, es posible extraer muestras de la población de manera que a cada una se asocie como valor la proporción de la característica analizada.
Por ejemplo, en la población {1, 2, 3}, la característica par tiene un valor p = 1 / 3, mientras que la impar es q = 2 / 3. Mediante la tabla siguiente de muestras se construye una nueva distribución muestral de las proporciones.

Muestra
1,1
1,2
1,3
2,1
2,2
2,3
3,1
3,2
3,3
Proporción f/n
0
0,5
0
0,5
0
0,5
0
0,5
0


Parámetros estadísticos de una distribución muestral de las proporciones de tamaño n:
image_gallery?uuid=3f2ecaec-b29e-4f60-a66e-e62681996f20&groupId=10137&t=1260845747890
Una distribución muestral de las proporciones se comporta como una distribución normal descrita por los parámetros Nimage_gallery?uuid=0bf05561-14e0-4219-8217-42853f744b23&groupId=10137&t=1263991273953.
Distribución x2

 Un poco de historia
          La prueba t-Student fue desarrollada en 1899 por el químico inglés William Sealey Gasset (1876-1937), mientras trabajaba en técnicas de control de calidad para las destilerías Guiness en Dublín. Debido a que en la destilería, su puesto de trabajo no era inicialmente de estadístico y su dedicación debía estar exclusivamente encaminada a mejorar los costes de producción, publicó sus hallazgos anónimamente firmando sus artículos con el nombre de "Student".
La distribución t de Student es la distribución de probabilidad del cociente:
Dónde:
Z tiene una distribución normal de media nula y varianza 1
V tiene una distribución chi-cuadrado con ν grados de libertad
Z y V son independientes.
          Si μ es una constante no nula, el cociente  es una variable aleatoria que sigue la distribución t de Student no central con parámetro de no-centralidad μ.


4.-Distribución t de Student
En probabilidad y estadística, la distribución t (de Student) es unadistribución que surge del problema desestimar la mediade unapoblación normalmente cuando el tamaño de la muestra es pequeño.
Aparece de manera natural al realizar la prueba t de Student para la determinación de las diferencias entre dos medias muéstrales y para la construcción del confianza para la diferencia entre las medias de dos poblaciones cuando se desconoce la desviación típica de una población y ésta debe ser estimada a partir de los datos de una muestra.
Existen dos versiones de la prueba t-Student: una que supone que las varianzas poblacionales son iguales y otra versión que no asume esto último. Para decidir si se puede suponer o no la igualdad de varianza en las dos poblaciones, se debe realizar previamente la prueba F-Snedecor de comparación de dos varianzas.
5.-Distribuciónvariable FISHER
Una variable F se define como el cociente entre dos variables ji-cuadrado divididas por sus correspondientes grados de libertad.
Considerando dos muestras aleatorias independientes, de tamaño n1 y n2, extraídas de una población normal, el estadístico F será.
La necesidad de disponer de métodos estadísticos para comparar las varianzas de dos poblaciones es evidente a partir del análisis de una sola población. Frecuentemente se desea comparar la precisión de un instrumento de medición con la de otro, la estabilidad de un proceso de manufactura con la de otro o hasta la forma en que varía el procedimiento para calificar de un profesor universitario con la de otro.
Intuitivamente, podríamos comparar las varianzas de dos poblaciones, y, utilizando la razón de las varianzas muéstrales s21/s22. Si s21/s22 es casi igual a 1, se tendrá poca evidencia para indicar que y no son iguales.
Por otra parte, un valor muy grande o muy pequeño para s21/s22, proporcionará evidencia de una diferencia en las varianzas de las poblaciones.

La variable aleatoria F se define como el cociente de dos variables aleatorias ji-cuadrada independiente, cada una dividida entre sus respectivos grados de libertad. Esto es,
http://www.itch.edu.mx/academic/industrial/estadistica1/img/image969.gif
Donde U y V son variables aleatorias ji-cuadrada independientes con grados de libertad 1 y 2 respectivamente.



Sean U y V dos variables aleatorias independientes que tienen distribución ji cuadradas con grados de libertad, respectivamente. Entonces la distribución de la variable aleatoria está dada por:

Y se dice que sigue la distribución F con grados de libertad en el numerador y grados de libertad en el denominador.
La variable aleatoria F es no negativa, y la distribución tiene un sesgo hacia la derecha. La distribución F tiene una apariencia muy similar a la distribución ji-cuadrada; sin embargo, se encuentra centrada respecto a 1, y los dos parámetros proporcionan una flexibilidad adicional con respecto a la forma de la distribución.

6.- Distribución X2/CH1/U2
En estadística, la distribución χ² (de Pearson) es una distribución de probabilidad continua con un parámetro k que representa los grados de libertad de la variable aleatoria:

DondeZi son variables de distribución normal, de media cero y varianza uno. El que la variable aleatoria X tenga esta distribución se representa habitualmente así.
Es conveniente tener en cuenta que la letra griega χ se transcribe al latín como chi1 y se pronuncia en castellano como ji.2 3
La distribución χ² tiene muchas aplicaciones en inferencia estadística, por ejemplo en la denominada prueba χ² utilizada como prueba de independencia y como prueba de bondad de ajuste y en la estimación de varianzas. También está involucrada en el problema de estimar la media de una población normalmente distribuida y en el problema de estimar la pendiente de una recta de regresión lineal, a través de su papel en la distribución t de Student, y participa en todos los problemas de análisis de varianza, por su papel en la distribución F de Snedecor, que es la distribución del cociente de dos variables aleatorias independientes con distribución χ².

Distribución chi cuadrada
Una variable Chi cuadrado se define como la suma de n variables normales estandarizadas elevadas al cuadrado, con un parámetro v que representa los grados de libertad de la variable aleatoria
X=Z12+…+Zv2
Donde Zi son variables de distribución normal, de media cero y varianza uno. El que la variable aleatoria X tenga esta distribución se representa habitualmente así: X~Xv2
Es conveniente tener en cuenta que la letra griega χ se transcribe al latín como chi [] y se pronuncia en castellano como ji.[][]
La distribución χ² tiene muchas aplicaciones en inferencia estadística, por ejemplo en la denominada prueba χ² utilizada como prueba de independencia y como prueba de bondad de ajuste y en la estimación de varianzas. También está involucrada en el problema de estimar la media de una población normalmente distribuida y en el problema de estimar la pendiente de una recta de regresión lineal, a través de su papel en la distribución t de Student, y participa en todos los problemas de análisis de varianza, por su papel en la distribución F de Snedecor, que es la distribución del cociente de dos variables aleatorias independientes con distribución χ².
Propiedades La variable continua X tiene una distribución chi cuadrada, con v grados de libertad, si su función de densidad está dada por:

Fx; v=12v2Γ (v2) xv2-1e-x2,   x>0,0,                 en cualquier otro caso


Donde v es un entero positivo y Γ es la función gamma

La media y varianza de la distribución chi cuadrada son:
μ=v     y       σ2=2v
Y la varianza muestral es
            s2=i=1n (Xi-X) 2n-1

Si S2 es la varianza de una muestra aleatoria de tamaño n que se toma de una población normal que tiene la varianza σ2, entonces el estadístico
X2=(n-1) S2σ2=i=1n (Xi-X) 2σ2
Tiene una distribución chi cuadrada con v= n-1 grados de libertad.
Los valores de a variable aleatoria X2 se calcula de cada muestra mediante la formula
X2=(n-1) s2σ2




                                                        




 





                  
Bibliografía
Autor:
Ing. Agr. M. Sc. Marco Tulio Aceituno Juárez