REPUBLICA BOLIVARIANA DE VENEZUELA
MINISTERIO DEL PODER POPULAR PARA LA
EDUCACION SUPERIOR
PROGRAMA: SISTEMA E INFORMTICA
U.C:
MATEMÁTICA APLICADA
Distribución en el Muestreo
Integrantes: Lcdo.
Chávez Martha Nehomar Romero
Chávez Martha Nehomar Romero
Arteaga Dania
Berrio Yorlis
Baena Tania
Chávez Martha
Santa Bárbara de Zulia, septiembre de
2012
1.-Teoría de muestreo
Muestreo:
Es un
procedimiento por medio del cual se estudia una parte de la población llamada
muestra, con el objetivo de inferir con respecto a toda la población.
Es importante relacionar el muestreo con lo que es el
censo, el cual se define como la enumeración completa de todos los elementos de
la población de interés.
Uno
de los propósitos de la estadística inferencial es estimar las características
poblacionales desconocidas, examinando la información obtenida de una muestra,
de una población. El punto de interés es la muestra, la cual debe ser
representativa de la población objeto de estudio.
Se
seguirán ciertos procedimientos de selección para asegurar de que las muestras
reflejen observaciones a la población de la que proceden, ya que solo se pueden
hacer observaciones probabilísticas sobre una población cuando se usan muestras
representativas de la misma.
Una
población está formada por la totalidad de las observaciones en
las cuales se tiene cierto observa.
Una
muestra es un subconjunto de observaciones seleccionadas de una
población.
Importancia
Es la actividad por la cual
se toman ciertas muestras de una población de elementos de los cuales vamos a
tomar ciertos criterios de decisión, el muestreo es importante porque a través
de él podemos hacer análisis de situaciones de una empresa o de algún campo de
la sociedad.
Terminología
básica para el muestreo
Los nuevos términos, los cuales son frecuentemente
usados en inferencia estadística son:
Estadístico:
Un
estadístico es una medida usada para describir alguna característica de una
muestra , tal como una media aritmética, una mediana o una desviación estándar
de una muestra.
Parámetro: Una
parámetro es una medida usada para describir alguna característica de una
población, tal como una media aritmética, una mediana o una desviación estándar
de una población.
Cuando los dos nuevos términos de arriba son usados,
por ejemplo, el proceso de estimación en inferencia estadística puede ser
descrito como le proceso de estimar un parámetro a partir del estadístico
correspondiente, tal como usar una media muestral (un estadístico para estimar
la media de la población (un parámetro).
2.-Distribuciones
Muéstrales Media aritmética
Las muestras
aleatorias obtenidas de una población son, por naturaleza propia,
impredecibles. No se esperaría que dos muestras aleatorias del mismo tamaño y
tomadas de la misma población tenga la misma media muestral o que sean
completamente parecidas; puede esperarse que cualquier estadístico, como la
media muestral, calculado a partir de las medias en una muestra aleatoria,
cambie su valor de una muestra a otra, por ello, se quiere estudiar la
distribución de todos los valores posibles de un estadístico.
Tales
distribuciones serán muy importantes en el estudio de la estadística
inferencial, porque las inferencias sobre las poblaciones se harán usando
estadísticas muéstrales.
Como el
análisis de las distribuciones asociadas con los estadísticos muéstrales,
podremos juzgar la confiabilidad de un estadístico muestral como un instrumento
para hacer inferencias sobre un parámetro poblacional desconocido.
Como los
valores de un estadístico, tal como x, varían de una muestra aleatoria a otra,
se le puede considerar como una variable aleatoria con su
correspondiente distribución de frecuencias.
La
distribución de frecuencia de un estadístico muestral se denomina distribución muestral. En general,
la distribución muestral de un estadísticos
la de todos sus valores posibles calculados a partir de muestras del mismo
tamaño.
Suponga que se
han seleccionado muestras aleatorias de tamaño 20 en una población grande. Se
calcula la media muestral x para cada muestra; la colección de todas estas
medias muéstrales recibe el nombre de distribución
muestral de medias, lo que se puede ilustrar en la siguiente
figura:
Suponga que se eligen muestras
aleatorias de tamaño 20, de una población grande, y se calcula la desviación
estándar de cada una. La colección de todas estas desviaciones estándar muéstrales
se llama distribución muestral de la
desviación estándar, y lo podemos ver en la siguiente figura:
Se eligen
muestras ordenadas de tamaño 2, con reemplazo, de la población de valores 0, 2,
4 y 6. Encuentre:
, la media poblacional.
, la desviación estándar poblacional.
X, la media de la distribución muestral
de medias.
X, la desviación estándar de la distribución muestral de
medias.
Además, grafique las frecuencias para
la población y para la distribución muestral de medias.
En matemáticas
y estadística, la
media aritmética (también
llamada promedio o simplemente media) de un conjunto finito de
números es el valor característico de una serie de datos cuantitativos objeto
de estudio que parte del principio de la esperanza matemática o valor esperado,
se obtiene a partir de la suma de todos sus valores dividida entre el número de
sumandos.
Cuando el conjunto es una muestra aleatoria
recibe el nombre de media muestral
siendo uno de los principales estadísticos muéstrales.
Expresada de
forma más intuitiva, podemos decir que la media (aritmética) es la cantidad
total de la variable distribuida a partes iguales entre cada observación.
Por ejemplo, si en una habitación hay tres
personas, la media de dinero que tienen en sus bolsillos sería el resultado de
tomar todo el dinero de los tres y dividirlo a partes iguales entre cada uno de
ellos. Es decir, la media es una forma de resumir la información de una
distribución (dinero en el bolsillo) suponiendo que cada observación (persona)
tuviera la misma cantidad de la variable.
También la
media aritmética puede ser denominada como centro de
gravedad de una distribución,
el cual no está
necesariamente en la mitad.
Una de las limitaciones de la media
aritmética es que se trata de una medida muy sensible a los valores extremos;
valores muy grandes tienden a aumentarla mientras que valores muy pequeños
tienden a reducirla, lo que implica que puede dejar de ser representativa de la
población.
La distribución de la probabilidad de
[pic] se llama distribución muestral de la media y depende del
tamaño de la población, el tamaño de las muestras y el método de elección de
las muestras.
Se deben ver
las distribuciones muéstrales de la media y la varianza con el mecanismo a
partir del cual se harán finalmente inferencias de los parámetros de μ y σ. La
distribución muestral de [pic] con tamaño muestral n es la distribución que
resulta cuando un experimento se lleva a cabo una y otra.
Entonces esta distribución describe la
variabilidad de los promedios muéstrales alrededor de la media de la población
μ y también de la varianza de la muestra σ2 alrededor de la varianza de la
población s2 en experimentos que se repiten.
3.-Distribución muestral Media aritmética con dos muestra
A partir de las muestras
seleccionadas de una población pueden construirse variables aleatorias
alternativas, de cuyo análisis se desprenden interesantes propiedades
estadísticas.
Las dos formas más comunes
de estas variables corresponden a las distribuciones muéstrales de las medias y
de las proporciones.
Ø Distribución
muestral de las medias
Dada una población constituida por un
número n de elementos, cuya mediaaritméticaes
y donde la desviación
típica viene dada ,
pueden formarse n2 muestras con reemplazamiento distintas, formadas
por dos elementos de la población.
Para cada una
de estas muestras es posible una media
muestral, que
denotaremos con el símbolo. Un ejemplo de la tabla de
muestras de tamaño 2, tomada de la población {1, 3, 5}, con sus medias
aritméticas reflejadas, sería:
A partir de la variable estadística original x de la
población se puede construir una nueva variable estadística, que tendría como valores las
medias de las muestras tomadas de la población.
La media
aritmética de esta distribución
muestral de las medias se denota por, y su desviación típica por.
Parámetros de la distribución muestral de las medias
de tamaño 2
Establecida una distribución muestral de las medias de
tamaño 2, su esperanza matemática
adopta el valor siguiente:
Siendo la media aritmética de la población, la media aritmética de cada
muestra, la media aritmética de todas las
medias, E [x] la esperanza matemática de la variable aleatoria x (para la
población) y E [ ] la esperanza matemática de la
variable aleatoria (para la distribución muestral de
las medias).
Por su parte, los valores de la varianza y la
desviación típica de esta distribución muestral de tamaño 2 son:
Donde es la desviación típica de la población, la desviación típica de la
distribución muestral, V [x] la varianza de la variable x (población) y V [] la varianza de la variable (distribución muestral de las
medias).
Distribución muestral de las medias de tamaño n
En una distribución muestral de las medias, la variable aleatoria mediamuestralsigue
una ley normal descrita como N (,/n).
Parámetros estadísticos de una distribución muestral
de las medias de tamaño n:
Ø
Distribución muestral de las proporciones
Sea una población formada por n elementos, de los
cuales algunos poseen una determinada característica y otros no (llamaremos p a
la proporción de los elementos que poseen la característica, y q = 1 - p a la
de los restantes elementos). Entonces, es posible extraer muestras de la
población de manera que a cada una se asocie como valor la proporción de la
característica analizada.
Por ejemplo, en la
población {1, 2, 3}, la característica par tiene un valor p = 1 / 3, mientras
que la impar es q = 2 / 3. Mediante la tabla siguiente de muestras se construye
una nueva distribución muestral de las
proporciones.
Muestra
|
1,1
|
1,2
|
1,3
|
2,1
|
2,2
|
2,3
|
3,1
|
3,2
|
3,3
|
Proporción f/n
|
0
|
0,5
|
0
|
0,5
|
0
|
0,5
|
0
|
0,5
|
0
|
Parámetros estadísticos de una distribución muestral
de las proporciones de tamaño n:
Una distribución muestral de las proporciones se
comporta como una distribución normal descrita por los parámetros N.
Distribución
x2
Un poco de historia
La prueba
t-Student fue desarrollada en 1899 por el químico inglés William Sealey Gasset
(1876-1937), mientras trabajaba en técnicas de control de calidad para las
destilerías Guiness en Dublín. Debido a que en la destilería, su puesto de
trabajo no era inicialmente de estadístico y su dedicación debía estar
exclusivamente encaminada a mejorar los costes de producción, publicó sus
hallazgos anónimamente firmando sus artículos con el nombre de
"Student".
La distribución t de Student es la distribución de
probabilidad del cociente:
Dónde:
Z tiene una distribución normal de media nula y
varianza 1
V tiene una distribución chi-cuadrado con ν grados de
libertad
Z y V son independientes.
Si μ es
una constante no nula, el cociente es
una variable aleatoria que sigue la distribución t de Student no central con
parámetro de no-centralidad μ.
4.-Distribución
t de Student
En
probabilidad y estadística, la distribución t (de Student)
es unadistribución que surge del problema desestimar la mediade unapoblación normalmente cuando el tamaño de la
muestra es pequeño.
Aparece de
manera natural al realizar la prueba t de
Student para la
determinación de las diferencias entre dos medias muéstrales y para la
construcción del confianza para
la diferencia entre las medias de dos poblaciones cuando se desconoce la desviación típica de una población y ésta debe ser
estimada a partir de los datos de una muestra.
Existen dos versiones de la
prueba t-Student: una que supone que las varianzas poblacionales son iguales y
otra versión que no asume esto último. Para decidir si se puede suponer o no la
igualdad de varianza en las dos poblaciones, se debe realizar previamente la
prueba F-Snedecor de comparación de dos varianzas.
5.-Distribuciónvariable
FISHER
Una variable F se define como
el cociente entre dos variables ji-cuadrado divididas por sus correspondientes
grados de libertad.
Considerando dos muestras
aleatorias independientes, de tamaño n1 y n2, extraídas de una población
normal, el estadístico F será.
La necesidad de disponer de
métodos estadísticos para comparar las varianzas de dos poblaciones es evidente
a partir del análisis de una sola población. Frecuentemente se desea comparar
la precisión de un instrumento de medición con la de otro, la estabilidad de un
proceso de manufactura con la de otro o hasta la forma en que varía el
procedimiento para calificar de un profesor universitario con la de otro.
Intuitivamente, podríamos
comparar las varianzas de dos poblaciones, y, utilizando la razón de las
varianzas muéstrales s21/s22. Si s21/s22 es casi igual a 1, se tendrá poca
evidencia para indicar que y no son iguales.
Por otra parte, un valor muy
grande o muy pequeño para s21/s22, proporcionará evidencia de una diferencia en
las varianzas de las poblaciones.
La variable aleatoria F se
define como el cociente de dos variables aleatorias ji-cuadrada independiente,
cada una dividida entre sus respectivos grados de libertad. Esto es,
Donde U y V son variables
aleatorias ji-cuadrada independientes con grados de libertad 1 y 2
respectivamente.
Sean U y V dos variables
aleatorias independientes que tienen distribución ji cuadradas con grados de
libertad, respectivamente. Entonces la distribución de la variable aleatoria
está dada por:
Y se dice que sigue la
distribución F con grados de libertad en el numerador y grados de libertad en
el denominador.
La variable aleatoria F es
no negativa, y la distribución tiene un sesgo hacia la derecha. La distribución
F tiene una apariencia muy similar a la distribución ji-cuadrada; sin embargo,
se encuentra centrada respecto a 1, y los dos parámetros proporcionan una
flexibilidad adicional con respecto a la forma de la distribución.
6.-
Distribución X2/CH1/U2
En estadística, la
distribución χ² (de Pearson) es una distribución de probabilidad continua con
un parámetro k que representa los grados de libertad de la variable aleatoria:
DondeZi son variables de
distribución normal, de media cero y varianza uno. El que la variable aleatoria
X tenga esta distribución se representa habitualmente así.
Es conveniente tener en
cuenta que la letra griega χ se transcribe al latín como chi1 y se pronuncia en
castellano como ji.2 3
La distribución χ² tiene
muchas aplicaciones en inferencia estadística, por ejemplo en la denominada
prueba χ² utilizada como prueba de independencia y como prueba de bondad de
ajuste y en la estimación de varianzas. También está involucrada en el problema
de estimar la media de una población normalmente distribuida y en el problema
de estimar la pendiente de una recta de regresión lineal, a través de su papel
en la distribución t de Student, y participa en todos los problemas de análisis
de varianza, por su papel en la distribución F de Snedecor, que es la
distribución del cociente de dos variables aleatorias independientes con
distribución χ².
Distribución
chi cuadrada
Una variable Chi cuadrado se
define como la suma de n variables normales estandarizadas elevadas al
cuadrado, con un parámetro v que representa los grados de libertad de la
variable aleatoria
X=Z12+…+Zv2
Donde Zi son variables de
distribución normal, de media cero y varianza uno. El que la variable aleatoria
X tenga esta distribución se representa habitualmente así: X~Xv2
Es conveniente tener en cuenta que la letra
griega χ se transcribe al latín como chi [] y se pronuncia en castellano como
ji.[][]
La distribución χ² tiene
muchas aplicaciones en inferencia estadística, por ejemplo en la denominada
prueba χ² utilizada como prueba de independencia y como prueba de bondad de ajuste
y en la estimación de varianzas. También está involucrada en el problema de
estimar la media de una población normalmente distribuida y en el problema de
estimar la pendiente de una recta de regresión lineal, a través de su papel en
la distribución t de Student, y participa en todos los problemas de análisis de
varianza, por su papel en la distribución F de Snedecor, que es la distribución
del cociente de dos variables aleatorias independientes con distribución χ².
Propiedades La variable continua X tiene una
distribución chi cuadrada, con v grados de libertad, si su función de densidad
está dada por:
Donde v es un entero
positivo y Γ es la función gamma
La media y varianza de la
distribución chi cuadrada son:
μ=v y
σ2=2v
Y la varianza muestral es
s2=i=1n
(Xi-X) 2n-1
Si S2 es la varianza de una
muestra aleatoria de tamaño n que se toma de una población normal que tiene la
varianza σ2, entonces el estadístico
X2=(n-1) S2σ2=i=1n (Xi-X) 2σ2
Tiene una distribución chi cuadrada con v=
n-1 grados de libertad.
Los valores de a variable
aleatoria X2 se calcula de cada muestra mediante la formula
X2=(n-1) s2σ2
Bibliografía
www.seh-lelha.org/stat1.htm
http://es.wikipedia.org/wiki/Distribución_t_de_Student
http://virtual.uptc.edu.co/ova/estadistica/docs/libros/tstudent.pdf
Autor:
Ing.
Agr. M. Sc. Marco Tulio Aceituno Juárez