Equipo+No.6+Resumen+U.8


 * UNIVERSIDAD AUTONOMA DE QUÉRETAROCAPITULO 8. Distribuciones de muetreo fundamentales y descripciones de datos **

8.1 MUESTREO ALEATORIO Son los posibles resultados de todo expermento estadistico. El resultado de un experimento se puede registrar como un valor numerico o como una representacion descriptiva. Por ejemplo: los resulados de lanzar una dado, son numericos, pero si la variable es el tipo de sangre de un grupo de personas, el muesteo sera descriptivo. Pues puee ser AB, A, B, u O, y con signo positivo o negativo. Poblaciones y Muestras En el contexto de variables aleatorias se le denomina Poblacion a la totalidad de observaciones que nos interesan, de número finito o infinito. Y puede referirse a observaciones respecto de cualquier cuestion de interes, ya sea grupos de personas animales o todos los resultados posibles de algun sistema biologico o de ingenieria complicados. El número de observaciones en la poblacion se define como el tamaño de la poblacion y puede ser finito o infinito. Cada observacion en la poblacion es un valor de la variable aleatoria X que tiene alguna distribucion de la rpobabilidad //f(x)// que se define por:

Donde 0 indica un éxito y 1 un fracaso. Sin embargo hay poblaciones que no se pueden medir todas completas. Por lo tanto debemos depender de un subconjunto de observaciones de la poblacion para ayudrnos a realizar inferencias con respecto a la misma poblacion. Esto nos lleva a considerar la nocion del muestreo. Muestra es un subconjunto de la poblacion. Para que las inferencias sean validas se debe tomar una muestra representativa de la poblacion y no se debe de elegir una muestra donde se escojan a los mimbros pues podria dar resultados erroneos. Cualquier procedimiento de muestreo que produzca inferencias que sobreestimen, o subestimen de forma consistente alguna caracteristica de la poblacion se dice que esta sesgado. Para eliminar esto se debe elegir una muestra aleatoria de forma independiente y al azar. El concepto de muestra aleatoria se describe de manera formal en la siguiente deficion: Sean varibles aleatorias independientes //n//, cada una con la misma distribucion de probabilidad //f(x)//. Definimos como una muestra aleatoriade tamaño //n// de la poblacion //f(x)// y escribimos su distribucion de probabilidad conjunta como

8.2 Algunos estadisticos importates Existe un valor p que representa a la poblacion, sin embargo muchas veces resulta muy difícil aplicar algun estudio a toda la poblacion, es por ello que se selecciona una muestra que se encuentra en funcion de p verdadera. A cualquier funcion de las variables aleatorias que forman una muestra aleatoria se llama estadistico. Tendencia Central en la muestra Los estadisticos que, por o general, se utilizan mas para medir el centro de un cnjunto de datos, acomodados en orde de magnitud, son la media, la mediana y la moda. Si representan una muestra aleatoria de tamaño //n//, entonces la media de la muestra se define mediante el estadistico

Observe que el dato estadistico toma el valor de cuando toma el valor de etc. El la practica al valor de un estadistico, se le da el mismo nombre del estadistico. Por ejemplo, el término //media de la muestra// se aplica tanto al estadistico como a su valor calculado. Varianza de la Muestra La variabilidad en la muestra deberia indicar como se dispersan las observaciones a partir del promedio. Es posible tener dos conjuntos de observaciones co las mismas media o mediana, y que difieran de una manera considerable en la varibilidad de sus mediciones alrededor del promedio. Para elegir entre dos muestras que presente estas mismas caracteristicas, es recomendable que se observe la varibilidad y esta como se comporta ante la media. Si representan una muestra aleatoria de tamaño //n// entonces la varianza de la muestra se define con el estadistico

El valor calculado de para una muestra dada se denota como. Teorema Si es la varianza de una muestra aleatoria de tamaño //n//, podemos escribir

Por definicion,

Al reemplazar terminos semejantes obtenemos la formula de calculo mas util del teorema. La desviacion estandar de la muestra, se denota con S, es la raiz cuadrada positiva de la varianza de la muestra. 8.3 Presentacion de datos y metodos graficos La informacion grafica con respecto a la validez de esta supociocion se puede obtener de presentaciones como los diagraamas de tallo y hojas y los histogramas de frecuencias; con el objetivo principal de que las graficas den una verificaciones diagnostica ssobre la suposicion de que los datos vienen de una distribucion normal. Grafica de caja y extensión Esta grafica encienrra el rango intercuartil de los datos en una caja que tiene la mediana representada dentro. El rango intercuartil tiene como extremos el percentil 75 (cuartil superior) y el percentil 25 (cuartil inferior). La grafica de caja puede ofrecer al observador informacion con respecto a cuales observaciones son valores extremos, los cuales son observaciones que se consideran inusualmente alejadas de la masa de los datos. La informacion visual en las graficas de caja y extension y de caja no intenta ser una prueba formal de valores extremos. Más bien, se ve como una herramienta de diagnostico. Un procedimiento comun consiste en utilizar un multiplo del rango intercuartil. Por ejemplo, si la distancia desde la caja exede 1.5 veces el rango intercualtil la observacionse puede considerar un valor extremo. Las graficas de datos pueden sugerir relaciones entre variables. Las graficas ayudan en la detección de anomalías o de observaciones de valores extremos en las muestras. Grafica de cuantiles Se pueden utilizar las ideas basicas de la grafica de cuantiles para //comparar muestras de datos//, donde el objetivo el analista es encontrar diferencias. Y su objetivo consiste en describir, en forma de muestra, a funcion de la distribucion acumulada. Un cuantil de una muestra, //q(f)//, es una valor para el que una fracción específica //f// de los valores de los datos es menor o igual a //q(f).// Una grafica de cuantiles simplemente //grafica los valores de los datos en el eje vertical contra una evaluación empírica de la fracción de observaciones excedidas por los valores de los datos.// Para propositos teoricos esta fraccion se calcula con, donde //i// es el orden de las observaciones cuando se clasifican de inferior a superior. A diferencia de la gráfica de caja, la gráfica de cualtiles realmente muestra todas las observaciones. Grafica de Cuantiles-cuantiles normales La metodologia incluye una gráfica de los cantiles empiricos recien presentados contra el cuantil correspondiente de la distribucion normal. Entonces, la expresion para un cuantil de una variable aleatoria N(µ,σ) es muy complicada. Sin embargo, una buena aproximacion esta dada por

Grafica de probabilidad normal En este tipo de graficas el eje vertical contiene //f// graficada en una ppel especial y la escala utilizada da como resultado una linea recta, cuand se grafica contra los valores de los datos ordenados. 8.4 Distribuciones Muestrales El campo de la inferencia estadistica trata basicamente con generalizaciones y preddiones Inferencias sobre la poblacion a partir de informacion de la muestra Calculamos un estadistico a partir de una muestra que se selecciona de la poblacion, y con base en tales estadisticos hacemos varias afirmaciones con respecto a los valores de los parametros de la poblacion, que pueden ser ciertas o no. Como un estadistico es una varible aleatoria que depende solo de la muestra observada, debe tener una distribucion de probabilidad. L adistribucion de probabilidad de un estadistico se llama distribucion muestral. Depende del tamaño de la poblacion, del tamaño de las muestras y del metodo de eleccion de estas. 8.5 DISTRIBUCIÓN MUESTRAL DE S2

El teorema del límite central nos permitió utilizar el hecho de que a N (0,1) conforme crece el tamaño de la muestra. Las distribuciones muestrales de estadísticos importantes nos permiten conocer información sobre los parámetros. Por lo general, los parámetros son la contraparte del estadístico en cuestión. Por otro lado, si se estudia la variabilidad en la resistencia, claramente la distribución muestral de S2 se utilizará para conocer la contraparte paramétrica, la varianza de la población σ2. Si se extrae una muestra aleatoria del tamaño n de una población normal con media µ y varianza σ2, y se calcula la varianza muestral, obtenemos un valor del estadístico s2. Procederemos a considerar la distribución del estadístico (n-1) S2/σ2. Los valores de la variable aleatoria x2 se calculan de cada muestra mediante la fórmula La probabilidad de que una muestra aleatoria produzca un valor x2 mayor que algún valor específico es igual al área bajo la curva a la derecha de este valor. Se acostumbra representar con x2σ el valor x2 por arriba del cual encontramos un área de α. 8.6 DISTRIBUCIÓN CON t  Del teorema del límite central. Sus aplicaciones giran alrededor de las inferencias sobre una media de la población o la diferencia entre dos medios de población. A menudo, de hecho, una estimación de σ la debe proporcionar la misma información muestral que produce el promedio muestral x. Como resultado, un estadístico natural a considerar para tratar con las inferencias sobre µ es Puesto que S es el análogo de la muestra para σ. Si el tamaño de la muestra es pequeño, los valores de S2 fluctúan de forma considerable de una muestra a otra y la distribución de T se desvía de forma apreciable de la de una distribución normal estándar. Si el tamaño de la muestra es suficientemente grande, digamos n ≥ 30, la distribución de T no difiere mucho de la normal estándar. Sin embargo, para n< 3. Es útil tratar con la distribución exacta de T. Para desarrollar la distribución muestral de T supondremos que nuestra aleatoria se seleccionó de una población normal. La distribución de la probabilidad de T se publicó por primera vez en 1908 en un art. De W.S. Gosset. En esa época, Gosset era empleado de una cervecería irlandesa que no autorizaba la publicación de investigaciones de sus empleados. Para evadir la prohibición, publicó su trabajo en secreto bajo el nombre “Student”. En consecuencia, la distribución de T normalmente se llama distribución t de Student, o simplemente distribución t. Para poder derivar esta distribución, Gosset supone que las muestras se seleccionan de una población normal. ¿PARA QUE SE UTILIZA LA DISTRIBUCIÓN t? <span style="font-family: 'Corbel','sans-serif';">Se usa de manera extensa en problemas que tienen que ver con inferencia acerca de la media de la población o en problemas que implican muestras comparativas (es decir, en casos donde se trata de determinar si las medias de dos muestras son significativamente diferentes).

<span style="display: block; font-family: 'Corbel','sans-serif'; font-size: 14pt; line-height: 115%; text-align: center;">8.7 DISTRIBUCIÓN F  <span style="font-family: 'Corbel','sans-serif';">Motivamos la distribución t en parte sobre la base de la aplicación a problemas en los que hay muestreo comparativo (es decir, comparación entre dos medias muestrales.  <span style="font-family: 'Corbel','sans-serif';">Aunque es de interés que la información muestral arroje luz sobre dos medias de poblaciones, es frecuente el caso que una comparación, es algún sentido, de la variabilidad sea igualmente importante, si no es que más.  <span style="font-family: 'Corbel','sans-serif';">El estadístico F se define como la razón de dos variables aleatorias chi cuadradas independientes, divida cada una entre su número de grados de libertad. De aquí, podemos escribir  <span style="font-family: 'Corbel','sans-serif';">Donde U y V son variables aleatorias independientes que tienen distribuciones chi cuadradas con v1 y v2 grados de libertad, respectivamente. Estableceremos ahora la distribución muestral de F. <span style="font-family: 'Corbel','sans-serif';">¿Para qué se utiliza la distribución F?

**<span style="font-family: 'Corbel','sans-serif';">La distribución F se usa en situaciones de dos muestras para utilizar inferencias acerca de las varianzas de población. De hecho, la distribución F se llama distribución de razón de Varianzas. **

MARTINEZ CHAVEZ JORGE CARLOS OLVERA JUAREZ DENZEL ISMAEL PEREZ CRUZ KARINAIDE RAMIREZ MARTINEZ JOSE GABRIEL