Equipo+No.+1+Resumen

** Distribuciones de muetreo fundamentales y descripciones de datos ** ** 8.1 MUESTREO ALEATORIO ** Son los posibles resultados de todo expermento estadistico. El resultado de un experimento se puede registrar como un valor numerico o como una representacion descriptiva. Por ejemplo: los resulados de lanzar una dado, son numericos, pero si la variable es el tipo de sangre de un grupo de personas, el muesteo sera descriptivo. Pues puee ser AB, A, B, u O, y con signo positivo o negativo. ** Poblaciones y Muestras ** En el contexto de variables aleatorias se le denomina **Poblacion** a la totalidad de observaciones que nos interesan, de número finito o infinito. Y puede referirse a observaciones respecto de cualquier cuestion de interes, ya sea grupos de personas animales o todos los resultados posibles de algun sistema biologico o de ingenieria complicados. El número de observaciones en la poblacion se define como el tamaño de la poblacion y puede ser finito o infinito. Cada observacion en la poblacion es un valor de la variable aleatoria X que tiene alguna distribucion de la rpobabilidad //f(x)// que se define por:
 * Capitulo 8 **

Donde 0 indica un éxito y 1 un fracaso. Sin embargo hay poblaciones que no se pueden medir todas completas. Por lo tanto debemos depender de un subconjunto de observaciones de la poblacion para ayudrnos a realizar inferencias con respecto a la misma poblacion. Esto nos lleva a considerar la nocion del muestreo. **Muestra** es un subconjunto de la poblacion. Para que las inferencias sean validas se debe tomar una muestra representativa de la poblacion y no se debe de elegir una muestra donde se escojan a los mimbros pues podria dar resultados erroneos. Cualquier procedimiento de muestreo que produzca inferencias que sobreestimen, o subestimen de forma consistente alguna caracteristica de la poblacion se dice que esta sesgado. Para eliminar esto se debe elegir una muestra aleatoria de forma independiente y al azar. El concepto de muestra aleatoria se describe de manera formal en la siguiente deficion: Sean varibles aleatorias independientes //n//, cada una con la misma distribucion de probabilidad //f(x)//. Definimos como una muestra aleatoriade tamaño //n// de la poblacion //f(x)// y escribimos su distribucion de probabilidad conjunta como

** 8.2 algunos estadisticos importates ** Existe un valor p que representa a la poblacion, sin embargo muchas veces resulta muy difícil aplicar algun estudio a toda la poblacion, es por ello que se selecciona una muestra que se encuentra en funcion de p verdadera. A cualquier funcion de las variables aleatorias que forman una muestra aleatoria se llama **estadistico.** ** Tendencia Central en la muestra ** Los estadisticos que, por o general, se utilizan mas para medir el centro de un cnjunto de datos, acomodados en orde de magnitud, son la **media**, la **mediana** y la **moda**. Si representan una muestra aleatoria de tamaño //n//, entonces la **media de la muestra** se define mediante el estadistico

Observe que el dato estadistico toma el valor de cuando toma el valor de etc. El la practica al valor de un estadistico, se le da el mismo nombre del estadistico. Por ejemplo, el término //media de la muestra// se aplica tanto al estadistico como a su valor calculado. **Varianza de la Muestra** La variabilidad en la muestra deberia indicar como se dispersan las observaciones a partir del promedio. Es posible tener dos conjuntos de observaciones co las mismas media o mediana, y que difieran de una manera considerable en la varibilidad de sus mediciones alrededor del promedio. Para elegir entre dos muestras que presente estas mismas caracteristicas, es recomendable que se observe la varibilidad y esta como se comporta ante la media. Si representan una muestra aleatoria de tamaño //n// entonces la **varianza de la muestra** se define con el estadistico

El valor calculado de para una muestra dada se denota como. ** Teorema ** Si es la varianza de una muestra aleatoria de tamaño //n//, podemos escribir

Por definicion,

Al reemplazar terminos semejantes obtenemos la formula de calculo mas util del teorema. La **desviacion estandar de la muestra**, se denota con S, es la raiz cuadrada positiva de la varianza de la muestra. ** 8.3 Presentacion de datos y metodos graficos ** La informacion grafica con respecto a la validez de esta supociocion se puede obtener de presentaciones como los diagraamas de tallo y hojas y los histogramas de frecuencias; con el objetivo principal de que las graficas den una verificaciones diagnostica ssobre la suposicion de que los datos vienen de una distribucion normal. ** Grafica de caja y extensión ** Esta grafica encienrra el rango intercuartil de los datos en una caja que tiene la mediana representada dentro. El rango intercuartil tiene como extremos el percentil 75 (cuartil superior) y el percentil 25 (cuartil inferior). La grafica de caja puede ofrecer al observador informacion con respecto a cuales observaciones son **valores extremos**, los cuales son observaciones que se consideran inusualmente alejadas de la masa de los datos. La informacion visual en las graficas de caja y extension y de caja no intenta ser una prueba formal de valores extremos. Más bien, se ve como una herramienta de diagnostico. Un procedimiento comun consiste en utilizar un **multiplo del rango intercuartil**. Por ejemplo, si la distancia desde la caja exede 1.5 veces el rango intercualtil la observacionse puede considerar un valor extremo. Las graficas de datos pueden sugerir relaciones entre variables. Las graficas ayudan en la detección de anomalías o de observaciones de valores extremos en las muestras. ** Grafica de cuantiles ** Se pueden utilizar las ideas basicas de la grafica de cuantiles para //comparar muestras de datos//, donde el objetivo el analista es encontrar diferencias. Y su objetivo consiste en describir, en forma de muestra, a funcion de la distribucion acumulada. Un **cuantil** de una muestra, //q(f)//, es una valor para el que una fracción específica //f// de los valores de los datos es menor o igual a //q(f).// Una **grafica de cuantiles** simplemente //grafica los valores de los datos en el eje vertical contra una evaluación empírica de la fracción de observaciones excedidas por los valores de los datos.// Para propositos teoricos esta fraccion se calcula con, donde //i// es el orden de las observaciones cuando se clasifican de inferior a superior. A diferencia de la gráfica de caja, la gráfica de cualtiles realmente muestra todas las observaciones. ** Grafica de Cuantiles-cuantiles normales ** La metodologia incluye una gráfica de los cantiles empiricos recien presentados contra el cuantil correspondiente de la distribucion normal. Entonces, la expresion para un cuantil de una variable aleatoria N(µ,σ) es muy complicada. Sin embargo, una buena aproximacion esta dada por

** Grafica de probabilidad normal ** En este tipo de graficas el eje vertical contiene //f// graficada en una ppel especial y la escala utilizada da como resultado una linea recta, cuand se grafica contra los valores de los datos ordenados. ** 8.4 Distribuciones Muestrales ** El campo de la inferencia estadistica trata basicamente con generalizaciones y preddiones ** Inferencias sobre la poblacion a partir de informacion de la muestra ** Calculamos un estadistico a partir de una muestra que se selecciona de la poblacion, y con base en tales estadisticos hacemos varias afirmaciones con respecto a los valores de los parametros de la poblacion, que pueden ser ciertas o no. Como un estadistico es una varible aleatoria que depende solo de la muestra observada, debe tener una distribucion de probabilidad. L adistribucion de probabilidad de un estadistico se llama **distribucion muestral.** Depende del tamaño de la poblacion, del tamaño de las muestras y del metodo de eleccion de estas.