Equipo+no.+1_Resumen+Muestreo+y+Descripcion+de+Datos

= = uuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuu UUUUUUUUUUUUUUUU **Universidad Autónoma de Querétaro ** = = = =
 * [[image:http://www.gratisweb.com/megamamfred007/UAQ/e-ingenieria2.gif width="101" height="137" align="right"]][[image:http://www.gratisweb.com/megamamfred007/UAQ/UAQ.jpg width="111" height="145" align="right"]]

UUUUUUUUUUUUUUUUUUUUUUUUUUUU "Probabilidad y Estadistica"
uuuuuuuuuuuuuuuuuuuuuuuuuuuuuu || [|Texto en docs.]
 * **RESUMEN: **
 * "Muestreo y Descripcion de Datos" ** ||

**//8.0 Nociones Básicas.//**

Antes de empezar con el tema, revisaremos algunas definiciones, que servirán como base para el resto de este tema. · Población. Se define población como la totalidad de las observaciones en las que estamos interesados, según su tamaño, podemos definirlas como finitas o infinitas; y según el tipo de experimento que estemos diseñando podrá ser una población binomial, normal, etc. · Muestra: Es un subconjunto de la población. · Inferencia: Es una suposición que se realiza acerca de la población, mediante el comportamiento de una de sus muestras.

**//8.1 Muestreo Aleatorio//**

En muchas ocasiones debemos generar conclusiones acerca de nuestra población; sin embargo debido a varios factores (tiempo, presupuesto, etc.), esto no es viable, así pues, será necesario hacer inferencias, utilizando los datos obtenidos en las muestras; esto nos obliga a considerar la noción del muestreo. Para que las inferencias, puedan considerarse //validas,// nuestras muestras deberán representar a nuestra población. De otra forma, nuestras inferencias podrían subestimar o sobrestimar alguna característica de nuestra población. (muestreo sesgado). Para eliminar la posibilidad de sesgo en el muestreo, este debe ser aleatorio, de esta manera las observaciones se realizan de forma independiente. Para poder hacer un muestreo aleatorio, nuestra población debe de componerse de variables aleatorias independientes, con la misma distribución de probabilidad (//f//), que la población. Por lo que su distribución de probabilidad conjunta se representa como: //f//(x1+x2+x3…+xn)=//f//(x1)+//f//(x2)+//f//(x3)…+//f//(xn) **//8.2 Algunas estadísticas importantes//**

El propósito principal al utilizar muestras aleatorias, es obtener información sobre parámetros desconocidos de la población, por ejemplo, podemos utilizar una porción grande de nuestras muestras aleatorias, para calcular una proporción con respecto a nuestra muestra. La anterior proporción esta en función de nuestros valores observados, ahora bien este valor variara con respecto a las otras muestras aleatorias. A esto se le conoce como estadística.

**//Tendencia central en la muestra//** Las estadísticas más utilizadas para medir el centro de un conjunto de datos son la media, la mediana y la moda. La media, tal vez la más importante de estas 3 medidas, esta no es más que el promedio de las observaciones, y se calcula de la siguiente manera:

Por otro lado, la mediana (Ẍ) se considera la segunda estadística más útil, y nos ayuda a medir el centro de un conjunto de observaciones:

La última estadística es la moda (M), como ya sabemos, la moda es la observación que se presente más frecuentemente en nuestro estudio, aunque esta no siempre existe; esto ocurre cuando todas las observaciones tienen la misma frecuencia. Por otro lado, habrá casos donde aparezca más de una moda.

**//Variabilidad de la muestra//** Las anteriores mediciones nos sirven para ubicar el centro de nuestra muestra, más no nos proporcionan una idea acerca de la dispersión de nuestras observaciones, para esto utilizamos el rango y la varianza. El rango es la distancia (numérica) entre el valor más alto y el más bajo de nuestra muestra. La varianza (S2) se define como la suma de los cuadrados de las diferencias entre las observaciones y la media muestral.

Desarrollando la formula anterior, podemos obtener otro método un poco más sencillo para calcular la varianza:

Por otro lado, la varianza esta en unidades cuadradas, por lo que para saber la dispersión de nuestros datos, es más conveniente utilizar la desv. Estándar, representada por la letra S, por lo que es la raíz cuadrada de la varianza.

**//8.3 Presentaciones de datos y métodos gráficos.//**

**//Gráfico de Caja//** Este método gráfico, representa los cuartiles de nuestra muestra, la gráfica se podría describir como, una caja que encierra los datos que van del primer al tercer cuartil; a mitad de esta generalmente se localiza la mediana, o segundo cuartil. Además de la caja, este grafico presenta unas extensiones que van del dato mas bajo al más alto; lo que nos permite observar si existen datos atípicos en nuestra muestra; un dato atípico se considera como un evento raro, y se puede observar si la distancia entre el dato y el primer cuartil se localizan a 1.5 veces la longitud de la caja. **//Gráfico de Cuantiles//** Grafica la cantidad de observaciones contra la fracción que representan de la muestra:

**//8.4 Distribuciones muestrales//**

Se conoce como distribución muestral a la distribución de probabilidad de una estadística., esta depende del tamaño de la población, la muestra y el método de elección de muestras. Las distribuciones muestrales, se ven como el mecanismo a partir del cual se pueden generar inferencias de los parámetros de la media y la varianza de la población.

**//8.5 Distribuciones muestrales de medias.//**

Para muestras muy grandes de una población cuya distribución es desconocida, se podrá decir que la anterior tiene una distribución normal, esto es a consecuencia del teorema del limite central, que dice lo siguiente:

Por lo general la aproximación de la media de la muestra será normal, si n>30,

**//Inferencias sobre la media de la población.//** Aplicaciones importantes del anterior teorema son: pruebas de hipótesis, estimación, control de calidad, etc; esto debido a que determina valores razonables de la media de la población.

**//8.6 Distribución muestral de S2.//**

Determina la cantidad de variable entre variables aleatorias, estas deben estar entre 0 y 1. Se calcula de la siguiente manera:


 * //8.7 Distribución T//**

Anteriormente estudiamos el uso del teorema del limite central, sin embargo, no siempre se conoce la desviación estándar de la población; en estos casos una distribución tipo T, resulta mas útil.

Si el tamaño de la muestra es suficientemente grande (n>30), entonces la distribución de T, no varia mucho con la normal; pero para(n<30), es recomendable tratar con la distribución T. La distribución T, es muy parecida a la distribución Z, la única diferencia es que la primera presenta mas variaciones debido a la fluctuación de los valores de la varianza y media de la muestra, solamente cuanto n, tiende al infinito, ambas distribuciones serán las mismas. La distribución T, se utiliza para en problemas que implican observar si las medias de 2 muestras son significativamente diferentes. Recordemos también que el hecho de que la distribución T, cuando n>30, se parezca a una distribución normal, no se debe al tamaño de la muestra en si, si no a que la desviación estándar es lo suficientemente buena como para analizar el problema.


 * //8.8 Distribución F//**

Encontramos la aplicación de la distribución F, en los casos donde es importante comparar la variación entre dos muestras. Podemos definir la distribución F como la división de 2 variables aleatorias independientes, divididas entre el número de grados de libertad. También es conocida como distribución entre razón de varianzas.

WALPOLE, Ronald; MYERS, Raymond y MYERS, Sharon. //"Probabilidad y Estadisica para Ingeniería y Ciencias// Ver Resumen con Imagenes

//**Luis Alfredo Leal Monroy. **// //**Hiroaki Fukumori Villafani. **// //**Melnyk Ben Y. Ferman Gutiérrez. **// || = =
 * =**Equipo No. 1 **=