Logo Studenta

APA ESTADISTICA

¡Este material tiene más páginas!

Vista previa del material en texto

Título: ESTADISTICA Y PROBABILIDADES
Autor: Crespo Arguedas Lia Marisol
__________________________________________________________________________________________________________
FICHA DE IDENTIFICACIÓN DE TRABAJO DE INVESTIGACIÓN
	Título
	ESTADISTICA Y PROBABILIDADES
	Autor/es
	Nombres y Apellidos
	Código de estudiantes
	
	Lia Marisol Crespo Arguedas
	39834
	Fecha
	06/07/2019
	Carrera
	Ingeniería en gas y petróleo 
	Asignatura
	Probabilidad y Estadistica
	Grupo
	A
	Docente
	Ing. Carmen Romero
	Periodo Académico
	II/2018 
	Subsede
	La Paz
Copyright © (2018) por (Lia Marisol Crespo Arguedas). Todos los derechos reservados
CONTENIDO
CAPITULO 1. INTRODUCCION	3
CAPÍTULO 2. PLANTEAMIENTO DEL PROBLEMA	4
2.1. Objetivos.-	4
CAPÍTULO 3. MARCO TEÓRICO	5
3.1. Estadistica.-	5
3.1.1Población.-	6
3.1.2.Muestra.-	7
3.1.3.Muestreo.-	8
3.1.4.Encuesta.-	8
3.2. Distribución de frecuencias.-	20
3.2.1.Tipos de frecuencias.-	20
3.2.2.Distribución de frecuencias agrupadas.-	22
3.2.3.Histogramas, Polígonos de Frecuencia y Ojivas .-	22
3.2.4. Poligono de frecuencia.-	23
3.2.5.Ojiva.-	24
3.3. Medidas de resumen.-	27
3.3.1.La media de un conjunto de datos .-	27
3.3.2.La mediana de un conjunto de datos .-	27
3.3.3.La moda de un conjunto de datos .-	28
3.3.4.Cuartiles.-	28
3.3.5.Centiles o Percentiles.-	30
3.4.Asimetria y Curtosis.-	35
3.5.Probabilidad.-	38
3.5.3.Distribución binomial.-	42
3.5.4. Ley de Poison.-	44
3.5.5.Distribucion de variable aleatoria continua ( densidad).-	45
3.5.6.Diseño de la muestra.-	47
3.5.7.Chicuadrado.-	51
CAPITULO 4. CONCLUSIONES	55
CAPITULO 5. BIBLIOGRAFIA	55
CAPITULO 1. INTRODUCCION
Entre la diversidad de actividades que comprende un proyecto de generación de información estadística, se encuentran las de diseño de la muestra, orientadas a la captura, codificación, validación, integración de la base de datos, así como la explotación de ésta para la presentación de resultados. Este conjunto de actividades impacta tanto en la calidad como en la oportunidad de los resultados.En un proyecto de encuesta, el diseño de la muestra es crucial debido a su efecto en la confiabilidad de los resultados. Ésta se relaciona con otras fases previas como son: la planeación y el diseño conceptual, así como con las subsecuentes: la captación, el procesamiento y la presentación de resultados. En el presente documento se describen los elementos técnicos a considerar durante el proceso de decisiones que involucra esa fase, incluyendo los condicionantes en el marco del proyecto y las opciones a tener en cuenta. Para ello se desarrollan cuatro capítulos, donde se plantean los aspectos generales; las opciones para determinar el esquema de muestreo, las macroactividades que cubre y un apartado sobre la documentación de las actividades de la fase. Se incluye también un glosario y la bibliografía consultada.
CAPÍTULO 2. PLANTEAMIENTO DEL PROBLEMA
2.1. Objetivo General.-
· Estudiar todo lo avanzado en estadística y probabilidad, dándonos ejemplos para cada caso relacionados con la carrera de Ingenieria en Gas y Petroleo.
2.2. Objetivos específicos.-
· Explicar los conceptos básicos de estadística y probabilidad.
· Realizar una encuesta y encuestar a 40 personas.
· Hallar la validación de la encuesta mediante el alfa de cronbach.
· Realizar los graficos correspondientes a cada pregunta de la encuesta.
· Estudiar la distribución de frecuencia con un ejemplo relacionado a la carrera de Ingenieria en Gas y Petroleo.
· Estudiar la distribución de frecuencia con un ejemplo relacionado a la carrera de Ingenieria en Gas y Petroleo.
· Realizar un histograma y polígono de frecuencia de la tabla de la distribución de frecuencias.
· Calcular la media, mediana, la moda, los cuartiles y los percentiles con un ejemplo relacionado a la carrera de Ingenieria en Gas y Petroleo.
· Hallar la curtosis y la asimetría con un ejemplo relacionado a la carrera de Ingenieria en Gas y Petroleo.
· Estudiar la probabilidad con un ejemplo relacionado a la carrera de Ingenieria en Gas y Petroleo.
· Realizar un ejemplo relacionado con la Ingenieria en Gas y Petroleo de distribución binomial mediante una tabla.
· Realizar un ejemplo relacionado con la Ingenieria en Gas y Petroleo de la ley de poison.
· Calcular la muestra de la encuesta realizada.
· Calcular el chicuadrado de la encuesta realizada
CAPÍTULO 3. MARCO TEÓRICO
3.1. Estadistica.-
La estadística es comúnmente considerada como una colección de hechos numéricos expresados en términos de una relación sumisa, y que han sido recopilado a partir de otros datos numéricos.
Kendall y Buckland definen la estadística como un valor resumido, calculado, como base en una muestra de observaciones que generalmente, aunque no por necesidad, se considera como una estimación de parámetro de determinada población; es decir, una función de valores de muestra.
La estadística es una técnica especial apta para el estudio cuantitativo de los fenómenos de masa o colectivo, cuya mediación requiere una masa de observaciones de otros fenómenos más simples llamados individuales o particulares. 
Gini Murria R. Spiegel dice: "La estadística estudia los métodos científicos para recoger, organizar, resumir y analizar datos, así como para sacar conclusiones válidas y tomar decisiones razonables basadas en tal análisis”
Yale y Kendal dice “La estadística es la ciencia que trata de la recolección, clasificación y presentación de los hechos sujetos a una apreciación numérica como base a la explicación, descripción y comparación de los fenómenos". 
Cualquiera sea el punto de vista, lo fundamental es la importancia científica que tiene la estadística, debido al gran campo de aplicación que posee.
Datos Estadísticos:
Los datos estadísticos no son otra cosa que el producto de las observaciones efectuadas en las personas y objetos en los cuales se produce el fenómeno que queremos estudiar. Dicho en otras palabras, son los antecedentes (en cifras) necesarios para llegar al conocimiento de un hecho o para reducir las consecuencias de este.
Los datos estadísticos se pueden encontrar de forma no ordenada, por lo que es muy difícil en general, obtener conclusiones de los datos presentados de esta manera. Para poder obtener una precisa y rápida información con propósitos de descripción o análisis, estos deben organizarse de una manera sistemática; es decir, se requiere que los datos sean clasificados. Esta clasificación u organización puede muy bien hacerse antes de la recopilación de los datos.
Los datos estadísticos pueden ser clasificados en cualitativos, cuantitativos, cronológicos y geográficos.
· Datos Cualitativos: cuando los datos son cuantitativos, la diferencia entre ellos es de clase y no de cantidad.
Ejemplo para la carrera de Ingenieria en Gas y Petroleo:
Si deseamos clasificar los estudiantes de UDABOL que cursan la materia de PERFORACION I por su estado civil, observamos que pueden existir solteros, casados, divorciados, viudos.
· Datos cuantitativos: cuando los valores de los datos representan diferentes magnitudes, decimos que son datos cuantitativos.
Ejemplo para la carrera de Ingenieria en Gas y Petroleo:
Se clasifican los estudiantes de UDABOL de acuerdo a sus notas, observamos que los valores (nota) representan diferentes magnitudes.
3.1.1Población.-
El concepto de población en estadística va más allá de lo que comúnmente se conoce como tal. Una población se precisa como un conjunto finito o infinito de personas u objetos que presentan características comunes.
"Una población es un conjunto de todos los elementos que estamos estudiando, acerca de los cuales intentamos sacar conclusiones". Levin & Rubin (1996).
"Una población es un conjunto de elementos que presentan una característica común". Cadenas (1974).
Ejemplo para la carrera de Ingenieria en Gas y Petroleo:
Los estudiantes de la Universidad de Aquino Bolivia UDABOL de la carrera de Ingenieria en Gas y Petroleo.
El tamaño que tiene una población es un factor de suma importancia en el proceso de investigación estadística,y este tamaño vienen dado por el número de elementos que constituyen la población, según el número de elementos la población puede ser finita o infinita. Cuando el número de elementos que integra la población es muy grande, se puede considerar a esta como una población infinita, por ejemplo; el conjunto de todos los números positivos. Una población finita es aquella que está formada por un limitado número de elementos.
Cuando la población es muy grande, es obvio que la observación de todos los elementos se dificulte en cuanto al trabajo, tiempo y costos necesario para hacerlo. Para solucionar este inconveniente se utiliza una muestra estadística.
Es a menudo imposible o poco práctico observar la totalidad de los individuos, sobre todos si estos son muchos. En lugar de examinar el grupo entero llamado población o universo, se examina una pequeña parte del grupo llamada muestra.
3.1.2.Muestra.-
"Se llama muestra a una parte de la población a estudiar que sirve para representarla". Murria R. Spiegel (1991).
"Una muestra es una colección de algunos elementos de la población, pero no de todos". Levin & Rubin (1996).
"Una muestra debe ser definida en base de la población determinada, y las conclusiones que se obtengan de dicha muestra solo podrán referirse a la población en referencia", Cadenas (1974).
Ejemplo para la carrera de Ingenieria en Gas y Petroleo:
El estudio realizado a 50 miembros del UDABOL de la carrera de Ingenieria en Gas y Petroleo.
3.1.3.Muestreo.-
Esto no es más que el procedimiento empleado para obtener una o más muestras de una población; el muestreo es una técnica que sirve para obtener una o más muestras de población.
Este se realiza una vez que se ha establecido un marco muestral representativo de la población, se procede a la selección de los elementos de la muestra aunque hay muchos diseños de la muestra.
Al tomar varias muestras de una población, las estadísticas que calculamos para cada muestra no necesariamente serían iguales, y lo más probable es que variaran de una muestra a otra.
3.1.4.Encuesta.-
Se entiende por encuesta las observaciones realizadas por muestreo, es decir son observaciones parciales.El diseño de encuestas es exclusivo de las ciencias sociales y parte de la premisa de que si queremos conocer algo sobre el comportamiento de las personas, lo mejor, más directo y simple es preguntárselo directamente a ellas. (Cadenas, 1974).
Según Antonio Napolitano "La encuesta, es un método mediante el cual se quiere averiguar. Se efectúa a través de cuestionarios verbales o escritos que son aplicados a un gran número de personas".
Tipos de encuestas:
· Encuestas descriptivas: Reflejan o documentan las actitudes o condiciones presentes. Esto significa que intentan describir en qué situación se encuentra una determinada población en el momento en que se realiza la encuesta.
· Encuestas analíticas: Buscan, además de describir, explicar los por qué de una determinada situación. En este tipo de encuestas las hipótesis que las respaldan suelen contrastarse por medio del examen de por lo menos dos variables, de las que se observan interrelaciones y luego se formulan inferencias explicativas.
Tipos de preguntas:
· De respuesta abierta: En estas encuestas se le pide al interrogado que responda él mismo a la pregunta formulada. Esto le otorga mayor libertad al entrevistado y al mismo tiempo posibilitan adquirir respuestas más profundas así como también preguntar sobre el porqué y cómo de las preguntas realizadas. Por otro lado, permite adquirir respuestas que no habían sido tenidas en cuenta a la hora de hacer los formularios y pueden crear así relaciones nuevas con otras variables y respuestas.
· De respuesta cerrada: En éstas, los encuestados deben elegir para responder una de las opciones que se presentan en un listado que formularon los investigadores. Esta manera de encuestar da como resultado respuestas más fáciles de cuantificar y de carácter uniforme. El problema que pueden presentar estas encuestas es que no se tenga en el listado una opción que coincida con la respuesta que se quiera dar, por esto lo ideal es siempre agregar la opción “otros”.
Ventajas:
· Bajo costo.
· Información más exacta (mejor calidad) que la del censo, debido a que el menor número de encuestadores permite capacitarlos mejor y más selectivamente.
· Es posible introducir métodos científicos objetivos de medición para corregir errores.
· Mayor rapidez en la obtención de resultados.
· Técnica más utilizada y que permite obtener información de casi cualquier tipo de población.
Desventajas:
· Es necesario dar un margen de confiabilidad de los datos, una medida del error estadístico posible al no haber encuestado a la población completa. Por lo tanto deben aplicarse análisis estadísticos que permitan medir dicho error con intervalos de confianza, medidas de desviación estándar, coeficiente de variación, etc. Esto requiere de profesionales capacitados al efecto, y complica el análisis de las conclusiones.
Ejemplo para la carrera de Ingenieria en Gas y Petroleo:
Se realizo una encuesta referente a las conecciones de gas domiciliario en la ciudad de La Paz- Bolivia para la carrera de Ingenieria en Gas y Petroleo de UDABOL.
· Se le dio un valor a cada respuesta que se la clasifico como respuestas cerradas:
 SI = 5 
 NO = 3 
NO RESPONDE = 1
Calificando cada encuesta con los valores dados se obtiene la tabla 1 pag.14.
· Se calculo en la tabla 1 la sumatoria total de los puntos para cada persona encuestada con la formula:
𝛴Xn= X₁+X₂+………..Xn
Donde:
𝛴= sumatoria
X₁,₂,…n= puntos de cada pregunta 
· Se calculo la varianza para cada pregunta, con la formula:
Donde:
= varianza
X= termino del conjunto
Xprom= media de la muestra
N = tamaño de la muestra
· Se calculo la sumatoria total de las varianzas obtenidas para cada preguntacon la formula:
𝛴Xn= X₁+X₂+………..Xn
TABLA 1. Tabla de la encuesta en Excel
3.1.4.1. Alfa de Cronbach.-
El alfa de Cronbach no deja de ser una media ponderada de las correlaciones entre las variables (o ítems) que forman parte de la escala. Puede calcularse de dos formas: a partir de las varianzas (alpha de Cronbach) o de las correlaciones de los ítems (Alpha de Cronbach estandarizado). Hay que advertir que ambas fórmulas son versiones de la misma y que pueden deducirse la una de la otra. El alpha de Cronbach y el alpha de Cronbach estandarizados, coinciden cuando se estandarizan las variables originales (items).
Donde:
Si² = S i 2 {\displaystyle S_{i}^{2}} es la varianza del ítem i,
St² = S t 2 {\displaystyle S_{t}^{2}} es la varianza de los valores totales observados
K = k {\displaystyle k} es el número de preguntas o ítem
Reemplazando en la formula, tenemos:
· Se utiliza la formula de Cronbach para ver el nivel de confiabilidad con la siguiente formula:
TABLA 2. Tabla nivel de confiabilidad del alfa de Cronbach
Se toma la decisión según la tabla mostrada, siendo 0,76 una confiabilidad alta
· Tabular los datos obtenidos de las respuestas de cada persona en una tabla.
TABLA 3. Tabulacion de las respuestas obtenidas en las encuestas.
· Realizar el grafico de la torta para cada pregunta.
INTERPRETACION: De acuerdo a los datos obtenidos en la tabla se puede concluir que para :
La pregunta 1 ¿USTED TIENE CONECCION DE GAS A DOMICILIO? 
Según la respuesta de las 40 personas , 30 respondieron que tienen gas a domicilio y solo 8 personas que no tenían gas a domicilio.
INTERPRETACION: De acuerdo a los datos obtenidos en la tabla se puede concluir que para:
La pregunta 2 ¿USTED CREE QUE ES UN AVANCE FAVORABLE LA INDUSTRIALIZACION DEL GAS EN BOLIVIA? De las 40 personas 28 respondieron que si están de acuerdo en que es un avance la industrialización del gas en Bolivia y 8 dijeron que no es favorable
INTERPRETACION: De acuerdo a los datos obtenidos en la tabla se puede concluir que para:
La pregubta 3,¿ESTA CONFORME CON LA ISTALACION DE GAS A DOMICILIO EN SUHOGAR? De las 40 personas 31 estan conformes con su instalación de gas a domicilio y solo 8 personas no estaba de acuerdo.
INTERPRETACION: De acuerdo a los datos obtenidos en la tabla se puede concluir que para:
La pregunta 4.¿ESTA DE ACUERDO CON QUE LA CONECCION DE GAS A DOMICILIO SEA GRATUITA? De las 40 personas 36 respondieron que si están de acuerdo en que la coneccion del gas en Bolivia sea gratuita y 4 dijeron que no están de acuerdo.
INTERPRETACION: De acuerdo a los datos obtenidos en la tabla se puede concluir que para:
 La pregunta 5 LA CONECCION A GAS SI BIEN ES GRATUITA , SE DEBE PAGAR SI SE PASA LOS 20 METROS ¿ESTARIA DEACUERDO EN PAGAR ESTE MONTO? De las 40 personas 26 respondieron que si están de acuerdo en pagar ese monto por la coneccion de gas a domicilio y 14 dijeron que no están de acuerdo.
INTERPRETACION: De acuerdo a los datos obtenidos en la tabla se puede concluir que para:
La pregunta 6.¿USTED ESTA CONFORME CON EL MONTO MENSUAL QUE TIENE QUE PAGAR EN LA FACTURA DEL GAS? De las 40 personas 29 respondieron que si están conforme con el monto de su factura de gas y 11 dijeron que no están de acuerdo.
INTERPRETACION: De acuerdo a los datos obtenidos en la tabla se puede concluir que para:
La pregunta 7.¿USTED CREE QUE ES MAS SEGURO TENER GAS A DOMICILIO QUE COMPRAR UNA GARRAFA ? De las 40 personas 33 respondieron que si es seguro tener gas a domicilio y 5 dijeron que no comprar una garrafa no es inseguro.
INTERPRETACION: De acuerdo a los datos obtenidos en la tabla se puede concluir que para:
La pregunta 8.¿ESTARIA DE ACUERDO EN USAR UN CALEFON PARA QUE SU DUCHA SEA A GAS Y NO ASI A CORRIENTE ELECTRICA? De las 40 personas 26 respondieron que si están de acuerdo en usar un calefón en vez de usar corriente eléctrica en su duchay 13 dijeron que no.
INTERPRETACION: De acuerdo a los datos obtenidos en la tabla se puede concluir que para:
La pregunta 9.¿USTED CREE QUE GASTA MUCHO EN LA DUCHA CONECTADA A LA CORRIENTE ELECTRICA? De las 40 personas 34 respondieron que si gastan mucho en la ducha a corriente eléctrica y 5 dijeron que no es mucho gasto.
INTERPRETACION: De acuerdo a los datos obtenidos en la tabla se puede concluir que para:
La pregunta 10. ¿USTED CREE QUE GASTARIA MENOS SI USA UN CALEFON DE GAS EN SU DUCHA O SI CAMBIA SU CALEFACCION DE CORRIENTE ELECTRICA A GAS ? De las 40 personas 27 respondiero que si gastaría menos si usa un calefón de gas en su ducha o si cambia su calefacción a gas y 11 dijeron que no gastaría menos en cambiarlos a agas.
3.2. Distribución de frecuencias.- 
En estadística, se le llama distribución de frecuencias a la agrupación de datos en categorías mutuamente excluyentes que indican el número de observaciones en cada categoría.1​ Esto proporciona un valor añadido a la agrupación de datos. La distribución de frecuencias presenta las observaciones clasificadas de modo que se pueda ver el número existente en cada clase.
Las distribuciones de frecuencias son tablas en que se dispone las modalidades de la variable por filas. En las columnas se dispone el número de ocurrencias por cada valor, porcentajes, etc. La finalidad de las agrupaciones en frecuencias es facilitar la obtención de la información que contienen los datos.
3.2.1.Tipos de frecuencias.-
· Frecuencia completa
La frecuencia completa por su denominación es el número de veces que aparece un determinado valor en un valor estadístico. Se representa por fila. La suma de la frecuencia completa es igual al número total de datos, que se representa por N. Para indicar resumidamente estas sumas se utiliza la letra griega Σ (sigma mayúscula) que se lee sumatoria. 
· Frecuencia relativa
La frecuencia relativa es igual al números de veces que se repite un evento o sea la frecuencia multiplicado por el 100% y divida entre el total de la frecuencia. 
Ejemplo para la carrera de Ingenieria en Gas y Petroleo:
Se calcula la frecuencia para el porcentaje de personas que tienen gas a domicilio del 60%
Frecuencia* % = % Total de frecuencia 15* 100% = 1,500 = 60% 
Es el total de la frecuencia relativa de el 100% o 99% dependiendo de los decimales que uses, si no te da tu ejerció tiene algún error. 
· Frecuencia acumulada
La frecuencia acumulada es la suma de las frecuencias absolutas de todos los valores inferiores o iguales al valor considerado. 
La frecuencia acumulada es la frecuencia estadística F(XXr) con que el valor de una variable aleatoria (X) es menor que o igual a un valor de referencia (Xr). 
La frecuencia acumulada relativa se deja escribir como Fc(X≤Xr), o en breve(Xr), y se calcula de 
Fc (Hr) = HXr / N
Donde 
MXr es el número de datos 
X con un valor menor que o igual a Xr, 
N es número total de los datos. 
En breve se escribe: 
Fc = M / N
Cuando Xr=Xmin, donde Xmin es el valor mínimo observado, se ve que Fc=1/N, porque M=1.
 Por otro lado, cuando Xr=Xmax, donde Xmax es el valor máximo observado, se ve que Fc=1, porque M=N. 
En porcentaje la ecuación es: 
Fc(%) = 100 M / N
· Frecuencia relativa acumulada
La frecuencia relativa acumulada es el cociente entre la frecuencia acumulada de un determinado valor y el número total de datos. Se puede expresar en tantos por ciento. 
Ejemplo para la carrera de Ingenieria en Gas y Petroleo:
Durante el mes de julio, en una ciudad se han registrado los siguientes pozos exploratorios en YPFB: 
32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 44 
3.2.2.Distribución de frecuencias agrupadas.-
La distribución de frecuencias agrupadas o tabla con datos agrupados se emplea si las variables toman un número grande de valores o la variable es continua. Se agrupan los valores en intervalos que tengan la misma amplitud denominados clases. A cada clase se le asigna su frecuencia correspondiente. Límites de la clase. Cada clase está delimitada por el límite inferior de la clase y el límite superior de la clase. 
La amplitud de la clase es la diferencia entre el límite superior e inferior de la clase. La marca de clase es el punto medio de cada intervalo y es el valor que representa a todo el intervalo para el cálculo de algunos parámetros. En caso de que el primer intervalo sea de la forma:
(-∞,k], o bien [k,+∞)
Donde k es un número cualquiera, en el caso de (-∞,k].
Para calcular la marca de clase se tomará la amplitud del intervalo adyacente a el (ai+1), y la marca de clase será ((k-ai+1) +k)/2. 
En el caso del intervalo [k,+∞) también se tomará la amplitud del intervalo adyacente a el (ai-1) siendo la marca de clase ((k+ai-1)+k)/2. 
3.2.3.Histogramas, Polígonos de Frecuencia y Ojivas .-
Estás tablas, o los valores contenidos en las mismas, también pueden ser representadas en diferentes tipos de gráficos.
Un Histograma es la representación gráfica de una tabla de frecuencias. El histograma puede ser: de frecuencias absolutas, de frecuencias relativas, de frecuencias absolutas acumuladas y de frecuencias relativas acumuladas. 
Más profundamente, el histograma de frecuencias es una representación visual de los datos en donde se evidencian fundamentalmente tres características: forma, acumulación o tendencia posicional y dispersión o variabilidad.
3.2.4. Poligono de frecuencia.-
Un Polígono de Frecuencia es el nombre que recibe una clase de gráfico que se crea a partir de un histograma de frecuencia.
 Los histogramas emplean columnas verticales para reflejar las frecuencias, los polígonos de frecuencia se forman uniendo los puntos más altos de cada una de las columnas del Histograma 
Podemos observar que el polígono de frecuencia es la línea roja que une el centro de cada barra del histograma. Sólo se ha dejado el histograma para una mayor comprensión del concepto que se desea ilustrar.
3.2.5.Ojiva.-
Por último hablaremos de las Ojivas. Una Ojiva se utiliza para representar la frecuencia acumulada. Similar al Polígono de frecuencia, se forma o se construye uniendo los puntos más altos de cada columna pero de un Histograma que represente las Frecuencias Acumuladas. 
Al estar construido en función de las frecuencias acumuladas permite ver cuántas observacionesse encuentran por encima o debajo de ciertos valores, en lugar de solo exhibir los números asignados a cada intervalo.
En este caso la Ojiva es la línea azul, pero se ha dejado el Histograma, por dos razones: (1) Para visualizar un histograma de Frecuencias Acumuladas; y, (2) Para tener una visión más clara de lo que representa la Ojiva.
En este ejemplo se visualiza claramente lo que se conceptualizó antes, por ejemplo, se puede ver rápidamente que hay 8 secciones con 39 alumnos o menos. Cabe destacar que las Ojivas también se pueden hacer a la inversa, comenzando con la mayor y terminando con la menor frecuencia.
Estos 3 tipos de gráficos son muy útiles y son fáciles de interpretar cuando estamos trabajando con tablas de frecuencia.
Ejemplo para la carrera de Ingenieria en Gas y Petroleo:
Los datos siguientes representan a los salarios del personal ( ingenieros en gas y petróleo) de YPFB expresado en miles de Bs.
3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26, 20, 11, 13, 22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13. 
· Construcción de una tabla de datos agrupados: 
· Se localizan los valores menor y mayor de la distribución. En este caso son 3 y 48.
· fi se calcula contando en los intervalos la cantidad como en el intervalo 0-5 hay solo un valor que es el 3.
· hi se calcula con la formula: hi = fi / n
· El Xi se calcula por la formula : Li + Ls / 2
Se restan y se busca un número entero un poco mayor que la diferencia y que sea divisible 
	Intervalo
	Xi
	fi
	Fi
	hi
	Hi
	%hi
	%Hi
	[0, 5)
	2.5
	1
	1
	0.025
	0.025
	2.5
	2.5
	[5, 10)
	7.5
	1
	2
	0.025
	0.050
	2.5
	5
	[10, 15)
	12.5
	3
	5
	0.075
	0.125
	7.5
	12.5
	[15, 20)
	17.5
	3
	8
	0.075
	0.200
	7.5
	20
	[20, 25)
	22.5
	3
	11
	0.075
	0.275
	7.5
	27.5
	[25, 30)
	27.5
	6
	17
	0.150
	0.425
	15
	42.5
	[30, 35)
	32.5
	7
	24
	0.175
	0.600
	17.5
	60
	[35, 40)
	37.5
	10
	34
	0.250
	0.850
	25
	85
	[40, 45)
	42.5
	4
	38
	0.100
	0.950
	10
	95
	[45, 50)
	47.5
	2
	40
	0.050
	1
	5
	100
	Total:
	
	40
	
	1
	
	
	
· Se realiza el histograma.
· Se elabora el polígono de frecuencia
3.3. Medidas de resumen.-
3.3.1.La media de un conjunto de datos .-
La media de un conjunto de números, algunas ocasiones simplemente llamda el promedio , es la suma de los datos dividida entre el número total de datos. 
Ejemplo para la carrera de Ingenieria en Gas y Petroleo:
Encontrar la media de los salarios del personal (ingenieros en gas y petróleo) de YPFB expresado en miles de Bs. En 2001.
{2, 5, 5, 6, 8, 8, 9, 11}. 
Hay 8 números en el conjunto. Súmelos, y luego divida entre 8. 
2+5+5+6+8+8+9+11 / 8 = 6.75 
Así, la media es 6.75.
INTERPRETACION: El promedio de los salarios del personal de ingenieros de YPFB en 2001 es 6.75 miles de Bs. 
3.3.2.La mediana de un conjunto de datos .-
La mediana de un conjunto de números es el número medio en el conjunto (después que los números han sido arreglados del menor al mayor) o, si hay un número par de datos, la mediana es el promedio de los dos números medios. 
Ejemplo para la carrera de Ingenieria en Gas y Petroleo:
Encuentre la mediana del conjunto {3, 10, 36, 255, 79, 24, 5, 8} que son las conecciones de gas domiciliario que se realizo en la zona Sopocachi el 2004 .
Primero, arregle los números en orden ascendente. 
{3, 5, 8, 10, 24, 36, 79, 255} 
Hay 8 números en el conjunto y la mitad esta entre 10 y 24 .Así, encuentre el promedio de los dos números medios, 10 y 24. 
(10 + 24)/2 = 34/2 = 17 
Así, la mediana es 17. 
INTERPRETACION: la mediana es 17 conecciones a gas que se realizaron en la zona Sopocachi de la cuidad de La Paz en 2004
3.3.3.La moda de un conjunto de datos .-
La moda de un conjunto de números es el número que aparece más a menudo. 
Ejemplo para la carrera de Ingenieria en Gas y Petroleo:
Encuentre la moda del conjunto {2, 3, 5, 5, 7, 9, 9, 9, 10, 12} que representan las perforaciones en el campo VRB-2 de YPFB Andina desde el año 1997 al 2006.
El 2, 3, 7, 10 y 12 aparecen una vez cada uno. 
El 5 aparece dos veces y el 9 aparece tres veces. 
Así, el 9 es la moda. 
INTERPRETACION: Se hicieron 9 perforaciones en cada uno de los tres años, como en el:2002,2003 y 2004
3.3.4.Cuartiles.-
Los cuartiles son los tres valores que dividen al conjunto de datos ordenados en cuatro partes porcentualmente iguales.
Hay tres cuartiles denotados usualmente Q1, Q2, Q3. El segundo cuartil es precisamente la mediana. El primer cuartil, es el valor en el cual o por debajo del cual queda un cuarto (25%) de todos los valores de la sucesión (ordenada); el tercer cuartil, es el valor en el cual o por debajo del cual quedan las tres cuartas partes (75%) de los datos.
Datos Agrupados
Como los cuartiles adquieren su mayor importancia cuando contamos un número grande de datos y tenemos en cuenta que en estos casos generalmente los datos son resumidos en una tabla de frecuencia. La fórmula para el cálculo de los cuartiles cuando se trata de datos agrupados es la siguiente:
k= 1,2,3
Donde:
Lk = Límite real inferior de la clase del cuartil k
n = Número de datos
Fk = Frecuencia acumulada de la clase que antecede a la clase del cuartil k.
fk = Frecuencia de la clase del cuartil k
c = Longitud del intervalo de la clase del cuartil k
Para Datos No Agrupados
Si se tienen una serie de valores X1, X2, X3 ... Xn, se localiza mediante las siguientes fórmulas:
- El primer cuartil:
Cuando n es par:
1*n / 4
Cuando n es impar:
1(n+1) / 4
-Para el tercer cuartil
Cuando n es par:
3*n / 4
Cuando n es impar:
3(n+1) / 4
3.3.5.Centiles o Percentiles.-
Los percentiles son, tal vez, las medidas más utilizadas para propósitos de ubicación o clasificación de las personas cuando atienden características tales como peso, estatura, etc.
Los percentiles son ciertos números que dividen la sucesión de datos ordenados en cien partes porcentualmente iguales. Estos son los 99 valores que dividen en cien partes iguales el conjunto de datos ordenados. Los percentiles (P1, P2,... P99), leídos primer percentil,..., percentil 99.
Datos Agrupados
Cuando los datos están agrupados en una tabla de frecuencias, se calculan mediante la fórmula:
k= 1,2,3,... 99
Donde:
Lk = Límite real inferior de la clase del decil k
n = Número de datos
Fk = Frecuencia acumulada de la clase que antecede a la clase del decil k.
fk = Frecuencia de la clase del decil k
c = Longitud del intervalo de la clase del decil k
Ejemplo para la carrera de Ingenieria en Gas y Petroleo:
Se a realizado 79 conecciones de gas a domicilio a 600 personas. Se refleja en la siguiente tabla 
	Respuesta
	[ 0, 10 )
	[ 10, 20 )
	[ 20, 30 )
	[ 30, 40 )
	[ 40, 50 )
	[ 50, 60 )
	[ 60, 70 )
	[ 70, 80 )
	Nº de peronas
	40
	60
	75
	90
	105
	85
	80
	65
Calcular los cuartiles, la mediana, el rango intercuartílico, el decil 2, el decil 8, el percentil 48 y el percentil 67.
	Intervalos
	xi
	fi
	Fi
	xi2
	fi·xi
	fi·xi2
	[ 0, 10 )
	5
	40
	40
	25
	200
	1000
	[ 10, 20 ) 
	15
	60
	100
	225
	900
	13500
	[ 20, 30 )
	25
	75
	175
	625
	1875
	46875
	[ 30, 40 )
	35
	90
	265
	1225
	3150
	110250
	[ 40, 50 )
	45
	105
	370
	2025
	4725
	212625
	[ 50, 60 )
	55
	85
	455
	3025
	4675
	257125
	[ 60, 70 )
	65
	80
	535
	4225
	5200
	338000
	[ 70, 80 )
	75
	65
	600
	5625
	4875
	365625
	Sumatorios
	25600
	1345000
3.4.Asimetria y Curtosis.-
	Hasta ahora se han estudiado los parámetros de centralización y de dispersión que son las medidas más frecuentes que se calculan en cualquier estudio estadístico.
Sin embargo existe también medidas que indican de la simetría o asimetría de la distribución y del achatamiento o no de la misma.
Empezando con la simetría, es lógico pensar que si la distribución tiene una única moda y es simétrica, entonces las tres medidas de centralización coinciden. Si no es simétrica, suele suceder que la mediana esté comprendida entre la moda y la media.
Medidas de simetría o asimetría. Miden la mayor o menor simetría de la distribución. Existen dos medidas de este tipo:
Índice de simetría de Pearson:   
	 
	
	 
	Índice de simetríade Fisher:  
	 
	
	
	 
	Si la distribución es simétrica, ambos índices son iguales a 0; si es asimétrica a la derecha, ambos son positivos; y si es asimétrica a la izquierda, ambos índices son negativos.
Medidas de curtosis. Miden la mayor o menor concentración de datos alrededor de la media. Se suele medir con el coeficiente de curtosis:
	 
	
	 
	 
	Si este coeficiente es nulo, la distribución se dice normal (similar a la distribución normal de Gauss) y recibe el nombre de mesocúrtica.
Si el coeficiente es positivo, la distribución se llama leptocúrtica, más puntiaguda que la anterior. Hay una mayor concentración de los datos en torno a la media.
Si el coeficiente es negativo, la distribución se llama platicúrtica y hay una menor concentración de datos en torno a la media. sería más achatada que la primera.
Ejemplo para la carrera de Ingenieria en Gas y Petroleo:
Determinar qué tipo de curtosis tiene la siguiente distribución: 6, 9, 9, 12, 12, 12, 15 y 17. Que representan las perforaciones que se realizaron en YPFB Andina en 2017 .Emplear la medida de Fisher y el coeficiente percentil de curtosis.
Calculando la media aritmética se obtiene
Calculando la Medida de Fisher se obtiene:
	Datos
	
	6
	915,0625
	9
	39,0625
	9
	39,0625
	12
	0,0625
	12
	0,0625
	12
	0,0625
	15
	150,0625
	17
	915,0625
	Total
	2058,5
3.5.Probabilidad.-
La teoría de la probabilidad es una rama de las matemáticas que estudia los fenómenos aleatorios y estocásticos. Los fenómenos aleatorios se contraponen a los fenómenos deterministas, los cuales son resultados únicos y/o previsibles de experimentos realizados bajo las mismas condiciones determinadas, por ejemplo, si se calienta agua a 100 ºC a nivel del mar se obtendrá vapor. Los fenómenos aleatorios, por el contrario, son aquellos que se obtienen de experimentos realizados, otra vez, bajo las mismas condiciones determinadas pero como resultado posible poseen un conjunto de alternativas, por ejemplo, el lanzamiento de un dado o de una moneda. 
La teoría de probabilidades se ocupa de asignar un cierto número a cada posible resultado que pueda ocurrir en un experimento aleatorio, con el fin de cuantificar dichos resultados y saber si un suceso es más probable que otro. 
Muchos fenómenos naturales son aleatorios, pero existen algunos como el lanzamiento de un dado, donde el fenómeno no se repite en las mismas condiciones, debido a que las características del material hace que no exista una simetría del mismo, así las repeticiones no garantizan una probabilidad definida. En los procesos reales que se modelizan mediante distribuciones de probabilidad corresponden a modelos complejos donde no se conocen a priori todos los parámetros que intervienen; ésta es una de las razones por las cuales la estadística, que busca determinar estos parámetros, no se reduce inmediatamente a la teoría de la probabilidad en sí. 
En 1933, el matemático soviético Andréi Kolmogórov propuso un sistema de axiomas para la teoría de la probabilidad, basado en la teoría de conjuntos y en la teoría de la medida, desarrollada pocos años antes por Lebesgue, Borel y Frechet entre otros. 
Esta aproximación axiomática que generaliza el marco clásico de la probabilidad, la cual obedece a la regla de cálculo de casos favorables sobre casos posibles, permitió la rigorización de muchos argumentos ya utilizados, así como el estudio de problemas fuera de los marcos clásicos. Actualmente, la teoría de la probabilidad encuentra aplicación en las más variadas ramas del conocimiento, como puede ser la física (donde corresponde mencionar el desarrollo de las difusiones y el movimiento Browniano), o la economía (donde destaca el modelo de Black y Scholes para la valuación de acciones). 
La probabilidad constituye un importante parámetro en la determinación de las diversas casualidades obtenidas tras una serie de eventos esperados dentro de un rango estadístico. 
Existen diversas formas como método abstracto, como la teoría Dempster-Shafer y la teoría de la relatividad numérica, esta última con un alto grado de aceptación si se toma en cuenta que disminuye considerablemente las posibilidades hasta un nivel mínimo ya que somete a todas las antiguas reglas a una simple ley de relatividad. 
La probabilidad de un evento se denota con la letra p y se expresa en términos de una fracción y no en porcentajes por lo que el valor de p cae entre 0 y 1. Por otra parte, la probabilidad de que un evento "no ocurra" equivale a 1 menos el valor de p y se denota con la letra q 
P(Q) = 1 – P(E)
P = P ( Q ) = 1 − P ( E ) {\displaystyle P(Q)=1-P(E)}
Los tres métodos para calcular las probabilidades son la regla de la adición, la regla de la multiplicación y la distribución binomial.
Ejemplo:
Se lanzan dos dados al aire y se anota la suma de los puntos obtenidos. Se pide:
1La probabilidad de que salga el 7
2La probabilidad de que el número obtenido sea par
3La probabilidad de que el número obtenido sea múltiplo de tres
Se lanza al aire el dado y se anota los puntos obtenidos. Se pide: 
La probabilidad de que salga 7 :
	1
	2
	3
	4
	5
	6
	6
	5
	4
	3
	2
	1
P(7) = 6/36 = 1/6
La probabilidad de que el número obtenido sea par:
P(par) = 18/36 =1/2
La probabilidad de que el numero obtenido sea múltiplo de tres
	1
	1
	2
	2
	3
	3
	4
	4
	5
	5
	6
	6
	2
	5
	1
	4
	3
	6
	2
	5
	1
	4
	3
	6
 P(par) = 12/36 = 1/3
Ejemplo para la carrera de Ingenieria en Gas y Petroleo:
En el curso de la carrera de ingeniería en gas y petróleo hay 10 alumnas rubias, 20 morenas, cinco alumnos rubios y 10 morenos. Un día asisten 44 alumnos, encontrar la probabilidad de que el alumno que falta:
1Sea hombre
2Sea mujer morena
3Sea hombre o mujer
1.Sea hombre
P(hombre) = 15/45 = 1/3
2.Sea mujer morena
P( mujer morena) = 20/45 = 4/9
3.Sea hombre o mujer
P( hombre U mujer ) = 1
Ejemplo para la carrera de Ingenieria en Gas y Petroleo:
En un sobre hay 20 papeletas de YPFB Andina , ocho llevan dibujado el símbolo del Estado Plurinacional de Bolivia y las restantes son blancas. Hallar la probabilidad de extraer al menos una papeleta con el dibujo del símbolo del Estado Plurinacional de Bolivia.
1Si se saca una papeleta
2Si se extraen dos papeletas
3Si se extraen tres papeletas
Si se saca una papeleta
P(C = 8/20
2Si se extraen dos papeletas
P(C₂) = 1 – P(2B) = 1 – () = 62/ 95
3Si se extraen tres papeletas
P(C₃) = 1 – P(3B) = 1 – () = 46/57
Ejemplo para la carrera de Ingenieria en Gas y Petroleo:
Los estudiantes A y B de Ingenieria en Gas y Petroleo tienen respectivamente probabilidades 1/2 y 1/5 de suspender un examen. La probabilidad de que suspendan el examen simultáneamente es de 1/10. Determinar la probabilidad de que al menos uno de los dos estudiantes de Ingenieria Petrolera suspenda el examen.
Son suceso compatibles
P(A U B) =+ = 3/5
3.5.3.Distribución binomial.-
La probabilidad de ocurrencia de una combinación específica de eventos independientes y mutuamente excluyentes se determina con la distribución binomial, que es aquella donde hay solo dos posibilidades, que se suelen designar como éxito y fracaso. 
1. Hay dos resultados posibles mutuamente excluyentes en cada ensayo u observación.
2. La serie de ensayos u observaciones constituyen eventos independientes.
3. La probabilidad de éxito permanece constante de ensayo a ensayo, es decir el proceso es estacionario.
Para aplicar esta distribución al cálculo de la probabilidad de obtener un número dado de éxitos en una serie de experimentos en un proceso de Bernoulli, se requieren tres valores: el número designado de éxitos (m), el número de ensayos y observaciones (n); y la probabilidad de éxito en cada ensayo (p). Entonces la probabilidad de que ocurran m éxitos en un experimento de n ensayos es: 
Dónde:
 ( n m ) = n ! m ! ( n − m ) ! {\displaystyle {n \choose m}={\frac {n!}{m!(n-m)!}}} Es el número total de combinaciones posibles de m elementos en un conjunto de n elementos. 
Ejemplo para la carrera de Ingenieria en Gas y Petroleo:
Si de seis a siete de la tarde se admite que el valordel calculo de presiones en un pozo petrolero de cada cinco está en los parámetros correctos, ¿cuál es la probabilidad de que, cuando se marquen 10 valores del calculo de las presiones elegidos al azar, sólo estén en los parámetros correctos dos?
B(10, 1/5)
p = 1/5
q = 4/5
P(X = 2) = 0.3020
Ejemplo para la carrera de Ingenieria en Gas y Petroleo:
Un agente de seguros vende a cinco ingenieros de la planta de gas en Bolivia el 2003 de la misma edad y que disfrutan de buena salud. Según las tablas actuales, la probabilidad de que una persona en estas condiciones viva 30 años o más es 2/3. Hállese la probabilidad de que, transcurridos 30 años, vivan:
1.Las cinco personas 
2.Al menos tres personas 
3.Exactamente dos personas
3.5.4. Ley de Poison.-
Ejemplo para la carrera de Ingenieria en Gas y Petroleo:
Si el 5% de los equipos de perforación en el campo VBR-2 (Campo Vibora) de YPFB Andina son defectuosos , determinar que en una muestra de 100 equipos.
a) 7 sean defectuosos.
b) más de 5 sean defectuosos
c) 2 equipos o menos sean defectuosos.
d) entre 1 y 3 equipos inclusive sean defectuosos.
a) 
b) P( x > 5) + P ( x 5) = 1
P ( x = 0 , x = 1 , x = 2 , x = 3 , x = 4 , x = 5 ) = P ( 	x 5 )
P ( x = 0 , x = 1 , x = 2 , x = 3 , x = 4 , x = 5 ) =
P ( x = 0 , x = 1 , x = 2 , x = 3 , x = 4 , x = 5 ) = (1+ 5 + 12.5 + 125/6 + 625/24 + 625/24 )
P ( x = 0 , x = 1 , x = 2 , x = 3 , x = 4 , x = 5 ) = *91.420
P ( x = 0 , x = 1 , x = 2 , x = 3 , x = 4 , x = 5 ) = 0.616
· Por la ley de complemento , segun la siguiente formula:
P( x > 5) + P ( x ≤ 5) = 1
P( x > 5) = 1 - P ( x ≤ 5) 
P( x > 5) = 1 – 0,616
P( x > 5) = 0.384
c) P( x 2) + P ( x < 2) = 1
 P( x 2) = 1 - P ( x = 0 , x = 1)
P( x 2) = 1 –((1+ 5))
P( x 2) = 0.0404
d) P ( 1 = P ( x = 1 , x = 2 , x = 3)
 P ( 1 = 
 P ( 1 = ( 5 + 12.5 + 125/6 )
 P ( 1 = 0.258
3.5.5.Distribucion de variable aleatoria continua ( densidad).-
Una variable aleatoria X es continua si su función de distribución es una función continua.
Donde se corresponden con variables asociadas con experimentos en los cuales la variable medida puede tomar cualquier valor en un intervalo: mediciones biométricas, intervalos de tiempo, áreas, etc.como ejemplo:
· Resultado de un generador de números aleatorios entre 0 y 1. Es el ejemplo más sencillo que podemos considerar, es un caso particular de una familia de variables aleatorias que tienen una distribución uniforme en un intervalo [a, b]. Se corresponde con la elección al azar de cualquier valor entre a y b.
· Estatura de una persona elegida al azar en una población. El valor que se obtenga será una medición en cualquier unidad de longitud (m, cm, etc.) dentro de unos límites condicionados por la naturaleza de la variable. El resultado es impredecible con antelación, pero existen intervalos de valores más probables que otros debido a la distribución de alturas en la población. Más adelante veremos que, generalmente, variables biométricas como la altura se adaptan un modelo de distribución denominado distribución Normal y representado por una campana de Gauss.
Dentro de las variables aleatorias continuas tenemos las variables aleatorias absolutamente continuas.
Diremos que una variable aleatoria X continua tiene una distribución absolutamente continua si existe una función real f, positiva e integrable en el conjunto de números reales, tal que la función de distribución F de X se puede expresar como
Una variable aleatoria con distribución absolutamente continua, por extensión, se clasifica como variable aleatoria absolutamente continua.
En el presente manual, todas las variables aleatorias continuas con las que trabajemos pertenecen al grupo de las variables absolutamente continuas, en particular, los ejemplos y casos expuestos.
Ejemplo para la carrera de Ingenieria en Gas y Petroleo:
La temperatura cuando se perfora en pozo Caranda esta distribuida normalmente con una media de 18.7 °C y una desviación estándar de 5°C . calcule la probabilidad de que la temperatura en el interior del pozo este por debajo de 21°C que esta en los parámetros requeridos en una buena perforación.
Si 
γ = 21°C
𝜇 = 18.7°C
𝜎 = 5 °C
Reemplazando en la formula:
Z = 0.46
Por tablas tenemos:
X = 0.4
Y = 0.06
P( X = 21°C ) = 0.6772
3.5.6.Diseño de la muestra.-
El diseño de la muestra es la fase de un proyecto de generación de estadística básica donde se define el esquema de muestreo a utilizar, se determina el tamaño y procedimiento de selección de la muestra y, en el caso del muestreo probabilístico, se calculan los factores de expansión y los estimadores que se requieren para la generación de resultados. El diseño de la muestra interactúa con otras fases del proceso de generación, como se visLa fase de diseño conceptual y el diseño de la muestra interactúan en doble sentido, debido a que las coberturas conceptual y geográfica influyen en las decisiones sobre el esquema de muestreo, y éste a su vez puede implicar el ajuste del desglose conceptual y geográfico, dado el límite del presupuesto. Además, es en el diseño conceptual en donde se define, en su caso, el diseño de los estimadores necesarios para inferir los resultados hacia la población de estudio.La fase de diseño de la captación y procesa-miento también interactúa en dos sentidos con la fase de diseño de la muestra, dado que la estrategia para el visualiza en el siguiente diagrama:
La interacción se da en lo general de la siguiente forma: La fase de planeación interactúa como condicionante de la fase del diseño de la muestra, esto debido a que define el alcance de los objetivos del proyecto en cuanto a cobertura temática y geográfica, así como las restricciones impuestas por el presupuesto disponible
La fase de diseño conceptual y el diseño de la muestra interactúan en doble sentido, debido a que las coberturas conceptual y geográfica influyen en las decisiones sobre el esquema de muestreo, y éste a su vez puede implicar el ajuste del desglose conceptual y geográfico, dado el límite del presupuesto. Además, es en el diseño conceptual en donde se define, en su caso, el diseño de los estimadores necesarios para inferir los resultados hacia la población de estudio. La fase de diseño de la captación y procesa-miento también interactúa en dos sentidos con la fase de diseño de la muestra, dado que la estrategia para el diseño de captación implica considerar la distribución geográfica de la muestra, en tanto que en el sentido inverso, el diseño de la muestra requiere considerar las opciones idóneas para la captación de los datos, dadas las características del contexto donde se realiza el proyecto.Finalmente, el diseño de la muestra se relaciona con la fase de procesamiento, mediante la entrega de los factores de expansión, las estimaciones y precisiones correspondientes.
La muestra para variable cualitativa :
La muestra para variable cuantitativa:
Donde:
z = nivel de confianza
e = error
N = pobalcion
n = tamaño de la muestra
Ejemplo para la carrera de Ingenieria en Gas y Petroleo:
La empresa YPFB manifiesta que la satisfacción de sus clientes en 2003 fue de 90% y se realizo un nuevo estudio para saber si en la nueva gestion del Ing. Barriga PRIMER EJECUTIVO DE YPFB la empresa esta al agrado de la población para tal estudio se realizo un trabajo del 95% con el nivel de confianza y una significancia del 5% se desea el tamaño de la muestra.
Si:
z = 95%
e = 5%
z = 1.96
p = 50% (éxito)
q = 50% ( fracaso)
N = 10000
· En la formula: 
n = 384.16
n = 384
· Para la población (finita):
n = 369.9
n = 370
· Para el Ajuste:
10000 * 0.05 = 500
500 > 384
· Para la corrección, de la formula:
n = 369.8
n = 370
3.5.7.Chicuadrado.-
Una prueba de chi-cuadrada es una prueba de hipótesis que compara la distribución observada de los datos con una distribución esperada de los datos.Existen varios tipos de pruebas de chi-cuadrada: 
Prueba de bondad de ajuste de chi-cuadrada. Utilice este análisis para probar qué tan bien una muestra de datoscategóricos se ajusta a una distribución teórica.Por ejemplo, usted puede comprobar si un dado es justo, lanzando el dado muchas veces y utilizando una prueba de bondad de ajuste de chi-cuadrada para determinar si los resultados siguen una distribución uniforme. En este caso, el estadístico de chi-cuadrada cuantifica qué tanto varía la distribución observada de los conteos con respecto a la distribución hipotética.
Pruebas de chi-cuadrada de asociación e independencia
Los cálculos para estas pruebas son iguales, pero la pregunta que se está tratando de contestar puede ser diferente. 
· Prueba de asociación: Utilice una prueba de asociación para determinar si una variable está asociada a otra variable. Por ejemplo, determine si las ventas de diferentes colores de automóviles dependen de la ciudad donde se venden. 
· Prueba de independencia: Utilice una prueba de independencia para determinar si el valor observado de una variable depende del valor observado de otra variable. Por ejemplo, determine si el hecho de que una persona vote por un candidato no depende del sexo del elector.
Ejemplo para la carrera de Ingenieria en Gas y Petroleo:
Para la encuesta que se realizo y los datos obtenidos de hombre o mujer:
	GENERO
	ITEMS
	TOTAL
	
	P-1
	P-2
	P-3
	P-4
	P-5
	P-6
	P-7
	P-8
	P-9
	P-10
	
	HOMBRE
	7
	11
	11
	12
	9
	12
	10
	8
	7
	11
	91
	
	8.92
	 8.30
	 9.82
	 10.76
	 8.61
	 9.22
	 9.22
	 8.91
	 8.30
	 8.92
	 
	MUJER
	22
	16
	21
	23
	19
	18
	20
	21
	20
	18
	198
	
	19.40
	18.06
	21.41
	23.41
	18.73
	20.07
	20.07
	19.40
	18.06
	19.40
	 
	TOTAL
	29
	27
	32
	35
	28
	30
	30
	29
	27
	29
	296
8.92
8.30
9.82
 =10,76
 =8.61
 =9.22
 =9.22
 =8.91
 =8.30
 =8.92
19.40
18.06
21.41
 =23.41
 =18.73
 =20.07
 =20.07
 =19.40
 =18.06
 =19.40
∑= 288.99
 > 
Entonces no dependen las respuestas de si las personas son mujeres o varones.
CAPITULO 4. CONCLUSIONES
Se pudo llegar a concluir que el presente trabajo se realizó satisfactoriamente, de esa manera se estudiaron la distribución de frecuencias , los tipos de frecuencia, la distribución de frecuencia agrupadas, el histograma, el polígono de frecuencia , la ojiva , medidas de resumen, la media, la mediana, la moda , los cuartiles , los centiles y los percentiles , asi mismo la asimetría y curtosis , también se realizaron ejercicios de probabilidad con la ley de poison , el diseño de la muestra y por ultimo el chicuadrado , con sus respectivas ecuaciones. La encuesta se realizo satisfactoriamente se encuestaron a 40 personas entre hombres y mujeres , se realizaron las tablas y las graficas correspondientes para cada pregunta llegando a tener un nivel de confianza de 0.76 , que es aceptable.
CAPITULO 5. BIBLIOGRAFIA
https://www.monografias.com/trabajos54/numeros-indices/numeros-indices2.shtml
http://www5.uva.es/estadmed/datos/indices/indices.htm
http://www.fuenterrebollo.com/Economicas2013/indices-teoria.pdf
libro:Estadistica;Victor Chungara Castro, Editorial Leonardo(2016).
https://www.google.com/search?q=dise%C3%B1o+de+la+muestra+para+variable+cualitativa&source=lnms&tbm=isch&sa=X&ved=0ahUKEwjAqqyM6pbjAhWLc98KHcBKC3MQ_AUIECgB&biw=1366&bih=633	
https://es.slideshare.net/.../diapositivas-terminadas-de-estadistica-ii-grupo-n01-471341.com
https://www.smartick.es/blog/matematicas/recursos.../ejercicios-de-probabilidad/
https://www.superprof.es/.../probabilidades/.../ejercicios-y-problemas-de-probabilidad.com
http://proyest1.blogspot.com/p/probabilidad-simple-ejercicios.html
https://www.profesor10demates.com/.../curso-de-probabilidad-con-ejercicios-y.html
¿USTED TIENE CONECCION DE GAS A DOMICILIO? 
PREG1	SI	NO	NO RESP	30	8	2	¿USTED CREE QUE ES UN AVANCE FAVORABLE LA INDUSTRIALIZACION DEL GAS EN BOLIVIA? 
PREG2	SI	NO	NO RESP	28	8	4	¿ESTA CONFORME CON LA ISTALACION DE GAS A DOMICILIO EN SU HOGAR?
PREG3	SI	NO	NO RESP	31	8	1	¿ESTA DE ACUERDO CON QUE LA CONECCION DE GAS A DOMICILIO SEA GRATUITA? 
PREG4	SI	NO	NO RESP	36	4	0	LA CONECCION A GAS SI BIEN ES GRATUITA , SE DEBE PAGAR SI SE PASA LOS 20 METROS ¿ESTARIA DEACUERDO EN PAGAR ESTE MONTO? 
PREG5	SI	NO	NO RESP	26	14	0	¿USTED ESTA CONFORME CON EL MONTO MENSUAL QUE TIENE QUE PAGAR EN LA FACTURA DEL GAS? 
PREG6	SI	NO	NO RESP	29	11	0	¿USTED CREE QUE ES MAS SEGURO TENER GAS A DOMICILIO QUE COMPRAR UNA GARRAFA ? 
PREG7	SI	NO	NO RESP	33	5	2	¿ESTARIA DE ACUERDO EN USAR UN CALEFON PARA QUE SU DUCHA SEA A GAS Y NO ASI A CORRIENTE ELECTRICA? 
PREG8	SI	NO	NO RESP	26	13	1	¿USTED CREE QUE GASTA MUCHO EN LA DUCHA CONECTADA A LA CORRIENTE ELECTRICA? 
PREG9	34	5	1	
¿USTED CREE QUE GASTARIA MENOS SI USA UN CALEFON DE GAS EN SU DUCHA O SI CAMBIA SU CALEFACCION DE CORRIENTE ELECTRICA A GAS ? 
PREG10	SI	NO	NO RESP	27	11	2	HISTOGRAMA
[0, 5)	[5, 10)	[10, 15)	[15, 20)	[20, 25)	[25, 30)	[30, 35)	[35, 40)	[40, 45)	[45, 50)	1	1	3	3	3	6	7	10	4	2	[0, 5)	[5, 10)	[10, 15)	[15, 20)	[20, 25)	[25, 30)	[30, 35)	[35, 40)	[40, 45)	[45, 50)	1	2	5	8	11	17	24	34	38	40	
54
Asignatura: Probabilidad y Estadistica
Carrera: Ingeniería en Gas y Petróleo
PREG 1PREG 2PREG 3PREG 4PREG 5PREG 6PREG 7PREG 8PREG 9PREG 10
TOTAL PREGSEXO
 ENCUESTADOS
 ITEMS
PERSONAS ITEMS
PERSONA 1H551555555546
PERSONA 2M555535535546
PERSONA 3M553555555346
PERSONA 4M555335535544
PERSONA 5M535555355344
PERSONA 6H155533555542
PERSONA 7H555535535344
PERSONA 8M535553535544
PERSONA 9M515555355544
PERSONA 10H535535535544
PERSONA 11M555533555546
PERSONA 12M335555355342
PERSONA 13M355553535544
PERSONA 14M553555533544
PERSONA 15M555355555548
PERSONA 16M555535553344
PERSONA 17M555535555548
PERSONA 18M535553555344
PERSONA 19H355555553546
PERSONA 20M533553555544
PERSONA 21M355535535544
PERSONA 22H555555551546
PERSONA 23H355553555142
PERSONA 24M555555135544
PERSONA 25M533555355342
PERSONA 26M515555555546
PERSONA 27M553553355342
PERSONA 28H555555535548
PERSONA 29H553533555544
PERSONA 30H355555555346
PERSONA 31M555555153544
PERSONA 32M535353555544
PERSONA 33H553355535544
PERSONA 34H115555555542
PERSONA 35M553535555344
PERSONA 36H515555515542
PERSONA 37M555535553546
PERSONA 38H355535535140
PERSONA 39M355535535544
PERSONA 40M555553555346
1,241,760,950,360,910,79751,09751,13750,77751,33753,1775
14H y 26M10,3675SEXO TOTAL
VAR TOTAL
 ENCUESTADOS
VALORESPREG1PREG2PREG3PREG4PREG5PREG6PREG7PREG8PREG9PREG10
SI30283136262933263427
NO88841411513511
NO RESP2410002112
TOTAL40404040404040404040

Otros materiales