Prévia do material em texto
Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios Colección Textos Universitarios Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios Primera edición: junio, 2017 Primera reimpresión: abril, 2018 Tiraje: 700 ejemplares © De esta edición: Universidad de Lima Fondo Editorial Av. Javier Prado Este N.o 4600, Urb. Fundo Monterrico Chico, Lima 33, Perú Apartado postal 852, Lima 100 Teléfono: 437-6767, anexo 30131 fondoeditorial@ulima.edu.pe www.ulima.edu.pe Diseño, edición y carátula: Fondo Editorial de la Universidad de Lima Imagen de portada: Natee K Jindakum / Shutterstock.com Impreso en el Perú Se prohíbe la reproducción total o parcial de este libro, por cualquier medio, sin permiso expreso del Fondo Editorial. ISBN 978-9972-45-392-2 Hecho el depósito legal en la Biblioteca Nacional del Perú n.o 2018- 04506 Estadística descriptiva y probabilidades. Aplicaciones en la ingeniería y los negocios / Rosa Millones, Emma Barreno, Félix Vásquez, Carlos Castillo. Primera edición, primera reimpresión. Lima: Universidad de Lima. Fondo Editorial, 2018. 332 páginas: gráficos, ilustraciones. (Textos Universitarios). Bibliografía: página 311. 1. Estadística descriptiva. 2. Probabilidades (Estadística). 3. Variables aleatorias. 4. Ingeniería - - Estadística aplicada. 5. Negocios - - Estadística aplicada. I. Millones-Rivalles, Rosa, autora. II. Barreno-Vereau, Emma-Virginia, autora. III. Vásquez-Urbano, Félix, autor. IV. Castillo-Crespo, Carlos, autor. V. Universidad de Lima. Fondo Editorial. 519.53 E ISBN 978-9972-45-392-2 Índice 7 Presentación 11 Capítulo 1. Estadística descriptiva 13 1. División de la estadística 15 2. Conceptos básicos 15 3. Descripción tabular y gráfica de variables 17 3.1 Distribución de frecuencias de variable cualitativa 18 3.1.1 Gráfico de barras 18 3.1.2 Gráfico circular 19 3.2 Distribución de frecuencias de variable cuantitativa 25 3.2.1 Distribución de frecuencias de variable cuantitativa discreta 25 3.2.2 Distribución de frecuencias de variable cuantitativa continua 27 3.3 Diagrama de Pareto 38 4. Medidas de tendencia central 40 4.1 Media aritmética (promedio) 41 4.2 Mediana 42 4.3 Moda 42 4.4 Relaciones entre la media, la mediana y la moda 49 5. Medidas de posición 50 5.1 Cuartiles 50 5.2 Percentiles 52 6. Medidas de dispersión 54 6.1 Rango o amplitud 54 6.2 Rango intercuartílico 55 6.3 Varianza 55 6.4 Desviación estándar 56 6.5 Coeficiente de variación 57 7. Medidas de forma 63 7.1 Coeficiente de asimetría 63 7.1.1 Coeficiente de asimetría de Pearson 64 7.1.2 Coeficiente de asimetría de Fisher 64 7.2 Coeficiente de curtosis 64 8. Análisis exploratorio de datos 66 Índice Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios8 8.1 Gráfico de cajas 67 9. Problemas resueltos 71 10. Problemas propuestos 93 Capítulo 2. Probabilidad 107 1. Conceptos básicos 109 1.1 Experimento aleatorio o al azar 109 1.2 Espacio muestral 109 1.3 Suceso 110 1.4 Evento 110 2. Técnicas de conteo 112 2.1 Principio de adición 112 2.2 Principio de multiplicación 113 2.3 Permutaciones 114 2.3.1 Permutaciones de n elementos sin repetición 114 2.3.2 Permutaciones de n elementos sin repetición tomados de k en k 115 2.3.3 Permutaciones con elementos iguales 116 2.4 Combinaciones 117 3. Probabilidad 119 3.1 Introducción 119 3.2 Probabilidad clásica o a priori 119 3.3 Probabilidad relativista 121 3.4 Definición axiomática 122 4. Teoremas de probabilidad 123 4.1 Probabilidad condicional 123 4.2 Teorema de la multiplicación 124 4.3 Teorema de la probabilidad total 125 4.4 Teorema de Bayes 125 4.5 Probabilidad de eventos independientes 128 5. Problemas resueltos 132 6. Problemas propuestos 151 Capítulo 3. Variable aleatoria 157 1. Definición 159 2. Tipos de variables aleatorias 161 2.1 Variable aleatoria discreta 161 2.1.1 Definición 161 2.1.2 Función de probabilidad de una variable aleatoria discreta 161 2.1.3 Función de distribución 164 2.2 Variable aleatoria continua 167 2.2.1 Definición 167 2.2.2 Función de densidad de probabilidad de una variable aleatoria continua 167 2.2.3 Función de probabilidad acumulativa (distribución) 170 Índice 9 3. Esperanza matemática y varianza de una variable aleatoria 171 3.1 Esperanza matemática 171 3.1.1 Definición 171 3.1.2 Propiedades 171 3.2 Varianza 175 3.2.1 Definición 175 3.2.2 Propiedades 175 4. Interpretación de la esperanza matemática, varianza y coeficiente de variación de una variable aleatoria 178 5. Problemas resueltos 181 6. Problemas propuestos 199 Capítulo 4. Distribuciones de probabilidad 207 1. Distribuciones de probabilidad 209 2. Distribuciones de probabilidad de variables aleatorias discretas 209 2.1 Distribución de Bernoulli 209 2.2 Distribución binomial 210 2.3 Distribución hipergeométrica 215 2.4 Distribución de Poisson 221 3. Distribuciones de probabilidad de variables aleatorias continuas 225 3.1 Distribución uniforme continua 225 3.2 Distribución triangular 229 3.3 Distribución normal 231 3.4 Distribución exponencial 240 3.5 Distribución gamma 242 3.6 Relación entre las distribuciones de Poisson, exponencial y gamma 245 3.6.1 Relación de la distribución de Poisson con la distribución exponencial 245 3.6.2 Relación de la distribución de Poisson con la distribución gamma 246 3.7 Distribución de Weibull 246 3.8 Distribución ji-cuadrado 250 3.9 Distribución t de Student 254 3.10 Distribución F de Fisher-Snedecor 256 4. Problemas resueltos 260 5. Problemas propuestos 282 Respuestas a los problemas propuestos 299 Bibliografía 311 Anexos Anexo 1: Resumen de fórmulas de estadística descriptiva 315 Anexo 2: Resumen de fórmulas de probabilidad 316 Anexo 3: Distribuciones notables de probabilidad 317 Presentación 11 Presentación En el mundo actual es imprescindible el uso de herramientas estadísticas que faciliten el procesamiento y comprensión de la información para así desarrollar un pensamiento reflexivo y analítico asociado a la realidad en diversos aspectos del ámbito profesional y social. Para ello, mediante el proceso de enseñanza- aprendizaje, se deben aplicar estrategias que permitan al alumno desarrollar su capacidad para enfrentar con éxito situaciones problemáticas, sintetizándolas en un lenguaje simbólico y gráfico para su mejor resolución. El propósito de este libro es proporcionar a los estudiantes que cursan una primera asignatura de estadística y probabilidad los conocimientos y nociones básicas en esta materia de una manera ágil y de fácil comprensión, a través de nu- merosos y variados ejemplos y problemas resueltos, gran parte de ellos mediante el uso de programas. Al final de cada capítulo se ha incluido un conjunto de pro- blemas propuestos como una herramienta pedagógica que permita desarrollar las habilidades del alumno afianzando los nuevos conocimientos adquiridos y preparándolo para que pueda resolver problemas similares que se le presenten en su vida profesional, tanto en el ámbito de la ingeniería y sus procesos, así como en los negocios y la actividad empresarial. Entendemos que resolver pro- blemas es una habilidad que se adquiere con la práctica, como los deportes, y mediante la metodología propuesta en el presente libro se brinda un sustento y ayuda para que el alumno desarrolle su razonamiento estadístico, el cual le permitirá solucionar los retos que se le presenten en su quehacer profesional. El desarrollo de diversos casos prácticos se puede encontrar en la siguiente dirección electrónica: http://downloads.ulima.edu.pe/fondoeditorial/libros/estaddescr Los temas y la casuística expuestos están basados en los apuntes de clases, así como en la experiencia acumulada, a través de muchos años, dictando la asigna- tura de Estadística y Probabilidad en la Escuela de Ingeniería de la Universidad de Lima. Todas las imágenes y tablas son materiales originales creados por los autores, salvoindicación expresa de lo contrario; con respecto a las capturas, de no indi- carse lo contrario, estas corresponden al software Minitab. El capítulo 1 comprende las definiciones básicas, la organización, tabulación y presentación de datos; las medidas estadísticas de resumen y el análisis ex- ploratorio de datos. Las técnicas de conteo, el cálculo de probabilidades y los teoremas de probabilidad son abordados en el capítulo 2. En el capítulo 3 se desarrolla el tema de distribución de probabilidad de una variable aleatoria, así como la esperanza y varianza que caracterizan a dicha distribución. Finalmente, en el capítulo 4 se consideran las distribuciones especiales de probabilidad. Expresamos nuestro agradecimiento a las autoridades de la Escuela de Inge- niería que han hecho posible la publicación del presente libro que será de gran utilidad para nuestros alumnos y el público interesado. Los autores La estadística es una ciencia necesaria y útil en toda carrera profesional, ya que las técnicas y procedimientos estadísticos son aplicables a características de diferente naturaleza, como, por ejemplo: la ocurren- cia de fallas en un dispositivo, las ventas diarias de una empresa, entre otras. Los datos estadísticos se caracterizan por ser aleatorios, ya que el dato es inesperado y casual; inciertos, es decir, no se tiene cono- cimiento del valor que puede tener; y varia- bles, no constantes. Para la comprensión de los datos estadísticos se debe partir por la organización, presentación y resumen de los mencionados datos. Sabes Capacidades adquiridas 9 Comprender los conceptos básicos de la estadística. 9 Clasificar los tipos de variables. 9 Organizar y representar los datos en forma tabular y gráfica. 9 Calcular las medidas resumen. 9 Determinar la forma de distribución de los datos. Piensas Competencias por lograr 9 Diferenciar entre la estadística descriptiva e inferencial. 9 Utilizar las tablas y gráficas adecua- das según el tipo de variable. 9 Reconocer las situaciones de uso de las diferentes medidas resumen. Haces Habilidades por desarrollar 9 Resumir grandes volúmenes de datos. 9 Aplicar las propiedades de las princi- pales medidas resumen. 9 Interpretar las medidas resumen de acuerdo al contexto de análisis Secciones 1. División de la estadística 2. Conceptos básicos 3. Descripción tabular y gráfica de variables 4. Medidas de tendencia central 5. Medidas de posición 6. Medidas de dispersión (variabilidad) 7. Medidas de forma 8. Análisis exploratorio de datos Conocimientos previos Teoría de conjuntos, manejo de notación matemática. Estadística descriptiva Capítulo 1 Capítulo 1. EstadístiCa dEsCriptiva 15 1. División De la estaDística La estadística se divide en dos grandes ramas: la estadística descriptiva y la estadística inferencial. a. La estadística descriptiva se encarga de la recopilación, organización y presentación de los datos. b. La estadística inferencial se ocupa de analizar e interpretar los resultados de la muestra para generalizarlos a la población que generó la muestra y así tomar decisiones al respecto. La estadística inferencial utiliza concep- tos de probabilidad para realizar el análisis de los datos. En este capítulo se presentan las técnicas de la estadística descriptiva, cuyo objetivo es describir gráfica y numéricamente un conjunto de datos. La esta dística descriptiva aplicada a un conjunto de datos es utilizada para conocer de manera aproximada lo que ocurre en la población, de la que se seleccionó la muestra, en cuanto a su forma (varianza, asimetría, curtosis) y posición (media, mediana, moda). 2. conceptos básicos En esta sección se plantean los conceptos que se usarán frecuentemente en el resto del libro. a. Unidad de análisis. Corresponde a la entidad representativa que será ob- jeto de análisis, el “qué” o “quién” es objeto de interés en un estudio. Pre- sentan una o más características observables de interés. Una unidad de análisis podría ser, por ejemplo, un residente de Lima Metropolitana, una vivienda del distrito de Lince, una microempresa del cono este de Lima Metropolitana, entre otros. Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios16 b. Población. Se refiere al conjunto total de unidades de análisis correspon- dientes al estudio que se desea realizar, de los cuales se desea describir su comportamiento y/u obtener conclusiones. La cantidad total de unidades de análisis que tiene una población es denotada por N. c. Muestra. Una muestra es un subconjunto de la población, y debe ser re- presentativa y aleatoria. La muestra es representativa si lo que se necesita conocer de la población está presente en la muestra, es decir, si los datos asociados a la muestra se asemejan a la población en estudio; y es aleatoria porque los datos registrados fueron obtenidos de manera espontánea sin preferencia alguna. Se trabaja a partir de muestras para: i. Reducir el costo y el tiempo de recopilación de datos. ii. Disminuir o eliminar los errores asociados a la manipulación de datos, etc. La cantidad total de observaciones que tiene una muestra es deno tada por n. d. Variable. Una variable es una característica de interés, y se denota prefe- rentemente por cualquiera de las últimas letras del alfabeto. Las variables se pueden clasificar como: i. Cualitativas (Categóricas): Los valores de esta variable corresponden a propiedades, atributos, cualidades, etc. Estas variables se determinan por observación, y a su vez se pueden subdividir en: • Cualitativa nominal: los valores o categorías de esta variable son atributos que no presentan ningún tipo de ordenación o jerarquía. • Cualitativa ordinal: los valores o categorías de esta variable son atri- butos, pero responden a un orden o jerarquía. ii. Cuantitativas: Los valores de esta variable corresponden a valores nu- méricos. Estas variables se determinan por conteo o medición, y a su vez se pueden subdividir en: • Cuantitativa discreta. Se presenta cuando el registro de la variable es resultado de un proceso de conteo, y se representan mediante números naturales, los cuales forman un conjunto finito o infinito numerable. Ejemplos de variables cuantitativas discretas son la can- tidad de televisores que existen en una vivienda familiar, el número de pasajeros que transporta diariamente un bus del Metropolitano. • Cuantitativa continua. Una variable numérica es cuantitativa conti- nua si el valor de la variable se obtiene por medición o comparación con un patrón de medida; pueden adoptar cualquier valor dentro de un rango y se expresa mediante números reales. Ejemplos de este tipo de variable son el ingreso mensual de un ejecutivo, el tiempo de atención en ventanilla de una agencia bancaria, entre otros. e. Parámetro. Es una medida que resume y describe a una característica de la población; su valor se calcula usando todos los datos de la pobla- Capítulo 1. EstadístiCa dEsCriptiva 17 ción. Los parámetros se denotan usando letras griegas (µ, p, s, etc.). En la mayoría de los problemas de análisis de datos, los valores de los pa- rámetros no son conocidos. Ejemplo: media poblacional del consumo mensual de combustible (µ), proporción poblacional de ejecutivos con grado académico de doctor (p), entre otros. f. Estadístico. Un estadístico es una función definida sobre la muestra; me- diante el valor del estadístico se busca conocer el posible valor del pará- metro. El estadístico se caracteriza porque su valor cambia de muestra a muestra, es decir, no es constante, y se espera que su valor difiera muy poco de su respectivo parámetro poblacional. Los estadísticos se denotan por letras latinas: ,x p, s, etc. Ejemplo: media muestral del ingreso men- sual de los practicantes universitarios ( ),x proporción muestral de clientes satisfechos (p), entre otros. En la figura 1 se representa la relación entre población y muestra. 3. Descripción tabular y gráficaDe variables La toma de decisiones depende del análisis de una gran cantidad de datos. Si este conjunto de datos u observaciones no tiene un orden determinado es casi imposible analizarlo. Esto motiva el estudio de procedimientos que resuman la información; en la ejecución de este proceso de resumen se origina un error Figura 1. Relación entre población y muestra. Población de tamaño N Muestra de tamaño N Parámetros: µ : Media poblacional Estadísticos: ,x : Media muestral s2 : Varianza poblacional s2 : Varianza muestral Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios18 (pérdida de información) que debe ser el menor posible. Por otro lado, la des- cripción numérica y gráfica de las variables depende de su tipo; esto significa que cada tipo de variable tiene su particular descripción numérica, así como su propia gráfica. Esta última debe trasmitir en forma clara y precisa la informa- ción que poseen los datos acerca de la población en estudio. 3.1 Distribución de frecuencias de variable cualitativa La descripción numérica de una variable cualitativa, nominal u ordinal, es rea- lizada con la denominada “tabla de distribución de frecuencias”, la cual se abre- viará como TDF. Sea X una variable cualitativa (nominal u ordinal) con k categorías, las cuales son observadas a partir de una muestra de n unidades de análisis; las diferentes categorías de esta variable pueden organizarse de la forma que se aprecia en la tabla 1: Categorías de la variable (Ci) Conteo de observaciones (Oi) Porcentaje (%) (Pi) C1 O1 P1 C2 O2 P2 : : : Ck Ok Pk Total n 100 % Donde: Oi: Número de datos observados en la i-ésima categoría. La suma de los conteos es igual al tamaño de la muestra: 1= =∑ k i i O n. Pi: Porcentaje de datos observados en la i-ésima categoría, respecto al tamaño de muestra: 100= ii O P n %. La suma de los porcentajes es igual a 100 % : 1 100 = =∑ k i i P %. La descripción gráfica de las variables cualitativas puede ser realizada mediante barras (horizontales, verticales), gráficas circulares, entre otros, y permitirán revelar en forma visual los patrones de comportamiento de la variable bajo estudio. 3.1.1 Gráfico de barras Un gráfico de barras es un conjunto de barras (horizontales o verticales) que tienen las siguientes características: a. La cantidad de barras debe ser igual al número de categorías de la variable, deben ser estas categorías mutuamente excluyentes. Tabla 1. Estructura de una TDF para una variable cualitativa. Capítulo 1. EstadístiCa dEsCriptiva 19 b. La altura de cada barra representa al conteo o porcentaje de cada categoría, y el ancho debe ser igual para todas. Las barras deben estar igualmente espaciadas. c. Debe ser fundamentalmente ilustrativo, es decir, tratar de trasmitir al usua- rio, gráficamente y de la mejor forma posible, lo que está ocurriendo en la muestra. 3.1.2 Gráfico circular Un gráfico circular es un círculo dividido en sectores de manera proporcional al conteo o porcentaje de las observaciones. Las características de un gráfico circular son: a. La cantidad de sectores circulares debe ser igual al número de cate gorías de la variable, ellos deben ser mutuamente excluyentes. b. El tamaño de cada sector circular es proporcional al total de la muestra. CASO: Puntualidad de pago de clientes El gerente de una tienda por departamentos ha recopilado datos correspon- dientes a 250 clientes activos que poseen una tarjeta de crédito emitida por la tienda; las variables consideradas para el estudio son las siguientes: Género: Género del cliente Edad: Edad del cliente I. Familiar: Ingreso familiar mensual del cliente L. Crédito: Línea de crédito del cliente Zona: Zona de análisis donde reside el cliente: Lima o Provincias D. Efectivo: Si el cliente ha realizado o no disposición de efectivo durante los últimos 3 meses. N° Visitas: N.° de visitas, en las cuales hizo uso de su tarjeta de crédito, en los últimos 3 meses. M. Compras: Monto de compras, en soles, del cliente durante los últimos 6 meses. M. Ofertas: Monto de compras, en soles, correspondiente a ofertas duran- te los últimos 6 meses. Clasificación: Clasificación del cliente de acuerdo a su puntualidad históri- ca de pagos de la tarjeta: Puntual Anticipado (P. A.), Puntual (P), Impuntual (I) Los datos recopilados se presentan en el archivo del software Minitab Clientes.mtw, y serán de utilidad para algunos ejemplos brindados en el presente capítulo. Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios20 Ejemplo 1 En el archivo Clientes.mtw, a partir de los datos correspondientes a la cla- sificación de acuerdo a la puntualidad en los pagos de los 250 clientes en análisis, realice lo siguiente según se indique: a. Obtenga la tabla de distribución de frecuencias. Solución i. Ingresar a Stat> Tables> Tally Individual Variables (véase la figura 2). ii. Seleccionar la variable Clasificación, y elegir las opciones Counts y Percents (véase la figura 3). Figura 2. Acceso al comando Tally Indi- vidual Variables. Figura 3. Cuadro de diálogo del coman- do Tally Individual Variables. Capítulo 1. EstadístiCa dEsCriptiva 21 iii. Presionar el botón OK, luego de lo cual se obtendrá el siguiente reporte: Tally for Discrete Variables: Clasificación Clasificación Impuntual Puntual Puntual anticipado N = Count 55 32 163 250 Percent 22.00 12.80 65.20 Nota: En el reporte obtenido la etiqueta Count representa a los conteos, es decir, al número de clientes correspondientes a cada clasificación, mien- tras que Percent representa a los porcentajes correspondientes. Adecuando las etiquetas se podría tener la siguiente tabla: Clasificación (Ci) Conteo de clientes (Oi) Porcentaje de clientes (%) (Pi) Impuntual 35 22.0 Puntual 32 12.8 Puntual anticipado 163 65.2 Total 250 100 Interpretación: El 22 % de los clientes presentan un pago impuntual, 12 8. % presentan un pago puntual, mientras que un 65 2 . % realizan un pago puntual anticipado. b. Elabore el gráfico de sectores asociados a la variable de estudio. Solución i. Ingresar a Graph> Pie Chart… ii. Elegir la opción Chart count of unique values y seleccionar la variable Clasificación. iii. Presionar el botón Labels… iv. Pulsar sobre la pestaña Slice Labels y seleccionar Category name, Frequency, y Percent (véase la figura 4). Tabla 2. TDF para la variable Clasificación. Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios22 Nota: Si se desea personalizar el título de la gráfica se debe ingresar a la pestaña Titles/Footnotes. v. Presionar el botón OK, se obtendrá el gráfico de sectores, y luego de borrar la leyenda, quedará como se muestra en la figura 5. Pie Chart of Clasificación Puntual anticipado 163, 65.2 % Impuntual 55, 22.0 % Puntual 32, 12.8 % Ejemplo 2 En el archivo Clientes.mtw, a partir de los datos correspondientes al ingreso familiar de los clientes en análisis, realice lo siguiente: a. Codifique los ingresos familiares de acuerdo al siguiente criterio: Menos de S/ 2800 : < S/ 2800 De S/ 2800 a menos de S/ 3600 : S/ 2800 – S/ 3600 De S/ 3600 a menos de S/ 4400 : S/ 3600 – S/ 4400 De S/ 4400 a menos de S/ 5200 : S/ 4400 – S/ 5200 De S/ 5200 a más: > = S/ 5200 Figura 4. Cuadro de diálogo del comando Pie Chart: Labels. Figura 5. Gráfico de sectores correspon- diente a la variable Clasificación. Capítulo 1. EstadístiCa dEsCriptiva 23 Solución i. Ingresar a Data> Code> To Text… ii. En Code values in the following columns, seleccionar I. Familiar iii. En Method, seleccionar Code range of values e ingresar los valores de referencia. iv. En Endpoints to include, seleccionar Lower endpoint only de tal forma que el intervalo considere solamente el límite inferior (intervalo cerrado a la izquierda). v. En Storage location for the coded columns, seleccionar In specifiedcolumns of the current worksheet. En Columns, señalar la columna C12. Todo lo señalado se puede apreciar en la figura 6. vi. Presionar el botón OK, luego de lo cual, en la columna C12, se alma- cenarán los resultados de la codificación realizada. Si se desea, se puede asignar una etiqueta a la columna C12, tal como por ejemplo Intervalo ingresos. Figura 6. Cuadro de diálogo del comando Code: To Text. Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios24 b. Elabore el gráfico de barras para los resultados de la codificación realizada. Solución i. Ingresar a Graph> Bar Chart… ii. En Bars represent, seleccionar la opción Counts of unique values. Seleccionar el gráfico Simple. Presionar el botón OK. iii. En Categorical variables seleccionar la variable ya codificada Inter valo ingresos. iv. Presionar el botón Chart Options. En Percent and Accumulate, seleccionar la opción Show Y as Percent. Presionar OK. v. Presionar el botón Labels... vi. Seleccionar la pestaña Data Labels y seleccionar Use Y-value labels. Presionar OK (Véase la figura 7). vii. Presionar el botón OK, luego de lo cual se obtendrá el gráfico de barras respectivo tal como se muestra en la figura 8. Figura 8. Gráfico de barras correspondiente a la variable Intervalo ingresos. Figura 7. Cuadro de diálogo del comando Bart Chart: Labels. Capítulo 1. EstadístiCa dEsCriptiva 25 3.2. Distribución de frecuencias de variable cuantitativa En la sección 2 se mencionó que las variables cuantitativas pueden ser discretas o continuas, las cuales presentan una diferente estructura en su tabla de distri- bución de frecuencias. En la interpretación de la distribución de frecuencias de variable cuantitativa y de su correspondiente gráfica deben tenerse presente los siguientes aspectos: a. Simetría de la distribución. b. Variabilidad de los datos. c. Presencia de valores discordantes o extremos (outliers) Aspectos que se explicarán en los puntos posteriores del presente capítulo. 3.2.1 Distribución de frecuencias de variable cuantitativa discreta Sea X una variable cuantitativa discreta, conformadas por k valores diferentes: x1, x2, …, xk–1, xk ; observados a partir de una muestra de tamaño n. Los diferentes valores de la variable pueden organizarse de la forma que se aprecia en la tabla 3: Variable (Xi) Frecuencia Absoluta (fi) Frecuencia absoluta acumulada (Fi) Frecuencia relativa porcentual (hi%) Frecuencia relativa porcentual acumulada (Hi%) x1 f1 F1 = f1 h1 H1= h1 x2 f2 F2 = f2 + F1 h2 H2 = h 2 + H1 : : : : : xk–1 fk–1 Fk–1 = fk–1 + Fk–2 hk–1 Hk–1 = hk–1 + Hk–2 xk fk Fk = fk + Fk–1 = n hk Hk = hk + Hk–1 = 100 % Total n 100 % Donde: fi : Conteo de datos observado por cada valor de la variable. La suma de las frecuencias absolutas es igual al tamaño de la muestra (n): 1 k i i f n. = =∑ hi%: Porcentaje de datos observado por cada valor de la variable. La suma de las frecuencias relativas es igual a la unidad: 1 1 = =∑ k i i h . Generalmente se expresan en porcentaje, entonces la suma es igual al 100 %. Fi: Se obtiene sumando las frecuencias absolutas de los valores inferiores o iguales al valor indicado de la variable. Entonces: 1= = ∑ i j j iF f . La última frecuencia absoluta acumulada es igual al tamaño de la muestra (n). Hi%: Se obtiene sumando las frecuencias relativas de los valores inferiores o iguales al valor indicado de la variable. Entonces: 1= ∑= i j j iH h% %. La última frecuencia relativa acumulada es igual al 100 %. Tabla 3. Estructura de una TDF para variable cuantitativa discreta. Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios26 3.2.1.1 Gráfico de bastones El gráfico de bastones es similar a un gráfico de barras utilizado para repre- sentar una variable cualitativa, pero en lugar de una barra se utiliza una línea, también llamada bastón, con una altura que sería proporcional a la frecuencia absoluta o relativa que se desee representar. Ejemplo 3 En el archivo Clientes.mtw se dispone de los datos correspondientes al nú- mero de visitas a la tienda por departamentos en las cuales los clientes hicie- ron uso de su tarjeta de crédito, durante los últimos 3 meses. A partir de los mencionados datos realice lo que se solicite. a. Obtenga la tabla de distribución de frecuencias. Solución i. Ingresar a Stat> Tables> Tally Individual Variables… ii. Seleccionar la variable N.° Visitas, y elegir las opciones Counts, Percents, Cumulative counts, y Cumulative percents. iii. Presionar el botón OK para obtener el siguiente reporte. Tally for Discrete Variables: N° Visitas N° Visitas Count Percent CumCnt CumPct 2 24 9.60 24 9.60 3 17 6.80 41 16.40 4 26 10.40 67 26.80 5 47 18.80 114 45.60 6 34 13.60 148 59.20 7 34 13.60 182 72.80 8 25 10.00 207 82.80 9 32 12.80 239 95.60 10 11 4.40 250 100.00 N= 250 Nota: La etiqueta CumCnt representa la frecuencia absoluta acumulada, y CumPct a la frecuencia relativa acumulada expresada en porcentaje. Interpretaciones: • f2: 17 clientes, durante los 3 últimos meses, han realizado 3visitas a la tienda. • F5: 148 clientes, durante los 3 últimos meses, han realizado hasta 6 visitas a la tienda. • h3%: 10 40 . % de los clientes, durante los 3 últimos meses, ha rea - lizado 4 visitas a la tienda. • H4%: 45 60. % de los clientes, durante los 3 últimos meses, ha realizado hasta 5 visitas a la tienda. Capítulo 1. EstadístiCa dEsCriptiva 27 b. Elabore el gráfico de bastones para el número de visitas. Solución i. Ingresar a Graph> Bar Chart… ii. En Bars represent, seleccionar la opción Counts of unique values. Seleccionar el gráfico Simple. Pulse el botón OK. iii. Seleccionar la variable N.° Visitas. iv. Presionar el botón Chart Options, en Percent and Accumulate selec- cionar la opción Show Y as Percent. Hacer clic en OK. v. Presionar el botón Labels… vi. Seleccionar la pestaña Data Labels y Seleccionar Use y-value labels. Pulsar OK. vii. Seguidamente, Presionar el botón Data View…, desmarcar la opción Bars y Seleccionar la opción Project lines. Pulsar OK. viii. Presionar el botón OK, luego de lo cual se obtendrá el gráfico de bas- tones correspondiente tal como se muestra en la figura 9. Si la variable cuantitativa discreta a representarse en forma tabular o gráfica posee una gran cantidad de valores distintos, entonces esta puede ser trabajada como si fuera una variable cuantitativa continua; cuyo procedimiento se detalla a continuación. 3.2.2 Distribución de frecuencias de variable cuantitativa continua Los siguientes términos básicos deben tenerse presente para la descripción nu- mérica y gráfica de una variable cuantitativa discreta con muchos valores y de una variable cuantitativa continua (datos agrupados): Figura 9. Gráfico de bastones correspon- diente a la variable Número de visitas. Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios28 a. Clase: es el conjunto de valores agrupados de la muestra de acuerdo a cierto criterio. b. Intervalo de clase: es el intervalo que contiene a la clase; en el presente texto se trabajarán con intervalos cerrados por la izquierda y abiertos por la derecha: … …〉 [ , . c. Límite superior de clase: límite superior del intervalo de clase; se denota por LS. d. Límite inferior de clase: límite inferior del intervalo de clase; se denota por LI. e. Amplitud de la clase: es el ancho del intervalo, determinado por la di- ferencia entre el límite superior e inferior de la clase. Se trabajarán con intervalos de igual amplitud; se denota por C. f. Marca de clase (yi): La marca de clase es el punto medio del intervalo de clase. Si las clases de una distribución tienen el mismo ancho o amplitud, el intervalo de clase común, denominado intervalo de clase de la distribución; por lo tanto, la diferencia entre dos marcas de clase consecutivases igual a la amplitud. La estructura de la distribución de frecuencias para este tipo de variable se aprecia en la tabla 4: Intervalo (i) Marca de clase (yi) Frecuencia absoluta (fi ) Frec. Absoluta acumulada (Fi ) Frec. Relativa porcentual (hi%) Frec. Relativa porcentual acumulada (Hi%) 1 y1 f1 F1 = f1 h1 H1 = h1 2 y2 f2 F2 = f2 + F1 h2 H2 = h2 + H1 : : : : : : k yk fk n = fk +Fk–1 hk 100 %= hk + Hk –1 Total n 100 % Donde: fi, hi%, Fi y Hi% , se encuentran asociados al i-ésimo intervalo de clase en los que se han dividido los valores de la variable, y representan lo mismo que lo señalado en la TDF para variable cuantitativa discreta. Las consideraciones a tomarse en cuenta en la construcción de una tabla de frecuencias de datos agrupados son: a. Cada observación debe ser estar contenida solo en una clase, es decir, las clases deben ser mutuamente excluyentes. b. En lo posible, las clases deben tener la misma amplitud. c. Tener presente que las marcas de clase representan a todos los valores contenidos en sus respectivas clases. Tabla 4. Estructura de una TDF para variable cuantitativa continua. Capítulo 1. EstadístiCa dEsCriptiva 29 A continuación, se presenta el procedimiento para la construcción de la distribución de frecuencias asociada a la variable cuantitativa continua: Paso 1. Calcular el valor del rango, recorrido o amplitud de los datos con la siguiente fórmula: R = Valor máximo – Valor mínimo Nótese que el rango indica la distancia numérica que separa al valor mínimo hasta el valor máximo de las observaciones. Paso 2. Calcular el número de intervalos (clases) k usando la regla de Sturges, la fórmula es: 101 3 32=k + log n. ( ) El valor de k es común redondearlo al entero más cercano; por ejemplo, para 60=n , resulta 6 8678 7= ≈k . . Lo que se busca en este paso es determinar la can- tidad apropiada de clases en que se debe dividir el rango de datos R. La regla de Sturges no es recomendable utilizarla de manera irrestricta porque proporciona valores de k inapropiados en algunos casos. Un valor pequeño de k condensa excesivamente los datos, perdiéndose información. Por otro lado, un valor gran- de de k, no permite conocer el patrón de comportamiento de las observaciones. Paso 3. Calcular la amplitud de la clase C usando la siguiente fórmula: = RC k Debe tratarse de que C tenga el mismo número de posiciones decimales que poseen los datos. Para facilitar las comparaciones, es preferible trabajar con un valor de C constante para todos los intervalos, salvo en aquellos casos que por la naturaleza misma de los datos no puede hacerse. Verificar que se cumple la condición ≥C k R( )( ) ; lo cual asegura que ninguna observación quede fuera de la distribución de frecuencias. Paso 4. Construir la tabla de distribución de frecuencias considerando el valor mínimo como el límite inferior de la primera clase a distribución de frecuencias. A este límite inferior se le debe agregar el valor de C para obtener el límite su- perior. El límite superior de la primera clase es el límite inferior de la siguiente clase. Continuar agregando C hasta la última clase que señala k. Tenga presente que la interpretación de las clases es cerrada a la izquierda y abierta a la derecha, a excepción del último intervalo que puede ser cerrado por ambos extremos. Figura 10. Rango de un conjunto de datos.Valor mínimo Valor máximo Amplitud Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios30 La distribución de frecuencias presenta el número de observaciones de la muestra que caen dentro de cada una de las clases. El término distribución de frecuencias se abrevia normalmente como distribución. ¿Para qué se estudia la distribución de frecuencias? En estadística, el objeti- vo principal es conocer la población que generó la muestra. Al construir la distribución de frecuencias se busca conocer (estimar) el comportamiento de los datos poblacionales de tal forma que podamos extraer (usando los datos muestrales previamente colocados en la distribución de frecuencias) algunas conclusiones con respecto a lo que realmente ocurre en la población. Los tipos de gráficos más importantes de una tabla de frecuencias de datos agrupados son: a. Histogramas b. Polígono de frecuencias relativas 3.2.2.1 Histograma El histograma es un conjunto de rectángulos, todos ellos, generalmente, del mis- mo ancho (C), y con una altura proporcional a la frecuencia absoluta o relativa. En otras palabras, el área de cada rectángulo, en relación con todos los otros, muestra la proporción del número total de observaciones que ocurren en esa clase. Un histograma que usa las frecuencias relativas, recibe el nombre de histograma de frecuencias relativas, y tiene la misma forma que el histograma de frecuencias absolutas. El procedimiento para la construcción de un histograma es: 1. Trazar dos ejes, un eje para las marcas de clase yi (eje X) y el otro para las frecuencias absolutas o frecuencias relativas. 2. Trazar rectángulos para cada una de las clases consideradas en la tabla de frecuencias, con ancho igual al C y largo proporcional a la frecuencia absoluta (fi) o relativa porcentual (hi%). Los rectángulos, a diferencia del diagrama de barras para variables cualitativas, deben ser adyacentes, es decir, cada barra debe estar junta a la que precede o antecede. En la figura 12 se presentan algunos tipos de histogramas. Figura 11. Clases y sus límites. Valor mínimo Valor máximo Amplitud Clase 2 Clase 3 Clase 4 Límite inferior de la clase Límite superior de la clase Capítulo 1. EstadístiCa dEsCriptiva 31 10 0 10 0 10 0 10 0 10 0 10 0 10 0 10 0 10 0 10 0 10 0 10 0 10 0 10 0 10 0 10 0 10 0 10 0 10 0 Histogramas normales Histogramas de doble pico 10 0 10 0 10 0 10 0 10 0 10 0 10 0 10 0 100 10 0 10 0 10 0 Histogramas con islas aisladas Histogramas “Cliff” (Precipicio) 10 0 10 0 10 0 10 0 10 0 10 0 10 0 10 0 10 0 10 0 10 0 10 0 10 0 10 0 10 0 10 0 10 0 10 0 10 0 10 0 10 0 Histograma “rueda dentada” El histograma de la muestra debe tener una distribución cuya forma es muy similar a aquella de la población de la cual se tomó la muestra. La principal ventaja del histograma de frecuencias relativas es que permite comparar datos de diferentes tamaños de muestra. 3.2.2.2 Polígono de frecuencias (absolutas o relativas) El procedimiento para la construcción de un polígono de frecuencias (absolutas o relativas) consiste en unir mediante líneas rectas los pares de valores de mar- cas de clase y frecuencias absolutas o relativas: (yi, fi) o (yi, hi%) respectivamente. Luego, añadir clases, con frecuencia cero, en cada extremo de la escala de marcas de clase para cerrar la gráfica y de esta manera obtener el polígono de frecuen- cias. Las principales ventajas de un polígono de frecuencias son: a. Es una representación más sencilla y clara que su histograma correspondiente. b. Ofrece un esquema más claro del patrón de datos. c. El polígono se vuelve cada vez más suave y curvo a medida que crece el número de clases y de observaciones. d. El polígono de frecuencias relativas es utilizado para comparar la distri- bución de frecuencias correspondientes a dos o más poblaciones. Figura 12. Tipos de histogramas. Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios32 Ejemplo 4 En el archivo Clientes.mtw se dispone de los datos correspondientes al monto de compras de los clientes, durante los últimos 6 meses. A partir de los mencionados datos realice lo que se solicite. a. Obtenga la tabla de distribución de frecuencias. Solución Paso 1. Determinar el rango de la variable. i. Stat> Basic Statistics> Display Descriptive… ii. Seleccionar la variable M. Compras. iii. Pulsar el botón Statistics, seleccionar Minimum, Maximum, Range, y N total. Presionar el botón OK. Se obtiene el siguiente reporte: Descriptive Statistics: M. ComprasTotal Variable Count Minimum Maximum Range M. Compras 250 1200.0 4530.0 3330.0 El rango de la variable monto de compras es: R = 4530 – 1200 = S/ 3330 Paso 2. Determinar el número de intervalos. i. Cantidad de datos: 250=n ii. 101 3 32 250 8 961 9= + = ≈k . log ( ) . Paso 3. Determinar la amplitud de la clase. 3330 370 9 RC / k S= = = Paso 4. Construir los intervalos. Se tiene en cuenta que el valor mínimo de los montos de compra, duran- te los últimos 6 meses, es de S/ 1200 y la amplitud de los intervalos es S/ 370 para obtener los límites superiores inferiores de cada uno de los 9 intervalos, tal como se presenta en la tabla 5. Intervalo (Ii) Límite inferior Límite superior 1 1200 1570 2 1570 1940 3 1940 2310 4 2310 2680 5 2680 3050 6 3050 3420 7 3420 3790 8 3790 4160 9 4160 4530 Tabla 5. Intervalos para la variable montos de compra. Capítulo 1. EstadístiCa dEsCriptiva 33 Paso 5. Obtener el histograma de la variable monto de compras de acuerdo a los intervalos elaborados y de ahí construir la tabla de distribución de frecuencias correspondiente. i. Graph> Histogram… ii. Seleccionar la opción Simple iii. Seleccionar la variable M. Compras. El histograma obtenido se presenta en la figura 13. El presente histograma cuenta con 18 intervalos, y en el eje horizon- tal aparecen las marcas de clase, lo que el software Minitab denomina como “midpoints”, es decir, los puntos medios de los intervalos. Figura 13. Histograma correspondiente a la variable Monto de compras. Modificar el histograma i. Hacer doble click sobre cualquier co- lumna del histograma. ii. Pulsar sobre la pestaña Binning. iii. Seleccionar Cutpoint, y en Midpoint/ Cutpoint positions señalar el mínimo valor 1200( ) y al límite superior del primer intervalo 1570( ), dejando un espacio vacío entre ambos valores, tal como se muestra en la figura 14. Pulsar OK. iv. Si aparece un cuadro de diálogo con el mensaje Bins extended to encompass all data, pulsar sobre Aceptar. Figura 14. Cuadro de diálogo del comando Histogram – Edit Bars. Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios34 v. En el histograma editado presionar el botón derecho del mouse y pul- sar sobre Add, luego sobre Data Labels…, verificar que se encuentre marcada la opción Use y-value labels. Pulsar OK. El histograma ya editado se presenta en la figura 15. A partir de las frecuencias absolutas representadas en el histogra- ma elaborado se obtienen las frecuencias absolutas acumuladas, las frecuencias relativas simples y las acumuladas, tal como se presenta en la tabla 6. Intervalo (Ii) Límite inferior Límite superior Marca de clase (yi) Frecuencia absoluta (fi) Frec. Relativa porcentual (hi%) Frec. Absoluta acumulada (Fi) Frec. Relativa porcentual acumulada (Hi%) 1 1200 1570 1385 16 6.4 16 6.4 2 1570 1940 1755 27 10,8 43 17.2 3 1940 2310 2125 32 12.8 75 30.0 4 2310 2680 2495 38 15.2 113 45.2 5 2680 3050 2865 38 15.2 151 60.4 6 3050 3420 3235 31 12.4 182 72.8 7 3420 3790 3605 28 11.2 210 84.0 8 3790 4160 3975 26 10.4 236 94.4 9 4160 4530 4345 14 5.6 250 100.0 Total = 250 100.0 - - - - - - Figura 15. Histograma editado correspondiente a la variable Monto de compras. Tabla 6. TDF para la variable Monto de compras. Capítulo 1. EstadístiCa dEsCriptiva 35 Interpretaciones: • f6: 31 clientes, durante los 6 últimos meses, han presentado un monto de compras comprendido entre 3050 (inclusive) y 3420 soles. • F4: 113 clientes, durante los 6 últimos meses, han presentado un monto de compras inferior a S/ 2680. • h2%: 10 8 . % de los clientes, durante los 6 últimos meses, han presentado un monto de compras comprendido entre 1570 (inclusive) y 1940 soles. • H7%: 84 0 . % de los clientes, durante los 6 últimos meses, han pre- sentado un monto de compras comprendido entre 1200 (inclusive) y 3790 soles. Las demás frecuencias, aparte de la frecuencia absoluta obtenida en el histograma elaborado, se pueden obtener a través de los cálculos correspondientes, o a través de la modificación del histograma para así visualizar los valores de las demás frecuencias necesarias para com- pletar la tabla. Modificación del histograma i. Dar doble click sobre el eje vertical para que aparezca la ventana de diálogo de edición de escala. ii. Seleccionar la pestaña Type, en dicha pestaña se puede cambiar la es- cala de frecuencia (Frequency) a porcentajes (Percent). iii. Si se desea obtener la presentación de los valores acumulados se debe seleccionar la opción Accumulate values across bins. Por ejemplo, en la figura 16, se presenta las opciones seleccionadas para obtener las frecuencias relativas acumuladas, mientras que en la figura 17 se presentan los resultados obtenidos. Figura 16. Cuadro de diálogo del comando Histogram – Edit Scale. Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios36 La tabla de distribución de frecuencias de una variable cuantitativa conti- nua es de datos agrupados porque los datos están formando clases o gru- pos. Nótese también que las clases son igualmente espaciadas. Las marcas de clase yi son los valores representativos de cada clase y serán utilizados en el cálculo de las medidas de tendencia central y de dispersión. b. Obtenga el polígono de frecuencias. Solución i. En el archivo Clientes.mtw, ingresar en las columnas C14 y C15, res- pectivamente, los valores de las marcas de clase y de las frecuencias relativas (en forma de proporción y no como porcentaje); conside- rando unas marcas de clase ficticias antes y después de la primera y úl tima marca de clase respectivamente. Etiquete adecuadamente las columnas empleadas: C14: Marca de clase C15: Frecuencia relativa Nota: Considerar frecuencia relativa cero para marca de clase ficticia, tal como se muestra en la figura 18. Figura 17. Histograma de la variable Monto de com- pras – Frecuencia relativa porcentual acumulada. Capítulo 1. EstadístiCa dEsCriptiva 37 ii. Graph> Scatterplot… iii. Elegir la opción With Connect Line. Pulsar OK. iv. Ingresar los datos tal como aparecen en la figura 19. v. Pulsar el botón Labels… e ingresar a la pestaña Data Labels y seleccio- nar la opción Use y-value labels. Pulsar OK. vi. Pulsar el botón Data View…, se observa que la opción Symbols ya se encuentra seleccionada, en forma adicional se debe seleccionar la op- ción Connect line, tal como se muestra en la figura 20. Pulsar OK. Figura 18. Cuadro de diálogo del comando Scatterplot. Figura 19. Cuadro de diálogo del comando Scatterplot. Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios38 vii. Pulsar OK para obtener el polígono de frecuencias asociado a la varia- ble monto de compras, tal como se muestra en la figura 21. 3.3 Diagrama de Pareto El diagrama de Pareto es una gráfica que permite identificar las causas que afec- tan en un porcentaje significativo a un problema. Una vez identificadas las cau- sas se procede a resolverlas para reducir en un gran porcentaje la ocurrencia del problema en estudio. Esto contribuye a mejorar la calidad del producto o servi- cio que se ofrece. El diagrama de Pareto también sirve para separar y atender (o resolver) las causas que son “vitales” de aquellas que son “triviales” lo que permitirá una reducción significativa del problema. Figura 20. Cuadro de diálogo del comando Scatterplot: Data View. Figura 21. Polígono de frecuencias corres- pondiente a la variable Monto de compras. Capítulo 1. EstadístiCa dEsCriptiva 39 Ejemplo 5 En la cafetería de un Centro de Convenciones se viene presentando un alto número de fallas en la prestación del servicio: demoras, quejas, insatisfac- ción, etc. Para determinar las principales causas de estas fallas se realizó un estudio donde se consultaba al personal de atención directo (meseros, super- visores,jefe) e indirecto (personal de cocina y apoyo), así como a los propios clientes sobre cuál era al origen de las fallas en la prestación del servicio. A continuación, en la tabla 7, se presenta un resumen de las causas identifica- das, y la frecuencia con que fueron mencionadas. Cód. Descripción Frecuencia A Alto número de clientes 28 B Cocinas domésticas, no industriales 5 C Demora del mesero en la toma del pedido 19 D Doble ingreso de pedido del cliente 1 E Equipo de cómputo con deficiencias 5 F Error de digitación de pedido del cliente 23 G Falta de orden en el ambiente de la cocina 6 H No se cuenta con insumos suficientes 28 I No se verifica la boleta antes de imprimirla 3 J Pocas mesas de atención 2 a. Obtenga el diagrama de Pareto asociado a las causas de las fallas en el servicio. Solución i. Ingresar los datos proporcionados en una hoja de trabajo del software Minitab. ii. Ingresar a Stat> Quality Tools> Pareto Chart… iii. Completar el cuadro de diálogo tal como se presenta en la figura 22. Tabla 7. Resumen de las opiniones recabadas sobre las causas de las fallas en el servicio. Figura 22. Cuadro de diálogo del comando Pareto Chart. Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios40 En Defects or attribute data in se puede seleccionar la columna C1 Cód., tal como se presenta en la figura 22, o se puede seleccionar la co- lumna C2 Descripción. Lo preferible es trabajar con etiquetas cortas, tal como aparece en la columna C1, ya que, si se utilizan etiquetas exten- sas, como la descripción completa de las causas, estas ocupan demasia- do espacio en la gráfica, reduciendo el espacio para el propio diagrama de Pareto. En la figura 23 se aprecia el diagrama obtenido. b. Indique cuáles son las principales causas detectadas en las fallas del servi- cio de la cafetería en el Centro de Convenciones. Solución [A] Alto número de clientes 23 3 .( %), [H] No se cuenta con insumos su- ficientes 23 3 .( %), [F] Error de digitación de pedido del cliente 19 2 ( . %) y la [C] Demora del mesero en la toma del pedido 15 8 .( %). Causas que en conjunto representan el 81 7 . % de las causas señaladas por los informantes. 4. MeDiDas De tenDencia central Las medidas de tendencia central cuantifican la forma de agrupamiento o ten- dencia de los datos respecto a ciertos valores. Las medidas de tendencia cen- tral pueden calcularse para la población (bajo ciertas condiciones) como para la muestra. La relación entre las medidas de tendencia central calculadas en la muestra (estadísticos) y sus correspondientes medidas de tendencia central a nivel de población (parámetros) radica en que los valores de los estadísticos son utilizados para estimar los valores de los parámetros. Las principales medidas de tendencia central de una muestra (a nivel de población también existen y se denominan parámetros) son: Figura 23. Diagrama de Pareto para las causas de las fallas en el servicio. Capítulo 1. EstadístiCa dEsCriptiva 41 a. Media o promedio aritmético. b. Mediana. c. Moda. Para cada medida de tendencia central se tienen fórmulas para calcular sus valores dependiendo si los datos están o no agrupados. A continuación, se pre- sentan las medidas de tendencia central que se calculan en una muestra. 4.1 Media aritmética (promedio) La media muestral es un punto de equilibrio entre los valores que están por debajo y por encima de ella. La media muestral, o simplemente media, si no hay confusión alguna, se denota por x . Los tipos de media muestral son: a. Media simple. b. Media ponderada. Las fórmulas para calcular la media son: Datos no agrupados Datos agrupados Media simple 1= ∑ = n i i x x n Media 1= ∑ = k i i i y f y n = 1= ∑ k i i i y h Donde: yi son los valores de la variable o las marcas de clase fi son las frecuencias absolutas hi son las frecuencias relativas Media ponderada 1 1 = = ∑ = ∑ k i i i k i i w x x w Donde: wi son los pesos o ponderaciones. Las propiedades de la media muestral son: a. La media es única, puede asumir cualquier valor real y siempre existe. b. Si i iy x a,= ± entonces y x a,= ± para a constante. c. Si i iy ax ,= entonces y ax.= d. Si una muestra se divide en k submuestras de tamaño ni para cada submuestra; la media de la muestra es igual a la suma de las medias pon- deradas de las submuestras, dividido entre el tamaño de muestra total: 1 1 1 2 2 1 = = ∑ + + + = = ∑ k i i i k k k i i x n x n x n x n x nn ... . Lo señalado se conoce como media de medias. Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios42 e. 1 0 = − =∑ n i i x x( ) f. La media es afectada por los valores extremos. 4.2 Mediana La mediana se define como el valor que divide en dos partes iguales al conjunto ordenado de observaciones. La mediana se denota por Me y se calcula de la si- guiente manera: Datos no agrupados Datos agrupados a. Ordenar los datos de menor a mayor, x(1), x(2), …, x(n) b. Si n es impar, entonces la mediana es: 1 2 + = nMe x Si n es par, entonces la mediana es: 1 2 2 2 + + = n nx x Me x(i) es el valor de la i-ésima observación después de que los datos han sido ordenados a. Calcule n/2 para ubicar la clase mediana. b. Luego, aplique la siguiente fórmula 12 − − = + Me Me Me n F Me LI C f donde: i) LIMe es el límite inferior de la clase donde se encuentra la mediana ii) FMe-1 es la frecuencia acumulada absoluta de la clase anterior a la clase donde se encuentra la mediana. iii) fMe es la frecuencia absoluta de la clase donde se en- cuentra la mediana. Las propiedades de la mediana son: 1. La mediana es única y siempre existe. 2. Si = ±i iy x a, entonces = ±Me y Me x a( ) ( ) , para a constante. 3. Si =i iy ax , entonces =Me y a Me x( ) ( ), para a constante. 4. La mediana no es afectada por los valores extremos. Esta propiedad signi- fica que la mediana debe ser usada en lugar de la media cuando se tengan datos con valores extremos. Esta propiedad de la mediana es conocida como robustez. 5. La mediana puede asumir cualquier valor real. 4.3 Moda La moda se define como el valor de la variable que posee la mayor frecuencia; también es conocida como el valor más común o el valor típico de las observa- ciones. La moda se denota por Mo y se calcula de la siguiente manera: Capítulo 1. EstadístiCa dEsCriptiva 43 Datos no agrupados a) Determine el valor que posee la mayor frecuencia. b) En caso de existir más de un valor con la mayor frecuencia, en- tonces, todos esos valores son considerados valores modales. Las propiedades de la moda son: a. A diferencia de la media y de la mediana, la moda se puede calcular para datos cuantitativos y para datos cualitativos. b. La moda puede o existir para un conjunto de datos, y de existir no siempre es única. c. La moda no es afectada por los valores extremos. d. La moda puede asumir cualquier valor real. e. La moda debe ser utilizada cuando se desea reportar el valor de la variable que posee la mayor posibilidad de ocurrencia. CASO: Financiera En una agencia financiera se dispone de 10 cajeros destinados a la atención al público, cuando cada uno de ellos termina sus labores realiza el cierre de caja correspondiente. Los tiempos empleados, en minutos, por cada uno de los cajeros al momento de realizar el cierre correspondiente al día anterior se presentan a continuación: 25 19 25 24 27 25 22 26 20 23 La entidad financiera tiene un contrato con una institución de educación superior, y durante la presente semana debe recabar los pagos de pensiones de los alumnos ingresantes en el presente período académico. Los mencio- nados pagos se presentan en 5 categorías distintas. A continuación, se pre- senta la distribución de los pagos realizados por los primeros 81 ingresantes: Categorías de pensiones Monto de pago (S/) ( yi ) N.° de ingresantes( fi ) A 380 7 B 420 15 C 470 28 D 540 21 E 600 10 Total 81 Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios44 Ejemplo 6 En relación al caso Financiera, se solicita lo siguiente con respecto a los tiem- pos empleados: a. En forma manual, calcule el tiempo promedio diario empleado en el cierre de caja por parte de los cajeros de la entidad financiera. Solución Aplicando la fórmula: 1 25 19 25 24 27 25 22 26 20 23 23 6 10 n i i x x n .= ∑ + + + + + + + + + = = = Interpretación: El promedio de los tiempos empleados para el cierre de caja por parte de los 10 cajeros es de 23 6. minutos. b. En forma manual, determine el valor de la mediana asociada al tiempo empleado diariamente en el cierre de caja por parte de los cajeros de la entidad financiera. Solución Para calcular la mediana se aplica el siguiente procedimiento: i. Ordenar los datos de menor a mayor: 19 20 22 23 24 25 25 25 26 27 x(1) x(2) x(3) x(4) x(5) x(6) x(7) x(8) x(9) x(10) ii. Como el número de datos (n) es par, entonces se identifican los dos valores centrales para calcular la mediana: 10 101 1 5 62 2 2 2 24 25 24 5 2 2 2 2 n nx x x x x x Me x ( ) ( )( ) . + + + + + + = = = = = Interpretación: El 50 % de los cajeros presentó tiempos de cierre de a lo más 24 5. minutos, mientras que el restante 50 % presentó tiempos de cierre de por lo menos 24 5. minutos. c. En forma manual, determine el valor de la moda asociada al tiempo em- pleado diariamente en el cierre de caja por parte de los cajeros de la enti- dad financiera. Solución Para determinar el valor de la moda solamente se debe identificar el valor que más se repite en la serie de datos, de lo cual se observa que un tiempo de 25 minutos fue el tiempo de cierre presentado por un mayor número de cajeros ( 3 en total). Capítulo 1. EstadístiCa dEsCriptiva 45 Por lo tanto: 25=Mo x( ) Interpretación: El tiempo de cierre que más frecuentemente se repite entre los cajeros fue de 25 minutos. d. Haga uso del software Minitab para obtener los valores de la media, mediana y moda. Solución Para calcular los valores de la media, la mediana y la moda mediante el software Minitab, se deben ingresar los datos en una columna y luego apli- car el siguiente procedimiento: i. Digite los datos en la columna C1, y etiquételos como Tiempo cierre. ii. Ingresar a Stat> Basic Statistics> Display Descriptive Statistics… iii. Seleccionar la variable Tiempo cierre iv. Presionar el botón Statistics… v. Seleccione las siguientes estadísticas descriptivas: mean (media), median (mediana), y mode (moda). Pulse el botón OK vi. Presionar el botón OK. El reporte obtenido se presenta a continuación: Descriptive Statistics: Tiempo cierre N for Variable Mean Median Mode Mode Tiempo cierre 23.600 24.500 25 3 Figura 24. Cuadro de diálogo del comando Display Descriptive Statistics: Statistics. Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios46 Ejemplo 7 En relación al caso Financiera, se solicita lo siguiente con respecto a los montos de pago, en soles, de los 81 ingresantes a la institución de educación superior: a. Calcule el monto promedio, por concepto de pago de pensiones, que la financiera recabó por cada ingresante. Solución Debido a que los datos se presentan en una tabla resumen, para calcular el monto promedio se debe utilizar la fórmula de la media ponderada: 1 380 7 420 15 470 28 540 21 600 10 487 16 7 15 28 21 10 k i i i y f M y n ( ) ( ) ( ) ( ) ( )( ) .= ∑ + + + + = = = = + + + + Y Interpretación: El promedio de los montos por concepto de pago de pen- siones es de S/ 487 16. . a.1 Todos los ingresantes además realizaron un pago por concepto de un curso de informática, el cual tenía un costo único de S/ 90, ¿cuál es el promedio del monto de pago incluyendo el pago por el mencionado curso?, y ¿cuál sería el monto total del pago recibido por parte de los 81 ingresantes? Solución Y * : Monto de pago incluyendo el curso Y * = Pago pensión + Pago curso 90Y Y⇒ = +* Monto promedio de pago incluyendo el pago del curso: 90 90 487 1 577 166 90M M = M / *( ) ( ) ( ) . S .= + = + =Y Y + Y Monto total del pago recibido por los 81 ingresantes: 1= ∑ k i i i y f* Como: 1 1 81 577 16 81 46 750 81 k i i ki i i i y f M y f M * * * *( ) ( )( ) . ( )= = ∑ = ⇒ = =∑ ≈Y Y a.2 Los montos de pago por concepto de pensiones se incrementarán en un 5 % a partir del próximo mes, en cada una de las categorías de pago. Si ya se hubiera efectuado el mencionado incremento, ¿cuál hubiera sido el nuevo monto promedio por concepto de pago de pensiones? Solución W: Nuevo monto de pago considerando el incremento del 5 % 1 0 05 Y= +W ( . ) Nuevo monto promedio: 1 05 1 05 1 05 487 16M W M M( ) ( . ) . ( ) . ( . )= = = =Y Y S/ 511 52. Capítulo 1. EstadístiCa dEsCriptiva 47 b. Determine e interprete los valores de la mediana y la moda correspon- dientes a los montos por concepto de pago de pensiones. Solución Mediana: Para determinar el valor de la mediana se aplica el siguiente procedimiento: i. Determinar las posiciones que ocupan cada uno de los datos, los cuales ya aparecen en forma ordenada en la tabla resumen, para lo cual se obtienen las frecuencias absolutas acumuladas: Monto de pago (S/) (xi) N.° de ingresantes (fi) N.° acumulado ingresantes (Fi) 380 7 7 420 15 22 470 28 50 540 21 71 600 10 81 Total 81 ii. Como el número de datos n( ) es impar, entonces, se identifica el valor central: 411 81 1 2 2 470+ + = = = =nMe X x x x( )( ) Nota: El tercer valor de los 5 distintos montos de pago 3 470=x ( ) corresponde, de acuerdo a las frecuencias acumuladas, a los valores ordenados desde la posición 23 a la posición 50 de los 81 pagos reci- bidos ( 23x( ) a 50x ). Interpretación: El 50 % de los ingresantes realizó pago por concepto de pensiones fue por un monto de a lo más S/ 470, mientras que el restan- te 50 % realizó pagos de por lo menos S/ 470. Moda: Para determinar el valor de la moda se observa el valor que más se repite, es decir, el que presenta mayor frecuencia, siendo dicho valor el de S/ 470. Por lo tanto: 470=Mo x( ) Interpretación: El monto por concepto de pago de pensiones que más frecuentemente realizaron los ingresantes fue de S/ 470. Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios48 Escenario: Caso Financiera La entidad financiera también realiza la compra y venta de moneda ex- tranjera, y durante el presente día se han realizado 200 transacciones de compra de euros. Los montos asociados a las compras de euros se resumen en la siguiente tabla de distribución de frecuencias: Intervalo (Ii) Monto de euros comprados (€) Frecuencia absoluta (fi) Límite inferior Límite superior Marca de clase (yi) 1 0 600 300 16 2 600 1200 900 32 3 1200 1800 1500 68 4 1800 2400 2100 44 5 2400 3000 2700 28 6 3000 3600 3300 12 Total 200 Ejemplo 8 En relación al escenario presentado sobre las 200 transacciones de compra de euros, se solicita lo siguiente: a. Calcule el monto promedio de euros comprados por cada transacción. Solución Debido a que los datos se presentan en una tabla resumen para datos agrupados, se debe utilizar la fórmula correspondiente y trabajar con la marca de clase y las frecuencias absolutas: 1 300 16 900 32 1500 68 2100 44 2700 28 3300 12 16 32 6 1 8 44 28 12 716 k i i k y f y n ( ) ( ) ( ) ( ) ( ) ( )= ∑ + + + + + = = = + + + + + Interpretación: El promedio de los montos de compra en cada transacción es de 1716 euros. b. Calcule la mediana asociada al monto de euros comprados por cada tran- sacción. Solución Para determinar el valor de la mediana se aplica el siguiente proce dimiento: i. Obtener las frecuencias absolutas acumuladas.Capítulo 1. EstadístiCa dEsCriptiva 49 Intervalo (Ii) Monto de euros comprados (€) Frecuencia absoluta (fi) Frec. Absoluta acumulada (Fi) Límite inferior Límite superior Marca de clase (yi) 1 0 600 300 16 16 2 600 1200 900 32 48 3 1200 1800 1500 68 116 4 1800 2400 2100 44 160 5 2400 3000 2700 28 188 6 3000 3600 3300 12 200 Total 200 ii. Identificar el intervalo mediano, el cual es el intervalo cuya frecuencia acumulada sea mayor o igual a la mitad de los datos que conforman la muestra. Determinar i, tal que 200 100 2 2 ≥ = =i nF . Se observa que 3 116 100 1200 1800= ≥ ⇒ 〉F [ , es el intervalo mediano. iii. Aplicar la fórmula correspondiente. 1 100 482 120 1658 820 600 68 Me Me Me n F Me y LI c f - ,( ) − − = + = + = Interpretación: El 50 % de las transacciones implicó la compra de a lo más 1656 8, euros, mientras que el restante 50 % implicó la compra de por lo menos el mencionado valor. 4.4 Relaciones entre la media, la mediana y la moda Si la variable en estudio es cuantitativa, el cálculo de ,x Me y Mo se realizan de la manera indicada en las secciones anteriores. Las relaciones entre estas medi- das de tendencia central se presentan en la figura 25. Media = Mediana = ModaMedia > Mediana > Moda Media < Mediana < Moda Figura 25. Relaciones entre la media, la me- diana y la moda. Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios50 5. MeDiDas De posición Las medidas de posición dividen al conjunto de datos, previamente ordenado, en grupos con determinada cantidad de observaciones. Las principales medidas de posición son: a. Cuartiles. b. Percentiles. 5.1 Cuartiles Los cuartiles son valores que dividen al conjunto ordenado de observaciones en cuatro partes iguales. Los cuartiles son denotados por Q1, Q2 y Q3. La figura 27 representa el significado de los cuartiles. Obsérvese que el 25 % de las observaciones son menores que Q1 y el 75 % de observaciones son al menos igual a Q1. También nótese que Q2 asume el mismo valor de la mediana (Me) y su interpretación es la misma, es decir, 50 % de las observaciones son menores que la mediana y 50 % de las observaciones son ma- yores que la mediana. Por otro lado, el 75 % de las observaciones son menores que Q3 y el 25 % son mayores que Q3. Q1 Q2 Q3 25 % 25 % 25 % 25 % 50 % 50 % 75 % Figura 26. Cuartiles y porcentajes de ob- servaciones. Capítulo 1. EstadístiCa dEsCriptiva 51 CASO: Patio de juegos El Gerente de una cadena de juegos infantiles y familiares se encuentra analizando las actividades diarias de tres de sus principales locales ubi- cados en modernos centros comerciales de Lima Metropolitana. Entre las principales características en estudio se encuentran las siguientes: – Número de niños por grupo (grupo familiar o grupo de amigos) que ingresan simultáneamente al patio de juegos. – Tiempo de permanencia, en minutos, del grupo de niños. – Monto total gastado, en soles (S/), por el grupo de niños (tickets, canjes, etc.). – Número de juegos totales utilizados por el grupo de niños. Se ha recabado los datos correspondientes a 220 grupos de niños, los cuales se presentan en el archivo: Juegos.mtw. Ejemplo 9 En el archivo Juegos.mtw, a partir de los datos correspondientes al número de niños por grupo, así como al número de juegos totales utilizados, realice lo solicitado: a. En relación al número de niños por grupo, obtenga los valores correspon- dientes al primer y al tercer cuartil, y su interpretación. Solución i. Ingresar a Stat> Basic Statistics> Display Descriptive Statistics… ii. Seleccionar la variable N.° de niños iii. Presionar el botón Statistics… iv. Seleccione las siguientes estadísticas descriptivas: first quartile (primer cuartil), y third quartile (tercer cuartil). Pulse el botón OK v. Presionar el botón OK El reporte obtenido se presenta a continuación: Descriptive Statistics: N.° de niños Variable Q1 Q3 N° de niños 2.250 4.750 Interpretación: • El 25 % de los grupos familiares o grupos de amigos ingresó con me- nos de 3niños al patio de juegos ( .2.25)≤ • El 75 % de los grupos familiares o grupos de amigos ingresó con me- nos de 5 niños al patio de juegos ( 4.75 .)≤ Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios52 Nota: El cuartil 1 divide a un 25 % inferior y a un 75 % superior, asimis- mo, el cuartil 3 divide a un 75 % inferior y a un 25 % superior; por lo tanto, se pueden brindar las siguientes interpretaciones equivalentes: • El 75 % de los grupos familiares o grupos de amigos ingresaron con por lo menos 3 niños al patio de juegos ( .2.25)≥ • El 25 % de los grupos familiares o grupos de amigos ingresaron con por lo menos 5 niños al patio de juegos ( 4.75 .)≥ b. Para el local de Santiago de Surco, señale el número de juegos por debajo del cual se encuentra el 25 % de los grupos de niños con menor cantidad de juegos utilizados. Solución Proceder de similar manera que el ítem anterior (a) y desagregar por la variable Local (By variables). El reporte obtenido se presenta a continuación: Descriptive Statistics: Nº juegos Variable Local Q1 Nº juegos Independencia 4.000 Santa Anita 6.000 Santiago de Surco 3.000 Conclusión: En el local de Santiago de Surco el 25 % de los grupos de niños utilizaron a lo más 3 juegos. 5.2 Percentiles Los percentiles xp(p = 1, 2, ..., 99) dividen al conjunto ordenado de datos en 100 partes iguales. De tal forma que p% de las observaciones son menores que el percentil xp y (100 – p)% de observaciones son al menos iguales a xp. Los percen- tiles son importantes en áreas como investigación de mercados pues permiten la segmentación de estos. En el presente texto, la obtención de los cuartiles y percentiles se trabajará a partir de la base de datos mediante el uso del software Minitab. Ejemplo 10 En el archivo Juegos.mtw, a partir de los datos correspondientes al tiempo de permanencia, calcule los percentiles P35 y P65. Solución i. Etiquetar a la columna C8 como k y en dicha columna digitar los valores de asociados a los percentiles solicitados: 0 35. y 0 65. , para los percentiles P35 y P65, respectivamente. Capítulo 1. EstadístiCa dEsCriptiva 53 ii. Ingresar a Calc> Calculator… iii. En Store result in variables señalar a la columna C9 iv. En Expression ingresar y editar la función del percentil (Percentile), la cual se puede buscar en Functions. La edición de la función se puede apreciar en la siguiente figura: Figura 27. Cuadro de diálo- go del comando Calculator: Percentile. Nota: Si solamente se deseaba obtener un percentil, entonces, se podría omitir el trabajo con la columna k, y editar la función, por ejemplo, de la siguiente forma: PERCENTILE(‘Tiempo’,0.35) v. Presionar el botón OK. El resultado aparecerá en la columna C9 que fue seleccionada, tal como aparece en la siguiente figura: Los valores de los percentiles son: 35 50 235=P . y 65 56 3=P . ; los cuales indican que el 35 % y 65 % de los grupos de niños permanecieron a lo más 50 235. y 56 3. minutos respectivamente. Figura 28. Resultados del comando Calculator: Percentile. Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios54 6. MeDiDas De Dispersión Las medidas de dispersión son valores que sirven para cuantificar la homo- geneidad (uniformidad, variabilidad) de los datos, es decir, sirven para medir la proximidad que tienen los datos entre sí. Las medidas de dispersión también son conocidas como medidas de variabilidad. Para el cálculo de algu- nas de las medidas de dispersión se toma un punto de referencia que general- mente es la media. Las medidas de dispersión a nivel de la muestra (a nivel de la población tam- bién existen las mismas medidas) son: a. Medidas de dispersión absolutas: i. Rango o Amplitud. ii. Rango intercuartílico.iii. Varianza iv. Desviación estándar Se denominan medidas de dispersión absolutas porque presentan si- milares unidades de medida que poseen las observaciones. b. Medidas de dispersión relativa: Coeficiente de variación. Se denomina medida de dispersión relativa porque no tiene unidades de medida. Siempre debe usarse, como mínimo, una medida de ten- dencia central y una medida de dispersión para describir el comportamiento de un conjunto de datos. 6.1 Rango o amplitud El rango muestral es la medida de dispersión más simple y se denota por R; el rango es la primera medida de dispersión que debe usarse porque permite cono- cer el intervalo de variación de los datos. Las fórmulas para calcularlo se indican a continuación. Datos no agrupados Datos agrupados R = Valor máximo – valor mínimo 1= −kR LS LI Las propiedades del rango muestral son: a. Fácil de calcular. b. El rango siempre asume valores positivos. c. La principal desventaja del rango es que no describe la variabilidad de los datos que se encuentran comprendidos entre los valores mí- nimo y máximo. Capítulo 1. EstadístiCa dEsCriptiva 55 6.2 Rango intercuartílico La diferencia entre el tercer y el primer cuartil 3 1Q Q( – ) es conocido como el rango (o amplitud) intercuartílico; dentro del mencionado rango se encuentra el 50 % central de las observaciones. Las propiedades del rango intercuartílico son: a. El rango intercuartílico siempre asume valores positivos. b. El rango intercuartílico se utiliza cuando se presentan datos discordantes. c. El rango intercuartílico no se ve afectado por la existencia de datos discordantes. 6.3 Varianza La desviación de una observación con respecto a la media se define como: ix x ,− y puede asumir valores positivos o negativos dependiendo si el valor ix se en- cuentra por encima o por debajo de la media. La figura 29 ilustra este concepto. La varianza muestral 2( )S cuantifica la dispersión de los valores ix con res- pecto a .x Las fórmulas para calcular el valor de 2S se presentan a continuación: Datos no agrupados Datos agrupados ( ) 22 2 12 1 1 1 == −∑−∑ = = − − nn ii ii x nxx x S n n 22 12 1 = −∑ = − k i i i y f ny S n La varianza muestral asume un valor grande cuando los valores ix se alejan del promedio y un valor pequeño cuando los valores ix se ubican alrededor del promedio. Las propiedades de la varianza muestral son: a. La varianza muestral 2S es única y siempre existe. b. La varianza muestral 2S siempre es positiva. c. Si = ±i iy x a, entonces = 2 2 y xS S , para a constante. Figura 29. Desviación de una observación con respecto a la media. Desviación negativa Desviación positiva −iX X −kX X ix x kx Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios56 d. Si yi = axi, entonces, 2 2 2 y xS a S= , para a constante. e. La varianza muestral 2S es afectada por los valores extremos. f. El mayor inconveniente de la varianza muestral 2S es que su unidad de medida es el cuadrado de la unidad de medida de los datos originales. 6.4 Desviación estándar La desviación estándar muestral, denotada por S, cuantifica la dispersión de los datos xi con respecto a la media. La fórmula para calcular el valor de la desvia- ción estándar muestral S es la misma para datos agrupados y no agrupados y se define como: 2=S S Donde: 2S es la varianza muestral calculada previamente para datos agrupa- dos o no agrupados. La desviación estándar muestral es la medida de dispersión más utilizada junto con la media muestral ( x ). Estas dos medidas descriptivas poseen un con- junto de propiedades estadísticas que las hacen de suma utilidad en el análisis de datos. Las propiedades de la desviación estándar muestral son: a. La desviación estándar muestral S es única y siempre existe. b. La desviación estándar muestral S siempre es positiva. c. Si = ±i iy x a , entonces, =y xS S para a constante. d. Si =i iy ax , entonces, =y xS aS , para a constante. e. La desviación estándar muestral S es afectada por los valores extremos. f. La desviación estándar muestral S tiene su unidad de medida igual a la unidad de medida de los datos originales, esta propiedad la hace útil para analizar la dispersión de los datos. g. En el caso de que se desee comparar la variabilidad de dos o más con- juntos, la desviación estándar muestral S puede usarse únicamente si se cumplen las siguientes dos condiciones: i. Los conjuntos de datos a comparar tienen las mismas unidades de medida. ii. Las medias muestrales de los conjuntos de datos tiene valores próxi- mos entre sí. Si no se cumplen estas condiciones, no debe usarse S como medida de comparación. Capítulo 1. EstadístiCa dEsCriptiva 57 6.5 Coeficiente de variación El coeficiente de variación, denotado por C.V., cuantifica la dispersión relativa que tienen los datos expresándola como el porcentaje de la desviación estándar (S) con respecto al valor absoluto de la media x( ), es decir, si x es el 100 %, entonces el coeficiente de variación es el porcentaje de la desviación estándar muestral con respecto a x. Luego, 100= SC V x . . % La fórmula de cálculo de C.V. es la misma para datos agrupados y no agrupados. Las propiedades del coeficiente de variación son: a. El coeficiente de variación no tiene unidad de medida. b. El coeficiente de variación es útil para juzgar si un conjunto de datos es homogéneo o heterogéneo. Para este fin, se deben utilizar valores de referencia. Algunos autores hacen uso de valores de referencia, que se muestran en la tabla 8, para interpretar el valor del coeficiente de variación: Valor del C.V. Interpretación 0 5< ≤C V. . Los datos son muy homogéneos. 5 10< ≤C V. . Los datos son homogéneos. 10 15< ≤C V. . Los datos son regularmente homogéneos. 15 20< ≤C V. . Los datos son regularmente heterogéneos. 20 25< ≤C V. . Los datos son heterogéneos. 25 < C V. . Los datos son muy heterogéneos. c. El coeficiente de variación es útil para comparar la dispersión de dos o más conjuntos de datos que tienen los mismos o diferentes unidades o promedios. d. Si = −i iy x a, entonces, >y xC V C V. . . . , y si = +i iy x a, entonces, <Z XC V C V. . . . , para a constante. e. Si =i iy ax , entonces, =y xC V C V. . . . . Tabla 8. Valores de refe- rencia para la interpreta- ción del coeficiente de variación. Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios58 Ejemplo 11 El monto de consumo efectuado por los primeros 6 clientes de una heladería ubicada dentro de un centro comercial se muestran a continuación: 33 12 24 18 35 16 a. En forma manual, calcule el rango de los montos de consumo por parte de los primeros 6 clientes. Solución Max 35= , Min 12= Rango = Max – Min 35 12 23= =– Interpretación: La diferencia entre el mayor y menor monto de consumo, de los primeros 6 clientes, fue de S/ 23. b. En forma manual, determine el valor de la varianza y de la desviación estándar asociados a los montos de consumo. Solución Realizando los cálculos previos: 6 1 33 12 24 18 35 16 23 6 6 = ∑ + + + + + = = = i i x x 6 2 2 2 2 2 2 2 1 33 12 24 18 35 16 3614 = = + + + + + =∑ i i x Aplicando la fórmula de la varianza: 2 2 2 12 23614 6 23 88 1 6 1 = −∑ − = = = − − n i i x nx S n ( ) soles Obteniendo la respectiva desviación estándar: 2 88 9 38= = ≈S S /.S . Interpretación: La dispersión de los montos de consumo, con respecto a su valor promedio es de S/ 9 38. . c. En forma manual, determine e interprete el valor del coeficiente de varia- ción de los montos de consumo. Solución A partir de los valores ya calculados, se tiene que: 9 38100 100 40 78 23 = = ≈ SC V x .. . % % . % Interpretación: Los montos de consumo presentan valores muy heterogé- neos, es decir, son muy distintos entre sí. Capítulo 1. EstadístiCa dEsCriptiva 59 CASO: Cable TV Una empresa que brinda elservicio de instalación de televisión por cable se encuentra realizando un análisis de la cantidad de cable coaxial que se utilizó en las últimas 100 instalaciones realizadas; los datos recabados se resumieron en la siguiente tabla de distribución de frecuencias: Intervalo (Ii) Cable coaxial utilizado (metros) Frecuencia absoluta (fi) Límite inferior Límite superior Marca de clase (yi) 1 10 14 12 4 2 14 18 16 10 3 18 22 20 26 4 22 26 24 42 5 26 30 28 18 Total 100 Ejemplo 12 En relación a los datos de las 100 instalaciones de televisión por cable reali- zadas por la empresa, responda según se solicite: a. Calcule el rango de la cantidad de cable coaxial utilizado en las insta- laciones en análisis. Solución Debido a que los datos se presentan en una tabla resumen para datos agrupados, se debe utilizar la fórmula correspondiente y trabajar con los límites extremos de los intervalos: LS5 = 30, LI1 = 10 A = LS5 – LI1 = 30 10 20− = Interpretación: La diferencia entre el mayor y menor cantidad de cable coaxial utilizado fue de 20 metros. b. Calcule la desviación estándar y el coeficiente de variación asociado a la cantidad de cable coaxial utilizado en las instalaciones en análisis. Solución Utilizando la fórmula correspondiente a datos agrupados, en la cual se hace uso de la marca de clase y las frecuencias absolutas, se tiene lo siguiente. Realizando los cálculos previos: Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios60 1 12 4 16 10 20 26 24 42 28 18 22 4 4 10 26 42 18 = ∑ + + + + = = = + + + + k i i i y f y n ( ) ( ) ( ) ( ) ( ) . 5 2 2 2 2 2 2 1 12 4 16 10 20 26 24 42 28 18 51 840 = = + + + + =∑ i i i y f ( ) ( ) ( ) ( ) ( ) Aplicando la fórmula de la desviación estándar: 2 2 2 1 51 840 100 22 4 4 1 1 100 1 = −∑ − = = ≈ − − k i i i y f ny S n ( . ) . metros Interpretación: La dispersión de cantidad de cable coaxial utilizado en las instalaciones, con respecto a su valor promedio, es de aproximadamente 4 1. metros. Aplicando la fórmula del coeficiente de variación: 4 1100 100 18 3 22 4 = = ≈ SC V y .. . % % . % . Interpretación: Los montos de consumo presentan valores regularmente heterogéneos, es decir, son regularmente distintos entre sí. CASO: Usuarios de equipos de cómputo Una revista tecnológica ha realizado un estudio para conocer el uso de los equipos de cómputo en los hogares. Para el mencionado estudio se recaba- ron datos asociados a 160 equipos de cómputo que disponen los residentes de Santiago de Surco. Las variables de interés para el estudio fueron las siguientes: Equipo: Tipo de equipo de cómputo (PC Escritorio, Portátil). N.° usuarios: Cantidad de usuarios que han configurado el sistema operativo. Almacenamiento: Cantidad de información digital almacenada (GB). Los datos recabados se presentan en el archivo: Usuarios.mtw Ejemplo 13 a. En relación a la cantidad de información digital almacenada por los usua- rios, obtenga e interprete los valores correspondientes a rango, rango intercuartílico, varianza, desviación estándar y coeficiente de variación. Interprete el rango intercuartílico y la desviación estándar. Capítulo 1. EstadístiCa dEsCriptiva 61 Solución i. Ingresar a Stat> Basic Statistics> Display Descriptive Statistics… ii. Seleccionar la variable Almacenamiento iii. Presionar el botón Statistics… iv. Seleccione las siguientes estadísticas descriptivas: Standard deviation (desviación estándar), Variance (varianza), Coefficient of variation (coeficiente de variación), range (rango) e Interquartile range (rango in- tercuartílico). Pulse el botón OK v. Presionar el botón OK El reporte obtenido se presenta a continuación: Descriptive Statistics: Almacenamiento Variable StDev Variance CoefVar Range IQR Almacenamiento 232.8 54206.4 38.17 982.8 388.0 Interpretaciones: • El 50 % central de la cantidad de información digital almacenada por los usuarios presenta un rango de 388 GB. • La dispersión de la cantidad de información digital almacenada por los usuarios, con respecto a su valor promedio, es de aproximadamente 232 8. GB. b. En relación a los resultados del ítem anterior (a), responda según se solicite: i. Si en la cantidad de información digital almacenada en todos los usua- rios se desea considerar una cantidad reservada de 4 GB para la pape- lera de reciclaje, ¿cuál sería el nuevo valor de la desviación estándar? Figura 30. Selección de medidas de dispersión. Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios62 Solución Sea Y : Cantidad de información digital almacenada y reservada consi- derando 4 GB adicionales. Se sabe que: 232 8=S X( ) . GB Por lo tanto: 4 232 8Y = + = =S S X S X( ) ( ) ( ) . GB ii. Exprese el valor de la varianza en terabytes (TB). NOTA: 1 TB 1024= GB. Solución Sea Y : Cantidad de información digital almacenada expresada en terabytes. Se sabe que: 54 206 4=V X ( ) . GB2. Por lo tanto: 20 001 0 001Y = =V V X V X( ) ( . ) . ( ) 0 000001 54 206 4= (. . ) 1 0 001= GB . TB 20 0542064=V (Y) . TB iii. Al expresar la cantidad de información digital almacenada en terabytes, ¿cómo se modifica el valor del coeficiente de variación? Solución El coeficiente de variación fue: 100 38 17x S C V X x . .( ) % . %= = Aplicando el factor de conversión se tiene lo siguiente: 0 001 0 001=M X M X( . ) . ( ), y 0 001 0 001=S X S X( . ) . ( ) El nuevo coeficiente de variación: 0 001 0 001 100 38 17 0 001 = =x S C V X x . . .( . ) % . %. . Nota: El valor del coeficiente de variación no ha cambiado luego de aplicar el factor de conversión, ya que la transformación aplicada es del tipo Y = kX, y por lo tanto la constante k se anula en el cálculo del coeficiente de variación, ya que aparece en el numerador y en el de- nominador. Si la transformación hubiese sido del tipo Y = ±X k, sí se modificaría el valor del mencionado coeficiente. c. En relación al número de usuarios que han configurado el sistema opera- tivo, ¿en cuál tipo de equipo presenta una distribución más homogénea? Solución Proceder de similar manera que el ítem (a) y desagregar por la variable “Equipo”. El reporte obtenido se presenta a continuación: Capítulo 1. EstadístiCa dEsCriptiva 63 Descriptive Statistics: N° Usuarios Variable Equipo CoefVar N° Usuarios PC Escritorio 35.84 Portátil 47.57 Conclusión: En las PC de escritorio, el número de usuarios que han con- figurado el sistema operativo presenta una distribución más homogénea, ya que a pesar de que ambos tipos de equipos poseen altos valores del coeficiente de variación, en las PC de escritorio se obtiene un menor valor en comparación al de los equipos portátiles. 7. MeDiDas De forMa Las medidas de forma sirven para cuantificar la desviación que tiene la distribu- ción de los datos con respecto a la distribución simétrica y unimodal conocida como distribución normal. Las medidas de forma son: a. Coeficiente de asimetría. b. Coeficiente de curtosis (apuntamiento). 7.1 Coeficiente de asimetría Los principales coeficientes de asimetría son el de Pearson y el de Fisher, cuyas fórmulas se presentan posteriormente. La interpretación del coeficiente de asimetría (C.A.), ya sea el de Pearson o el de Fisher, es la siguiente: a. Si C.A. < 0, entonces la distribución es asimétrica a la izquierda (negativa). b. Si C.A. = 01, entonces la distribución es simétrica. c. Si C.A. > 0, entonces la distribución es asimétrica a la derecha (positiva). CA = 0 CA < 0 CA > 0 1 En la práctica es difícil obtener un valor igual a cero, así que se trabaja con valores aproximados a cero. Figura 31. Tipos de asimetría. Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios64 7.1.1 Coeficiente de asimetría de Pearson Este coeficiente se utiliza para juzgar si un conjunto de datos con distribución acampanadaes simétrico o no, para lo cual se aplica la siguiente fórmula: 3 − = x x Me C A Pearson S ( ) . . Recuérdese que una distribución es simétrica y unimodal cuando = =x Me Mo. Nota: El coeficiente de asimetría de Pearson debe utilizarse sólo en aquellos datos unimodales con distribución acampanada. 7.1.2 Coeficiente de asimetría de Fisher Es la medida de asimetría más utilizada, ya que no presenta ninguna condición previa y se aplica a cualquier tipo de distribución. A continuación, se presenta la fórmula poblacional del coeficiente de asimetría de Fisher: 3 1 1 2 = − ∑ = − − n i i x x x n S C A Fisher n n . . ( )( ) La fórmula muestral del coeficiente de asimetría de Fisher hace uso de la media y de la desviación estándar muestral, así como de un factor de corrección. En el presente texto, se aplicará directamente el software para el cálculo correspondiente. 7.2 Coeficiente de curtosis La curtosis cuantifica la cantidad de observaciones que se agrupan alrededor de las medidas de tendencia central de la distribución de los datos. La interpretación del valor del coeficiente de curtosis K es: 4 1 4 3 n i xi K ( ) = − µ∑ = − s a. Si K > 0 la distribución es leptocúrtica (apuntalada) b. Si K = 0 la distribución es mesocúrtica (normal) c. Si K < 0 la distribución es platicúrtica (aplanada) Mesocúrtica Leptocúrtica Platicúrtica Figura 32. Tipos de curtosis. Capítulo 1. EstadístiCa dEsCriptiva 65 Nota: Los coeficientes de asimetría y de curtosis son índices, y por lo tanto no poseen unidades de medida. CASO: Aplicativo móvil para el monitoreo de la actividad física Una empresa de artículos deportivos ha desarrollado un aplicativo móvil para el monitoreo de la actividad física, y ha convocado a 240 personas para monitorear sus caminatas y actividad física de mayor esfuerzo (trotar y correr). Luego de una semana se recabaron las siguientes características: Valoración: Valoración del aplicativo móvil elegido: Deficiente, Aceptable, Excelente Recorrido: Recorrido, medido en kilómetros (km), monitoreado durante la semana. Los datos recabados se presentan en el archivo: Ejercicios.mtw. Ejemplo 14 a. En relación al recorrido monitoreado, obtenga los coeficientes de asime- tría de Pearson y de Fisher. Brinde su interpretación. Solución i. Ingresar a Stat> Basic Statistics> Display Descriptive Statistics… ii. Seleccionar la variable Recorrido iii. Presionar el botón Statistics… iv. Seleccione las siguientes estadísticas descriptivas: media, mediana, desviación estándar, y coeficiente de asimetría (skewness). Pulse el botón OK v. Presionar el botón OK El reporte obtenido se presenta a continuación: Descriptive Statistics: Recorrido Variable Mean StDev Median Skewness Recorrido 29.972 5.033 29.000 0.76 Para el cálculo del coeficiente de asimetría de Pearson se hará uso de la media, mediana y desviación estándar obtenidas en el reporte, ya que en el software Minitab no se puede calcular directamente dicho coeficiente. 3 3 29 972 29 0 579 5 033 − − = = ≈ x Me S ( ) ( . )Pearson . . .C A. 0 76= C.A. Fisher . Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios66 Interpretación: Los datos del recorrido monitoreado durante la sema- na, mediante el aplicativo móvil, presentan una distribución asimétrica positiva, ya que el valor del coeficiente es positivo. b. Obtenga e interprete la curtosis asociada al recorrido monitoreado me- diante el aplicativo móvil, según la valoración del aplicativo realizada por el participante. Solución i. Ingresar a Stat> Basic Statistics> Display Descriptive Statistics… ii. Seleccionar la variable Recorrido iii. By variables: Valoración iv. Presionar el botón Statistics… v. Seleccione Kurtosis. Pulse el botón OK vi. Presionar el botón OK El reporte obtenido se presenta a continuación: Descriptive Statistics: Recorrido Variable Valoración Kurtosis Recorrido Aceptable -0.18 Deficiente -0.43 Excelente 0.32 Interpretaciones: • Los participantes que valoraron el aplicativo como Deficiente o Acep- table presentaron un recorrido que se distribuye en forma platicúrtica (aplanada). • Los participantes que valoraron el aplicativo como Excelente presenta- ron un recorrido que se distribuye en forma leptocúrtica (apuntalada) 8. análisis exploratorio De Datos El análisis exploratorio de datos consiste de una serie de técnicas estadísticas, de tipo gráfico, propuestas por Tukey (1977) con la finalidad de detectar lo si- guiente: i. Asimetría de la distribución. ii. Presencia de valores extremos (outliers) iii. Dispersión de los datos. iv. Violación de alguna suposición. Capítulo 1. EstadístiCa dEsCriptiva 67 Las técnicas de análisis exploratorio de datos son: a. Tallos y hojas (stem and leaf). b. Gráfico de cajas (boxplot). En el presente texto solamente se abordará al gráfico de cajas, ya que es el de mayor aplicación y difusión. 8.1 Gráfico de cajas Un gráfico de cajas es un rectángulo (caja) que es construido sobre los valores del primer cuartil, de la mediana y del tercer cuartil. El gráfico de caja es una poderosa herramienta visual que permite comparar diversos conjuntos de datos simultáneamente respecto a simetría, variabilidad, valores extremos y violación de suposiciones. La figura 33 describe las partes de una caja. * Valor extremo Tercer cuartil Q3MedianaPrimera cuartil Q1 Q1 – 1.5(Q3 – Q1 ) Q3 + 1.5(Q3 – Q1 ) Las características del gráfico de caja son: a. La localización de la caja es dada por la línea que atraviesa la caja y que representa la mediana. b. La dispersión es dada por el largo de la caja, así como por la distancia en- tre los extremos de los bigotes. c. El sesgo (asimetría) se observa en la desviación que existe entre la línea que representa la mediana y los extremos de los bigotes. d. Los valores extremos (atípicos, discordantes, outliers) son representados mediante asteriscos. CASO: Consumo de electricidad Un programa de apoyo social ha recabado datos asociados al con- sumo de energía eléctrica, en kilovatioshora al mes (kW.h /mes), de las viviendas de las zonas de mayor densidad poblacional en 4 distritos del cono norte. Estos datos se presentan en el archivo: C_Electricidad.mtw Figura 33. Partes de un gráfico de cajas. Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios68 Ejemplo 15 a. Obtenga el gráfico de cajas asociado al consumo de electricidad y brinde una interpretación. Solución i. Ingresar a Graph> Boxplot… ii. Seleccionar la opción One Y – Simple. iii. Pulse el botón OK iv. Seleccionar a la variable C. Electricidad v. Presionar el botón OK Nota: Si se desea que el gráfico de cajas se muestre en horizontal, enton- ces, se debería haber pulsado el botón Scale, y marcar la opción Transpose value and category scales. Para editar el gráfico de cajas obtenido, se debe realizar lo siguiente: i. Presionar el click derecho del mouse con el cursor sobre la caja. ii. Seleccionar Add> Data Labels… iii. En la pestaña Outliers, seleccionar la opción Use y-value labels iv. Pulsar OK. El gráfico editado se presenta a continuación: Figura 34. Selección del gráfico de cajas simple de una sola variable. Capítulo 1. EstadístiCa dEsCriptiva 69 Interpretación: Se observan 3 datos atípicos o discordantes (outliers), 2 inferiores y 1 superior, los cuales indican que existen 2 viviendas con con- sumos mensuales de electricidad muy bajos (12 00. y 12 68. kW.h/mes); asimismo, existe una vivienda con un consumo muy alto ( 30 kW.h/mes) en comparación a las demás viviendas de la muestra. b. Obtenga gráficos de cajas del consumo de electricidad pero considerando los diferentes distritos en análisis. Solución i. Ingresar a Graph> Boxplot… ii. Seleccionar la opción One Y – With Groups iii. Pulse el botón OK iv. Seleccionar a la variable a ser graficadaC. Electricidad v. Seleccionar a la variable cualitativa (categórica) Distrito. Figura 36. Selección del gráfico de cajas sim- ple con grupos. Figura 35. Gráfico de cajas simple de una sola variable. Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios70 vi. Presionar el botón OK. Luego de obtenido el gráfico, editar para etiquetar los datos atípicos. El gráfico editado se presenta a continuación: Interpretación: Se aprecia que en las viviendas de Carabayllo y Comas que conforman la muestra no existen datos discordantes; mientras que en los distritos de Independencia y San Martín de Porres sí existen datos discordantes. Figura 37. Cuadro de diálogo del gráfico de cajas simple con grupos. Figura 38. Gráfico de cajas simple con grupos. Capítulo 1. EstadístiCa dEsCriptiva 71 9. probleMas resueltos 1. En relación a la cantidad de megabytes (MB) consumidos mensualmente por los usuarios prepago de una empresa de telecomunicaciones que adquieren paquetes de datos; se realizará una estimación del consumo promedio de megabytes en base a 200 usuarios elegidos al azar. A cada una de las expre- siones que se presentan, hágales corresponder uno de los siguientes térmi- nos estadísticos: A. Unidad de análisis B. Población C. Muestra D. Muestreo E. Variable F. Dato G. Parámetro H. Estadístico Para realizar la correspondencia entre las expresiones y los términos es- tadísticos, coloque dentro de los paréntesis la letra correspondiente. Expresiones en evaluación: i. ( ) La cantidad de MB consumidos mensualmente por un usuario prepago. ii. ( ) Un usuario prepago consumió 124 MB en un mes. iii. ( ) Los 200 usuarios prepago seleccionados. iv. ( ) La cantidad promedio de MB consumidos por todos los usuarios prepago. v. ( ) La cantidad promedio de MB consumidos por los 200 usuarios prepago. vi. ( ) Un usuario prepago de la empresa de telecomunicaciones. vii. ( ) Todos los usuarios prepago de la empresa de telecomunicaciones. viii. ( ) El procedimiento utilizado para seleccionar a los 200 usuarios prepago. Solución i. (E) ii. (F) iii. (C) iv. (G) v. (H) vi. (A) vii. (B) viii. (D) 2. Una revista electrónica dedicada a temas tecnológicos realizó un estudio dirigido a los jóvenes de algunos distritos de la zona residencial de Lima Metropolitana. Para el estudio se realizó la selección al azar de 800 jóvenes de los mencionados distritos. Los principales resultados obtenidos fueron los siguientes: El 42 % de los encuestados posee un smartphone de gama alta, y el 19 % usa el sistema operativo móvil iOS; además, en promedio, acceden desde su smartphone, 2 5. horas diariamente a las redes sociales, y se determinó que la mayoría de los jóvenes se encuentra suscrito a 3 redes sociales. Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios72 De acuerdo al contexto presentado: a. Identifique la unidad de análisis, población, muestra, variables y tipos de variables. b. Presente un ejemplo de dato y de estadístico. Solución a. De acuerdo al contexto se tiene lo siguiente: Unidad de análisis: Joven residente en alguno de los distritos residencia- les de Lima Metropolitana. Población: Todos los jóvenes residentes en los distritos residenciales de Lima Metropolitana. Muestra: 800 jóvenes residentes en los distritos residenciales de Lima Metropolitana. Variable 1: Posesión de smartphone (cualitativo nominal). Variable 2: Sistema operativo móvil que usa el smartphone (cualitativo nominal). Variable 3: Tiempo de acceso diario, desde el smartphone, a las redes so- ciales (cuantitativo continuo). Variable 4: Número de redes sociales a las que está suscrito (cuantitativo discreto). b. Se pueden brindar los siguientes ejemplos: Dato: Un joven encuestado señaló que el sistema operativo de su smart phone es Android. Estadístico: El 42 % de los encuestados posee un smartphone de gama alta. 3. Para cada uno de los siguientes estudio, indique la unidad de análisis, la variable y el tipo de variable que debería ser utilizado para resumir la información: a. Conocer el número de hijos de los operarios de una empresa manu- facturera. b. Determinar el nivel de satisfacción de asegurados de una AFP. c. Identificar el país de procedencia de los turistas que visitan la reserva de Paracas. Solución a. Unidad de análisis: Operario de una empresa manufacturera. Variable: Número de hijos. Tipo de variable: Cuantitativo discreto. b. Unidad de análisis: Asegurado de la AFP. Variable: Nivel de satisfacción. Tipo de variable: Cualitativa ordinal. Capítulo 1. EstadístiCa dEsCriptiva 73 c. Unidad de análisis: Turista que visita la reserva de Paracas. Variable: País de procedencia. Tipo de variable: Cualitativa nominal. 4. En base a una muestra de 320 personas de la población económicamente activa, se elaboró una gráfica circular asociada al nivel de satisfacción con la oferta turística: a. Determine el porcentaje de encuestados que señalaron un nivel de satisfacción medio. b. Indique el número de encuestados que señalaron un alto nivel de satisfacción. c. De los encuestados que señalaron un nivel de satisfacción medio con la oferta turística, un 37 5 . % laboran en el sector público. ¿Cuántas per- sonas señalaron un nivel de satisfacción medio y laboran en el sector privado? Solución a. La suma de todos los porcentajes debe ser igual al 100 %, entonces: 12 5 27 5 100 60 0+ + = ⇒ =X X . % . % % . % El 60 0 . % de los encuestados señalaron un nivel de satisfacción medio. b. El 12 5 . % de los 320 encuestados señalaron un nivel de satisfacción alto, entonces: 0 125 320 40=. ( ) encuestados: c. Nivel de satisfacción Medio: 0 60 320 192× =. encuestados De los 192 encuestados, el 37 5 . % labora en el sector público, entonces: 0 375 192 72=. ( ) encuestados La diferencia con respecto a los 192 encuestados nivel de satisfacción medio, corresponden al sector privado: 192 72 120− = encuestados. Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios74 5. Se realizó una tabla cruzada asociada a las variables de rendimiento y local asociadas a los trabajadores de una empresa del rubro tecnológico, tal como se muestra a continuación. Rendimiento Local Total L1 L2 L3 L4 Bajo 2 3 1 2 8 Medio 9 14 20 7 50 Alto 3 7 9 3 22 Total 14 24 30 12 80 Responda a las siguientes preguntas: a. ¿Cuántos y que porcentaje de trabajadores eran del local L1 y tuvieron un rendimiento medio? b. De los trabajadores con un rendimiento medio, ¿qué porcentaje corres- ponden al local L3? Justifique cuantitativamente. c. De los trabajadores con un rendimiento alto, ¿qué porcentaje no corres- ponden al local L4? Justifique cuantitativamente. d. De los trabajadores del local L4, ¿es o no correcto afirmar que más de la cuarta parte tuvo un rendimiento alto? Justifique cuantitativamente. Solución a. ¿Cuántos y que porcentaje de trabajadores eran del local L1 y tuvieron un rendimiento medio? 9 de 80 trabajadores, es decir, 11 25. %. b. De los trabajadores con un rendimiento medio, ¿qué porcentaje corres- ponde al local L3? Justifique cuantitativamente. De los trabajadores con un rendimiento medio, el 40 % corresponde al local L3. c. De los trabajadores con un rendimiento alto, ¿qué porcentaje no corres- ponde al local L4? Justifique cuantitativamente. De los trabajadores con un rendimiento alto, el 86 36. % 3 7 9 22([ ] / )+ + no corresponde al local L4. d. De los trabajadores del local L4, ¿es o no correcto afirmar que más de las tres décimas partes tuvieron un rendimiento alto? Justifique cuantitativamente. No es correcto afirmar que, de los trabajadores del local L4, más de las tres décimas partes tuvieron un rendimiento alto, ya que los trabajadores con este nivel de rendimiento representan el 25 % 3 12 25 30 3 10/ /%( ).%≅ < ≅ 6. En una muestra de 160 personas, entre hombres y mujeres, que realizaroncompras en un centro comercial, se observó la forma de pago (efectivo, tar- jeta de débito, tarjeta de crédito); luego de lo cual se resumió lo siguiente: Capítulo 1. EstadístiCa dEsCriptiva 75 • 35 % de las personas pagaron con tarjeta de débito. • Los hombres que pagaron con efectivo representan la décima parte del total de personas en estudio. • De las 64 mujeres, el 18 75 . % pagó con efectivo. • De los hombres, el 31 25 . % pagó con tarjeta de débito. a. A partir de la información brindada, obtenga y presente la tabla de con- tingencia correspondiente. b. De las personas que pagaron con tarjeta de crédito, ¿qué porcentaje fue- ron hombres? Justifique cuantitativamente. Solución a. Tabla de contingencia: • 56 personas pagaron con tarjeta de débito: 0 35 160 56. .× = • 16 hombres que pagaron con efectivo: 0 10 160 16. .× = • De las mujeres, 12 pagaron con efectivo: 0 1875 64 12. .× = • De los hombres, 30 pagaron con tarjeta de débito: 0 3125 96 30. .× = Los demás valores de la tabla se obtuvieron por diferencia. Sexo Medio de pago Total Efectivo T. Débito T. Crédito Hombre 16 30 50 96 Mujer 12 26 26 64 Total 28 56 76 160 7. Un investigador ha realizado un estudio sobre los grupos de personas que asisten a funciones artísticas o de entretenimiento. En relación a la varia- ble correspondiente al número de individuos que conforman el grupo de personas que asisten a la función artística, se tiene, en forma incompleta, la siguiente tabla de distribución de frecuencias asociada a una muestra de 160 grupos de personas. i N.° de personas (yi) Frecuencia absoluta (fi) Frecuencia absoluta acumulada (Fi) Frecuencia relativa porcentual (hi%) Frecuencia relativa porcentual acumulada (Hi%) 1 2 15 2 3 40 3 4 79 4 5 116 5 6 142 6 7 Total Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios76 Responda adecuadamente a las siguientes preguntas: a. Complete la tabla presentada. b. ¿Cuántos grupos de personas se encontraban conformados por más de 4 personas? c. Calcule e interprete el valor de F5 – F3. d. ¿Es cierto que los grupos de 4 personas representan un poco más de la cuarta parte de los grupos en estudio? e. ¿Qué porcentaje de grupos se encontraban conformados por hasta 6 personas? f. ¿Qué porcentaje de participantes indicaron que su grupo lo conforma- ban 4 o más personas? g. Si los grupos de 2 a 3personas son considerados como “Reducidos”; los de 4 a 5 personas son considerados “Numerosos”, y los de 6 a más como “Muy numerosos”; ¿cuál de dichas categorías es la de mayor porcentaje? Solución a. Tabla de distribución de frecuencias: i N° de personas (yi) Frecuencia absoluta (fi) Frec. Absoluta acumulada (Fi) Frec. Relativa porcentual (hi%) Frec. Relativa porcentual acumulada (Hi%) 1 2 15 15 9.38 9.38 2 3 25 40 15.63 25.00 3 4 39 79 24.38 49.38 4 5 37 116 23.13 72.50 5 6 26 142 16.25 88.75 6 7 18 160 11.25 100.00 Total 160 100.00 b. 4 5 6 37 26 18 81f f f+ + = + + = participantes De forma similar: 3160 160 79 81 F– − == participantes. c. 5 3 142 79 63F F– = − = grupos se encontraban conformados de 5 a 6 personas. d. La cuarta parte 1 4/( ) es el 25 %, y se tiene que: 3 24 38 25h % . % %= < Por lo tanto, no es cierto lo que se señala, ya que, en realidad, un poco menos de la cuarta parte de los grupos en estudio se encontraban con- formados por 4 personas. e. 5 88 75H % . %= de los grupos se encontraban conformados por hasta 6 personas. Capítulo 1. EstadístiCa dEsCriptiva 77 f. 2100 100 25 75 H % % % % %− = − = de los grupos se encontraban conformados de 4 a más personas. g. Grupos “Reducidos”: 2 25 0H % . %= Grupos “Numerosos”: 4 2 72 5 25 0 47 5H H% % . % . % . %− = − = Grupos “Muy numerosos”: 4100 100 72 5 27 5H% % % . % . %.− = − = Por lo tanto, los grupos “Numerosos” 47 5( . %) representan el mayor porcentaje. 8. Los directivos de una empresa distribuidora de energía eléctrica se encuen- tran realizando un estudio para analizar el monto asociado al consumo anual de energía eléctrica. Para la realización de un estudio piloto se se- leccionaron a 32 hogares de los distritos de Ate, Comas y Lince, los cuales presentaron los siguientes montos de consumo: 2300 2890 2960 3100 2880 1700 1880 3200 3050 2030 2380 2140 2650 2820 1780 2340 3800 3350 1800 3050 3560 3720 2450 3010 2740 2420 2540 2300 2580 2070 2080 1850 a. Realice la siguiente codificación: Bajo: consumos menores a S/ 2400 Estándar: consumos mayores o iguales a S/ 2400 pero menores de S/ 2800. Elevado: consumos mayores o iguales a S/ 2800 pero menores de S/ 3200. Muy elevado: consumos o mayores a S/ 3200 ¿Cuál es el porcentaje de hogares correspondiente a cada categoría de la presente clasificación? b. Utilizando el criterio de Sturges, construya la tabla de distribución de frecuencias correspondiente. Solución a. Luego de digitar los datos en la hoja de trabajo del software Minitab, se realizará una codificación de numérico a texto: 0 2399 99: . ⇒ Bajo 2400 2799 99: . ⇒ Estándar 2800 3199 99: . ⇒ Elevado 3200 99999: ⇒ Muy elevado Luego de lo cual se obtienen los porcentajes correspondientes: Tally for Discrete Variables: Monto consumo Pago Count Percent Bajo 13 40.63 Elevado 8 25.00 Estándar 6 18.75 Muy elevado 5 15.63 N= 32 Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios78 b. Se obtienen las estadísticas descriptivas correspondientes Descriptive Statistics: Monto consumo annual Total Variable Count Minimum Maximum Range Pago anual 32 1700 3800 2100 Luego de obtenido el rango, se determina el número de intervalos, aplicando la fórmula de Sturges: 101 3 32 32 5 9971 6k . (log ( )) .= + = ≈ Por lo tanto, la amplitud del intervalo es: 2100 350 6 = =C . A continuación, se hace uso del software Minitab para obtener el histograma correspondiente: A partir del cual se construye la tabla de distribución de frecuencias de los montos del consumo anual de energía eléctrica, tal como se mues- tra a continuación: Límite inferior Límite superior Marca de clase (yi) Frecuencia absoluta (fi) Frecuencia relativa porcentual (hi%) Frecuencia absoluta acumulada (Fi) Frecuencia relativa porcentual acumulada (Hi%) 1700 2050 1875 6 18.750 6 18.750 2050 2400 2225 7 21.875 13 40.625 2400 2750 2575 6 18.750 19 59.375 2750 3100 2925 7 21.875 26 81.250 3100 3450 3275 3 9.375 29 90.625 3450 3800 3625 3 9.375 32 100.000 Capítulo 1. EstadístiCa dEsCriptiva 79 9. En un taller mecánico autorizado de una marca de automóviles, se ha reca- bado el kilometraje recorrido por los automóviles que ingresan al taller para una reparación en el motor. A continuación, se presenta, en forma incomple- ta, la tabla de distribución de frecuencias asociada a 250 automóviles: Nota: Intervalos de igual amplitud. i Intervalo de kilómetros (S/) Marca de Clase ( yi ) N.º Autos (fi) N.º Acum. Autos (Fi) % Autos (hi%) % Acum. Autos (Hi%) 1 – [ 〉 16.00 2 – [ 〉 112 3 – [ 〉 172 4 – [ 〉 19.20 5 22 000 – [ 〉 20 000 Total 250 100 Realice o responda según se solicite. a. Complete la tabla de distribución de frecuencias. b. ¿Cuál es la amplitud de los intervalos? c. ¿Cuál es la marca de clase correspondiente al primer intervalo? d. ¿Qué porcentaje de autos no se encuentran comprendidos en el primer intervalo? e. ¿Cuántos autos presentaron un kilometraje de por lo menos 6000 km pero por debajo de los 18 000 km? Solución a. Complete la tabla de distribución de frecuencias. i Intervalo de kilómetros (S/) Marca de Clase (yi) N.º Autos (fi) N.º Acum. Autos (Fi) % Autos (hi%) % Acum. Autos (Hi%) 1 2000 6000 –[ 〉 4 000 40 40 16.00 16.00 2 6000 10 000–[ 〉 8 000 72 112 28.80 44.80 3 10 000 14 000–[ 〉 12 000 60 172 24.0068.80 4 14 000 18 000–[ 〉 16 000 48 220 19.20 88.00 5 18 000 22 000–[ 〉 20 000 30 250 12.00 100.00 Total 250 100 % Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios80 b. ¿Cuál es la amplitud de los intervalos? 40 000 km. c. ¿Cuál es la marca de clase correspondiente al segundo intervalo? 8000 km. d. ¿Qué porcentaje de autos no se encuentran comprendidos en el primer intervalo? 100 16 84 % % %− = e. ¿Cuántos autos presentaron un kilometraje de por lo menos 6000 km pero por debajo de los18 000 km? 72 60 48 180+ + = automóviles. 10. En una galería comercial especializada en la venta de muebles para el hogar se ha realizado una encuesta para determinar los motivos de insatisfacción de los clientes, y se ha elaborado el siguiente diagrama de Pareto. a. Si cada cliente insatisfecho emitió una opinión sobre su motivo de in- satisfacción, ¿cuántos clientes insatisfechos fueron considerados para el estudio? b. Obtenga los valores faltantes correspondientes a las frecuencias absolu- tas y relativas acumuladas. c. ¿Cuáles motivos de insatisfacción empezaría por tratar de solucionar?, ¿por qué criterio? Capítulo 1. EstadístiCa dEsCriptiva 81 Solución a. Como una frecuencia absoluta de 60 corresponde a un porcentaje (fre- cuencia relativa) de 40 %, entonces se tiene que: 60 0.40,= n entonces, 150n = clientes insatisfechos fueron los consi- derados para el estudio. b. 2 5 639 9 4f f f, ,= = = 4 689 33 98 00H H% . %, % . %= = c. ¿Cuáles motivos de insatisfacción empezaría por tratar de solucionar?, ¿por qué criterio? Se empezaría por tratar de solucionar los siguientes motivos: inade- cuada explicación del producto, pocos modelos, y diseños antiguos, ya que son los de mayor frecuencia, y juntos representan el 79 33 . % de la totalidad de opiniones emitidas. 11. En un hotel ubicado en Moyobamba, se ha elaborado una gráfica de basto- nes asociada al número de noches de estadía en el hotel, por parte de 128 clientes, tal como se muestra a continuación: Basado en el gráfico de bastones, obtenga e interprete adecuadamente las siguientes medidas estadísticas solicitadas. a. La media. b. La mediana. c. La moda. Solución a. Cálculo de la media. ( ) ( ) ( ) ( ) ( ) 5 1 1 22 2 50 3 32 4 18 5 6 320 2.5 128 128 = ∑ + + + + = = = = i i i y f y n Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios82 La cantidad promedio de noches de estadía en el hotel fue de 2 5. noches. b. La mitad de 128 es 64, así que se ubican los datos que ocupan las posi- ciones 64 y 65 el cual en ambos casos es 2 noches. ( ) ( )64 65 2 2( ) 2 2 2 x x Me X + + = = = noches, ya que n es par. El 50 % de los clientes encuestados tuvieron a lo más una estadía de 2 noches en el hotel. c. 2Mo X( ) = El tiempo de estadía más frecuente es de 2 noches. 12. A un grupo de 12 jóvenes se les consultó sobre el número de tarjetas de cré- dito que posee. Se determinó que 1 joven no poseía tarjeta de crédito, y que 6 3 1 , , y 1 jóvenes poseían 1 2 3 , , y 4 tarjetas de crédito, respectivamente. a. Obtenga e interprete el valor de la mediana asociada al número de tarje- tas de crédito que poseen los jóvenes en estudio. b. ¿Cómo mínimo, cuántos jóvenes con 3 tarjetas de crédito se deberían añadir al grupo de jóvenes en estudio, para que la mediana cambie de valor? c. Si se añade la mínima cantidad de jóvenes con 3 tarjetas de crédito que se determinó en el ítem anterior (b), ¿cuál tipo de distribución presen- taría la nueva muestra de jóvenes en relación al número de tarjetas de crédito que poseen? Justifique. Solución a. Presentando los datos ordenados. 0 1 1 1 1 1 1 2 2 2 3 4 x(1) x(2) x(3) x(4) x(5) x(6) x(7) x(8) x(9) x(10) x(11) x(12) 12n = Como n es par, entonces: 1 1 1(6) (7)2 2( ) 1 2 2 2 + + + + = = = = x xn n x x Me X Interpretación: El 50 % de los jóvenes encuestados posee a lo más 1 tarjeta de crédito. b. Si se añaden jóvenes con 3 tarjetas de crédito, estos ocuparán la posición ( )11x en adelante, y por lo tanto el tamaño de la muestra (n) aumentaría. Entonces, si se desea que la mediana se modifique, debería ser mayor que 1. Capítulo 1. EstadístiCa dEsCriptiva 83 Si se añaden jóvenes con 3 tarjetas de crédito, entonces, la nueva me- diana por lo menos debería encontrarse entre 7x( ) y 8x( ) . 1 1 2(7) (8)2 2( ) 1.5 2 2 2 + + + + = = = = x xn n x x Me X Lo cual ocurriría si =nx x(7) 2 , es decir si 14n = . Por lo tanto, para que la mediana cambie de valor, por lo menos 14 12 2− = jóvenes con 3 tarjetas de crédito se deberían añadir al grupo. c. Añadiendo 2 jóvenes con 3 tarjetas de crédito se tiene lo siguiente: Moda = 1 tarjeta Mediana = 1.5 tarjetas Media = 5 1 0(1) 1(6) 2(3) 3(1 2) 4(1) 25 1.786 12 2 14 = ∑ + + + + + = = = ≈ + i i i y f y n La nueva muestra de jóvenes, en relación al número de tarjetas de crédito que poseen, presenta una asimetría positiva (cola derecha), ya que moda < mediana < media 13. En un club de campo, se hizo el siguiente gráfico asociado al tiempo de uso de los servicios libres que ofrece el club por parte de los usuarios que se han hospedado en las cabañas durante los fines de semana. a. Obtenga e interprete el tiempo promedio de uso de los servicios libres que ofrece el club de campo. b. Si el club de campo se encuentra ofreciendo ofertas y promociones para la realización de actividades, por lo cual se espera que el tiempo de uso de los servicios libres disminuya en un 20 %, ¿cuál será el nuevo tiempo de uso promedio? Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios84 Solución a. A partir de la gráfica de frecuencias absolutas acumuladas, se obtiene la tabla de distribución de frecuencias correspondiente: Intervalos Marca de clase (yi) Frecuencia absoluta (fi) 60 120[ − 〉 90 10 120 180[ − 〉 150 64 180 240[ − 〉 210 97 240 300[ − 〉 270 100 300 360[ ]− 330 49 Total ----- 320 Cálculo de la media: ( ) ( ) ( ) ( ) ( ) 1 90 10 150 64 210 97 270 100 330 491( ) 320= + + + + = =∑ k i i i M Y y f n 74 040( ) 3 2 20 31.375= = M Y minutos Interpretación: Los usuarios del club de campo que se han hospedado en las cabañas durante los fines de semana usan los servicios libres un promedio de 231 4. minutos, aproximadamente. b. Haciendo uso de las propiedades de la media: ( )(0.80 ) 0.80 ( ) 0.80 231.375M Y M Y= = 185 1. minutos. El nuevo tiempo promedio de uso de los servicios libres del club de campo será de 185 1. minutos. 14. Una entidad especializada en el financiamiento de pequeños negocios po- see 2 agencias en un distrito del cono este. Las agencias A y B disponen de 4 y 6 promotores de crédito, respectivamente, quienes visitan a los pequeños emprendedores de la zona para ofrecerles financiamiento. La en- tidad financiera emitió el siguiente informe relacionado a la colocación de créditos, por parte de los promotores, durante el último mes: Tipo de créditos Promedio de los montos de crédito por asesor Agencia A Agencia B Nuevos créditos S/ 68 300 S/ 70 200 Renovación de créditos S/ 94 500 S/ 88 600 Nota: Crédito total colocado = Créditos nuevos + Créditos renovados Capítulo 1. EstadístiCa dEsCriptiva 85 a. Determine el promedio del monto de los nuevos créditos colocados por los promotores de crédito de ambas agencias en conjunto. b. Si el monto promedio de nuevos créditos colocados por los promotores en la Agencia A se encontraba errado (no era S/ 68 300 ); de forma tal que el promedio del monto de nuevos créditos colocados por los promotores de ambas agencias en conjunto es de S/ 69 500 , ¿cuál era el verdadero monto promedio de nuevos créditos colocados en la Agencia A? c. Determine el promedio del monto de los créditos totales colocados por los promotores de la agenciaA. d. Determine el promedio de los créditos totales colocados por los promo- tores de crédito de ambas agencias. Solución a. Sea, X: Monto de los nuevos créditos. Se tiene: 68 300=Ax , 70 200=Bx , 4An = , 6Bn = Se sabe que: A 4(68 300) 6(70 200) 694 400 S/ 69 440 n 4 6 10 + + = = = = + + A A B B B n x n xx n b. Se sabe que: += + A A B B A B n x n xx n n 4 6(70 200) 4 421 200 69 500 4 6 10 + + = = = + A Ax x x 69 500(10) 421 200 S/ 68 450 4 − = =Ax c. Sea, X: monto de los nuevos créditos, Y : monto de renovación de créditos, y Z: monto total de créditos. Se tiene: ( ) 68 300=AM X , ( ) 94 500=AM Y Haciendo uso de las propiedades de la media: 68 300 94 500 162 800A A A A AM Z M X M X M / ( ) ( ) ( ) ( ) S= + == + = + =Y Y d. 70 200 88 600 158 800B B B B B Bz M Z M X M X M /( ) ( ) ( ) ( ) S= = + == + = + =Y Y 4 162 800 6 158 800 1 604 000 160 400 4 6 10 A A B B A B n z n z z / n n ( ) ( ) S + + = = = = + + 15. En una fábrica de electrodomésticos, los operarios A y B fueron evaluados en su velocidad para ensamblar un modelo de ventilador. La evaluación se realizó en 2 turnos: mañana y tarde. Se obtuvo los siguientes resultados: Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios86 Turno Tiempo promedio (seg.) de ensamble Operario A Operario B Ambos operarios Mañana 170.0 172.0 170.96 Tarde 170.2 171.4 170.77 Los promedios fueron calculados con diferentes tamaños de muestra (número de ventiladores) para cada turno y para cada operario. a. Si en el turno de la mañana la muestra total de ventiladores ensambla- dos por ambos operarios fue de 125 ventiladores, ¿cuántos ventiladores fueron ensamblados por cada operario? b. En el turno de la tarde, ¿qué porcentaje de la muestra corresponde a cada operario? Solución a. Sea, X: tiempo de ensamblaje del operario durante el turno de la mañana. Se tiene: 170Ax ,= 172Bx ,= 125A Bn n+ = , entonces 125B An n= = − 170 125 172 170 96 125 AA B B A A A B n n n n x x n n x ( ) ( ) . + + + − = = = 170 172 21 500 21 370 65A A An n n .− + = ⇒ = El número de ventiladores que fueron ensamblados por cada opera- rio en el turno de la mañana es: 65An = y 60Bn .= b. Sea, :Y tiempo de ensamble del operario durante el turno de la tarde. De la fórmula del promedio general (media de medias) se deduce lo siguiente: AA B B A B A B A A B B A B A B A B n n n n n n n n n n y y y y y p y p y + = = + + + + = + , donde p es la proporción de la muestra que corresponde a cada operario. Se tiene: 170 2Ay . ,= 171 4yB . ,= 1 1 .+ = ⇒ = −A B B Ap p p p Por lo tanto: 170 2 1 171 4 170 2 171 4 171 4 170 77 0 525A A A A Ay p p p p p. ( ) . . . . . .= + − = − + = ⇒ = Los porcentajes de la muestra que corresponden a cada operario son de 52 5 . % y 47 5 . %, para los operarios A y B, respectivamente. Capítulo 1. EstadístiCa dEsCriptiva 87 16. Se han recabado los datos asociados a 80 usuarios de los principales ser- vicios de acceso a contenidos vía streaming, es decir, servicios de reproduc- ción de contenido digital en paralelo mientras se descarga sin almacenarse. En el archivo Streaming.mtw, se presentan los datos asociados a las siguientes variables: Servicio Servicio de streaming del cual es usuario activo. Nivel manejo Nivel de manejo de las funcionalidades del servicio. H. Conexión Horas de conexión mensual para el uso del servicio. En relación a las horas de conexión mensual responda a las siguientes preguntas: a. Según el nivel de manejo de las funcionalidades del servicio, ¿en cuál de los niveles los usuarios presentan un mayor promedio de horas de conexión? b. Para las horas de conexión mensual se consideró el tiempo de búsqueda de contenidos y el tiempo de reproducción. Si se considera un tiempo constante de 2 14. horas al mes para la búsqueda de contenidos. Para los usuarios de Deezer, ¿cuál es el nuevo valor promedio de las horas de co- nexión mensual sin considerar la búsqueda de contenidos? c. ¿Cuál es el valor de las horas de conexión por debajo del cual se encuen- tra el 50 % de usuarios de Spotify con menores tiempos de conexión? d. Complete el siguiente párrafo: El 25 % de los usuarios encuestados con menores tiempos de conexión, presenta como máximo horas de conexión mensual, el mismo valor que coincide para los usuarios de . Mientras que el 25 % de los usuarios de Netflix, con mayores tiem- pos de conexión, presenta un tiempo de conexión de 29 6. horas. e. Halle el tiempo máximo de horas de conexión mensual del 65 % de los usuarios de Netflix con menores tiempos de conexión. Solución a. Se obtiene los promedios asociados a las horas de conexión, en forma desagregada por nivel de manejo de las funcionalidades del servicio. Descriptive Statistics: H. Conexión Nivel Total manejo Count Mean Alto 9 30.41 Bajo 26 18.373 Medio 45 25.984 Los usuarios con un nivel de manejo alto de las funcionalida- des del servicio presentan un mayor promedio de horas de conexión 30 41. h( oras). b. Se obtiene los promedios asociados a las horas de conexión, en forma desagregada por el servicio de streaming. Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios88 Además, se obtienen los valores de la mediana y los cuartiles para responder las preguntas posteriores. Descriptive Statistics: H. Conexión Total Variable Servicio Count Mean Q1 Median Q3 H. Conexión Deezer 16 25.86 23.25 25.80 29.10 Netflix 32 24.27 18.50 25.15 29.60 Spotify 32 22.83 19.20 20.55 25.95 Aplicando las propiedades de la media se tiene lo siguiente: 2 14 2 14M X = M XDeezer Deezer( – . ) ( ) – . 2 14 25 86 2 14 23 72M XDeezer( . ) . . .− = − = horas c. De acuerdo al reporte obtenido se observa que el 50 % de usuarios de Spotify con menores tiempos de conexión presentan a lo más 20 55. ho- ras de conexión al mes, ya que ese es el valor de la mediana. d. Se obtienen las medidas de posición en forma general, sin considerar ningún tipo de desagregación. Descriptive Statistics: H. Conexión Total Variable Count Q1 Median Q3 H. Conexión 80 19.200 23.700 29.100 Se observa que los valores asociados a los espacios a completar se encuentran a asociados a (en orden de aparición): [1] Cuartil 1 general: 19 2. horas, 2[ ] Cuartil 1 asociado a Spotify: 19 2. horas, 3[ ]Cuartil 3 aso- ciado a Netflix. El párrafo completado queda de la siguiente forma: El 25 % de los usuarios encuestados con menores tiempos de conexión presenta como máximo19 2. horas de conexión mensual, el mismo valor que coincide para los usuarios de Spotify. Mientras que el 25 % de los usuarios de Netflix, con mayores tiempos de conexión, presenta un tiempo de conexión mínimo de 29 6. horas. e. Se tiene que dividir la hoja por la variable Servicio: Split by Servicio. En la hoja asociada al servicio de Netflix, se ingresa a la calculadora del software Minitab y se obtiene el percentil 65 : PERCENTILE(‘H. Co- nexión’, 0 65. ) Con lo que se concluye que el tiempo máximo de horas de conexión mensual del 65 % de los usuarios de Netflix con menores tiempos de conexión, es de 27 53. horas. Capítulo 1. EstadístiCa dEsCriptiva 89 17. Se dispone de la siguiente información sobre las notas, en escala centesi- mal, obtenidas por los asistentes a una capacitación, los cuales se dividie- ron en 2 grupos: Grupo A Grupo B Asistentes evaluados = 30 30 1 2100i i x = =∑ , 30 2 1 158 600i i x = =∑ Mediana = 75 puntos Asistentes evaluados = 28 28 1 2100i i x = =∑ , 28 2 1 174 375i i x = =∑ Mediana = 70 puntos a. Determine cuál grupo obtuvo puntajes más homogéneos. b. ¿Es cierto que la distribución de las notas del grupo B es más asimétrica que la distribución de las notas del grupo B? Solucióna. Se debe obtener la media y la desviación estándar para calcular el coefi- ciente de variación correspondiente. Grupo A Grupo B M(X) 1 n i i x n = ∑ 2100 70 30 = 2100 75 28 = S(X) 22 1 1 n i i x nx n = −∑ − 2158 600 30(70) 20 30 1 − = − 2174 375 28(75) 25 28 1 − = − C.V.% ( )100 %S X x 20 100 28 57 70 % . % = 25 100 33 33 75 % . % = Los asistentes del Grupo A obtuvieron puntajes más homogéneos, ya que este grupo presentó el menor coeficiente de variación 28 57 .( %). b. En base a los promedios calculados y a los valores medianos proporcio- nados, se procede a calcular el coeficiente de asimetría de Pearson. Grupo A Grupo B Coef. Asimetría Pearson 3 x Med S X ( ) ( ) − 3 70 75 0 75 20 ( ) .− = − 3 75 70 0 60 25 ( ) .− = La distribución de las notas de la sección B NO es más asimétrica que la distribución de las notas de la sección A, ya que el valor absoluto de su coeficiente de asimetría es menor, es decir, es más simétrica. Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios90 18. Los montos de compra, en soles, gastados por los clientes que han adquiri- do prendas de vestir en una tienda por departamentos se han representado en la siguiente tabla: Monto de compra N.° acumulado de clientes (fi ) 0 80[ − 〉 12 80 160[ − 〉 37 1600 240[ − 〉 97 240 320[ − 〉 132 320 400[ − 〉 152 400 480[ ]− 160 a. Considerando los datos, ¿cuál es el tipo de asimetría que presentan los montos de compra asociados a las prendas de vestir? b. Si se prevé que los montos de compra se incrementan en un 4 % más un adicional de 5 soles, calcule el coeficiente de variación de los montos de compra considerando el mencionado incremento, e indique cómo ha variado. Solución a. A partir de los datos se obtiene el monto promedio y el valor mediano, así como la desviación estándar, que sirven para calcular el coeficiente de asimetría de Pearson. Monto de compra (S/) yi N.° de clientes (fi) N.° acumulado de clientes (Fi) yifi (yi) 2fi 0 80[ − 〉 40 12 12 480 19 200 80 160[ − 〉 120 25 37 3000 360 000 1600 240[ − 〉 200 60 97 12 000 2 400 000 240 320[ − 〉 280 35 132 9800 2 744 000 320 400[ − 〉 360 20 152 7200 2 592 000 400 480[ ]− 440 8 160 3520 1 548 800 160 36 000 9 664 000 1 36 000 225 160 k i i i y f M n ( ) = ∑ = = =Y Intervalo mediano: 1600 240[ − 〉 Capítulo 1. EstadístiCa dEsCriptiva 91 1 1 1 160 37 2 2160 80 217 333 60 Me Me Me n F Me LI c / f - ( ) S . − − = + = + = Y 22 2 1 9 664 000 160 225 S 99 179 1 160 1 k i i i y f nx S / n ( )( ) .= −∑ − = = ≈ − − Y 3 225 217 3333 0 2319 99 179 y Med Coef As Pearson S ( . )( ) . . . ( ) . −− = = ≈ Y Los montos de compra asociados a las prendas de vestir presentan asimetría positiva. b. Se aplica las propiedades de la media y de la desviación estándar para hallar sus nuevos valores y del correspondiente coeficiente de variación: Cálculos: Y 1.04(Y) + 5 Media ( )Y = 225.000 Media(1.04 ( )Y + 5) = 239.000 S ( )Y = 99.179 S(1.04 ( )Y + 5) = 103.146 C.V. ( )%Y = 44.08 % C.V. (1.04 ( )Y + 5)% = 43.16 % El coeficiente de variación ha disminuido. 19. En relación a los ingresos mensuales de una muestra de 150 ejecutivos se determinó lo siguiente: S 3225 42Me X /( ) .= , 18C V X. .%( ) %= , y ( 0 075Coef As Pearson X. . ) .= De acuerdo a lo señalado, ¿cuál es el valor de la suma total de los ingre- sos mensuales de los ejecutivos que conformaron la muestra? Solución (1) 100 18 0 18S XC V X S X x x ( ). .%( ) % % ( ) .= = ⇒ = (2) 3 3 3225 42 0 075 0 075 3 9676 26 Coef As x Med x S X x Pearson S X S X . . * ( ) ( . ) . . ( ) . ( ) ( ) − − = = = ⇒ = − Reemplazando (1) en (2): ( )0 075 0 18 3 9676 26 3240x x x. . .= − ⇒ = Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios92 Se solicita 150 1 i i x = ∑ : 150 1501 1 3240 S 486 000 150 i i i i x x x / = = ∑ = = ⇒ =∑ 20. Sean los siguientes indicadores asociados a los tiempos de atención en las ventanillas de una agencia bancaria: Q1: 70 segundos Q3: 150 segundos Uno de los datos registrados corresponde a un tiempo de atención de 4 minutos con 55 segundos 4 55( : ) : ¿es un dato discordante? Justifique. Solución Sería considerado como un dato discordante superior si se cumple que: 3 1 5 295i IQ ix Q R x.> + = segundos 4 55 4 60 55: ( ) )( = + 150 70 80IQR = − = segundos Se observa que: 295 180 1 5 80 300. ( )< + = Por lo tanto dicho dato NO será considerado como un dato discordante. 21. Se ha realizado un estudio sobre el tiempo de residencia en algunos departamentos nuevos ubicados en el distrito de Santiago de Surco. Para la realización del estudio se recopilaron los datos asociados a 40 propietarios de los departamentos habitacionales del distrito en estudio, presentados a continuación: 34 16 26 34 29 31 41 19 26 40 4 7 31 14 16 22 38 39 30 6 17 32 57 25 22 37 31 33 11 21 37 12 23 43 28 30 27 24 35 25 a. Elabore y presente el gráfico de cajas relacionado al número de meses de residencia en los nuevos departamentos. b. Considerando los valores de los cuartiles que se muestran en el gráfico de cajas, ¿a partir de qué valor se ubican los datos discordantes superiores? Solución a. Se digitan los valores en una hoja de trabajo del software Minitab, y se obtiene el gráfico solicitado. Capítulo 1. EstadístiCa dEsCriptiva 93 b. Aplicando la fórmula se tiene que: 3 3 11 5 34 1 5 34 19 5 34 1 5 14 5 55 75Q Q Q. ( – ) . ( . ) . ( . ) .+ = + − = + = Conclusión: Considerando los valores de los cuartiles que se muestran en el gráfico de cajas, se tiene que un tiempo de residencia de por lo me- nos 56 meses ya sería considerado un dato discordante superior. 10. probleMas propuestos 1. En los siguientes párrafos se han dejado vacíos algunos paréntesis, donde deberá colocar el término estadístico adecuado. Términos recomendados: Unidad de análisis, Dato, Característica, Población, Muestra, V. Cualitativa nominal, V. Cualitativa ordinal, V. Cuantitativa discreta, V. Cuantitativa continua, Parámetro, Estadísti- co, Media, Cuartil 1, Mediana, Cuartil 3, Moda, Percentil. Nota: El término recomendado puede ser usado en singular o plural según se requiera en el contexto. En una investigación, sobre la ( ) en estudio “Clien- tes del supermercado Vival que poseen tarjeta de fidelización”, se se- leccionó una ( ) que se encontraba conformada por 480 clientes fidelizados de Vival. De cada ( ) se re- cabaron las siguientes ( ): tiempo empleado en rea- lizar las compras, monto de su última cuota de la tarjeta de fidelización, número de tarjetas adicionales, si consumió o no en el área de comidas, y distrito de residencia. Por lo tanto, no se consideró ninguna variable Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios94 ( ). Como en total se analizaron 5 variables re- lacionadas a los 480 clientes, entonces, en total se recabaron 2400 ( ). En relación a las variables ( ) se determinó el siguien- te ( ): El 35 % de los clientes residen en los distritos del cono este de Lima. Además, uno de los objetivos fue el de estimar el si- guiente ( ): tiempo promedio poblacional requerido por los clientes fidelizados de Vival al momento de realizar sus compras con un error máximo de 12 minutos. Otro de los resultados obtenidos, señalaba que la mayoría de los clientes fidelizados poseía 2 tarjetas adicionales, y que el 25 % de dichos clientes con menores valores de las cuotas a pagar presentaron un valor de a lo más S/ 280; lo cual representa, respectivamente, a la ( ) y ( ) de las características número de tarjetas adicionales y monto de su última cuota. 2. El editor de una revista desea realizar un estudio para analizar diversos aspectos relacionados a las presentaciones teatrales. Para el estudio,se se- leccionará una muestra de las presentaciones teatrales que se realizan en diversos escenarios ubicados en los principales departamentos del país; los encargados del trabajo de campo se contactarán con los representantes de la obra teatral y recabarán la siguiente información: número de asistentes, monto total de ingreso en boletería, tipo de obra teatral (infantil, clásico, comedia, etc.), número de actores, despliegue escenográfico (bajo, medio, alto), y duración del espectáculo teatral. En los departamentos en análisis, se estima que se presentan aproxima- damente 60 obras teatrales, y el estudio se realizará entre todas las pre- sentaciones realizadas durante los 3 días de fin de semana, se asume una presentación diaria de cada obra teatral. Se ha determinado que se seleccio- narán a 4 de cada 15 unidades de análisis disponibles durante el siguiente fin de semana. En cada una de las siguientes preguntas, marque con un aspa (X) la al- ternativa correcta o responda adecuada y justificadamente. Preguntas Seleccionar una alternativa Identifique adecuadamente a la unidad de análisis. ( ) Local donde se realiza la obra teatral ( ) Presentación teatral ( ) Obra teatral Señale el tamaño de la población en estudio. ( ) 60 locales ( ) 60 obras teatrales ( ) 180 obras teatrales ( ) 60 presentaciones teatrales ( ) 180 presentaciones teatrales Capítulo 1. EstadístiCa dEsCriptiva 95 Determine el tamaño de la muestra empleado en el presente estudio ( ) 48 presentaciones teatrales ( ) 16 locales ( ) 48 obras teatrales ( ) 48 locales ( ) 16 presentaciones teatrales Presente dos estimadores que se po- drían obtener del presente estudio (uno cualitativo y uno cuantitativo) 3. En un estudio de investigación del mercado gastronómico realizado en los principales restaurantes ubicados en los distritos turísticos de la capital; de una muestra de tamaño 160 se ha recabado las siguientes características relacionada a los jefes de cocina de los mencionados restaurantes: Escuela: Institución donde realizó su formación. Residencia: Zona de Lima donde reside. Experiencia: Tiempo de experiencia, en años cumplidos, en el cargo (jefe de cocina) G. Capacitación: Gasto (S/) en capacitación realizado en el último año Capacidad: Nivel de capacidad de atención del restaurant donde labora. a. Defina adecuadamente a la unidad de análisis. b. ¿Sería conveniente considerar que la unidad de análisis sea el restauran- te ubicado en los distritos turísticos de la capital? Justifique. c. Defina la muestra asociada al presente estudio, clasifique cada una de las variables e indique el parámetro y el estadístico correspondiente a cada una de las variables. Muestra: Variables Variable Clasificación Escuela Residencia Experiencia G. capacitación Capacidad Variable elegida Parámetro Estadístico 4. El gerente de una microfinanciera se encuentra analizando las deudas de clientes morosos que ya fueron canceladas en su totalidad. Para el mencio- nado estudio se seleccionó como muestra a las últimas 120 deudas cancela- das. A continuación se presenta el diagrama de columnas elaborado. Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios96 Si se sabe que el 65 833 . % corresponde a los clientes morosos de las zo- nas B y C en conjunto, y que los clientes morosos de la zona D fueron uno más que los de la zona A. a. ¿Cuántos fueron los clientes morosos de la zona A? b. Si los clientes morosos de la zona B fueron 33, ¿cuál es el porcentaje correspondiente a la zona C? 5. El gerente de una tienda de artículos deportivos realizó un estudio para el que seleccionó al azar a 96 de sus clientes que realizaron excursionismo de leve a intenso en localidades de las principales provincias del departamento de Lima. Alguna de las características consideradas en el estudio fueron las siguientes: sexo, provincia donde se practicó el excursionismo, y kilómetros recorridos; esto último fue medido con una pulsera especial que comerciali- za la tienda. Los datos recabados se presentan en el archivo Trekking.mtw. Realice la siguiente codificación en relación a los kilómetros recorridos: Menos de 5 km Leve De 5 km a menos de 6 km Moderado De 6 a más km Intenso La mencionada clasificación almacénela en la variable Intensidad. a. ¿Qué porcentaje de clientes realizaron un recorrido considerado como intenso? b. Complete la siguiente tabla. Intensidad Provincia Total Canta Cañete Huarochirí Yauyos Leve Moderado Intenso Total Capítulo 1. EstadístiCa dEsCriptiva 97 c. Procese adecuadamente y complete la siguiente gráfica. 6. Sobre la base de una muestra de 150 usuarios del servicio de televisión por cable o satelital, residentes en alguno de los 3 distritos considerados para el estudio, se ha determinado lo siguiente: • La muestra fue recogida equitativamente en los tres distritos. • De los usuarios que residen en Pueblo Libre, el 20 % paga tarifas men- suales por señal de cable o satelital entre 50 y 100 soles. • De los usuarios que residen en Magdalena, el 20 % paga entre 100 y 150 soles. • De los que viven en Los Olivos, el 30 % paga entre 150 y 200 soles. • De los 40 usuarios que pagan entre 50 y 100 soles, 10 residen en Los Olivos, y de los 60 que pagan entre 100 y 150 soles, igual cantidad de entrevistados reside en Pueblo Libre y Los Olivos. a. Elabore y presenta la tabla de contingencia asociada las variables distrito de residencia y la tarifa mensual por señal de cable o satelital 50 - 100 100 - 150 150 - 200 Total Pueblo Libre Magdalena Los Olivos Total b. ¿Cuál es el porcentaje de usuarios Los Olivos y que paga entre 100 y 150 soles? Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios98 c. De los usuarios que residen en Los Olivos, ¿qué porcentaje de ellos paga de 100 soles a más? d. De los usuarios que pagan menos de 150 soles, ¿qué porcentaje reside en Pueblo Libre? 7. En un estudio sobre los jóvenes universitarios que realizan prácticas prepro- fesionales en las áreas operativas de una empresa, se recabaron datos asocia- dos a los inconvenientes laborales, asociados a los mencionados practican- tes, reportados por los responsables del departamento de recursos humanos (Archivo: Practicantes.mtw). Indique cuáles fueron los principales inconve- nientes laborales que se deberían solucionar. Justifique adecuadamente. 8. En un estudio realizado para conocer el uso de dispositivos móviles para el acceso a contenidos multimedia por parte de los jóvenes del distrito de San Isidro, se trabajó con una muestra de 160 jóvenes, y a partir de los datos recabados se elaboró la siguiente gráfica: Si se sabe que el 62 5 . % de los jóvenes encuestados acceden a conteni- dos multimedia desde, a lo más, dos dispositivos distintos, responda según se solicite. a. ¿Cuántos jóvenes encuestados acceden a contenidos multimedia desde 4 dispositivos? b. ¿Cuál es el porcentaje de jóvenes encuestados que accede a contenidos multimedia desde 2 a 3 dispositivos? c. ¿Cuál es el porcentaje de jóvenes encuestados que accede a contenidos multimedia desde por lo menos 2 dispositivos? 9. Se ha realizado un estudio de 200 familias del distrito de Santiago de Sur- co que realizaron recientemente un viaje de vacaciones al interior del país. En base al monto gastado para todo el viaje, en soles, se elaboró el siguiente Capítulo 1. EstadístiCa dEsCriptiva 99 histograma de frecuencias relativas con intervalos de igual amplitud, don- de se han representado las marcas de clase de cada intervalo: Si se sabe que 4 2 64F F− = familias, responda a las siguientes preguntas: a. ¿Cuál es la amplitud de los intervalos? b. ¿Entre cuáles valores se encuentra el último intervalo? c. ¿Cuántas familias conforman el cuarto intervalo? d. ¿Cuántas familias gastaron un monto comprendido entre 2800 4600[ , 〉 ? 10.El gerente general de Fruti Fresh, cadena de juguerías ubicadas en centros comerciales, se encuentra realizando un estudio piloto en uno de sus prin- cipales locales. Para el estudio se ha determinado que cada cierto tiempo se seleccionará a uno de los empleados que se encuentra preparando alguno de los productos que conforman algún pedido realizado, y se recaba los datos asociados a las siguientes características: Presentación: Normal o frozen T. Atención: Tiempo de atención, en segundos, empleado en la atención del producto Los datos recabados en relación a 120 productos atendidos se presentan en el archivo Fruti.mtw. a. Al trabajarse con el criterio de Sturges para representar la variable “Tiem- po de atención”. a.1 ¿Cuántos intervalos se deben utilizar? a.2 Determine los intervalos a ser considerados y elabore el histograma de frecuencias. b. Usando la misma cantidad de intervalos determinada en el ítem (a), ela- bore un histograma múltiple, de frecuencias relativas, para representar la variable “Tiempo de atención” según la variable “Presentación”. 2700, 4500 Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios100 Nota: Edite el histograma múltiple para que considere los mismos inter- valos elaborados para el histograma original. c. Con respecto al histograma de frecuencias relativas del tiempo de aten- ción de los productos en presentación normal, señale el porcentaje de pro- ductos comprendidos desde el segundo al cuarto intervalo inclusive. 11. En un restaurante se determinó lo siguiente en relación al monto de consu- mo de las mesas durante el presente día: 160n = y =x S/ 95 498. Pero de dicho grupo, se retiró de los cálculos a quienes pagaron con tarjeta de crédito o débito, de tal forma que, en relación a las 120 mesas restantes, en donde se pagó en efectivo, el promedio del monto de consumo fue de S/ 95.255, ¿cuál fue el monto total de consumo por parte de las mesas que fueron retiradas de la muestra? 12. De un grupo de ejecutivos que laboran en el distrito de Miraflores se ha determinado que el ingreso mensual presenta una media de S/ 3950 y un valor mediano de S/ 3800. Asimismo, en el distrito de Santiago de Surco se ha determinado que el ingreso mensual de los ejecutivos presenta una media de S/ 3900 y un valor mediano de S/ 3750. Si la desviación estándar de los ingresos mensuales de los ejecutivos que laboran en Miraflores es menor con respecto a los que laboran en Santiago de Surco, de acuerdo al coeficiente de asimetría de Pearson, ¿en cuál de los 2 distritos el ingreso mensual de los ejecutivos presenta una mayor asimetría? 13. A partir de lo manifestado por 80 participantes en un estudio se determinó lo siguiente, en relación a la característica Y[ ] “Gasto”, en soles, en artículos de oficina: 80 1 9040i i y , = =∑ 80 2 1 1 048 200 = =∑ i i y ; además se sabe que Me(y)=115. Determine el valor del coeficiente de asimetría de Pearson correspon- diente a la variable 2.+Y . 14. De acuerdo a un seguimiento realizado a 200 asistentes a una feria tecno- lógica, se obtuvo los datos asociados a su tiempo de permanencia, en horas, con lo cual se determinó lo siguiente, luego de organizarlos en una tabla de distribución de frecuencias: • Los intervalos son de igual amplitud y la tabla se encuentra compuesta por 6 intervalos. • El primer intervalo corresponde a los tiempos de permanencia cuyo va- lor varía de 2 0 2 8. , .[ 〉 horas. Capítulo 1. EstadístiCa dEsCriptiva 101 • El 6 %, 25 % y 12 % de los asistentes pertenecen al primer, cuarto y sexto intervalo respectivamente. • 32 asistentes presentaron un tiempo de permanencia perteneciente al segundo intervalo. • Hasta el cuarto intervalo hay acumulados 134 asistentes. a. Complete la siguiente tabla de distribución de frecuencias de acuerdo a la información brindada. i Intervalos de tiempo de permanencia (horas) Marca de clase (yi) Asistentes (fi) Acumulado de asistentes (Fi) (yi)(fi) (yi) 2(fi) 1 2 3 4 5 6 b. Determine el valor de la desviación estándar correspondiente. c. Obtenga el valor del coeficiente de asimetría de Pearson. 15. Un fabricante de detergentes desea adquirir una máquina empaquetadora para el llenado de bolsas de aproximadamente 150 gramos. Se deberá esco- ger entre dos tipos de máquinas empaquetadoras que le ofrecen en iguales condiciones económicas. Para tomar una decisión, se realizaron 20 medi- ciones con la máquina A y 25 con la máquina B, y se obtuvo los siguientes resultados: Máquina A (Pesos en g) 143 145 146 148 149 150 150 150 150 152 150 150 150 150 153 151 152 154 155 156 Máquina B (Pesos en g) yi fi 131 139 [ , 〉 135 2 139 147 [ , 〉 143 4 147 155 [ , 〉 151 13 155 163 [ , 〉 159 4 163 171 [ , ] 167 2 Total = 25 Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios102 a. Halle los promedios de cada máquina e indique en cuál de ellas el pro- medio difiere más del valor especificado 150 gra( mos). b. ¿Hay mayor homogeneidad en la distribución en la distribución de los pesos de la máquina B? Justifique numéricamente. c. El inspector de la calidad informó que el equipo de medición que se empleó para medir los pesos de bolsas producidas por la máquina A estaba descalibrado. El verdadero peso de las bolsas en la máquina A es un 98 % del peso anterior más una constante de 2 7. gramos, ¿cuál será la verdadera desviación estándar del peso de las bolsas obtenido en dicha máquina? 16. En relación a la característica “kilometraje recorrido”, durante el último fin de semana, se elaboró el siguiente histograma de frecuencias relativas co- rrespondiente a 40 automóviles. a. ¿Cuál es el valor del kilometraje recorrido promedio? b. ¿El kilometraje recorrido presenta una distribución homogénea? 17. Una entidad bancaria ha implementado en sus agencias 3 tipos de venta- nillas de atención: [A] Usuarios no clientes, [B] Clientes, y [C] Exclusiva. En una agencia ubicada en el distrito de Miraflores, se ha determinado lo siguiente en relación al tiempo promedio de atención en dichas ventanillas: Tipo ventanilla N.° personas (ni) Tiempo promedio (seg.) ix( ) A 33 128.16 B 60 107.92 C 67 107.56 Capítulo 1. EstadístiCa dEsCriptiva 103 En otra agencia, ubicada en el distrito de Jesús María, donde se recabó un mismo tamaño de muestra distribuido de similar forma, se determinó lo siguiente: las ventanillas de atención tipo A presentan un 20 % menos de tiempo de atención que los de la agencia de Miraflores, mientras que en las ventanillas tipo B y C presentan un 10 % más de tiempo de atención. En ge- neral, ¿cuál es el tiempo de atención promedio en la agencia de Jesús María? 18. En una empresa, el ingreso mensual de sus técnicos especializados tiene una media de USD 750 y una desviación estándar de USD 220; mientras que al personal de servicios de mantenimiento les paga sueldos cuyo pro- medio es S/ 900 con una desviación estándar de S/ 80. a. Mediante un acuerdo con la gerencia, se realiza un incremento de 20 % a los ingresos mensuales de los técnicos especializados con una bonifi- cación adicional de USD 50 por concepto de movilidad, ¿es cierto que con esta modificación el ingreso mensual de los técnicos especializados se ha vuelto más heterogéneo? Justifique adecuadamente su respuesta. b. Si a cada trabajador de los servicios de mantenimiento se le aumentará k soles para el próximo mes, determine el valor de k para que el nuevo valor del coeficiente de variación sea igual al 8 %. 19. En un centro de idiomas se ha recabado los datos correspondientes a los puntajes obtenidos en la última evaluación 0 100(de a ). Los estudiantes que conformaron parte del estudio corresponden a los 3 niveles de estu- dios (básico, intermedio y avanzado). En base a los datos recopilados se elaboró el siguiente diagrama de cajas, desagregado por nivel de estudios: IntermedioBásicoAvanzado95 90 85 80 75 70 Nivel Pu nt aj e 82.181.782.5 95.9 71.7 Boxplot of Puntaje De acuerdo al diagrama de cajas presentado marque con un aspa (X) la opción correcta. Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios104 i. [ ] En el nivel avanzado, la mediana se encuentra más alejada del Cuar- til 3, y presenta un dato discordante. ii. [ ] En el nivel básico, la mediana se encuentra más alejada del Cuartil 3, y no presenta datos discordantes. iii. [ ] En el nivel intermedio, la mediana se encuentra más alejada del Cuartil 3, y presenta un dato discordante. iv. [ ] En el nivel básico, la mediana se encuentra más alejada del Cuartil 1, y no presenta datos discordantes. v. [ ] En el nivel avanzado, la mediana se encuentra más alejada del Cuar- til 1, y no presenta un dato discordante. 20. El gerente de operaciones de un parque de diversiones ha realizado un es- tudio para determinar la acogida que ha tenido el mencionado parque de diversiones. Para tal efecto en la entrada del recinto se solicitó la colabora- ción de 200 asistentes, quienes se comprometieron a brindar información de interés luego de su visita al parque de diversiones (Archivo: P_Diversio- nes.mtw). Las características recabadas se presentan a continuación: Ocasión: Primera visita o ya ha venido antes al parque de diversiones. Edad: Rango de edad, en años, del asistente encuestado. N.° juegos: Número de juegos o atracciones a las que ha accedido. Gasto: Monto total gastado en su visita (juegos, consumo, suvenir). a. Obtenga las medidas de tendencia central y de posición de la caracterís- tica N.° juegos, en general y desagregado por rango de edades. Responda a las siguientes preguntas. i. ¿En cuál de los rangos de edades la moda es distinta a la moda gene- ral? Justifique. ii. De las medias obtenidas en forma general, interprete de acuerdo al contexto el valor del tercer cuartil. iii. A los participantes del estudio con menos de 18 años, al momento de comprometerse a participar en el estudio, se les regaló un boleto para una de las atracciones del parque de diversiones. Luego de re- cabar los datos se observó que los participantes menores de 18 años habían incluido en sus respuestas al regalo otorgado, lo cual no debió ser, ¿cuál sería el verdadero valor promedio general relacionado a la característica “N.° juegos”? b. Obtenga las medidas de dispersión asociadas a la característica “Gasto”, en forma general y desagregada por la característica “Ocasión”. Respon- da a las siguientes preguntas. i. ¿Cuántos de los participantes del estudio que han asistido por pri- mera vez pertenecen al intervalo que permitió determinar al rango intercuartílico correspondiente? Capítulo 1. EstadístiCa dEsCriptiva 105 ii. El tipo de cambio es de S/ 3 1. por dólar. Si el gasto es expresado en dólares, ¿cuál sería la desviación estándar general de la característica “Gasto”? iii. ¿Cuáles participantes, presentan una mayor homogeneidad con res- pecto a la característica “Gasto”, los que han asistido por primera vez o los que ya han asistido antes? c. Determine el monto del gasto, en soles, por debajo del cual se encuentra el 35 % de participantes, de 40 a más años, que presentaron los menores gastos en su visita al parque de diversiones. d. Obtenga el diagrama de cajas, relacionado a la característica “Gasto”, en forma general desagregada por rango de “Edad”. Responda a las si- guientes preguntas. i. En el rango de edad donde se presentan datos discordantes, ¿cuál es el rango de edad y cuáles son los valores extremos de los bigotes? ¿Cuáles son los rangos de edad que presenta un valor mediano por debajo del presentado en el diagrama de cajas general y cuál de ellos presenta una similar distribución al de la caja general? En los procesos de ingeniería, así como en la gestión empresarial y de negocios, sur- gen situaciones de incertidumbre sobre los diferentes resultados de un proyecto o de una actividad en general para las cuales se requiere de una medición sobre la po- sibilidad de que ocurra uno u otro even- to. La teoría de la probabilidad brinda una respuesta a las inquietudes planteadas, a partir de lo cual se brinda un sustento for- mal a la toma de decisiones, en diferentes contextos de aplicación. Sabes Capacidades adquiridas 9 Diferenciar las diferentes técnicas de conteo. 9 Comprender los conceptos y funda- mentos de la probabilidad. 9 Calcular e interpretar las probabili- dades de ocurrencia de un evento. 9 Deducir y relacionar los teoremas de probabilidad. Piensas Competencias por lograr 9 Identificar la técnica de conteo adecuada a cada contexto. 9 Reconocer las situaciones de uso de los diferentes teoremas de probabilidad. Haces Habilidades por desarrollar 9 Aplicar técnicas de conteo en diferen- tes situaciones. 9 Plantear expresiones de probabilidad. 9 Aplicar los teoremas de probabilidad. Secciones 1. Conceptos básicos 2. Técnicas de conteo 3. Probabilidad 4. Teoremas de probabilidad Conocimientos previos Estadística descriptiva, teoría de conjuntos, manejo de notación matemática Probabilidad Capítulo 2 Capítulo 2. probabilidad 109 1. conceptos básicos 1.1 Experimento aleatorio o al azar Es aquella acción tal que, bajo determinado conjunto similar de condiciones ini- ciales, no siempre da el mismo resultado. Es lo contrario a un experimento deter- minista, donde se conoce el resultado antes de realizar la acción (conocimiento a priori). Comúnmente se le denota a un experimento aleatorio con .ε En consecuencia, un experimento aleatorio ε debe cumplir las siguientes condiciones: a) Debe tener más de un posible resultado el cual no se puede predecir con seguridad. b) Es posible describir el conjunto de todos los resultados posibles. c) Puede repetirse infinitas veces. Ejemplo 1 A continuación se presentan algunos experimentos aleatorios: i. Lanzar un dado y observar el lado superior. ii. Elegir 2 artículos de una línea de producción y observar si son defectuosos o no defectuosos. iii. Seleccionar a un elector y determinar su candidato presidencial preferido entre dos candidatos posibles. 1.2 Espacio muestral Un espacio muestral es el conjunto de todos los resultados posibles de un expe- rimento aleatorio ( ).ε El espacio muestral es denotado por Ω (también por S). Un espacio muestral puede ser clasificado como: Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios110 Discreto: si contiene un número finito o infinito numerable de elementos, o Continuo: si contiene un número infinito no numerable de elementos. El número de elementos de un Ω es denotado por n( ).Ω Ejemplo 2 A continuación, se presentan los espacios muestrales asociados a los experi- mentos aleatorios definidos en el ejemplo 1 : i. Lanzar un dado y observar el lado superior. 1 2 3 4 5 6 { , , , , , }Ω = ii. Elegir dos artículos de una línea de producción y observar si son defec tuosos (D) o no defectuosos D( ). D D D D D D D D{( , ), ( , ), ( , ), ( , )}Ω = iii. Seleccionar a un elector y determinar su candidato presidencial de preferen- cia entre dos candidatos posibles. {candidato A, candidato B}Ω = 1.3 Suceso Cada elemento del espacio muestral ( )Ω se denomina suceso y se designa por w. En todo espacio muestral se observa que: a. Cada w que pertenece a Ω es un resultado del experimento aleatorio. b. A cada resultado del experimento aleatorio le corresponde un, y solo un, w .∈ Ω { }1 2 nw w w, , . . . ,Ω = 1.4 Evento Un evento es cualquier subconjunto del espacio muestral ( ).Ω Un evento es denotado por letras latinas en mayúsculas: A, B, C, etc., y la cantidad total de elementos que conforman un evento es denotado por n(A). Eventos especiales i. Evento elemental Tiene solo un resultado: { }iE w= ii. Evento seguro Es el que siempre ocurre. Coincide con el espacio muestral Ω iii. Evento imposible Es elque nunca ocurre, se denota por ∅ iv. Evento opuesto o contrario Si no ocurre el evento E, entonces ocurre su complemento E { }i i iE w w w E/= ∈ Ω ∧ ∉ Capítulo 2. probabilidad 111 v. Eventos simultáneos Ocurren a la vez; los eventos E y F son simultáneos si E F .≠ ∅ vi. Eventos incompatibles o disjuntos No ocurren a la vez (son mutuamente excluyentes), es decir: E F .= ∅ vii. Eventos colectivamente exhaustivos Dos o más eventos disjuntos son colectivamente exhaustivos si la unión de todos ellos coincide con ;Ω es decir: 1 2 kE EE ... ,= Ω siempre que 1 2EE = ∅ para i j.≠ Ejemplo 3 En relación al experimento aleatorio de lanzar un dado y observar el lado superior, se definen los siguientes eventos: i. A: Sale número 6. 6A { }= ii. B: Se obtiene un número par. 2 4 6B { , , }= iii. C: Se obtiene un número impar. 1 3 5C { , , }= iv. D: Se obtiene un número mayor que 3. 4 5 6D { , , }= v. E: Se obtiene un número mayor que 7. E = ∅ vi. F: Se obtiene un número menor que 7. 1 2 3 4 5 6C { , , , , , }= Con los eventos así definidos, se procede a identificar a cada uno de los eventos especiales señalados: i. Evento elemental. 6A { }= ii. Evento seguro. 1 2 3 4 5 6F { , , , , , }= = Ω iii. Evento imposible. E = ∅ iv. Evento opuesto o contrario. BC ,= ya que 1 3 5B { , , }= v. Eventos simultáneos. C y D, ya que C D = {5} ≠ ∅ vi. Eventos incompatibles o disjuntos. A y C, ya que A C = ∅ vii. Eventos colectivamente exhaustivos. B y C, ya que B C = B C∅ ∧ = Ω Ejemplo 4 Una empresa constructora se encuentra evaluando si se presenta a alguna de 3 licitaciones; un evaluador brindará su recomendación sobre las licitacio- nes a cuáles presentarse, donde la decisión por cada de ellas puede ser: Sí se presenta a la licitación (S) o No se presenta (N), de tal forma que el espacio muestral queda definido de la siguiente forma: NNN, NNS, NSN, NSS, SNN, SNS, SSN, S{ }SSΩ = Se definen los siguientes eventos en relación a la recomendación sobre las tres licitaciones a presentarse: Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios112 i. A: No se presenta a licitación. A { }NNN= ii. B: Se presenta a la 2da licitación. B NNN, NSS, SSN,{ } SSS= iii. C: Se presenta por lo menos a una. C NNS, NSN, NSS, SNN, SNS, SSN,{ }SSS= iv. D: Se presentan a lo más a 3. D NNN, NNS, NSN, NSS, SNN, SNS, SSN{ }, SSS= v. E: Se presentan a 4 licitaciones. E = ∅ vi. F: Se decide lo mismo en las tres. F = {NNN,SSS} Con los eventos así definidos, se procede a identificar a cada uno de los eventos especiales señalados: i. Evento elemental. A = {NNN} ii. Evento seguro. D = Ω iii. Evento imposible. E = ∅ iv. Evento opuesto o contrario. A = C , ya que C ={NNN} v. Eventos simultáneos. B y F, ya que B F {SSS}= ≠ ∅ vi. Eventos incompatibles o disjuntos. A y B, ya que A B = ∅ vii. Eventos colectivamente exhaustivos. A y C, ya que A B A C= ∅ ∧ = Ω 2. técnicas De conteo Para el cálculo de probabilidades es importante cuantificar el espacio muestral de un experimento aleatorio; sin embargo, en muchos casos, esta cuantificación se torna difícil puesto que, por lo general, los experimentos aleatorios tienen gran cantidad de resultados posibles. De ahí surge la necesidad de utilizar téc- nicas que permitan determinar el número de resultados posibles de un experi- mento aleatorio que se esté estudiando sin necesidad de hacer una lista o rela- ción de todos los posibles resultados. 2.1 Principio de adición Suponga que un procedimiento, designado como P1, puede realizarse de n1 ma- neras, y que un segundo procedimiento, designado como P2, puede realizarse de n2 maneras. Además, no es posible que ambos procedimientos, P1 y P2, se realicen simultáneamente. Entonces, el número de maneras en que se puede hacer P1 o P2 es de: n1 + n2 maneras. Capítulo 2. probabilidad 113 Ejemplo 5 Un estudiante desea comprar una laptop, para lo cual considera que puede se- leccionar de entre las marcas R, S y T. La laptop de la marca R se presenta con dos tipos de procesador (core i5, core i7), mientras que la laptop de la marca S se presenta con tres tipos de procesador (core i3, core i5 y core i7), y la laptop de la marca T se presenta en sólo un tipo de procesador (core i5), ¿de cuántas mane- ras puede esta persona hacer la compra de la laptop? Solución • Compra de una laptop de la marca R: 2 maneras • Compra de una laptop de la marca S: 3 maneras • Compra de una laptop de la marca T: 1 manera Por el principio de adición, la compra de una laptop se puede realizar de 2 3 1 6+ + = maneras. 2.2 Principio de multiplicación Suponga que un procedimiento, designado como P1, puede hacerse de n1 ma- neras, y que un segundo procedimiento, designado como P2, puede hacerse de n2 maneras. Además, cada una de las maneras de efectuar el procedimiento P1 puede ser seguida por cualquiera de las maneras de efectuar el procedimiento P2. Entonces, el número de maneras en que se puede realizar P1 seguido de P2 es de: (n1)(n2) maneras. Ejemplo 6 En una clínica se utilizan cinco símbolos para clasificar las historias clínicas de sus pacientes, de manera que los dos primeros son letras y los 3 últimos son dígitos. Suponiendo que hay 25 letras (incluyendo las cinco vocales), ¿cuántas historias clínicas podrían identificarse si: a. Las letras y los números se pueden repetir. Solución • Para el primer símbolo se podrán utilizar 25 letras disponibles. • Para el segundo símbolo se podrán utilizar 25 letras disponibles. • Para el tercer símbolo se podrán utilizar 10 dígitos disponibles. • Para el cuarto símbolo se podrán utilizar 10 dígitos disponibles. • Para el quinto símbolo se podrán utilizar 10 dígitos disponibles. Por el principio de multiplicación, el número de posibles identifica ciones de historias clínicas es de: 2 325 25 10 10 6210 25 1 50 000( )( )( )( )( ) ( )( )= = maneras distintas. Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios114 b. Solamente una de las letras es una vocal y dos números son iguales. Solución • Colocar una vocal entre los 2 primeros símbolos: 2 maneras – En la posición elegida se pueden utilizar 5 vocales disponibles. – En la otra ubicación se pueden utilizar 20 letras (no vocales) disponibles. • Colocar un número que no se repita entre los 3 últimos símbolos: 3 maneras. – En la ubicación elegida para el número que no se repite se pueden utilizar10 dígitos disponibles. – En una de las 2 posiciones restantes, para los números que se van a repetir, se podrán utilizar 9 dígitos restantes. – En la otra de las posiciones se podrá utilizar solamente el número que se va a repetir. Por el principio de multiplicación, el número de identificaciones de las historias clínicas con las condiciones señaladas es de: 20 3 102 5 19 54 000 ( )( )( )( )( )( )( ) = maneras distintas. 2.3 Permutaciones 2.3.1 Permutación de n elementos sin repetición Se tiene n objetos diferentes y se desea saber de cuántas maneras pueden ser or- denados, por ejemplo, en una línea, sin que los elementos se repitan. Aplicando el principio de multiplicación, se observa que cualquiera de estos n objetos pue- de ocupar la primera posición, restarán (n1) objetos para la segunda posición, 2n( )− para la tercera posición y así sucesivamente hasta llegar a 1n n(( ))− − para la última posición; luego, el número de posibles ordenamientos de n objetos en una línea que consta de n posiciones es: 1 2 3 2 1nP n n n n nn ( )( )( )...( )( ) != − − − = Factorial El factorial de un número se define como el producto de los n primeros enteros positivos, es decir: 1 2 2 1n n n n! ( )( )... ( )( ),= − − con 0 1! .= Nota: El factorial de n representa el número de maneras diferen- tes en las que n elementos pueden ordenarse uno detrás de otro. Capítulo 2. probabilidad 115 2.3.2 Permutación de n elementos sin repetición tomados de k en k Siguiendo unrazonamiento similar, se determina que el número de maneras diferentes en que k elementos pueden elegirse y ordenarse uno detrás de otro a partir de un total de n elementos es: n k n n k P ! ( )! = − Ejemplo 7 Para un examen en aula de cómputo se espera la llegada de a lo más 6 alum- nos, quienes serán ubicados por orden de llegada, de izquierda a derecha, en una fila donde hay 6 computadoras. Para los siguientes casos, indique el número de maneras en que los diferentes alumnos pueden ser ubicados, en las computadoras disponibles: a. Llegan los 6 alumnos, uno tras otro. Solución • La primera computadora será ocupada por uno de 6 alumnos posibles. • La segunda computadora será ocupada por uno de los 5 alumnos restantes. • Se procede de forma similar hasta que la sexta computadora será ocupa- da por el único alumno restante. Por el principio de multiplicación, la cantidad de maneras distintas de ubicar a los 6 alumnos es de: 6 5 4 3 2 1 720( )( )( )( )( )( ) = En resumen, dado que interesa el orden de llegada de los alumnos, el número de maneras de ubicarlos es: 66 6 720P != = b. Solo llegan 4 alumnos de los 6 convocados, uno tras otro. Solución • La primera computadora será ocupada por uno de 6 alumnos posibles. • La segunda y la tercera computadora serán ocupadas, respectivamente, por uno de 5 y 4 alumnos restantes. • La cuarta computadora será ocupada por uno de los 3 alumnos restantes. Por el principio de multiplicación, la cantidad de maneras distintas de ubicar a los 4 alumnos es de: 6 5 4 3 360( )( )( )( ) = En resumen, se consideran permutaciones de n elementos tomados k de ellos; es decir: 6 4 6 6 360 6 4 2 P ! ! ( )! ! = = = − Nota: Este ejemplo (7.b) puede ser resuelto de una forma alterna, que se detallará más adelante. Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios116 c. Llegan los 6 alumnos, sin embargo 2 de ellos no deben sentarse uno al lado del otro, ¿de cuántas maneras se puede ubicar a los 6 alumnos en las computadoras disponibles? Solución Se definen los eventos: A: dos alumnos deben ser ubicados uno al lado del otro, y A : dos alumnos no se ubicarán uno al lado del otro. Por practicidad se determinará la cantidad de maneras distintas que se puede presentar el evento A, para luego determinar la cantidad de mane- ras del evento contrario. • Los dos alumnos que serán ubicados uno al lado del otro serán consi- derados como un bloque, y con los 4 restantes se tendrán 5! maneras de ubicarlos. • Los dos alumnos que permanecerán juntos se podrán ubicar de 2! maneras. Por lo tanto, el número de casos a favor del evento A es: 552 240n A P( ) ! .= = Tomando en cuenta el resultado del ítem a), donde se señala que el nú- mero de maneras de ubicar a los 6 alumnos es de 66 6 720P ! ,= = entonces, la cantidad de maneras en que los 2 alumnos señalados no se sientan uno al lado del otro será: 6 56 52 720 240 480n A P P( ) != − = − = 2.3.3 Permutación con elementos iguales El número de maneras diferentes en las que se puede ordenar n elementos, de los cuales n1, n2, ..., nk son iguales entre si para efectos del ordenamiento, con n = n1 + n2 + ... + nk , es dado por: 1 2 1 2 k n n n n k nP n n n, , ..., ! ! ! ... ! = Ejemplo 8 ¿Cuál es el total de posibles arreglos que se pueden hacer con las letras de la palabra PROBABILIDAD? Solución • La palabra consta de 12 letras de las cuales 8 letras son distintas. • Entre las 12 letras hay algunas que se repiten 2 veces: A, B, D, I, y las demás son diferentes. • Por lo tanto, el total de posibles arreglos de las letras que conforman la palabra es: 12 2 2 2 2 1 1 1 1 4 12 12 29937600 2 2 2 2 1 1 1 1 2 P , , , , , , , ! ! ! ! ! ! ! ! ! ! ( !) = = = Capítulo 2. probabilidad 117 2.4 Combinaciones En las permutaciones, el objetivo es determinar el número de posibles arreglos ordenados de objetos. Cuando el orden no importa, sino sólo el número de for- mas distintas de extraer de n objetos k de ellos a la vez; entonces, se trata de una combinación. El número de grupos diferentes de k elementos que pueden formarse a partir de un total de n elementos sin importar el orden de la selección es: nn k k n k n k C ! !( )! = − = La expresión nn k k C = tiene las siguientes propiedades: i. =nC n1 ii. − = n nC n1 iii. = n nC 1 iv. = nC0 1 Ejemplo 9 Luis tiene 10 amigos, de los cuales invitará a una reunión solamente a 7 de ellos. a. ¿De cuántas maneras puede Luis invitar a sus amigos? Solución Como no interesa el orden en que elija a sus invitados, Luis tiene: 10 10 120 7 7 3 ! ! ! = = maneras distintas de hacer las invitaciones. b. ¿De cuántas maneras puede Luis invitar a sus amigos si dos de ellos están enemistados y no pueden asistir juntos? Solución • Luis puede invitar a uno o ninguno de los amigos enemistados; por tanto: • Maneras de no invitar a ninguno de los 2 amigos, e invitar a 7 de los 8 restantes: ( )( )1 8 8 2 8 0 7 = = • Maneras de invitar a uno de los 2 amigos, e invitar a 6 de los 8 restantes: ( )( )2 28 56 1 2 8 6 = = Por el principio de la adición, número de maneras = 2 8 2 8 8 58 64 0 7 1 6 + = + = 8 + 56 = 64 Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios118 Ejemplo 10 Del ejemplo 7b, indique si sólo llegan 4 alumnos de los 6 convocados, uno tras otro, ¿cuál será el número de maneras en que los diferentes alumnos pue- den ser ubicados? Solución • Maneras en que se presentarán los 4 alumnos de 6 posibles (no interesa el orden): 64 6 15 4 6 4C ! !( )! = = − • Maneras distintas de ubicar a los 4 alumnos que llegan es de: 44 4 24P != = (ver ejemplo 7a) En resumen, se ubicarán de 6 44 4 15 24 360C P ( )( ) ,= = 360 maneras distintas, re- sultado que coincide con lo presentado en el ejemplo 7b. Ejemplo 11 Para hacer visitas de trabajo a 3 sucursales de provincias en grupos de 5, se dispone de 6 mujeres y 9 hombres. a. ¿Cuántos grupos distintos se pueden formar? Solución Como no interesa el orden para formar los 3 grupos, entonces: • Maneras de seleccionar a 5 de 15 personas posibles: 15 15 3003 5 15 55 ! !( )! = = − • Maneras de seleccionar a 5 de 10 personas restantes: 10 10 252 5 10 55 ! !( )! = = − • Maneras de seleccionar a 5 de 5 personas restantes: 5 5 1 5 5 55 ! !( )! = = − Por el principio de la multiplicación, número de maneras de formar los 3 grupos de 5 personas en cada grupo = 15 10 5 15 756 756 5 5 55 5 5 ! ! ! ! = = b. ¿De cuántas maneras pueden formarse tales grupos de modo que en cada uno de ellos estén siempre dos mujeres? Solución Cada grupo de 5 personas estará integrado por 3 hombres y 2 mujeres; es decir: • Primer grupo: 3 hombres de 9 posibles y 2 mujeres de 6 posibles. • Segundo grupo: 3 hombres de 6 posibles y 2 mujeres de 4 posibles. • Tercer grupo: 3 hombres de 3 posibles y 2 mujeres de 2 posibles. Capítulo 2. probabilidad 119 Por el principio de la multiplicación, número de maneras de formar los 3 grupos con las condiciones señaladas = 9 6 6 4 3 2 1260 3 2 3 2 3 2 120 151 200( )( ) = = 3. probabiliDaD 3.1 Introducción La probabilidad es una rama de las matemáticas que estudia a los experimentos aleatorios y permite tener una medida de la incertidumbre, de tal forma que se pueda dar un soporte adecuado a la toma de decisiones. 3.2 Probabilidad clásica o a priori Si un experimento aleatorio tiene n( )Ω posibles resultados, todos ellos igualmen- te probables, y si n(E) de estos resultados pertenecen a un evento E, entonces la probabilidad de ocurrenciadel evento E es: número de casos a favor de En EP E n número de casos posibles ( )( ) ( ) = = Ω El nombre a priori se debe a que no es necesario realizar el experimento para cal- cular la probabilidad, sino que este cálculo ha sido hecho sólo en base al empleo del razonamiento lógico. Por ejemplo, en un mazo de 52 cartas bien barajadas se saca una de ellas, la probabilidad de sacar una carta de espadas es 13 52 0 25/ . ,= porque se sabe que dentro del mazo hay 13 cartas que son espadas. Ejemplo 12 Cinco fabricantes producen un determinado dispositivo electrónico cuya ca- lidad varía de un fabricante a otro. Si usted eligiera tres fabricantes al azar, ¿cuál es la probabilidad de que la selección contenga exactamente dos de los tres mejores? Solución Puesto que en la elección no interesa el orden, el número de maneras de elegir a los 3 fabricantes es: 5 10 3 n( ) Ω = = Se define E: la selección contiene a dos de los 3 mejores. • Seleccionar a 2 de 3 mejores fabricantes, y • Seleccionar a 1 de los 2 no mejores Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios120 Por el principio de la multiplicación, el número de maneras en que puede ocurrir E es: 3 2 3 2 6 2 1 n E( ) ( )( ) = = = La probabilidad solicitada es: 6 0 6 10 n EP E n ( )( ) . ( ) = = = Ω Ejemplo 13 La Municipalidad de Lima ha convocado a 3 licitaciones para construir in- tercambios viales. A la licitación 1 (L1) se han presentado las empresas A, B y D; a la licitación 2 (L2) se han presentado las empresas A, B, C y E y a la licitación 3 (L3) se han presentado las empresas A, B, C, D y E. Todas tienen la misma probabilidad de ser elegidas. a. ¿De cuantas maneras se puede elegir a los ganadores de las 3 licitaciones? Solución 3 4 5 60n( ) ( )( )( )Ω = = maneras b. ¿Cuál es la probabilidad de que la empresa B gane solo una de las licitaciones? Solución Sea E: empresa B gana solo una licitación • La licitación 1 se puede otorgar a una de 3 empresas posibles, la licita- ción 2 se puede otorgar a una de 4 empresas posibles, y la licitación 3 se puede otorgar a una de 5 empresas posibles. En todas las licitacio- nes participa la empresa B. • La empresa B gana solamente la licitación 1, y las otras licitaciones alguna de las empresas restantes: 1 3 4 12( )( )( ) ,= o • La empresa B gana solamente la licitación 2, y las otras licitaciones alguna de las empresas restantes: 2 1 4 8( )( )( ) ,= o • La empresa B gana solamente la licitación 3, y las otras licitaciones alguna de las empresas restantes: 2 3 1 6( )( )( ) .= Por el principio de la adición, el número de maneras en que la empresa B gana solo una licitación: 1 3 4 2 1 4 2 3 1 12 8 6 26 26 0 4333 60 n E n EP E n ( ) ( )( )( ) ( )( )( ) ( )( )( ) ( )( ) . ( ) = + + = + + = = = = Ω Capítulo 2. probabilidad 121 c. ¿Cuál es la probabilidad de que la empresa A no gane ninguna de las licitaciones? Solución Sea F: empresa A no gana ninguna licitación 2 3 4 24n F( ) ( )( )( )= = 24 0 40 60 P F( ) .= = Ejemplo 14 Una compañía ha decidido comprar 6 computadoras de las cuales 3 deben ser portátiles y 3 fijas, y para realizar la compra se han presentado varias propuestas. De la empresa Teledata se ha evaluado 3 modelos portátiles y 3 fijos, de la empresa Dataservice se ha evaluado 4 modelos portátiles y 5 fijos. Si todas las computadoras tienen la misma probabilidad de ser elegidas, responda. a. ¿De cuantas maneras diferentes se puede hacer la compra? Solución • En total se ha evaluado 7 modelos portátiles y 8 modelos fijos. • Adquirir 3 computadoras portátiles de 7 posibles, y 3 fijas de 8 posibles: ( )( )7 83 3 35 56 1960n C C( ) ( )( )Ω = = = b. ¿Cuál es la probabilidad de que todas las computadoras compradas sean de la misma empresa? Solución Sea A: Todas las computadoras compradas son de la misma empresa. • Teledata: Adquirir 3 portátiles de 3 evaluadas, y 3 fijas de 3 evalua- das: 3 33 3C C , o • Dataservice: Adquirir 3 portátiles de 4 evaluadas, y 3 fijas de 5 eva- luadas: 4 53 3C C ( )( ) ( )( ) ( ) 3 3 4 5 3 3 3 3 1 1 4 10 0 0209 1960 C C C C P A n ( )( ) ( )( )( ) . + + = = = Ω 3.3 Probabilidad relativista Al igual que la probabilidad a priori, se basa en el cociente entre resultados fa- vorables observados sobre resultados totales del experimento en estudio. Su di- ferencia con la probabilidad clásica radica en que se calcula a través de datos experimentales. Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios122 Si un experimento aleatorio se repite n veces bajo las mismas condiciones y nE es el número de resultados favorables a un evento E, entonces: EnP E n ( ) = Ejemplo 15 De la producción de una máquina se ha observado que pueden ocurrir dos tipos de defectos. El defecto del tipo A ocurre un 7 % de las veces, el defecto del tipo B un 5 % de las veces, y en el 90 % de las veces no ocurre ninguno de los dos. Hallar la probabilidad de que al elegir un producto al azar tenga solo uno de estos defectos. Solución Haciendo uso del diagrama de Venn, se tiene: 0 07P A x y( ) .= + = 0 05P B y z( ) .= + = ( ) 0 90 0 10P A B w P A B. ( ) .= = ⇒ = Se sabe que: 0 10P A B P A P B P A B( ) ( ) ( ) ( ) .= + − = Entonces: 0 07 0 05 0 10 0 02 x y y z y y y ( ) ( ) ( ) . . . . + + + − = + − = ∴ = P(Solo un defecto) 0 10 0 02 0 08P A B P A B– .( ) . – .( )= = = 3.4 Definición axiomática Sea e un experimento aleatorio y Ω su espacio muestral. Una función P que asigna un número real a cada evento A de ,Ω denotada por P(A), es denominada probabilidad si satisface los siguientes axiomas: (i) 0P A( ) ≥ (ii) 1P( )Ω = (iii) Si A1, A2, ... son eventos mutuamente excluyentes dos a dos, entonces: 1 1 i i i i P A P A( ) ∞ ∞ = = = ∑ w = 0.90 x y z A B w = 0.90 x = 0.05 z = 0.03 A B y = 0.02 Capítulo 2. probabilidad 123 De los axiomas anteriores se deducen otras proposiciones de la probabilidad: 0P( )∅ = 1P A P A( ) ( )= − BP A P A P B P A B( ) ( ) ( ) ( )= + − BP A P A B P A P A B( ) ( ) ( ) ( )− = = − 4. teoreMas De probabiliDaD 4.1 Probabilidad condicional Sean A y B dos eventos de un espacio muestral ,Ω tal que 0P B( ) ;> luego, la probabilidad condicional de ocurrencia del evento A dado que (sabiendo que) ocurrió el evento B, está definida por: 0 P A B P A B P B P B ( ) ( | ) ; ( ) ( ) = > De manera similar, la probabilidad de que ocurra el evento B sabiendo que ocurrió el evento A es: 0 P A B P B A P A P A ( ) ( | ) ; ( ) ( ) = > La definición de probabilidad condicional satisface los axiomas de probabili- dad, es decir: a. 0P B A( | ) ≥ b. 1P A( | )Ω = c. Si B1, B2, B3, ... son eventos mutuamente excluyentes dos a dos, entonces ( ) 11 n i i ii P B A P B A| | ∞ == = ∑ Ejemplo 16 Con el propósito de conocer las causas por las que los estudiantes no consu- men productos naturales enlatados, la consultora Data Mining Today aplicó una encuesta a 400 estudiantes de diferentes instituciones educativas de Lima. Los resultados obtenidos en relación al género se muestran en la si- guiente tabla de contingencia. Género Calidad (C) Difusión (D) Frescura (F) Precio (P) Variedad (V) Otros (O) Total Hombre (H) 4 25 73 76 38 7 223 Mujer (M) 5 8 67 61 27 9 177 Total 9 33 140 137 65 16 400 Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios124 Si se selecciona un estudiante al azar, ¿cuál es la probabilidad de los siguientes casos? a. Que sea hombre o afirme que el motivo del no consumo de productos naturales sea la frescura. Solución 223 140 73 0 7250 400 P H F( ) . + − = = b. Que afirme que la causa es la variedad si se eligió a una mujer. Solución ( ) ( ) 27 0 1525 177 P V M P V M P M ( | ) .= = = c. Que no haya sido elegido un hombre si afirma que el motivo es lacalidad o el precio. Solución 5 61 0 45205 9 137 P M C P[ |( )] . + = = + 4.2 Teorema de la multiplicación El teorema de la multiplicación (regla de multiplicación) de probabilidades es muy útil para aquellos experimentos que son ejecutados en etapas sucesivas. Supóngase que un experimento tiene n etapas y sea Aj un evento definido en términos de la etapa j del experimento; entonces: 1 2 1j jP A A A A..[ .| ]− es la probabilidad condicional de un evento en la etapa j condicionado a lo que sucede en las etapas 1 2 1j, , ..., .− Teorema.- Sean ε un experimento aleatorio y Ω su espacio muestral co- rrespondiente. Sean los eventos A1, A2, ..., An para los cuales se tiene que 1 2 1 0nP A A A..[ . ]− > entonces: 1 2 1 2 1 1 23 1 2 1n n nP A A A A A A AP P | P |A A A A AP A|[ ] [ ] [ ] [ ]... [ ..... ]. −= En forma particular, sean los eventos A1 y A2, tal que 1 2 0P A A ) ,( > entonces: 1 2 1 2 1P A A P A P A |A( () )()= Lo señalado es una consecuencia directa de la probabilidad condicional, ya que: 0 P A B P A B P P P A B P B P A B B B( )( | ) ; ( ) ( )( ) | ( ) ( )= > ⇒ = Capítulo 2. probabilidad 125 0 P A B P B A P P P A B P A P B A A A( )( | ) ; ( ) ( )( ) | ( ) ( )= > ⇒ = Donde la P A B( ) es denominada probabilidad conjunta, mientras que P A( ) y P B( ) se denomina probabilidades marginales. 4.3 Teorema de la probabilidad total Si {A1, A2, ..., AK} es una partición del espacio muestral ( )Ω y B es un evento con- tenido en el mismo espacio muestral; entonces, la probabilidad de ocurrencia de B se puede obtener mediante la siguiente expresión: 1 2 1 1 K K K i i i i i P B P A B A B A B P A B P A P B A ( ) ( ) ( ) ... ( ) ( ) ( ) ( | ) = = = = =∑ ∑ 4.4 Teorema de Bayes Si {A1,A2,...,AK} es una partición de ,Ω y B es cualquier otro evento no vacío del mismo espacio muestral ;Ω entonces, la probabilidad de ocurrencia de un even- to Ai dado que ocurrió el evento B se define mediante: 1 i i i i K i i i P A B P A P B A P A B P B P A P B A ( ) ( ) ( | ) ( | ) ( ) ( ) ( | ) = ∩ = = ∑ Estas probabilidades iP A B( | ) , son denominadas probabilidades a posteriori y son útiles porque permiten comparar las probabilidades obtenidas después de la ocurrencia del evento B de interés. Ejemplo 17 De los reportes sobre una operación financiera, se tiene la siguiente información: • La probabilidad de ganar menos de 20 000 soles es de 0 35. ; • El 40 % de las veces se gana entre 20 000 y 40 000 soles; • Cuando se gana menos de 20 000 soles, la probabilidad de no lograr la meta es de 0 2. ; ; • Si se gana entre 20 000 y 40 000 soles, la probabilidad de que se logre la meta es de 0 6. ; • Cuando se gana más de 40 000 soles, la probabilidad de no lograr la meta es de 0 01. . Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios126 a. Halle la probabilidad de que se logre la meta. Solución Sean los eventos: Gi: ganancia se encuentra en un intervalo i, y M: lograr la meta. Se tiene que: 1 20 35 0 40P G P G( ) . , ( ) . ,= = y por diferencia se tiene que 3 0 25P G( ) .= 1 2 30 80 0 60 0 99P M|G P M G P G|M|( ) . , ( ) . , y ( ) .= = = 1 1 2 2 3 3 0 35 0 80 0 40 0 60 0 25 0 99 0 7675 P M P G P M G P G P M G P G P M G( ) ( ) ( ) ( ) ( ) ( ) ( ) , ( . )( . ) ( . )( . ) ( . )( . ) . | | |= + + = = + + = Forma alterna de solución: Las probabilidades conjuntas iP G M[ ( )] se obtienen al multiplicar las probabilidades marginales iP G[ ( )] con las probabilidades condiciona- les iP M G|[ ( )]. Luego de los cálculos se elabora la siguiente tabla: Ganancia M M Total G1: < 20 P(Gi M) = (0.35)(0.80) 0.2800 0.0700 0.35 G2: 20 – 40 0.2400 0.1600 0.40 G3: > 40 0.2475 0.0025 0.25 Total 0.7675 0.2325 1.00 b. Si se logró la meta, ¿en cuál de los tres intervalos mencionados es más probable que se encuentre la ganancia en la operación? Solución 1 1 1 1 0 35 0 80 0 28 0 3645 0 7675 0 7675 P G M P G P M G P G |M P M P M ( ) ( ) ( | ) ( . )( . ) .( ) . ( ) ( ) . . = = = = = 2 0 24 0 7675 0 3127P G |M /( ) . . .= = 3 0 2475 0 7675 03224P G |M /( ) . .= = Es más probable que la ganancia se encuentre en el primer intervalo, es decir, que sea inferior a 20 mil soles. Ejemplo 18 Del análisis de los registros (“log”) se concluye que las fallas habituales en una máquina que viene dando problemas están relacionadas con tres pro- cesos del sistema, P1, P2 y P3. Las fallas relacionadas con cada proceso son el 20 %, 45 % y 35 % respectivamente. Sólo alguna de estas fallas conlleva un apagado repentino de la máquina. De las fallas causadas por el primer Capítulo 2. probabilidad 127 proceso, el 30 % conlleva un apagado de la máquina, de las del segundo proceso un 55 % y de las del tercer proceso un 10 %. a. Muestre la información proporcionada en un diagrama de árbol Solución b. ¿Cuál es la probabilidad de que la próxima falla produzca un apagado repentino de la máquina? Solución 1 1 2 2 3 3P A P P P A P P P P A P P P P A P( ) ( ) ( ) ( ) ( )| ( )| ( )|= + + 0 2 0 3 0 45 0 55 0 35 0 10P A( ) ( . )( . ) ( . )( . ) ( . )( . )= + + 0 06 0 2475 0 035 0 3425P A( ) . . . .= + + = c. Si la siguiente falla produce un apagado repentino de la máquina, ¿cuál de los procesos es más probable que haya fallado? Solución 1 1 0 2 0 3 0 1752 0 3425 P P A P P A P A ( ) ( . )( . )( | ) . ( ) . = = = 2 2 0 45 0 55 0 7226 0 3425 P P A P P A P A ( ) ( . )( . )( | ) . ( ) . = = = 3 3 0 35 0 01 0 1021 0 3425 P P A P P A P A ( ) ( . )( . )( | ) . ( ) . = = = El proceso 2 tiene mayor probabilidad de falla. A A A A A A P1 P2 P3 1 0 20P P( ) .= 2 0 45P P( ) .= 3 0 35P P( ) .= 1 0 30P A|P( ) .= 1 0 70P A|P( ) .= 2 0 55P A|P( ) .= 2 0 45P A|P( ) .= 3 0 10P A|P( ) .= 3 0 90P A|P( ) .= Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios128 Ejemplo 19 Una empresa tiene 3 vendedores: A, B y C. Durante el último mes, estos vendedores han realizado, respectivamente, el 30 %, 20 % y 50 % de las ope- raciones de venta de la empresa. Del total de operaciones de venta realizadas por el vendedor A, el 1% tiene error en la orden de compra. Del total de ope- raciones de venta realizadas por el vendedor B, el 3% tiene error en la orden de compra. Del total de operaciones de venta realizadas por el vendedor C, el 90 % no tiene error en la orden de compra. a. Si se selecciona al azar una operación de venta, halle la probabilidad de que ésta tenga error en la orden de compra. Solución P E P A P E A P B P E B P C P E C| |( ) ( ) ( ) ( ) ( ) ( ) |( )= + + 0 30 0 01 0 2 0 03 0 50 00 10P E( ) . ( .( . )( . ) ( . )( ) () . )= + + 0 003 0 006 0 050 0 059P E( ) . . . .= + + = b. Si se selecciona al azar una operación de venta y ésta tiene error en la or- den de compra; determine la probabilidad de que la operación de venta corresponda al vendedor B. Solución 0 006 0 1017 0 059 P B EP B|E P E ( ) .( ) . ( ) . = = = 4.5 Probabilidad de eventos independientes La independencia de eventos es la propiedad necesaria para que la probabilidad de la intersección se obtenga al multiplicar las probabilidades individuales. En el ejemplo A, la multiplicación brindó la probabilidad correcta porque los eventos eran independientes. En el ejemplo B, los eventos no son independientes y la multiplicación brinda una respuesta distinta. E A B C E E E E E 0 20P B( ) .= 0 30P A( ) .= 0 50P C( ) .= 0 01P E|A( ) .= 0 99P E|A( ) .= 0 03P E|B( ) .= 0 97P E|B( ) .= 0 10P E|C( ) .= 0 90P E|C( ) .= Capítulo 2. probabilidad 129 Definición Se dice que dos eventos son independientes si, y sólo si, cualquiera de las siguien- tes proposiciones es verdadera: • P A B P A( ) ( )| = • P B A P B( ) ( )| = • P A B P A P B(( )) ( )= Lo anterior significa que dos eventos son independientes si la ocurrencia (o no ocurrencia) de uno no afectala probabilidad de ocurrencia del otro. Algunas veces es sencillo determinar la independencia de eventos, pero en otros casos es difícil, especialmente cuando los eventos que se desean analizar son combinaciones de otros eventos. Por ejemplo: a. La compra de un producto por un cliente A no tiene ningún efecto sobre la decisión de compra o no de otro cliente B, es decir, son independientes. b. Sean los eventos: A: tener una cuenta de ahorros en el Banco GGG, y B: recibir un préstamo en el Banco GGG El hecho de que una persona tenga una cuenta de ahorros en el Banco GGG puede aumentar la probabilidad de que la persona reciba un présta- mo del Banco GGG, lo cual ocurre en la práctica, por lo tanto los eventos A y B no son independientes. Para una mejor comprensión del concepto de independencia, se menciona el siguiente caso: Caso de análisis: Sean: A: aparece el número 4 en un dado rojo, y B: aparece el número 4 en un dado azul. Si ambos dados se lanzan una vez, ¿cuál es la probabilidad de que ocurran dos números 4 ? 1 6P A / ,( ) = 1 6P B /( ) = y 1 36P A B /( ) .= Nótese que el producto 1 6 1 6 1 36/ / /( )( ) = permite obtener la respuesta correcta. Pero no siempre es así. Si se lanzan los dos dados, se tiene que: P(suma de ambos dados sea 8 y los dos números sean iguales) 1 36/ .= Sin embargo: P(suma de ambos dados sea 8 ) 5 36/= P(dos números iguales) 6 36/= Si se multiplican dichas probabilidades se obtiene: 5 36 6 36 5 216/ / /( )( ) .= Luego, las probabilidades halladas no coinciden. Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios130 Ejemplo 20 Los alumnos A y B han sido designados para resolver un problema de ele- vada dificultad, y trabajarán en forma separada. Se estima que A tiene una probabilidad de 0 85. de resolverlo correctamente, ymientras que B tiene una probabilidad de 0 75. . Hallar la probabilidad de que: a) El problema quede resuelto correctamente. Solución El problema quedará resuelto cuando al menos uno de ellos lo puede resolver; es decir: P A B P A P B P A A B ( ) ( ) – ( )( ) ( )+ Por independencia 0 85 0 75 0 85 0 75 0 9625P A B P A P B P A P B( ) ( ) – ( ) ( ) . . – ( . )( .( ) .) = + = + = b) Solo uno de ellos lo resuelva. Solución Se define el evento S: sólo un alumno resuelve el problema 0 85 0 25 0 15 0 75 0 325P S P A B P A B( ) ( ) ( ) ( . )( . ) ( . )( . ) .= + = + = Ejemplo 21 Un empresario invierte en 3 proyectos diferentes: P1, P2 y P3. Por informa- ción anterior, el empresario sabe que las probabilidades de éxito en estos pro- yectos son de 0 6. , 0 7. y 0 9. , respectivamente, y, además, que los resultados de estos proyectos son independientes. a. Calcule la probabilidad de que este empresario tenga éxito en solo uno de estos proyectos. Solución Sean: P1: Éxito en el proyecto 1. 1 0 60P P( ) . ,= 1 0 40P P( ) .= P2: Éxito en el proyecto 2. 2 0 70P P( ) . ,= 2 0 30P P( ) .= P3: Éxito en el proyecto 3. 3 0 90P P( ) . ,= 3 0 10P P( ) . ,= P(Solo uno) = 1 2 3 1 2 3 1 2 3P P P P P P P P P P P P( ) ( ) ( )+ + 0 6 0 3 0 1 0 4 0 7 0 1 0 4 0 3 0 9 0 154( . )( . )( . ) ( . )( . )( . ) ( . )( . )( . ) .= + + = b. Halle la probabilidad de que el empresario tenga éxito en, a lo más, dos de estos proyectos. Solución Se definen los eventos Capítulo 2. probabilidad 131 T : tiene éxito en a lo más dos proyectos, y T : tiene éxito en los tres proyectos, 1 2 3 0 6 0 7 0 9 0 378P T P P P P( ) ( ) ( . )( . )( . ) . , luego := = = 1 0 378 0 622P T( ) . .= − = 1 0 378 0 622P T( ) . .= − = Ejemplo 22 El gerente de logística de una empresa afirma que el desabastecimiento del insumo A ocurre con probabilidad 0 1. , el del insumo B ocurre con probabi- lidad 0 08. y el del insumo C ocurre con probabilidad 0 05. . Considerando independencia para el abastecimiento de estos insumos en un momento de operación elegido al azar, halle las probabilidades para los siguientes eventos: a. E1: que los tres insumos registren abastecimiento. Solución Sean: A: Desabastecimiento del insumo A. P(A) = 0.10, P A( ) = 0.90 B: Desabastecimiento del insumo B. P(B) = 0.08, P B( ) = 0.92 C: Desabastecimiento del insumo C. P(C) = 0.05, P B( ) = 0.95 1( ) ( ) (0.90)(0.92)(0.95) 0.7866= = = P E P A B C b. E2: que solo el insumo B registre desabastecimiento. Solución 2( ) ( ) (0.9)(0.08)(0.95) 0.0684= = = P E P A B C c. E3: Que el desabastecimiento se produzca solo para los insumos A y C. Solución 3 0 10 0 92 0 05 0 0046P E P A B C( ) ( ) ( . )( . )( . ) .= = = d. E4: Que el insumo A o el B estén desabastecidos, pero no el insumo C. Solución 4P E P A B C P A B P C( ) [( ) ] ( ) ( )= = [ ]4( ) 0.10 0.08 (0.10)(0.08) (0.95) 0.1634= + − =P E Ejemplo 23 En una empresa de estudios de mercado se forman dos grupos de encues- tadores. El primer grupo está compuesto por 15 hombres y 5 mujeres, y el segundo grupo por 16 hombres y 6 mujeres. a) Si se selecciona al azar una persona de cada grupo, ¿cuál es la probabili- dad de que al menos una sea mujer? Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios132 Solución E: elegir al menos a una mujer. :E ninguna mujer es elegida 1 2 1 2 15 16 0 5454 20 22 P E P H H P H P H( ) ( ) ( ) ( ) . = = = = P(E) = 1 – ( )P E = 1 – 0.5454 = 0.4546 5. probleMas resueltos 1. Una caja contiene 20 fichas blancas numeradas de 1 a 20, 10 fichas rojas numeradas de 1 a 10, 40 fichas amarillas numeradas de 1 a 40, y 10 fichas azules numeradas de 1 a 10. Suponga que todas las fichas tienen igual pro- babilidad de ser elegidas y que se extrae una ficha al azar. a. ¿Cuál es la probabilidad de que la ficha sea azul o blanca? Solución Ω = {B1, …, B20, R1, …, R10, Am1, …, Am40, Az1, …, Az10}; 80n( )Ω = Blancas = {B1, …, B20} n(B) = 20 Rojas = {R1, …, R10} n(R) = 10 Amarillas = {Am1, …, Am40} n(Am) = 40 Azules = {Az1, …, Az10} n(Az) = 10 En este caso, no interesa el número de la ficha sino el color P A B P A P B( () )( )= + ya que son mutuamente excluyentes (o se da uno o se da el otro, pero no ambos simultáneamente) El total de fichas en la caja es 80: n(Ω) = 80 El total de total de fichas azules: n(Az) = 10 y de fichas blancas: n(B) = 20; luego, 20 10 30 0 375 80 80 80 P A B( ) .= + = = b. ¿Cuál es la probabilidad de que la ficha tenga el número 10, 11, 12 o 25? Solución Ahora no interesa el color sino el número. Con el número 10 hay 4 fichas, con el 11 y 12 hay 2, y con el 20 sólo 1. Entonces H Grupo 1 M 1 15 20 P H( ) = 1 5 20 P M( ) = H Grupo 2 M 2 16 22 P H( ) = 2 6 22 P M( ) = Capítulo 2. probabilidad 133 c. ¿Cuál es la probabilidad que la ficha sea roja o amarilla y que tenga el número 3, 4, o 5? Solución Para cada Colori se tiene que 1 0 0125 80i P(Color ) .= = 3 4 5 3 4 5 6 0 075 80 P R P R P R P A P A P A( ) ( ) ( ) ( ) ( ) ( ) .+ + + + + = = d. ¿Cuál es la probabilidad de que el número sea divisible por 3? Solución Las fichas blancas contienen a 6 divisibles por 3. 3B = {B3, B6, B9, B12, B15, B18} Las fichas rojas contienen a 3 divisibles por 3. 3R = {R3, R6, R9} Las fichas amarillas contienen a 13 divisibles por 3. 3Am = {Am3, Am6, …, Am36, Am39} Las fichas azules contienen a 3 divisibles por 3. 3Az = {Az3, Az6, Az9} La probabilidad de escoger un número que sea divisible por 3 se reduce a: 3P( ) = + + + = =6 3 13 3 25 0.3125 80 80 2. En una empresa se han elaborado tarjetas con el nombre de cada colaborador, así como un código para un sorteo; el mencionado código se encontraba con- formado por 5 posiciones: las 2 primeras posiciones eran figuras de la baraja (♦ ♣ ♥ ♠), y las 3 últimas eran valores numéricos (dígitos del 1 al 3). Cada figu- ra, así como los números, podía repetirse en el código. a. Hallar la probabilidad de que el código para el sorteo se encuentre con- formado por figuras y dígitos distintos. Solución El código se puedeconformar de (42)(33) = (16)(27) = 432 códigos distintos A: el código tiene figuras y dígitos distintos. • Ordenar 2 figuras, sin repetición, de 4 posibles: P42 = 4 4 3 2 4 2 2 ! ( )( )( !) ( )! ! = − = 12, y • Ordenar 3 dígitos, sin repetición, de 3 posibles: P3 = 3! = (3)(2)(1) = 6 • Número de casos a favor del evento A: n(A) = P42 P3 = (12)(6) = 72 10 11 12 25 10 11 12 25P P PP P( ) ( ) ( ) ( ) ( )= + + + = 4 2 2 1 9 0 1125 80 80 80 80 80 .+ + + = = Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios134 Por lo tanto, la probabilidad de que ocurra A es: 4 2 3 2 3 12 6 4324 3 0 16667 P P P A ( )( )( ) ( )( ) .= = ≈ b. ¿Cuál es la probabilidad de que el dígito central no se repita? Solución B: el dígito central no se repite. • Ordenar 2 figuras, con repetición, de 4 posibles: 24 • Elegir al dígito que no se repite: 31 3C = • Ordenar 2 dígitos, con repetición, de 2 posibles: 24 4= Por lo tanto, la probabilidad de que ocurra B es: 2 2 3 (4 )(3)(4) 12( ) 0.44444 27(4 )(3 ) = = ≈P B 3. Un ingeniero de sistemas que trabaja para una compañía de computación de- dicada al desarrollo de software está diseñando la clave de acceso a su progra- ma aplicativo. La clave debe estar formada por una palabra de cinco letras, elegidas entre cuatro vocales y ocho consonantes disponibles. a. Hallar la probabilidad de que la clave esté formada por 2 vocales al inicio y 3 consonantes al final, tal que las vocales y consonantes no se repitan. Solución • El total de posibles claves que puede formar el ingeniero con las 12 letras disponibles es: 512n( ) .Ω = • Se define el evento D: la clave tiene 2 vocales distintas al inicio y 3 consonantes distintas al final. El número de casos a favor de D es: 4 8 2 3( ) (12)(336) 4032= = =n D P P . Por lo tanto, la probabilidad de que ocurra D es: 5 4032 0 0162 12 P D( ) .= = b. ¿Cuál es la probabilidad de que el ingeniero forme una clave que contenga dos vocales iguales y tres consonantes iguales? Solución Se define el evento E: la clave tiene dos vocales iguales y tres consonan- tes iguales. Como para formar la clave interesa el orden, hay 4 maneras de elegir una vocal y 8 maneras de elegir una consonante, la vocal y la consonante elegidas se repetirán 2 y 3 veces respectivamente. Los casos a favor de E son: ( ) ( ) 5 2 3 5 5 4 34 8 32 32 32 10 320 2 32 3 3 n E P , ! ( )( )( !)( ) ( )( ) ( ) ( ) ( )( ) . ( !)( !)( !)( !) ! = = = = = Capítulo 2. probabilidad 135 La probabilidad de que ocurra E es: 5 320 0 001286 12 P E( ) .= = 4. En una empresa hay 3 subgerencias vacantes. Para cubrir estas vacantes, la empresa decide elegir al azar a tres de sus ejecutivos aptos para asumir cada uno de estos cargos. La empresa tiene cuatro sucursales: San Isidro, con 5 ejecutivos, Miraflores, con 8 ejecutivos; San Miguel, con 4 ejecutivos; y La Molina: con 3 ejecutivos. a. ¿Cuál es la probabilidad de que los 3 subgerentes elegidos sean de la misma sucursal? Solución 20 3 1140n C( )Ω = = E: los 3 ejecutivos elegidos son de la misma sucursal 5 8 4 3 3 3 3 3 20 3 10 56 4 1 71 0 0622 1140 1140 C C C C P E C ( ) . + + + + + + = = = = b. ¿Cuál es la probabilidad de que ninguno de los elegidos sea de la sucur- sal de Miraflores? Solución F: Ningún ejecutivo de Miraflores es elegido 8 12 0 3 20 3 0 19298 C C P F C ( ) .= = 8 12 0 3 20 3 1 220 0 19298 1140 C C P F C ( )( )( ) .= = = c. Hallar la probabilidad de que más de uno de los elegidos sea de la sucur- sal de San Isidro. Solución M: elegir a más de un ejecutivo de San Isidro 5 15 5 15 2 1 3 0 20 3 10 15 10 1 160 0 14035 1140 1140 C C C C P M C ( )( ) ( )( ) ( ) . + + = = = = 5. En una reunión de trabajadores con sus directivos (gerente y subgerente) se han ocupado totalmente 4 mesas con capacidad para 10 personas; además, se sabe que en la mesa 1 no se ha ubicado ni al gerente ni al subgerente, quienes se han ubicado en mesas diferentes. Se selecciona 3 trabajadores. Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios136 a. ¿Cuál es la probabilidad de que a lo más se seleccione a un trabajador de la mesa 1? Solución • Seleccionar a 3 de los 38 trabajadores: 383 8436C = Luego: Seleccionar a 0 trabajadores de la mesa 1 (10 trabajadores), y a 3 de las mesas restantes (28 trabajadores). 10 28 0 3 1 3276 3276C C ( )( )= = Seleccionar a 1 trabajador de la mesa 1 (10 trabajadores), y a 2 de las mesas restantes (28 trabajadores). 10 28 1 2 10 378 3780C C ( )( )= = • Probabilidad solicitada: 10 28 10 28 0 3 1 2 38 3 3276 3780 0 8364 8436 C C C C C .+ += ≈ b. En la mesa 2 tampoco se ha ubicado ni al gerente ni al subgerente, ¿cuál es la probabilidad de que por lo menos se seleccione a 2 trabajadores de la mesa 1 o de la mesa 2, pero no a trabajadores de ambas mesas a la vez? Solución Del procedimiento anterior: • Seleccionar a 3 de las 38 trabajadores: 383 8436C = Luego: Seleccionar a 1 de las 2 mesas (mesa 1 o mesa 2) 2 1 2C = De la mesa elegida previamente, se- leccionar a 2 trabajadores de la mesa (10 trabajadores), y a 1 de las mesas 3 o 4 (18 trabajadores), o 10 18 2 1 45 18 810C C ( )( )= = De la mesa elegida previamente, se- leccionar a 3 trabajadores de la mesa (10 trabajadores), y a 0 de las mesas 3 o 4 (18 personas) 10 18 3 0 120 1 120C C ( )( )= = • Probabilidad solicitada: ( )2 10 18 10 181 2 1 3 0 38 3 2 810 120 0 2205 8436 C C C C C C ( ) . + + = ≈ Capítulo 2. probabilidad 137 6. Una empresa transnacional requiere seleccionar practicantes de ingenie- ría para el verano del año siguiente. El perfil solicitado indica tener tres características: pertenecer al tercio superior, dominar el idioma inglés, y dominar Excel. Se presentaron al proceso de selección 500 estudiantes de diferentes universidades, y luego de la primera revisión de los currículos, se observó que: Pertenecen al tercio superior 186 Son del tercio superior y dominan inglés: 83 Dominan inglés 329 Dominan inglés y Excel: 217 Dominan Excel 295 Son del tercio superior y dominan Excel: 63 Todos los postulantes tienen al menos una de las tres características. Si se elige al azar a un postulante, determine la probabilidad de que: a. Tenga el perfil solicitado. Solución Tercio superior: n(T) = 186 Tercio superior y domina inglés: 83n T I =( ) Domina inglés: n(T) = 329 Dominan inglés y Excel: 217n I E( ) = Domina Excel: n(E) = 295 Tercio superior y domina Excel: 63n T E =( ) 500n( )Ω = 500 186 329 295 83 217 63 = + + + = + + + + + n T I E n T n I n E n T I n I E n T E n T I E n T I E ( ) ( ) ( ) –( ) ( ) ( ) ( ) ( ) ( – – – ( ) ) Entonces, 53n T I E( ) = Diagrama de Venn: P(Perfil) = 53 0 106 500 P T I E( ) .= = T I E 500n( )Ω = 93 30 53 82 16410 68 Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios138 b. Tenga solo una de las tres características. Solución S: el estudiante tiene solo una de las 3 características. P S P T I E T I E T I E( ) [( ) ( ) ( )]= 93 82 68 243 0 486 500 500 .+ += = = c. Domine el idioma inglés y Excel, pero no pertenezca al tercio superior. Solución 164 0 328 500 P I E T P I E T[( ) ] ( ) .− = = = 7. Se han encuestado a 160 profesionales de la construcción y acabados, y se ha recabado información sobre su edad, la tienda de su preferencia, así co- mo el motivo de dicha preferencia (Servicio o Variedad). A partir de los datos recabados se elaboró la siguiente tabla resumen: Edad Servicio Variedad Total Maestro Promart Sodimac Maestro Promart Sodimac De 40 a más 5 5 4 8 15 12 49 Menos de 40 21 18 15 6 26 25 111 Total 26 23 19 14 41 37 160 a. Si se selecciona un encuestado al azar para una verificación telefónica, obtenga las siguientes probabilidades. a.1) ¿Cuál es laprobabilidad de que el encuestado prefiera la tienda Sodimac? Solución 19 37 56 0 35 160 160 P Sodimac( ) .+= = = a.2) ¿Cuál es la probabilidad de que el encuestado no prefiera la tienda Promart? Solución 23 41 641 1 1 0 40 160 160 P Promart P Promart( ) ( ) .+= − = − = − = a.3) ¿Cuál es la probabilidad de que el encuestado tenga de 40 a más años o que valore la Variedad? Solución P(De 40 a más Variedad) = P(De 40 a más) + P(Variedad) – P(De 40 a más Variedad) Capítulo 2. probabilidad 139 P(De 40 a más Variedad) 49 14 41 37 8 15 12 106 0 6625 160 160 160 160 .+ + + += + − = = b. Si se elige al azar a 4 profesionales de 40 a más años, ¿cuál es la probabi- lidad de que exactamente 2 hayan valorado el Servicio? Solución • Seleccionar a 6 de los 49 profesionales de 40 a más años: 49 4 49 49 211 876 4 49 4 4 45 C ! ! !( )! ( !)( !) = = = − De los 49 profesionales de 40 a más años, hay 14 profesionales que valoraron el Servicio y 35 profesionales que valoraron la Variedad. • Seleccionar 2 de los 14 profesionales que valoraron el Servicio y 2 de los 35 profesionales que valoraron la Variedad: 14 35 2 2 14 35 9 54 11 595 2 12 2 3 5 3 4C C ! ! ( )( ) ( !)( !) ( !)( !) = = = • Probabilidad solicitada: 14 35 2 2 49 4 54 145 0 25555 211 876 C C C .= ≈ c. Si se elige al azar a 3 profesionales que prefieren la tienda Maestro, ¿cuál es la probabilidad de que por lo menos uno haya valorado la Variedad? Solución • Seleccionar a 3 de los 26 + 14 = 40 profesionales que prefieren la tienda Maestro: 40 3 9880C = • De los 40 profesionales que prefieren la tienda Maestro, hay 26 profe- sionales que valoraron al Servicio y 14 profesionales que valoraron la Variedad. • Seleccionar 2 de los 26 profesionales que valoraron al Servicio y 1 de los 14 profesionales que valoraron la Variedad: 26 14 2 1 325 14 4550C C ( )( ) == • Seleccionar 1 de los 26 profesionales que valoraron al Servicio y 2 de los 14 profesionales que valoraron la Variedad: 26 14 1 2 26 91 2366C C )( )( == • Seleccionar 0 de los 26 profesionales que valoraron al Servicio y 3 de los 14 profesionales que valoraron la Variedad: 26 14 0 3 1 364 364C C ( )( ) == • Probabilidad solicitada: 26 14 26 14 26 14 2 1 1 2 0 3 40 3 7280 0 7368 9880 C C C C C C C . + + = ≈ Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios140 8. Se compran 20 computadoras de una marca A y 30 de una marca B. De la marca A hay 2 que no funcionan; y de la marca B hay 3 que no funcionan. a. Si se elige al azar una de las computadoras, ¿cuál es la probabilidad de que no funcione? Solución P(computadora no funciona) 5 0 10 50 .= = b. Si para una inspección se elige al azar y sin reposición 5 computadoras, ¿Cuál es la probabilidad de que: b.1) Solo una de ellas sea de la marca A. Solución 50 2 118 760 5 n( ) Ω = = S: solo una computadora elegida es de la marca A • Seleccionar una computadora de la marca A de 20 disponibles: 20 1 • Seleccionar 4 computadoras de la marca B de 30 disponibles: 30 4 20 30 1 4 0 2587 2118760 P S( ) . = = b.2) A lo más una de ellas sea defectuosa. Solución A: a lo más una computadora elegida es defectuosa. • Seleccionar ninguna computadora defectuosa, y 5 no defectuosas: 5 45 0 5 , o • Seleccionar una computadora defectuosa, y 4 no defectuosas: 5 45 1 4 5 45 5 45 0 5 1 4 0 9282 2118760 P A( ) . + = = 9. Suponga que por la aduana de un aeropuerto deben pasar 20 embarques. Para cada uno de ellos, el responsable del embarque debe presionar un botón que emitirá una luz de color rojo (R), una luz de color ámbar (A) o una luz de co- Capítulo 2. probabilidad 141 lor verde (V). Si se emite luz roja, el embarque será revisado totalmente. Si se emite luz ámbar, el embarque se revisará parcialmente. Si se emite luz verde, el embarque no será revisado. a. Si se desea identificar la luz emitida para cada uno de los 20 embarques, determine el número de elementos que tiene el espacio muestral. Solución Con cada uno de los 20 embarques se tiene 3 opciones al presionar un botón, por lo tanto el total de posibles resultados es: 203N( )Ω = b. Halle la probabilidad de que la mitad de los embarques sean revisados totalmente y que cinco de los embarques sean revisados parcialmente. Solución M: la mtad de los embarques son revisados totalmente (R), y cinco de los embarques sean revisados parcialmente (A) Aplicando permutaciones con elementos iguales, se tiene que: 20 10 5 5 20 46 558 512 10 5 5 n M P , , !( ) ! ! ! = = = Por lo tanto, la probabilidad de que ocurra el evento M es: 20 46 558 512 0 01335 3 P M( ) .= = 10. En el depósito de la empresa Fabritext S.A hay dos lotes de cierto producto: • El lote 1 contiene 5 unidades de buena calidad, 4 de regular calidad y 3 de mala calidad. • El lote 2 contiene: 8 unidades de buena calidad, 6 de calidad regular y 4 de mala calidad. Un comprador debe elegir al azar 4 unidades, y si elige al menos 2 unida- des de buena calidad, compra los dos lotes. Sean las siguientes estrategias: i. Estrategia 1: de cada lote se eligen, al azar, sin reemplazo y sin considerar el orden, dos unidades. ii. Estrategia 2: se juntan los dos lotes; luego, se seleccionan, al azar y sin reemplazo, cuatro unidades. iii. Estrategia 3: de cada lote se eligen, al azar y con reemplazo, dos unidades. ¿Con cuál de las estrategias se tiene una mayor probabilidad de que se com- pre los dos lotes? Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios142 Solución Para la estrategia 1 La cantidad de sucesos del espacio muestral viene dada por: 12 18 10 098 2 2 n( ) Ω = = Lote 1: 5 unidades de buena calidad, y 7 de otras calidades Lote 2: 8 unidades de buena calidad, y 10 de otras calidades Sean A: elegir al menos dos unidades de buena calidad A: elegir a lo más una unidad de buena calidad 5 7 8 10 5 7 8 10 5 7 8 10 4200 0 2 0 2 0 2 1 1 1 1 0 2 n A( ) = + + = 42001 1 0 58407 10098 P A P A( ) ( ) .= − = − = Para la estrategia 2 El espacio muestral viene dado por: 30 27 405 4 n( ) Ω = = 13 17 13 17 11 220 0 4 1 3 n A( ) = + = 112201 1 0 59058 27405 P A P A( ) ( ) .= − = − = Para la estrategia 3 El espacio muestral viene dado por: 2 212 18 46 656n( ) ( )( )Ω = = 2 19 7402 57 7 10 10 7 10 10 7 7 8 10n A ( )( )( )( ) ( )( )( )( ) ( )( )( ) ( )( )( )( )+ + == 197401 1 0 57690 46656 P A P A( ) ( ) .= − = − = Hay mayor probabilidad de concretar la compra usando la estrategia 2. 11. En una fábrica de pantalones, se trabaja con 3 máquinas (M1, M2, M3). La producción de la máquina M1 equivale a la producción de M2 y M3 juntas y además la producción de M2 es la quinta parte del total. El 60 % de la producción de cada máquina corresponde a operarios antiguos y el resto a operarios nuevos. Si de la producción de la semana anterior (con las condiciones dadas), se selecciona un pantalón al azar, halle la probabilidad de que: Capítulo 2. probabilidad 143 a. Haya sido confeccionado en la máquina M3. Solución Se sabe que: 1 2 3P M P M P M( ) ( ) ( )= + (1), y 2 1( ) 0.20 5 = =P M (2) De (1) se deduce que: 1 0 50P M( ) .= (3) y 2 3 0 5P M P M( ) ( ) .+ = (4) De (2) y (4) se deduce que: 3 0 3P M( ) .= (5) b. Haya sido confeccionado en la máquina M2 y por un operario antiguo. Solución Sea: A: Es un operario antiguo Se sabe que: 0 60 1 2 3iP A M i ( ) . , ,| ,= = (6) De (2) y (6) se tiene que: 2 2 2 0 20 0 60 0 12P M A P M P A M( ) ( ) ( . )( .( ) | ) .= = = Siguiendo un similar procedimiento se puede completarla siguiente tabla: Antiguos (A) Nuevos (N) Total Máquina 1 (M1) 0.30 0.20 0.50 Máquina 2 (M2) 0.12 0.08 0.20 Máquina 3 (M3) 0.18 0.12 0.30 Total 0.60 0.40 1.00 c. Haya sido confeccionado por un operario nuevo o en la máquina M1. Solución Sea: N: Es un operario nuevo Entonces: 1 1 1 0 40 0 50 0 20 0 70P N M P N P M P N M( ) ( ) – .( ) ( ) . – . .= + = + = 12. En un examen de Matemáticas solo 75 % de los alumnos respondió todas las preguntas. De aquellos que lo hicieron, 80 % aprobó, pero de los que no lo respondieron en su totalidad, solo aprobó 50 %. a. Si se elige al azar a un estudiante que aprobó, ¿cuál es la probabilidad de que haya respondido todas las preguntas? Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios144 Solución Se definen los eventos: R: responder todas las preguntas. A: aprobar el examen Se sabe que: 0 75 0 25 0 80 0 50P R P R P A R P A R( ) . , ( ) . , ( | ) . , ( | ) .= = = = Se registra la información proporcionada en la siguiente tabla: A A Total R P R A |P R P A R( )( ) ( )= 0 75 0 80 0 600( )( ). . .= 0.150 0.75 R 0.125 0.125 0.25 Total 0.725 0.275 1.00 Se solicita: P AR|( ) De la tabla se tiene que: ( ) 0.60( ) 0.8276 ( ) 0.725 = = = P R AP R |A P A b. Si el estudiante elegido no aprobó, ¿cuál es la probabilidad de que no haya respondido todas las preguntas? Solución Se solicita: ( | )P R A De la tabla anterior, se tiene: 0 125 0 4545 0 275 P R AP R A P A ( ) .( | ) . ( ) . = = = 13. En una empresa se realizó una capacitación a los operarios de la Planta A y de la Planta B, y se tiene conocimiento de que los operarios capacitados provenientes de la Planta A son el doble que los provenientes de la Planta B. Se sabe que el 5 % de los operarios de la Planta A y el 10 % de los opera- rios de la Planta B obtuvieron una clasificación deficiente en la evaluación realizada luego de la capacitación. Si de una de las plantas se selecciona al azar 2 operarios, responda a las siguientes preguntas. Nota: Los resultados de la evaluación son independientes. a. Hallar la probabilidad de que los 2 operarios hayan obtenido una clasi- ficación aceptable (no deficiente). Solución Pi: Los 2 operarios son de la Planta i. i = A, B C: Los 2 operarios seleccionados obtuvieron una clasificación aceptable. Capítulo 2. probabilidad 145 Nota: Como los operarios capacitados de la Planta A son el doble que la Planta B: 2 1 3 3A B P P P P( ) , y ( )= = 2 10 9025 0 81 0 871667 3 3 P C( ) ( . ) ( . ) . = + = b. Si los 2 operarios seleccionados obtuvieron una clasificación aceptable, ¿cuál es la probabilidad de que sean de la Planta B? Solución 1 0 81 3 0 30975 0 871667 B B B P P C P P |C P C ( . )( ) ( ) . ( ) . = = = 14. Suponga que la SUNAT ha clasificado a las empresas por sectores (S1, S2 y S3), y también según el índice del pago del impuesto a la renta del 2014 en tres categorías (A1, A2 y A3). Considerando las clasificaciones antes mencionadas el 30 % de las em- presas son del sector S1 y de la categoría A1, el 10 % son del sector S1 y de la categoría A2, el 60 % de las empresas son del sector S1, el 20 % de las empresas son del sector S2 y de la categoría A1, el 5% de las empresas son del sector S2 y de la categoría A3, y el 35 % de las empresas son del sector S2. Además, se conoce que de las empresas que son del sector S3, el 60 % pertenecen a la categoría A1; y de las que son de la categoría S3, el 20 % son de la categoría A2. Se selecciona al azar una empresa. C PA C C C PB Planta Clasificación 2( | ) 0.95 0.9025= =A AP P P 2( | ) 0.90 0.81= =A AP P P 2 3A P P( ) = 1 3B P P( ) = Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios146 a. Determine la probabilidad de que pertenezca a la categoría A2 o perte- nezca a S3. Solución A continuación se resume la información proporcionada: 1 1 0 30 1 2 0 10 1 0 60P S A P S A P S. , . , ( ) .( ) ( )= = = (Grupo 1) 2 1 0 20 2 3 0 05 2 0 35P S A P S A P S. , . , ( ) .( ) ( )= = = (Grupo 2) 1 3 0 60 2 3 0 20P A |S P A |S( ) . , ( ) .= = (Grupo 3) Del (Grupo 1) y del (Grupo 2) se deduce que: 3 0 05P S( ) .= (1) De (1) y del (Grupo 3) se deduce que: 1 3 1 31 3 0 60 1 3 0 03 3 0 05 P A S P A SP A |S A S P S ( ) ( )( ) . ( ) . ( ) . = = = ⇒ = De igual forma: 2 3 0 01P A S( ) .= A partir de lo señalado se completa la siguiente tabla: A1 A2 A3 Total S1 0.30 0.10 0.20 0.60 S2 0.20 0.10 0.05 0.35 S3 0.03 0.01 0.01 0.05 Total 0.53 0.21 0.26 1.00 Se solicita: 2 3P A S( ) De la tabla elaborada se tiene: 2 3 2 3 2 3 0 21 0 05 0 01 0 25P A S P A P S P A S( ) ( ) – . . – .( ) ( ) .= + = + = b. Si se sabe que es de la categoría A2, halle la probabilidad de que no per- tenezca al sector S1. Solución De la tabla anterior, se tiene: ( )1 2 0 11 0 52380 21P S A .| . . = = c. Si la empresa elegida no pertenece al sector S2, ¿cuál es la probabilidad de que tampoco pertenezca a la categoría A3? Solución De la tabla anterior, se tiene: ( )3 2 0 44 0 52380 65P A S .| . . = = Capítulo 2. probabilidad 147 15. En un supermercado se viene analizando la compra de los clientes, y se recabó la siguiente información. • Todos los clientes adquirieron por lo menos un producto de la sección de artículos de limpieza. • 70 % de los clientes adquirieron más de un producto de la sección de artículos de limpieza. • 20 % de los clientes adquirieron el producto de limpieza en oferta. • De aquellos clientes que compraron más de un producto de la sección de artículos de limpieza, 15 % adquirieron el producto de limpieza en oferta. Calcule la probabilidad de que un cliente seleccionado al azar adquirie- ra exactamente un producto de la sección de artículos de limpieza y que dicho producto no sea el que se encontraba en oferta. Solución L: Adquiere solamente un producto de la sección de artículos de limpieza (caso contrario adquiere más de 1 producto, ya que todos adquirieron por lo menos 1). O: Se adquiere el producto en oferta. 0 30 0 70 0 15 0 20 0 31667P O k k( ) . ( ) ( . )( . ) . .= + = ⇒ = Por lo tanto: 1 1 0 31667 0 68333P O|L k( – – . .) = = = Se solicita: 0 30 0 68333 0 205P L O P L P O| L( ) ( ) ( ) ( . )( ). .= = = 16. En un municipio, un regidor tiene en pendiente la aprobación de 2 pro- yectos que ha presentado: A y B. Se estima que el proyecto A tiene una probabilidad de 0.7 de ser aprobado antes de la próxima sesión de Concejo, mientras que el proyecto B tiene una probabilidad de 0.9 de ser aprobado en el mismo plazo. Si la aprobación de un proyecto no influye en el otro, ¿cuál es la probabilidad de que... O L O Cantidad artículos de limpieza Prod. Oferta O O 0 30P L( ) .= P O|L k( ) = 0 15P O|L)( .= 0 70P L( ) .= L Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios148 a. Se aprueben los 2 proyectos antes de la próxima sesión de Concejo? Solución Se tiene que: 0 7P A( ) . = y 0 90P B( ) .= 0 70 0 90 0 63P A B P A P B( ) ( ) ( . )( . )) .( = = = b. Se apruebe solamente el proyecto A antes de la próxima sesión de Concejo? Solución 0 70 0 10 0 07P A B P A P B( ) ( . )( .( ) ( ) ) .= = = c. Se apruebe al menos uno de los dos proyectos antes de la próxima sesión de Concejo? Solución Sea: N: No aprobar ninguno de los 2 proyectos P N P A B( ) ( )= 0 30 0 10 0 03P A B P A P B( ) ( ) ( ) ( . )( . ) .= = = Luego por la probabilidad de evento contrario P(Aprobar al menos 1) 1 1 0 03 0 97P A B( ) . .= − = − = 17. En una tienda de calzado, el 40 % de las personas que ingresan al local rea- liza una compra, y se sabe que la decisión de compra es independiente de una persona a otra. Sobre los próximos 3 clientes que ingresarán a la tienda, responda las siguientes preguntas: a. ¿Cuál es la probabilidad de que los 3 clientes efectúen unacompra? Solución Ci: Cliente i realiza una compra. i = 1, 2, 3 3 1 2 3 1 2 3 0 4 0 064P C C C P C P C P C( ) ( ) ( ) . .( ) = = = b. ¿Cuál es la probabilidad de que por lo menos 2 de las personas realicen una compra? Solución 1 2 3 1 2 3 1 2 3 1 2 3 2 3 2 2 3 0 4 0 6 0 4 0 288 0 064 0 352 P P C C C P C C C P C C C P C C C P ( ) ( ) ( ) ( ) ( ) ( )( . )( ( ) . ) . . . . ≥ = + + + ≥ = + = + = c. ¿Cuál es la probabilidad de que se realice por lo menos una venta? Solución 3 1 2 31 0 1 1 0 6 1 0 216 0 784P P C C C( ) ( ) . . .− = − = − = − = Capítulo 2. probabilidad 149 18. Según su gravedad, los accidentes de trabajo están clasificados en tres gru- pos: leves, moderados y severos. La probabilidad de que ocurra un acciden- te leve es 0.5, de que ocurra un accidente moderado, 0.4; y de que ocurra un accidente severo, 0.1. a. Cinco accidentes ocurrieron independientemente en un mes: a.1) Calcule la probabilidad de que ninguno sea severo Solución Sean: L: Ocurre un accidente de trabajo de gravedad leve. 0 50P L( ) .= M: Ocurre un accidente de trabajo de gravedad moderado. 0 40P M( ) .= M: Ocurre un accidente de trabajo de gravedad severo. 0 10P S( ) .= Se solicita: P(Ninguno severo) P(Ninguno severo) 51 2 3 4 5 0 9 0 5905P S S S S S( ) ( . ) .= = = a.2) Halle la probabilidad de que a lo más uno sea moderado Solución A: a lo más un accidente moderado P A( ) = P(ninguno moderado) + P(solo uno moderado) 5 1 2 3 4 5 1 1 2 3 4 5 5 40 6 5 0 6 0 4 0 15456 P A P M M M M M C P M M M M M ( . ) ( ) ( ( ) ( ) . )( . ) .= = = + + a.3) ¿Cuál es la probabilidad de que todos tengan la misma gravedad? Solución T: Todos los accidentes de la misma gravedad 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 5 5 50 5 0 4 0 1 0 0415 P T P L L L L L P M M M M M P S S S S S P T ( ) ( ) ( . ) ( . ) ( . ) ( ) ( ) ( ) .= = + + = + + b. Halle la probabilidad de que el cuarto accidente que ocurre sea el prime- ro de severa gravedad Solución E: El cuarto accidente es el primero severo 3 1 2 3 4 0 9 0 1 0 0729P E P S S S S( ) ( ) ( . ) . .= = = 19. Un grupo empresarial decide ejecutar tres planes de inversión: 1, 2 y 3. Los tres planes serán tratados en forma independiente. Para cada plan de inversión se ha considerado tres posibilidades: Fracaso (F), Recuperación de la inversión en tres años o menos (RT) y Recuperación de la inversión en más de tres años pero en cinco años o menos (RC). Para el plan de inversión Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios150 1 se consideran las siguientes probabilidades: 1 0 10P F( ) . ,= 1 0 35P RT( ) .= y 1 0 55P RC( ) . .= Para el plan de inversión 2 se consideran las siguientes probabilidades: 2 0 15P F( ) . ,= 2 0 50P RT( ) .= y 2 0 35P RC( ) . .= Para el plan de inversión 3 se consideran las probabilidades siguientes: 3 0 05P F( ) . ,= 3 0 065P RT( ) .= y 3 0 30P RC( ) . .= a. ¿Cuál es la probabilidad de que sólo en uno de los planes se recupere la inversión? Solución Se define: Ri: Recuperar la inversión sólo en el plan i, i = 1, 2, 3 De lo señalado se deduce: P(R1) = P(RT1) + P(RC1) = 0.35 + 0.55 = 0.90, 1P R( ) = 0.10 P(R2) = P(RT2) + P(RC2) = 0.50 + 0.35 = 0.85, 2P R( ) = 0.15 P(R3) = P(RT3) + P(RC3) = 0.65 + 0.30 = 0.95, 3P R( ) = 0.05 Sea: A: solo en un plan de inversión se recupera la inversión 1 2 3 1 2 3 1 2 3 1 2 3 0 9 0 15 0 05 0 1 0 85 0 05 0 10 0 15 0 95 0 02525 P A P R R R P R R R P R R R P A P R R R ( . )( . )( . ) ( . )( . )( . ) ( ( ) ( ) ( ) ( ) ( ) ( . )( ) ) . ) . ( .= + + = = + + = b. Sabiendo que en solo uno de los planes se recuperó la inversión, ¿cuál es la probabilidad de que haya sido el segundo? Solución 1 2 3 0 1 0 85 0 05 0 1683 0 02525 P R R R A ( . )( . )( . ) ( | ) . . = = c. Determine la probabilidad de que no fracase el plan de inversión 1 o no fracase el plan de inversión 2. Solución 1 2 1 2 1 2 0 90 0 85 0 90 0 85 0 985 P F F P F P F P F F . . – ( . )( . ) ( ) ( ) ( ) ( ) .= + = = + − 20. Tres equipos de futbol compiten en un triangular. El campeón será aquel equipo que logre ganar sus dos partidos. Si los equipos son A, B, C y no existen los empates, se tiene que: P(A gane a B) = 0.70; P(B gane a C) = 0.80; P(C gane a A) = 0.90 a. ¿Cuál es la probabilidad de que A sea el campeón? Solución De los datos proporcionados se tiene que: Capítulo 2. probabilidad 151 P(A gane a C) = 1 – P(C gane a A) = 1 – 0.90 = 0.10 Para que A sea el campeón tiene que ganar a B y a C; es decir: P(A es el campeón) = P(A gane a B)P(A gane a C) = (0.70)(0.10) = 0.07 b. ¿Cuál es la probabilidad de que B sea el campeón? Solución Procediendo de manera similar al inciso a), se tiene: P(B gane a A) = 1 – P(A gane a B) = 1 – 0.70 = 0.30 P(B es el campeón) = P(B gane a A)P(B gane a C) = (0.30)(0.80) = 0.24 6. probleMas propuestos 1. El testigo de un accidente de tránsito le indica al policía que la placa de circulación del automóvil tenía las letras DUH seguidas por tres dígitos, el primero de los cuales era un cinco. Si el testigo no puede recordar los otros dos dígitos, pero asegura que los tres eran diferentes, encuentre el número máximo de placas que debe verificar la policía. 2. Se dispone de los siguientes dígitos 0, 1, 2, 3, 4, 5, y 6; para conformar núme- ros de 3 dígitos, tal que cada dígito solo puede usarse una vez: a. ¿Cuántos números distintos pueden formarse? b. ¿Cuántos números pares distintos pueden formarse? c. ¿Cuántos números distintos mayores que 330 pueden formarse? 3. Ocho personas, cuatro mujeres y cuatro hombres, compraron 8 lugares pa- ra un concierto. Considerando cada uno de los siguientes casos, ¿en cuántas formas diferentes pueden ubicarse en los lugares disponibles? a. Sin restricciones. b. Si se sientan por parejas (hombre y mujer). c. Si todos los hombres se sientan juntos a la izquierda de todas las mujeres. 4. Una caja de 12 baterías recargables contiene una defectuosa, ¿de cuántas maneras un inspector puede seleccionar tres de las baterías y a. obtener la defectuosa. b. no obtener la defectuosa? 5. El gerente de una fábrica desea determinar el número de maneras en que puede asignar trabajadores al primer turno. Cuenta con 12 hombres que pueden servir como operadores, 8 que pueden desempeñarse en manteni- miento y 4 que pueden ser supervisores. Si el turno requiere 6 operadores, 2 Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios152 trabajadores de mantenimiento y 1 supervisor, ¿de cuántas maneras puede integrarse el primer turno? 6. Un equipo de fútbol tiene 3 arqueros y 15 jugadores de campo. a. ¿Cuántas alineaciones distintas se pueden formar? b. Manuel y Jorge son amigos y jugadores de campo. ¿En cuántos casos se podrá formar el equipo, si al menos uno de los amigos debe jugar? 7. Con la intención de difundir temas relacionados a la protección y uso ra- cional del medio, el Ministerio del Ambiente tiene previsto difundir 5 spots (rotulados con las letras A, B, C, D y E) con información alusiva al tema durante los tres intermedios de un sintonizado programa informativo este domingo. ¿De cuántas maneras puede programarse la transmisión de los spots durante los tres intermedios si solo se puede programar un spot en cada intermedio y si: a. En los tres intermedios se puede difundir el mismo spot. b. Los tres spots difundidos son distintos. c. Un spot es difundido en dos intermedios. d. De los tres spots diferentes por difundir, uno de ellos es el spot B? 8. Una tienda tiene 3 vitrinas para mostrar sus productos, se puede colocar 1 o más artículos en una vitrina cualquiera. Si en cierto momento hay 4 artículos para exhibición. ¿Cuál es la probabilidad de que se utilicen solo 2 de las 3 vitrinas para los 4 artículos? 9. Los resultados de las prácticas I y II de un curso indican lo siguiente:el 70 % aprobó la práctica I, el 60 % aprobó la práctica II y el 10 % no aprobó ninguna de las 2 prácticas. a. ¿Qué porcentaje aprobó solo una de las 2 prácticas? b. Si un alumno aprobó la práctica I, ¿cuál es la probabilidad de que no haya aprobado la práctica II? c. ¿Son independientes los eventos: A1: aprobar la práctica I, A2: aprobar la práctica II? 10. Un lote de producción tiene 100 unidades, de las cuales se sabe que 20 están defectuosas. Una muestra aleatoria de 4 unidades se selecciona sin reem- plazo. ¿Cuál es la probabilidad de que la muestra contenga a lo más dos unidades defectuosas? 11. Suponga que usted rinde un examen de 10 preguntas de selección múltiple sobre una materia de la cual usted no sabe absolutamente nada. 5 de las 10 preguntas tienen 4 respuestas posibles (a, b, c y d), de las cuales solo una es Capítulo 2. probabilidad 153 la correcta. Las restantes 5 preguntas son del tipo verdadero - falso, por lo que tienen solo dos alternativas. Si usted contesta el examen completamen- te al azar, y cada pregunta bien contestada tiene un valor de 2 puntos, ¿cuál es la probabilidad de obtener la nota 18? 12. En unos grandes almacenes se tomó una muestra aleatoria de 10.000 com- pras a lo largo de un año. Esas compras se clasificaron según la forma de pago y el importe de las mismas. Se diferenciaron dos formas de pago: Con- tado (B1) y Crédito (B2). Los importes se agruparon en tres categorías: me- nos de 50 soles (A1), entre 50 y 500 soles (A2) y más de 500 soles (A3). Para estos eventos se sabe que: P(A1) = 0.3, P(A3) = 0.32, P(B1|A1) = 2/3, P(B1|A2) = 2/19, P(B1|A3) = 1/32 a. Si se elige una compra al azar y su importe se ha abonado al contado, ¿cuál es la probabilidad de que su valor sea inferior a 50 soles? b. ¿Los eventos forma de pago e importe de la compra son independientes? Compruebe. 13. Un cierto tipo de pólizas incluyen pagos hospitalarios. El 85 % de las póli- zas incluyen pagos de consultas externas o pagos de operaciones quirúrgi- cas. El 25 % de las pólizas no incluyen pagos de operaciones quirúrgicas. Considere la independencia entre estos dos eventos. Si se elige una póliza al azar: a. Calcule la probabilidad de que incluya pagos en consultas externas. b. Halle la probabilidad de que incluya sólo uno de estos tipos de pólizas. c. Si una póliza no incluye pagos de operaciones quirúrgicas, halle la pro- babilidad de que incluya pagos por consultas externas . 14. El gerente de un restaurante sabe que el porcentaje de clientes que pide aperitivo es 30 %. Por otro lado, la tercera parte de los clientes que piden aperitivo consume carne. De aquellos que no piden aperitivo, el 60 % consume carne. Si un cliente pide aperitivo y carne, la probabilidad de que pida postre es 0.80. Si pide aperitivo, pero no pide carne, entonces la probabilidad de que pida postre es 0.60. Si no pide aperitivo, pero sí carne, la probabilidad de que pi- da postre es 0.50. Por último, la probabilidad de que un cliente que no pide ni aperitivo ni carne pida postre es 0.25. a. ¿Cuál es la probabilidad de que un cliente elegido al azar pida postre? b. ¿Cuál es la probabilidad de que un cliente que pide postre pida también aperitivo? c. ¿Cuál es la probabilidad de que un cliente que no pide postre no pida tampoco aperitivo? Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios154 15. Estudios sobre posibles pérdidas o utilidades con dos proyectos de inver- sión efectuados por un analista financiero indicaron que invirtiendo en el proyecto A se pueden obtener los siguientes resultados, en miles de soles, –20, 0, 40 con probabilidades respectivas 0,1; 0,30; 0,60. Invirtiendo en el proyecto B las probabilidades para los resultados –20, 0, 40 son 0,30; 0,40; 0,30 respectivamente. Considere independientes los resultados de los dos proyectos. ¿Cuál es la probabilidad de lo siguiente?: a. ¿Solo en uno de los dos proyectos se obtenga pérdidas? b. ¿En ambos proyectos se obtenga el mismo resultado económico? 16. Una cervecería utiliza dos máquinas embotelladoras, pero no operan si- multáneamente. La segunda máquina opera como sistema de respaldo de la primera y opera sólo cuando la primera se descompone durante las horas de trabajo. La probabilidad de que la primera máquina se descomponga en horas de trabajo es 0.20. Si, efectivamente, la primera máquina se descom- pone, se enciende la segunda máquina y tiene la probabilidad de descom- ponerse de 0.30. a. ¿Qué probabilidad hay de que el sistema embotellador de la cervecería no esté funcionando en horas de trabajo? b. La confiabilidad del proceso de embotellado es la probabilidad de que el sistema esté operando en horas de trabajo. Calcule la confiabilidad del proceso. 17. De tres eventos A, B y C, se sabe que: • A y C son independientes • B y C son independientes • A y B son disjuntos • P(A C) = 2/3; P(B C) = 3/4; P(A B C) = 11/12. Hallar P(A), P(B) y P(C). 18. A altas horas de la madrugada, un individuo regresa a su casa ebrio. Solo puede abrir la puerta con una determinada llave de entre las cinco que tie- ne en su llavero. El portal de la casa está oscuro y no puede distinguir las llaves entre sí. El mejor método para abrir la puerta sería ir probando las llaves de una en una, eliminando las que no abran. Pero esta feliz idea se le ocurre solo con probabilidad 0.1 debido al lamentable estado en que regre- sa. El otro método consiste en probar llaves al azar hasta abrir la puerta, sin eliminarlas. a. ¿Cuál es la probabilidad de que abra la puerta al tercer intento? b. Si abre la puerta al tercer intento, ¿qué método es el más probable que haya utilizado? Capítulo 2. probabilidad 155 19. Un sistema está compuesto por 3 componentes que operan de manera inde- pendiente. Para que el sistema funcione, al menos dos de los componentes deben funcionar. Suponiendo que la confiabilidad del componente 1 es 0.95, la del componente 2 es 0.9 y la del componente 3 es 0.8 a. ¿Cuál es la probabilidad de que el sistema funcione? b. Sabiendo que el sistema funciona, ¿cuál es la probabilidad de que exac- tamente dos componentes funcionen? c. Dado que el componente 1 funciona, ¿cuál es la probabilidad de que el sistema funcione? 20. En el sistema de cómputo de una gran empresa pueden ocurrir fallas de tres tipos: de hardware, de software o eléctricas (alimentación). Nunca se presenta más de una falla en un día. Cuando se presentan problemas de hardware, se debe suspender el servicio con probabilidad de 0.73. Cuando ocurren problemas con el software, se suspende el servicio con probabilidad de 0.12. Cuando se presentan fallas eléctricas, la probabilidad de suspender el servicio es de 0.8. Históricamente, los ingenieros de mantenimiento han observado que una falla de software es cinco veces más probable que un problema de hardware y 2.5 veces más frecuente que una falla eléctrica. a. ¿Cuál es la probabilidad de que el sistema no suspenda su servicio en un día? b. Si el sistema ha dejado de prestar su servicio, ¿cuál es la causa más pro- bable de suspensión? 21. Al poner a la venta un producto, el administrador responsable ha determi- nado que solo puede presentarse una de las siguientes cuatro situaciones de la demanda: muy desfavorable, desfavorable, favorable y óptima. Tam- bién ha calculado las probabilidades siguientes: • 1/8 de que la demanda sea muy desfavorable. • 1/9 de que la demanda sea muy desfavorable y no se logre los resultados deseados. • 1/4 de que la demanda sea desfavorable. • 0,15 de que la demanda sea desfavorable y se logre los resultados deseados. • 1/4 de que la demanda sea favorable. • 0,18 de que la demanda sea favorable y se logre los resultados deseados. • 0,1 de que la demanda sea óptima y no se logre los resultados deseados. a. Halle la probabilidad de que se logre los resultados deseados sabiendo que la demanda fue óptima. b. Si no se logró los resultados deseados, ¿cuál es la probabilidadde que la demanda sea desfavorable o muy desfavorable? La variable aleatoria resume en un núme- ro la información que contiene el resultado de un experimento aleatorio, lo que permi- te su análisis y posterior modelamiento. En la práctica, las variables aleatorias se ajustan a ciertos modelos probabilísticos en los cuales nos basamos para realizar inferencias estadísticas que utilizan datos obtenidos de una muestra aleatoria y es necesario aproximar una distribución de probabilidad. Sabes Capacidades adquiridas 9 Calcular medidas de posición y de dispersión. 9 Conocer las propiedades y los teore- mas acerca de las probabilidades. 9 Graficar una función matemática. 9 Calcular la derivada y la integral de una función. Piensas Competencias por lograr 9 Definir una variable aleatoria y cons- truir su función de probabilidad. 9 Verificar las propiedades que debe tener una función de probabilidad de una variable aleatoria. 9 Construir la función de probabilidad acumulativa. 9 Calcular la esperanza matemática y la varianza de una variable aleatoria. 9 Interpretar apropiadamente la E(X), V(X) y CV(X) de una variable aleatoria. Haces Habilidades por desarrollar 9 Identificar las características de un experimento aleatorio. 9 Escoger el modelo probabilístico adecuado para resolver un problema real. Secciones 1. Definición. 2. Tipos de variables aleatorias 3. Esperanza matemática y varianza de una variable aleatoria 4. Interpretación de la E(X), V(X) y CV(X) Conocimientos previos Estadística básica, teoría de conjuntos, funciones matemáticas, probabilidades. Variable aleatoria Capítulo 3 Capítulo 3. Variable aleatoria 159 1. Definición Una variable aleatoria es una función cuyo dominio es el espacio muestral Ω asociado a un experimento aleatorio ,ε y su rango pertenece a los números rea- les. Se denota comúnmente por las letras X, Y, W, etc. La variable aleatoria tiene como objetivo transformar un conjunto no siempre numérico ( ),Ω en un con- junto siempre numérico; es decir, asigna un número real a cada elemento del espacio muestral. Esquemáticamente se representa en la figura 1. Ejemplo 1 Supóngase que el experimento ( ),ε consiste en escoger tres artículos al azar de un proceso de producción y se analiza la calidad de cada uno de ellos, donde b: bueno y d: defectuoso. a. Determine el espacio muestral. Solución El espacio muestral es: Ω = {bbb, bbd, bdb, dbb, bdd, dbd, ddb, ddd} Figura 1. Represen- tación gráfica de una variable aleatoria. Ω w1 w2 wn X(w1) = x1 X(w2) = x2 X(wn) = xn xR ∈� Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios160 b. Sea la variable aleatoria X: número de artículos defectuosos. Determine el rango (valores) de X. Solución Los valores que toma X son: X = {0, 1, 2, 3}. En efecto: X(bbb) = 0; X(bdb) = X(dbb) = X (bbd) = 1; X (bdd) = X (dbd) = X (ddb) = 2; X (ddd) = 3 Ejemplo 2 ABC es una empresa importadora de laptops de última generación. Para su campaña universitaria compra 10 laptops exclusivas en tamaño y presenta- ción. Después de 3 meses de exposición, la laptop queda desactualizada. Sea la variable aleatoria X: número de laptops vendidas en el trimestre. Determine el rango de X. Solución Los valores de la variable aleatoria X son: 0 1 2 3 3 4 5 6 7 8 9 10X , , , , , , , , , , ,{ }.= Ejemplo 3 Una empresa textil dispone de seis máquinas bordadoras computarizadas. Sea X la variable aleatoria que representa al número de máquinas bordadoras en uso en un momento específico de la jornada productiva. Determine los valores (rango) de la variable X. Solución Los valores de la variable aleatoria X son: 0 1 2 3 3 4 5 6X , , , , , , ,{ }.= Ejemplo 4 Suponga que la variable aleatoria X es el tiempo que demora un alumno en responder un examen que tiene un tiempo máximo de 90 minutos de dura- ción. Determine el rango de X. Solución Los valores que toma X son: RX = {x / 0 < x ≤ 90} minutos. Capítulo 3. Variable aleatoria 161 2. tipos De variables aleatorias Una variable aleatoria puede ser discreta o continua. 2.1 Variable aleatoria discreta 2.1.1 Definición Una variable aleatoria X es discreta si sus valores constituyen un conjunto conta- ble o numerable; tales como los presentados en los ejemplos 1, 2 y 3. El conjunto contable puede ser finito o infinito. 2.1.2 Función de probabilidad de una variable aleatoria discreta Sea ε un experimento aleatorio y Ω su espacio muestral. Sea X una variable aleatoria discreta definida en Ω y Rx su rango. Se denominará “función de pro- babilidad” a la función P definida en el rango de X, tal que: 0 1xP R: [ , ]→ y que satisface las siguientes condiciones: i) 0 ≤ p(xi) ≤ 1 ∀ xi∈RX. ii) 1ip x( ) ∀ ∈ ∑ = i Xx R Nota. 1. p(xi) representa la probabilidad de que la variable aleatoria X tome el valor de xi; es decir: p(xi) = P(X = xi). 2. La función de probabilidad de una variable aleatoria discreta también es llamada “función de cuantía de la variable aleatoria X”. 3. En la práctica, una función de probabilidad de una variable aleatoria discreta se puede representar de dos maneras: a. Utilizando una tabla cuyo formato se puede representar de la siguiente manera: xi x1 x2 x3 … xn …. Total P(X = xi) p(x1) p(x2) p(x3) … p(xn) …. 1 b. Utilizando una fórmula matemática que toma la siguiente forma: P(X = xi) = p(xi) = Expresión matemática; Dominio: Se especifican los valo- res de X para los cuales es válida la expresión matemática. Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios162 Ejemplo 5 Una variable X tiene la siguiente función de probabilidad: x 1 2 3 4 Total P(X = x) 0.30 C C/2 C/4 1 a. Hallar el valor de la constante C Solución Para hallar el valor de la constante C se usa la segunda condición de la definición. En efecto: 1 i XX R p xi( )∀ ∈ =∑ Por lo tanto: 1 2 3 4 1 0 3 2 4 1p p p p C C/ C/( ) ( ) ( ) ( ) . ,+ + + = ⇒ + + + = de donde: 0 4C . .= b. Calcular: i. 2P X( ,)< ii. 2 4P X ),( < ≤ iii. 3 1P X X( / )≤ > Solución i. 2 1 0 30P X P X( ) ( ) . .< = = = ii. 2 4 3 4 0 20 0 10 0 30P X P X P X( ) .( . .) ( )< ≤ = = + = = + = iii. 1 3 0 603 1 0 857143 1 0 70 P X P X X P X ( ) .( / ) . . ( ) . < ≤ ≤ > = = = > Ejemplo 6 Una pizzería tiene cinco líneas telefónicas. Sea X la variable aleatoria que representa al número de líneas en uso en un momento específico. Supóngase que la función de probabilidad de X está dada en la siguiente tabla: x 0 1 2 3 4 5 Total p(x) 0.05 0.15 0.20 0.15 0.25 0.20 1 Calcule la probabilidad de cada uno de los siguientes eventos: a. A = “a lo sumo 2 líneas están en uso” b. B = “menos de 4 líneas están en uso” c. C = “por lo menos 3 líneas están en uso” d. D = “entre 2 y 4 (inclusive) líneas están en uso” e. E = “entre 2 y 5 (inclusive) líneas no están en uso” f. F = “por lo menos 3 líneas no están en uso” Capítulo 3. Variable aleatoria 163 Solución Sea la variable aleatoria X: número de líneas en uso en un momento es pecífico, entonces: a. 2 0 1 2 0 05 0 15 0 20 0 40P A P X P X P X P X( ) ( ) ( ) ( ) . . .) . .(= ≤ = = + = + = = + + = b. 4 3 0 1 2 3 0 55P B P X P X P X P X P X P X( ) ( ) ( ) ( ) ( ) ( ) ( ) . .= < = ≤ = = + = + = + = = c. 3 3 4 5 0 60P C P X P X P X P X( ) ( ) ( ) ( )( .) .= ≥ = = + = + = = d. 2 4 2 3 4 0 60P D P X P X P X P X( ) ( ) ( ) ( ) . .( )= ≤ ≤ = = + = + = = e. Sea Y : número de líneas que no están en uso; entonces: 2 5 0 3 0 55P E P P X( ) ( ( ) .) .= ≤ ≤ = ≤ ≤ =Y f. 3 2 0 40P E P P X( ) ( )( ) . .= ≥ = ≤ =Y Nota. Para responder a los incisos e) y f) se usó el criterio del evento comple- mentario. Otra manera de responder a las preguntas sería construyendo la función de probabilidad de ,Y para luego en base a ella calcular las probabi- lidades pedidas. Ejemplo 7 La Facultad de Ingeniería acaba de recibir 5 módulos tecnológicos para fines de enseñanza. Se dispone de 3 ambientespara colocarlos (hay la posibilidad de que más de 1 módulo se coloque en un mismo ambiente). Construir la función de probabilidad de la variable aleatoria, X: Número de ambientes elegidos para colocar los 5 módulos. Solución Como se define X: número de ambientes elegidos para colocar los 5 módulos, los valores que toma X son: 1, 2 y 3. Se determina el número de casos posibles: 3 3 3 3 3 = 243n( )Ω = × × × × Luego, se calcula la probabilidad para cada valor que toma X: i. Seleccionar a 1 de 3 ambientes, y luego seleccionar a 5 de los 5 módulos. 3 5 1 5 31 243 243 P X( ) = = = ii. Seleccionar a 2 de 3 ambientes, y luego seleccionar a: – 1 de los 5 módulos para el primer ambiente y a 4 de los 4 módulos restantes para el segundo ambiente, o – 2 de los 5 módulos para el primer ambiente y a 3 de los 3 módulos restantes para el segundo ambiente, o así sucesivamente. 902 243 243 243 4 1 2 3 3 2 4 5 10 10 5 3 5 5 3 5 2 5 2 1 4 1 3P X( ) ( )= = + + + + + + == Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios164 5 4 3 5 4 2 5 4 1 5 3 2 5 3 1 5 2 1 1 1 3 1 2 2 1 3 1 2 1 2 2 2 3 1 1 243 3 + + 3 1 3P X( ) + + + = = iii. Seleccionar a 3 de 3 ambientes, y luego seleccionar a: – 1 de los 5 módulos para el primer ambiente y a 1 de los 4 módulos res- tantes para el segundo ambiente, y a 3 de los 3 módulos restantes para el tercer ambiente, o – 1 de los 5 módulos para el primer ambiente y a 2 de los 4 módulos res- tantes para el segundo ambiente, y a 2 de los 2 módulos restantes para el tercer ambiente, o así sucesivamente. 1 5 4 1 5 6 1 5 4 1 10 3 1 10 3 1 10 2 1 3 243 P X ( )( )( ) ( )( )( ) ( )( )( ) ( )( )( ) ( )( )( ) ( )( )( ) ( ) + + + + + = = 20 30 20 30 30 20 1503 243 243 P X( ) + + + + += = = Por lo tanto, la función de probabilidad de X es: x 1 2 3 Total P X x( )= 3 243 90 243 150 243 1 2.1.3 Función de distribución Es la función de probabilidad acumulada (menor o igual que). Sea X una variable aleatoria discreta con función de probabilidad p(x), se de- fine a la función de distribución F, como: F : →� � tal que: ( ) X x F x P X x p x( ) ( ) ≤ = ≤ = ∑ Ejemplo 8 Sea X una variable aleatoria cuya función de probabilidad es: x 1 2 3 4 5 Total p(x) 0.05 0.25 0.30 0.25 0.15 1 Capítulo 3. Variable aleatoria 165 a. Grafique la función de probabilidad Solución La gráfica de la función de cuantía es un diagrama de bastones, que se presenta en la figura 2. b. Construya la función de distribución Solución Para calcular la función de distribución se usa la definición, es decir: X x F x P X x p x( ) ( ) ( ). ≤ = ≤ = ∑ Por ejemplo: 1 1 0 0 0 0 0 9999 0 9999 0F P X F P X F P X( ) ; ( ) ; (( ) ( ) ( ). ) . ;− = ≤ − = ≤ = ≤ === lo que se puede sintetizar y decir que F(X) = 0, si 1X .< Análogamente: F(1) = 1 1 0 05F P X(( )) . ;= ≤ = 1 5 1 5 1 0 05F P X P X( ) ( )( . ) . . ;= ≤ = ≤ = 1 99 1 99F P X(( ). ) .= ≤ = 1 99P X .( )≤ = 1 0 05P X( ) . ;≤ = de lo cual se tiene que: 0 05F x( ) . ,= si 1 2X .≤ < Finalmente, la función de distribución es: 0.00, 1 0.05, 1 2 0.30, 2 3 ( ) ( ) 0.60, 3 4 0.85, 4 5 1.00, 5 < ≤ < ≤ <= ≤ = ≤ < ≤ < ≥ x x x F x P X x x x x c. Grafique la función de distribución Solución La gráfica de la función de distribución se presenta en la figura 3. Figura 2. Función de probabilidad (cuantía). Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios166 Ejemplo 9 Una tienda de electrodomésticos ofrece a sus clientes diferentes opciones pa- ra el pago de sus cuotas. Para un cliente seleccionado al azar, sea X, la varia- ble aleatoria que representa al número de meses para el pago de las cuotas. Si la función de probabilidad acumulada (distribución) está dada por: 0.00, 1 0.39, 1 4 0.53, 4 6 ( ) ( ) 0.69, 6 8 0.80, 8 12 1.00, 12 < ≤ < ≤ <= ≤ = ≤ < ≤ < ≥ x x x F x P X x x x x a. Construir la función de cuantía (probabilidad) de X. Solución Considerando que: P(X = x) = F(x) – F(x – 1), la función de probabilidad es: x 1 4 6 8 12 Total p(x) 0.39 0.14 0.16 0.11 0.20 1 b. Calcule la probabilidad de que el número de meses elegidos para el pago de las cuotas sea estrictamente mayor que 4, pero menor o igual que 12. Solución 8 12 0 16 0 11 0 204 1 6 0 72 4P X P XP X P X( ) ( ( ) ( ) . .) . . .+ = + = = + + =< ≤ = = c. Calcule la probabilidad de que el número de meses elegidos para el pago de las cuotas sea estrictamente menor que 4 o mayor o igual que 8. Solución 8 1 8 12 0 39 0 11 0 20 0 704 P X P X P X P XP X ( ) ( ) ( ) . . . .( ) ) .(+ ≥ = = + = + = = +< + = Figura 3. Función de distribución. Capítulo 3. Variable aleatoria 167 d. Utilice valores F(x) para calcular la probabilidad de que el número de me- ses elegidos para el pago de las cuotas se encuentre entre 4 y 8 meses (am- bos inclusive). Solución 8 8 1 0 80 0 39 0 414 X FP F( ) – ( )( ) . – . . .≤ ≤ = = = 2.2 Variable aleatoria continua 2.2.1 Definición Una variable aleatoria X es continua si sus valores pertenecen a los números reales. Puede ser un intervalo, una unión de intervalos o todos los reales; tal es el caso del ejemplo 4 (tiempo de demora en responder un examen), donde 0 90XR = x x/{ }< ≤ minutos. 2.2.2 Función de densidad de probabilidad de una variable aleatoria continua Sea X una variable aleatoria continua. Se llama función de densidad de pro- babilidad a la función: f : →� � y satisface las siguientes condiciones: i) 0f x x( ) , .≥ ∀ ∈� ii) 1f x dx( ) ∞ −∞ =∫ Nota 1. f x( ) no representa un valor de probabilidad, es la ordenada para un valor de x, y puede tomar un valor mayor a la unidad. 2. La gráfica de la función f x( ) siempre debe estar encima del eje X. 3. A diferencia del caso discreto, donde un evento puede ser un valor parti- cular que tome X, en el caso continuo, un evento debe ser necesariamente un intervalo. 4. Sea el evento A, tal que ocurre cuando la variable X a b, ,∈〈 〉 entonces: b aA P A f x dx f x dx( ) ( ) ( ) .= =∫ ∫ La probabilidad de un evento, en este caso, constituye el área bajo la curva de la función f x( ), su representación gráfica se muestra en la figura 4. Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios168 Ejemplo 10 Según el RENIEC, una persona debe esperar como máximo una hora para obtener el duplicado de su documento nacional de identidad (DNI), siendo este tiempo una variable continua con la siguiente función de densidad: 31 0 1 0 c x x x f ( ),( ) , otro caso ≤ ≤− = a. Hallar el valor de la constante c Solución Para hallar el valor de la constante c, se utilizará la segunda condición de la definición, es decir: 1f x dx( ) . ∞ − ∞ =∫ En efecto: 1 3 0 1 1c x dx( ) ;− =∫ de donde: 1 0 4 4 4 3 1 xc x c . − = ⇒ = b. Si un ciudadano ingresó a pedir su DNI a las 11 a.m., ¿cuál es la probabi- lidad de que aún esté allí a las 11 y 45? Solución De 11:00 a.m. a 11:45 a.m. han transcurrido 45 minutos, es decir, tres cuar- tos de hora (0.75 horas). 1 0 75 41 3 0 75 4 40 75 1 3 3 4 0 105469xP x x dx x .. ( ³ . ) ( ) . . = − = − ∫ = Figura 4. Representación gráfica de la probabilidad del evento A. Capítulo 3. Variable aleatoria 169 Ejemplo 11 El ingreso diario que tienen las tiendas que comercializan juguetes en las ga- lerías del centro de la ciudad, en el mes de diciembre, es una variable aleatoria, expresada en miles de soles, cuya función de densidad de probabilidad es la siguiente: 23 3 0 2 2 4 0 otro caso x x xf x,( ) , − < <= a. Hallar la probabilidad de que en un día las tiendas tengan ingresos supe- riores a 1000 soles Solución 22 2 3 1 1 23 3 31 2 0 50 2 4 4 4 x x x xP x dx( ) . . ≤ < = − = − =∫ b. Si el ingreso de una de las tiendas en un día es superior a 900 soles, ¿cuál es la probabilidad de que no sobrepase los 1500 soles? Solución 1 5 2 0 9 2 2 0 9 3 3 2 40 9 1 5 0 418501 5 0 9 0 7281 0 9 0 574753 3 2 4 x x dx P XP X X P X x x dx . . . ( . . ) .( . / . ) . . ( . ) . ≤ ≤ −∫ < > = = = = > −∫ c. Si se sabe que hay 100 tiendas con ingresos inferiores a 800 soles. Determine cuántas tiendas que comercializan juguetes tienen ingresos superiores a 800 nuevos soles. Solución Para calcular el número de tiendas que tienen ingresos mayores de 800 nuevos soles, se calcula primero el total de tiendas. Para ello, se usa la si- guiente identidad: 100 → P(X < 0.8) n → 1 Dónde: 0 80 8 2 3 0 2 0 3 3 30 8 0 352 2 4 4 4 x x x xP x dx .. ( . ) . . < = − = − =∫ Luego, se tiene: 100 → 0.352 n → 1 Entonces: n = 284 tiendas en total, por lo tanto, el número de tiendas que tienen ingresos superiores a 800 soles es de 184. Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios170 2.2.3 Función de probabilidad acumulativa (distribución) Sea X una variable aleatoria continua con función de densidad de probabilidad f x( ), se define a la función de distribución F como: F : →� � tal que: x F x P X x f t dt( ) ( ) ( ) −∞ = ≤ = ∫ Nota. Para calcular la probabilidad de un evento en el caso continuo (debe ser un inter- valo) se pueden utilizar dos procedimientos: 1. Integrando la función de densidad de probabilidad en el intervalo donde está definido el evento. 2. Utilizando la función de distribución en base a las siguientes identidades: 2.1 P x a F a( ) ( )< = 2.2 1P x a F a( ) – ( )> = 2.3 P a x b F b F a( ) ( ) – ( )< < = Ejemplo 12 El departamento de marketing de una firma distribuidora de automóviles considera que el tiempo, en años, que transcurre para la renovación de un automóvil por parte de un cliente típico es una variable aleatoria que puede representarse por la función: 2 72 0 6 0 x xf x ,( ) , otro caso < <= a. Construya la función de distribución de X Solución Usando la definición de función de distribución se tiene: Figura 5. Relación gráfica entre la función de densi- dad de probabilidad y de distribución. Capítulo 3. Variable aleatoria 171 2 3 3 0 0 72 216 216 x x F x P X x t t xdt( ) ( ) ,= ≤ = = =∫ de donde: 3 0 0 0 6 216 1 6 F x P X x x x x x ( ) ( ) , , , ≤ = ≤ = ≥ < < b. ¿Cuál es la probabilidad de que un vehículo se renueve después de 4 años? Solución 344 1 4 1 0 7037216P x F .( ) ( ) .< = − = − = c. Suponiendo que han pasado más de tres años desde la compra del vehícu- lo, ¿cuál es la probabilidad de tardar más de cinco años en renovarlo? Solución Se solicita: 5 1 5 0 4213 5 3 0 4815 3 1 3 0 875 P X F P X X P X F ( ) ( ) . ( | ) . ( ) ( ) . > − > > = = = = > − 3. esperanza MateMática y varianza De una variable aleatoria 3.1 Esperanza matemática 3.1.1 Definición Sea X una variable aleatoria con función de probabilidad p x( ) o f x( ). A la espe- ranza matemática de X denotada por E(X) o xµ se define por: i x X i i R x p x X x f x dx X E X ( ) si es discreta ( ) , si es continua , ( ) ∀ ∞ −∞ ∈ ∑ ∫ = µ = 3.1.2 Propiedades 1. La esperanza matemática de una constante es la misma constante, es decir: E C C( ) .= 2. 0E C X C E X C( ) ( );= ≠ 3. E X E X E( ) ( ) ( )± = ±Y Y 4. Sea X una variable aleatoria discreta con función de cuantía p(x) y G X( )=Y una función de X; entonces: X i i xi R G x p xE G X ( ([ ( )] ) ) ∀ ∈ ∑= Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios172 5. Sea X una variable aleatoria continua con función de densidad de probabi- lidad f x( ) y G X( )=Y una función de X; entonces: E G x G x f x dx[ ( )] ( ) ( ) ∞ −∞ = ∫ Ejemplo 13 La variable aleatoria X, definida como el número de refrigeradoras vendidas por día en cierta casa comercial, tiene la siguiente función de probabilidad: x 1 2 3 4 5 6 p(x) c c 1/8 1/8 2c 2c a. Determine el valor de la constante c. Solución Usando la segunda condición de la definición se tiene: 6 1 21 0 6 1 8x p x c( ) . = = ⇒ + =∑ de donde: 1 8 c .= b. Si se vendieron más de 2 refrigeradoras en un día, ¿cuál es la probabilidad de que se hayan vendido menos de 5? Solución 3 4 2 8 15 2 2 6 8 3 P X P X X P X ( ) /( | ) ( ) / ≤ ≤ < > = = = > c. Si la ganancia diaria de la casa comercial se encuentra representada por: 100 150X= −Y (en soles), hallar la ganancia esperada diaria de la casa comercial. Solución Se halla primero la esperanza de X: 1 1 11 2 6 4 8 8 8 E X( ) . . . = + + + = Como 100 150X ,= −Y entonces, 100 150 100 4 150 250E E[ ] [ ] – ( ) – .= = =Y X La casa comercial espera tener una ganancia diaria de 250 soles. d. ¿Cuál es la probabilidad de que la ganancia de la casa comercial sea menor que 250 soles? Solución 3250 100 150 250 4 3 0 375 8 P P X P X P X( ) ( ) ( ) ( ) .< = − < = < = ≤ = =Y Capítulo 3. Variable aleatoria 173 Ejemplo 14 Un inversionista está considerando tres estrategias para una inversión de 4000 dólares. Se estima que los posibles rendimientos son los siguientes: • ESTRATEGIA 1: Una utilidad de 9000 dólares con probabilidad 0.35 y una pérdida de 2000 dólares con probabilidad 0.65. • ESTRATEGIA 2: Una utilidad de 5000 dólares con probabilidad de 0.60 y una pérdida de 3000 dólares con probabilidad de 0.40. • ESTRATEGIA 3: Una utilidad segura de 1800 dólares. ¿Cuál de las tres estrategias aconsejaría usted al inversionista? Solución Se debe calcular la ganancia esperada para cada estrategia para determinar cuál estrategia es la mejor para invertir. En efecto, se define la variable G = ganancia de la inversión, entonces: • Para la estrategia 1: 9000 0 35 2000 0 65 1850E G( ) ( . ) – ( . )= = dólares • Para la estrategia 2: 50008 0 6 3000 0 4 1800E G( ) ( . ) – ( . )= = dólares • Para la estrategia 3 como la utilidad es segura, su ganancia esperada es de 1800 dólares. Si solamente se considera el criterio de la mayor ganancia esperada, entonces, el inversionista debería escoger la estrategia 1, pues su ganancia esperada es mayor. Ejemplo 15 El costo de un proyecto en miles de dólares está dado por 23 5C X X ,= + sien- do X el tiempo empleado en meses, que es una variable aleatoria que verifica: 2 213 4 1 2E X / E X[( – ½) ] , y [( – ) ]= = a. Determinar la media y la desviación estándar de X. Solución Utilizando los datos se tiene: 21 2 13 4E X / /[( – ) ] ,= entonces: 2 22 1 1 1 132 2 4 4 4 1 2 E X X E X E XE x / – ( ) ( )[( ) ] + = + = − = − (1) Por otro lado, de: 21 2E X[( – ) ] ,= se tiene: 2 2 21 2 1 2 1 2E X E X X E X E X[( ) ] [ ] ( ) ( )− = − + = − + = (2) Operando se tiene: 2 3E X E X( ) ( )− = (1) 2 2 1E X E X( ) ( )− = (2); de donde: 2 5 2E X E X( ) y ( ) .= = Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios174 De lo cual se tiene que 2 2 25 2 1V X E X E X( ) ( ) – ( ( )) – ,= = = y por lo tanto 1S X( ) .= En conclusión, 2E X( ) ;= y 1S X( ) .= b. Calcular el costo esperado del proyecto. Solución 2 23 5 3 5 3 2 5 5 31E C E X X E X E X( ) ( ) ( ) ( ) ( ) ( ) .= + = + = + = Por lo tanto, el costo esperado del proyecto es de 31 000 dólares. Ejemplo 16 Las pérdidas (en millones de soles) debido a incendios en una galería comercial se pueden considerar una variable aleatoria X con función de probabilidad: 20 0 20 0 c x x f x ( ), ( ) , en otro caso − < ≤ = a. Determine el valor de la constante c y construya la función de distribuciónde X. Solución Usando la segunda condición de la definición se tiene: 20220 20 00 0 120 1 20 1 400 200 1 2 200 xc x dx c x c c( ) ( ) . − = ⇒ − = ⇒ − = ⇒ =∫ Basándonos en la definición de la función de distribución: 21 20 0 1 0 20 400200 x o xF x t dt x x;( ) ( ) . −∫= − = < ≤ De donde: 0 0 2 0 1 0 20 200 1 20 x xF x P X x x x x , ( ) ( ) . , , ≤ = ≤ = − < < ≥ b. Al producirse un incendio, ¿cuál es la probabilidad de que las pérdidas superen los 8 millones de soles? Solución 8 1 8 1 8 1 0 80 0 32 0 52P X P X F( ) – ( ) – ( ) – ( . – . ) .> = ≤ = = = c. El administrador de una galería afirma que al producirse un incendio se espera una pérdida de 10 millones de soles. ¿Encuentra usted exagerada la afirmación del administrador de la galería? Justifique. Capítulo 3. Variable aleatoria 175 Solución Se calcula la esperanza de la pérdida: 20320 202 00 0 1 120 10 6 667 200 200 3 xE X x x dx x( ) ( ) .= µ = − = = −∫ La afirmación del administrador es exagerada, pues se espera una pérdida de 6 667. millones de soles. 3.2 Varianza 3.2.1 Definición Sea X una variable aleatoria con función de probabilidad p(x) o f x( ) y esperanza matemática E(X) o x .µ Se define a la varianza por: 2 2 2 i i xi X x x p x X f x dx X R x V X ( ) Si es discreta ( ) , Si es continua ( ) , ( ) ( ) ∀ ∞ − ∞ ∑ −µ ∈ − µ∫ = s = 3.2.2 Propiedades i. La varianza de una constante es cero, es decir: V(C) = 0. ii. 0V X( ) .≥ iii. 2 0V CX C V X C( ) ( ); .= ≠ iv. V X V X V( )) ;( ) (± = +Y Y (si X e Y son variables aleatorias independientes) v. 2 2V X E X E X( ) ( ) – [ ( )] ,= donde 2 2 2 X iixi R x p x X x f x dx X E x ( ) es discreta ( ) , Si es continua , Si ( ) ∀ ∞ − ∞ ∈ ∑ ∫ = Nota. En la práctica, se utiliza esta propiedad para calcular la varianza de una variable aleatoria. Ejemplo 17 Un concesionario compra 5 motos de alta cilindrada a un precio al por mayor de 2.5 miles de soles cada moto, y las vende a 4.0 miles de soles. Después de Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios176 un trimestre, debido al lanzamiento de otros modelos, las motos que no se vendieron se devuelven al distribuidor recibiendo de éste las 4/5 partes del precio de compra. Si la distribución de probabilidad de la variable aleatoria X= número de motos que no se vendieron en el trimestre es: x 0 1 2 3 4 5 Total P(X = x) 1 15 2 15 2 15 3 15 4 15 3 15 1 a. Hallar la probabilidad de que se vendan menos de 3 motos. Solución X: número de motos que no se vendieron en el trimestre. Se define la variable: :Y número de motos vendidas en el trimestre, entonces: 5 X–=Y Luego: 3 5 3 2 10 15 2 3 0 667P P X P X / /( ) ( – ) ( ) .< = < = > = = =Y b. Calcule la ganancia trimestral esperada y la desviación estándar del número de motos vendidas. Solución Se calcula primero la esperanza y varianza de las motos que no se vendie- ron en el trimestre: 3 0667E X( ) . ;= 2 3289V X( ) .= = 1.526.X⇒ s Ganancia esperada: Se define la variable G: ganancia del concesionario, entonces: 44 2 5 5 2 5 2 5 1 5 5 0 5 7 5 25G X X X X X/( – . )( – ) . ) –(( )( . . ( ) – . –) .= + = − = Luego: 7 5 2 7 5 2 3 0667 1 367E G E X E G( ) . – ( ) . – ( . ) ( ) .= = ⇒ = miles de soles. 27 5 2 2 4 2 3289 9 3155 3 052GV G V X V X( ) ( . – ) ( ) ( . ) . .= = = = ⇒ s = miles de soles. c. ¿Cuál es la probabilidad de que la ganancia trimestral sea de, al menos, 3500 de soles? Solución 53 5 7 5 2 3 5 2 0 333 15 P G P X P X( . ) ( . . ) ( ) .≥ = − ≥ = ≤ = = Ejemplo 18 El pago, en miles de soles, que debe realizar una aseguradora por gastos mé- dicos ambulatorios de un asegurado a una clínica es una variable aleatoria Capítulo 3. Variable aleatoria 177 con función de densidad de probabilidad: 4 0 3 9 0 x x xf x ( ) , , otro caso ( ) − < <= a. Construya la función de distribución acumulada de X. Solución Basándonos en la definición de la función de distribución se tiene: 2 3 2 3 0 0 1 1 4 24 9 9 2 3 9 27 x x t t x xF x t t dt( ) ( ) . = − = − = − ∫ Luego: 2 3 0 0 2 0 3 9 27 1 3 x x xF x P X x x x , ( ) ( ) , , ≤ = ≤ = − < < ≥ b. El gerente financiero de la aseguradora afirma que los pagos por este con- cepto son muy heterogéneos, puesto que el coeficiente de variación supera el 30 %. Verifique esta afirmación. Solución 33 2 3 0 0 1 1 4 1 44 1 75 9 9 3 4 E X x x dx x x( ) ( ) . = − = − =∫ 33 2 3 4 5 0 0 1 1 14 3 6 9 9 5 E X x x dx x x( ) ( ) . = − = − =∫ 2 0 53753 6 1 75 0 5375 100 41 89 1 75 V X C V .( ) . . . . . % . = − = ⇒ = × = Se verifica la afirmación dada por el gerente financiero. c. Si 81 asegurados son atendidos de manera ambulatoria en la clínica, ¿en cuántos casos se espera que el gasto no sea superior a 1000 soles? Solución Se calcula primero la probabilidad de que un asegurado atendido de ma- nera ambulatoria tenga un gasto que no supere los 1000 soles: 2 32 1 1 51 1 0 1852 9 27 27 P X F( ) ( ) . × ≤ = = − = = Por lo tanto, de 81 asegurados, se espera que en 81 0 1852 15( . ) = de ellos el gasto no supere los 1000 soles. Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios178 4. interpretación De la esperanza MateMática, varianza y coeficiente De variación De una variable aleatoria Los valores de esperanza matemática y la varianza de la variable aleatoria X son las medidas de tendencia central y de dispersión de X, respectivamente. A la E(X) y V(X) generalmente se les conoce como los parámetros de la distribución de pro- babilidades de la variable aleatoria X; por lo tanto, E(X) y V(X) representan los va- lores constantes que caracterizan a la población de los valores de X. Una segunda interpretación es de tipo frecuentista que se aprecia, en el siguiente ejemplo. Ejemplo 19 Tomando como base datos históricos, la distribución de las ventas diarias de paquetes de un producto en una tienda es como sigue: Número de paquetes vendidos (x) 10 11 12 13 14 Total p(x) 0.2 0.4 0.2 0.1 0.1 1.0 Calcule e interprete el número esperado, la varianza y el coeficiente de variación del número de paquetes vendidos. Solución Utilizando las fórmulas definidas anteriormente para su cálculo obtenemos: 2 1 4511 5 133 7 11 5 1 45 100 10 471 11 5 E X V X C V .( ) . ; ( ) . . . ; . . % . = = − = = × = El valor de E(X) = 11.5 se interpreta como sigue: si la tienda registrara las ventas de los paquetes de un gran número de días, el promedio de estos valo- res será un valor cercano a 11.5, es decir, E(X) = 11.5 es un valor de convergen- cia si se registran las ventas de un número muy grande de días, dicho de otro modo, en un grupo de días (muestra) el promedio puede ser mayor, mientras que en otra muestra podrá ser menor, pero en general convergerán hacia 11.5. Aunque E(X) recibe también el nombre de valor esperado, de ninguna ma- nera debe entenderse como el valor esperado de las ventas que ocurren en un día cualquiera. Nótese que esto es imposible desde que las ventas diarias asumen valores diferentes de 11.5. La V(X) = 1.45 no tiene una interpretación directa. En cambio, la desviación estándar igual a 1.204 sí la tiene. El valor de la desviación estándar se puede interpretar como la desviación promedio de los datos con respecto al valor medio (11.5 paquetes). Finalmente, el valor del coeficiente de variación: CV(X) = 10.471 %, indica que las ventas diarias son moderadamente homogéneas. Por lo tanto, se pue- de decir que existe regularidad en las ventas diarias. Capítulo 3. Variable aleatoria 179 Ejemplo 20 Sea X una variable aleatoria que representa el peso de un líquido y su función de densidad de probabilidad está dada por: 0 5 25 5 5 10 25 x x f x x x , ( ) - , < <= < < Nota: f(x) representa una distribución triangular. a. Construirla función de distribución de X. Solución Basándonos en la definición de la función de distribución: 2 0 5 5025 x o xdt xtF x ;( ) = < ≤∫= 2 5 5 1 5 10 5 5 25 25 50 x o x xF x dt dt x tt( ) ;= + = + < ≤∫ ∫ − − 2 5 5 1 5 10 5 5 25 25 50 x o x xF x dt dt x t t( ) ;= + = + < ≤∫ ∫ − − De donde: ( ) ( ) 2 2 50 1 5 0 0 0 5 5 10 50 1 10 x x x x x F x P X x x x , , , , + ≤ < ≤ = ≤ = − < < ≥ b. Al pesar el líquido se comete un error a causa de ciertas inexactitudes en el instrumento de medida. Hallar la probabilidad de que, para cualquier medida en particular, el error sea superior al 1 % respecto al valor verda- dero si el peso correcto es 5. Solución 2 2 50 4 95 5 05 5 051 1 0 9801 50 5 5 0 01 5 4 95 5 05 4 95 1 5 05P X P X P X F F . . . . ( . ( )) ( . ) ( . ) ( . ) ( . ) + − + − = > = < + > = + − = Ejemplo 21 Sea la demanda anual de aceite lubricante (en miles de galones) una variable aleatoria continua X con función de densidad dada por: 1 2 4 2 0 x f x , ( ) , otro caso ≤ ≤ = Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios180 a. ¿Cuál es la probabilidad que la demanda no sobrepase los 2750 galones? Solución 2 752 75 2 2 1 0 375 2 2 2 75 dx xP X .. . .( . ) =∫ ≤ = = b. Calcule la demanda esperada y la desviación estándar Solución Usando la definición se tiene: 424 2 2 1 3 2 4 x dx xE X( ) ∫ = = µ = = y 2 2 43 2 2 1 2 6 9 333 o x dx xE X( ) .∫ = = = 22 9 333 3 0 3333 0 5773V X( ) . . .= s = − = ⇒ s = c. Hallar: x x x xP X( )µ ≤ µs + s− ≤ Solución Reemplazando los valores de la media y la desviación estándar se tiene: 3 57723 5772 2 4227 2 4227 1 0 57725 2 2 2 4227 3 5772 dx xP X P X .. . . . .( ) ( . . ) = =∫ µ − s ≤ ≤ µ − s = ≤ ≤ = d. Por cada millar de galones vendidos se obtiene una utilidad de 300 dó- lares, mientras que cada millar no vendido produce una pérdida de 100 dólares. Un fabricante decide producir este tipo de aceite para todo un año, ¿cuál debe ser la producción óptima que logre maximizar su utilidad esperada? Solución X: demanda anual de aceite lubricante (en miles de galones) y tiene por función de densidad de probabilidad: 1 2 4 2 0 x f x( ) otro caso ≤ ≤ = Se define: k = la cantidad a producir en el año (en miles de galones) La variable aleatoria: U = Utilidad del fabricante La utilidad depende de la cantidad vendida, de acuerdo a la demanda, y se define como: 300 100 300 x k x x k U x k x k ( ) , ( ) , − − ≤ = > , de donde: Capítulo 3. Variable aleatoria 181 ( ) 400 100 300 x k x k U x k x k − ≤ = > El valor de k que maximiza la utilidad esperada se obtiene de: 0 d E U x dk ( [ ( )]) = Se halla primero la esperanza de la utilidad, en efecto: 4 2 1 1 400 100 300 2 2 k Rx k E U u x f x dx x k dx k dx( ) ( ) ( ) ( ) ∀∈ = = − + =∫ ∫ ∫ 42 2 2 100 50 150 100 700 400 k k x kx kx k k − + = − + − = Por lo tanto: 2100 700 400E U k k( ) = − + − Ahora: 2100 700 400 0 0 d E U x d k k dk dk ( [ ( )]) ( ; )− + − = ⇒ = de donde: 200 700 0 3 5k k .− + = ⇒ = Por lo tanto, deberían producirse 3500 galones para maximizar la uti- lidad esperada. 1. probleMas resueltos 1. Identifique las siguientes variables como discretas o continuas: a. El valor estimado (en dólares) de un departamento para vivienda. b. El número de practicantes en los estudios contables. c. El tiempo que se necesita para realizar un trabajo de auditoría. d. El número de clientes que entran a un restaurante en un día. e. La vida útil de una computadora. Solución a. Continua b. Discreta c. Continua d. Discreta e. Continua 2. Determine el valor de la constante c de modo que cada una de las siguientes funciones represente una función de probabilidad de una variable aleatoria discreta X. a. 2 4p x c x ( () )= + , para 0 2 3x , , .= Solución Para hallar el valor de la constante c se usa la segunda condición de la definición, es decir: Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios182 3 1 11 0 4 8 13 1 25i p x c c c ci( ) . de donde := = ⇒ + + = =∑ y la función de probabilidad es: X 0 2 3 Total P(x) 0.16 0.32 0.52 1 Nota. Se usó la definición de la función: 2 2 2 0 0 0 4 4 2 22 3 4 8 3 3 4 13 = = = + = = = = + = = = = + = p P X c c p P X c c p P X c c ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) b. 3 4 0 1 2 4 P x c x x x ( ) ; para , , = = − Solución Usando la segunda condición de la definición se tiene: 3 1 11 0 12 18 1 31x p x c c c c( ) . de donde : = = ⇒ + + = =∑ y la función de pro- babilidad es: X 0 1 2 Total P(x) 0.0323 0.3871 0.5806 1 Nota. Se usó la definición de la función: 3 4 0 0 4 P c c ( ) ; = = 3 4 1 12 1 3 P c c ( ) ; = = 3 4 2 18 2 2 = = P c c ( ) 3. Una caja contiene 7 fichas, de las cuales 3 son rojas y 4 son azules. Se selec- cionan al azar y sin reemplazo 2 fichas. Si las fichas son del mismo color se obtiene una utilidad de $ 2, en caso contrario, se pierde $ 1. a. Construir la función de probabilidad de la variable aleatoria X: Ganan- cia en el juego Solución La variable es X: ganancia en el juego y los valores que toma son –1 y 2. 3 2 4 3 32 1 2 1 2 7 6 7 6 7 3 41 1 7 7 P X P R R P A A P X ( ) ( ) ( ) ( ) = = + = × + × = =− = − = Capítulo 3. Variable aleatoria 183 La función de probabilidad de X es: X –1 2 Total P(X = x) 4/7 3/7 1 b. ¿Cuál es la ganancia esperada? Solución 4 3 2( ) 1 2 7 7 7 = − + = E X 4. Un embarque de 8 computadoras contiene 3 defectuosas. Aleatoriamente, 4 de estas computadoras son colocadas en una oficina. Si X es el número de computadoras defectuosas que se coloca en la oficina: a. Construya la función de probabilidad de X. Solución Como se define X: número de computadoras defectuosas colocadas; los valores que toma son: 0, 1, 2 y 3. Se determina el número de casos posibles: 8 70 4 n( ) Ω = = Luego, se calcula la probabilidad para cada valor que toma X: 0 3 5 0 4 5 70 70 P x( ) ; = = = 1 3 5 1 3 30 70 70 P x( ) = = = 3 5 2 2 302 70 70 P x( ) ; = = = 3 5 3 1 53 70 70 P x( ) = = = Por lo tanto, la función de probabilidad de X es: x 0 1 2 3 Total P(X = x) 5/70 30/70 30/70 5/70 1 b. Hallar la probabilidad de que se haya colocado una computadora defec- tuosa sabiendo que se colocó a lo más una con defectos. Solución 1 30 70 61 1 1 35 70 7 P X P X X P X ( ) /( / ) ( ) / = = ≤ = = = ≤ Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios184 c. El tiempo T que toma realizar un trabajo es una variable que viene expre- sada por 8 0 5T X. ,= + calcular la desviación estándar de la variable T Solución Primero, se calcula las características de la variable aleatoria X: 2 105 70 1 5 195 70 2 7857 0 5357 E X E X = V X ( ) ( ) ( ) / . / . . = = = = Luego: 2 28 0 5 0 5 0 5 0 5357 0 1339V T V X V X( ) .( ) ( ). ( ) . . .= + = = = La desviación estándar de T es: 0.3659 5. Para la señalización de emergencia de un hospital se ha instalado dos in- dicadores que funcionan independientemente. La probabilidad de que el indicador A se accione durante la avería es de 0.90, mientras que para el indicador B, la probabilidad es de 0.88. a. Determinar la probabilidad de que durante una avería se accione solo un indicador. Solución P(Acciona sólo un indicador) = 0 90 0 12 0 10 0 88 0 196P A B P A B ( ) ( ) . . . . .+ = × + × = b. Si se sabe que duranteuna avería no se accionó el indicador A, ¿cuál es la probabilidad de que tampoco se haya accionado el indicador B? Solución Nos piden: 0 12B A P B( / ) ( ) . ,= = debido a que los eventos son inde- pendientes. c. Un experto en seguridad afirma que cuando un indicador no se acciona es porque está fallado y por lo tanto el costo de su reparación es de $ 85. Si C denota el costo de reparación cuando se han instalado los dos indi- cadores, halle el costo esperado. Solución Sea :Y el número de indicadores defectuosos Los valores que toma 0 1 2 ,{ },=Y 0 0 90 0 88 0 792P P A B( ) ( ) . . .= = = × =Y 1 0 196P P A B P A B( ) ( ) ( ) .= = + = Y 2 0 10 0 12 0 012P P A B( ) ( ) . . .= = = × =Y Capítulo 3. Variable aleatoria 185 La función de probabilidad de Y es: Y 0 1 2 P(Y = y) 0.792 0.196 0.012 Como se define C: Costo de reparación cuando se han instalado los dos indicadores, Entonces: 85C = Y y aplicando propiedades de valor esperado: 85 85 0 22 18 7E C E( ) ( ) ( . ) .= = =Y dólares 6. El gerente de COMPUDATA indica que el número de computadoras portá- tiles (notebooks) que vende por día es una variable aleatoria X con función de distribución acumulada dada por: 0 2 0 05 2 3 0 20 3 4 0 48 4 5 0 72 5 6 0 92 6 7 1 7 x x x F x x x x x , . , . , ( ) . , . , . , , < ≤ < ≤ < = ≤ < ≤ < ≤ < ≥ a. Construya la función de cuantía (probabilidad) de X. Solución Usando que: 1P X x F x F x( ) () – ,)( = = se tiene: x 2 3 4 5 6 7 Total p(x) 0.05 0.15 0.28 0.24 0.20 0.08 1 b. Si en un día vende más de 2 notebooks, ¿cuál es la probabilidad de que venda menos de 7? Solución 3 6 0 877 2 0 9157 2 0 95 P X P X X P X ( ) .( / ) . ( ) . ≤ ≤ < > = = = > c. Si por cada notebook vendida, COMPUDATA gana 300 soles, hallar el valor esperado y la desviación estándar de la ganancia. Solución Se define la variable, G = ganancia de la empresa; entonces: 300G X= 24 63 23 15E X E X( ) . , ( ) .= = 223 15 4 63 1 7131V X( ) . . . ,( )= − = 1 3088 .s = Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios186 Luego: 300 300 4 63 1389E G E X (( ) ) )( .= = = 300 1 3088 392 64( . ) .s = =Y d. Si se observan las ventas de 3 días considerándolas como eventos inde- pendientes, hallar la probabilidad de que en sólo uno de ellos se haya vendido menos de 4 notebooks. Solución Se define los eventos Ai = {en el día i se vendieron menos de 4 notebook}, 0 20P Ai ) . .( = B = {solo en un día se vendieron menos de 4 notebook} Nos piden: 23 3 0 20 0 80 0 384P B P A A Ai i i( ) ( ) ( . )( . ) .= = = 7. Una fábrica tiene dos líneas de producción que trabajan en forma inde- pendiente. Según estudios realizados, la probabilidad de que, en un día, la línea de producción 1 tenga problemas en su funcionamiento es de 0.1; mientras que, para la línea de producción 2, la probabilidad correspon- diente es de 0.05. a. Si se selecciona al azar un día, construya la función de probabilidad y la función de distribución de la variable aleatoria X: Número de líneas de producción que tuvieron problemas en su funcionamiento en dicho día. Solución Como la variable aleatoria se define por: X = Número de líneas de producción que tuvieron problemas en su fun- cionamiento en dicho día; entonces, los valores que toma la variable X son: 0, 1 y 2. Se conoce que: 1 20 10 0 05P F P F. , ( )( ) .= = , entonces: 1 20 0 9 0 95 0 855P X P F F( ) ( ) . . .= = = × = 1 2 1 21 0 1 0 95 0 9 0 05 0 14P X P F F P F F( ) ( ) ( ) . . . . .= = + = × + × = 1 22 0 1 0 05 0 005P X P F F( ) ( ) . . .= = = × = Por lo tanto, la función de probabilidad es: x 0 1 2 Total p(x) 0.855 0.14 0.005 1.00 La función de distribución es: 0 0 0 0 855 0 1 0 995 1 2 1 0 2 x x F x x x . . ( ) . . < ≤ <= ≤ < ≥ Capítulo 3. Variable aleatoria 187 b. Suponga que la pérdida económica, en un día, por problemas en las líneas de producción (en miles de soles), está definida por 5 2X= +Y . Determine los valores de la media y el coeficiente de variación de la dis- tribución de Y. Interprete sus resultados. Solución Se calcula primero, la esperanza y varianza de X. 0 0 855 1 0 14 2 0 005 0 15E X( ) . . . .= × + × + × = 2 2 2 20 0 855 1 0 14 2 0 005 0 16E X( . .) . .= × + × + × = 20 16 0 15 0 1375V X( ) . . . .= − = Luego, como 5 2X ;= +Y entonces: 5 2 5 0 15 2 2 75E E X( ) [ . .]= + = × + =Y 2 25 5 0 1375 3 4375 1 854V V X( ) [ ] . . ; .= = × = s =YY Luego: 1 854 100 67 418 2 75 C V . . ( ) . % . = × =Y 8. Computadoras América S. A. es una empresa importadora de laptops de última generación. Para su campaña universitaria, compra 5 laptops al pre- cio unitario de 1200 dólares y las vende a 1700 dólares la unidad. Después de 1 mes de exposición, las laptops que no se hayan vendido tienen que ser retiradas del mercado y devueltas al distribuidor, quien entrega a Compu- tadoras América S.A. una cantidad igual a 80 % del precio unitario al que se le vendió. Se ha demostrado mediante una investigación de mercado que la tabla de la función de probabilidad de X: número de laptops vendidas es la siguiente: X 0 1 2 3 4 5 P(X = x) 0.05 0.15 0.05 0.20 0.30 0.25 Calcular e interpretar el valor esperado y el coeficiente de variabilidad para la utilidad neta de la empresa por la venta de las laptops. Solución Se define la variable Y = utilidad por la venta, entonces: 500 240 5 740 1200X X X( )= − − ⇒ = −Y Y Se calcula primero la esperanza y varianza de X. En efecto: 0 0 05 1 0 15 5 0 25 3 3E X( ) . . (...) . .= × + × + + × = 2 13 2E X( ) .= 213 2 3 3 2 31V X( ) . . . .= − = Luego: 740 1200 740 3 3 1200 1242E E X( ) ( ) – . –= = × =Y dólares 2740 1200 740 2 31 1 264 956 1124 7V V X ( ) ( ) . .= − = × = s =Y Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios188 Por lo tanto: 1124 7 100 90 56 1242 C V . . ( ) . %= × =Y 9. Una persona desea invertir en una de dos carteras de inversión: A o B. Ella estima que las probabilidades y los rendimientos monetarios para un año de cada cartera, considerando las condiciones económicas del país, serían como se muestran en las siguientes tablas. Condición económica Cartera A Cartera B Rendimiento monetario Probabilidad Rendimiento monetario Probabilidad Recesión –300 0.2 –500 0.1 Estabilidad 500 0.3 400 0.4 Crecimiento moderado 1000 0.4 1200 0.3 Auge repentino 2000 0.1 2800 0.2 a. ¿En cuál de las dos carteras esperaría un mejor rendimiento monetario? Solución Se debe calcular el valor esperado en caso. En efecto: E(Rendimiento A) = 690 E(Rendimiento B) = 1030 En la cartera B se espera mejor rendimiento. b. En términos relativos, ¿cuál de las dos carteras ofrece rendimientos más heterogéneos? Solución Se debe calcular el coeficiente de variación para cada cartera. En efecto: V(rendimiento A) = 2As = 416 900 V(rendimiento B) = 2Bs = 1 028 100 As = 645.678, CV (A) = 93.57 % Bs = 1013.952, CV (B) = 98.44 % La cartera B tiene rendimientos más heterogéneos. c. Si esta persona decidiera invertir en las dos carteras, considerando inde- pendientes los rendimientos monetarios de cada una de ellas, hallar la probabilidad de que en al menos una de ellas el rendimiento monetario sea negativo. Solución Usando el criterio del evento complementario se tiene: Capítulo 3. Variable aleatoria 189 P(al menos una tenga un rendimiento es negativo) = 1 – P (ninguna ten- ga un rendimiento negativo) 1 1 1 0 8 0 9 0 28P A B P A B P A P B( ) ( ) ( ) ( ) . . .= − = − × = − × = 10. Un inversionista tiene la posibilidad de colocar sus activos en dos títulos financieros distintos. Si compra acciones de “A”, la ganancia será de US$ 420 o la pérdida de US$ 110, en el lapso de una semana. Si compra acciones de “B”, la ganancia será de US$ 650 o la pérdida de US$ 300, en el lapso de una semana. Si existe la misma posibilidad de obtener ganancia para ambas acciones, ¿cuál debería ser el valor de probabilidadpara que el inversionista se en- cuentre indiferente entre una u otra acción? Solución Sea p = P(obtener ganancias), entonces la probabilidad de obtener ganancias en ambos tipos de acciones es p. Sea X: Ganancia por la inversión, la distri- bución de probabilidades es: Acciones A Acciones B x p(x) x × p(x) x p(x) x × p(x) –110 1 – p –110(1 – p) –300 1 – p –300(1 – p) 420 P 420p 650 p 650p Total 1 –110 + 530p Total 1 –300 + 950p Para que el inversionista encuentre indiferente invertir en cualquiera de las dos acciones su ganancia esperada deber ser la misma, por lo tanto: A BE X E X) ( )( = ; entonces: –110 + 530p = –300 + 950p, de donde: P = 0.4524 11. El señor Arias quiere asegurar su casa por US$ 80 000. La compañía de se- guros estima en 0.004 la probabilidad de que ocurra una pérdida total; en 0.01 la de que sufra una pérdida de US$ 40 000 y en 0.03 de que la pérdida sea del US$ 20 000. Si la aseguradora no pagará indemnización por otras pérdidas parciales; ¿cuál sería la ganancia esperada de la compañía en pó- lizas de este tipo si el cliente paga US$ 1500 por dicha póliza? Solución Se define la variable aleatoria: X: ganancia por póliza (dólares), los valores que toma X y su función de probabilidad son: X –78 500 –38 500 –18 500 1500 p(x) 0.004 0.01 0.03 0.956 Por lo tanto: E(X) = 246 dólares Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios190 12. Los accidentes registrados por una compañía de seguros de automóviles aportan la siguiente información. La probabilidad de que un asegurado tenga un accidente es de 0.15. Si un accidente ocurre, el daño del vehículo representa el 20 % de su valor en el mercado con una probabilidad de 0.80, un 60 % de su valor en el mercado con una probabilidad de 0.12 y representa una pérdida total con probabilidad de 0.08. ¿Cuál tendría que ser el valor de la prima que deberá cobrar la compañía para un automóvil cuyo valor es de 12 000 dólares para que su ganancia esperada sea de 50 dólares? Solución Se define la variable X = ganancia de la compañía por un seguro anual P = prima a cobrar por un seguro Entonces, la distribución de probabilidad de la variable X es: X p(x) x × p(x) P – 12 000 0.012 0.012P – 144 P – 7200 0.018 0.018P – 129.6 P – 2400 0.120 0.12P – 288 P 0.850 0.85P Total 1 P – 561.6 Se debe obtener un valor de P tal que: E(X) = 50, de donde: P – 561.6 = 50, entonces: P = 611.6 La prima a cobrar debe ser de 611.6 dólares. Nota. Para calcular las probabilidades p(x) se usó: P(X = P – 12000) = P(tenga un accidente y una pérdida total) = = P(tenga un accidente)× P(pérdida total/tenga un accidente) = 0.15× 0.08 = 0.012 13. Los impulsos provenientes de una fuente emisora tienen una intensidad (en kg.m2/s) que es considerada una variable aleatoria X cuya función de distribución acumulada es: 4 0 0 0 3 81 1 3 x xF x x x , ( ) , , ≤ = < < ≥ a. Calcular la probabilidad de que la fuente emisora tenga un impulso con intensidad entre 1 y 2 Solución 4 42 1 152 1 0 1851 81 81 1 1 2 8 P x F F( –) ( ) ( ) .− = =< < = = Capítulo 3. Variable aleatoria 191 b. Si se observan 5 de estos impulsos cuyas intensidades se consideran in- dependientes, ¿cuál es la probabilidad de que a lo más uno de ellos tenga una intensidad superior a 2? Solución Se define los eventos: iA = {El impulso i tiene una intensidad superior a 2} B = {A lo más un impulso tiene una intensidad superior a 2} 2 1 1 0 19752 0 19750 8025i iPP A P X AF( ) ( ) ( ) ( ) .. . .= > = − = − = = Nos piden: 5 4 5 0 1975 5 0 8025 0 1975 0 006405 i i i i i i i i i iP B P A A A A A P A A A A A( ) ( ) ( ) ( . ) ( . )( . ) . = + = = + = c. ¿Cuál es la desviación estándar de la intensidad de un impulso? Solución Primero se halla la función de densidad de probabilidad: 34 4 0 3 81 81 xd xf x x dx ( ) ; . = = < < Entonces, 3533 0 0 44 2 4 81 405 xxE X x dx( ) .= × = =∫ 3633 2 2 0 0 44 6 81 486 xxE X x dx( ) = × = =∫ 26 2 4 0 24V X( ) . ) ;( .= − = luego: 0 4898. .s = 14. En un laboratorio de pruebas, el error al medir la temperatura (en oC) es una variable aleatoria X con función de densidad de probabilidad: 2 1 2f x kx x( ) = − < ≤ a. Halle el valor de k y construya la función de distribución acumulada de X. Solución Usando la segunda condición de la definición para hallar k se tiene: 232 2 1 1 11 1 3 3 xk x dx k k, , − − = ⇒ = ⇒ =∫ Basándonos en la definición de la función de distribución tenemos: 33 2 1 1 11 3 9 3 x x xtF x t dt( ) , − − + = = =∫ luego: Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios192 3 1 0 1 1 2 9 1 2 x x F x x x , , - ( ) , + ≤ = < < ≥ b. Si se hacen 50 mediciones independientes de la temperatura, ¿en cuán- tas de ellas se espera un error de medición no mayor a 1.25? Solución Se calcula primero la probabilidad de que una medición tenga un error de medición no mayor a 1 25. ; 1 25 0 3281p P x( . ) . .= ≤ = Por lo tanto, de las 50 mediciones, se espera que en 50 0 3281 16.( ) ≈ de ellas tenga un error de medición no mayor a 1.25 15. El recorrido (en kilómetros) que los automovilistas logran con cierto tipo de neumáticos es una variable aleatoria con función de distribución acumula- da dada por: 20000 01 x xF x P X x e /- ;( ) ( ) >= ≤ = − a. ¿Qué porcentaje de neumáticos duran más de 10 000 kilómetros? Solución 0 510 000 1 10 000 0 6065P X F e .( ) – ( ) .−> = = = b. En términos del enunciado, ¿cómo interpreta el valor del primer cuartil? Solución 0 25P X a F a( ) ( ) . ,≤ = = donde 1a Q= Usando la función de distribución: 20000 11 0 25 5754 −= − = ⇒ = =aF a e a Q/( ) . km Hay un 25% de neumáticos (los de menor duración) con un recorrido inferior a 5754 km. c. El costo unitario de producción es de 50 dólares, pero si con el neumáti- co se logra recorrer menos de 1500 kilómetros el costo es de 80 dólares. Halle el costo unitario esperado. Solución Se define la variable: =Y costo unitario (US$) Y Condición Probabilidad 50 X ≥ 1500 0.92774 80 X < 1500 0.07226 Luego, 52 1678E( ) .=Y dólares Capítulo 3. Variable aleatoria 193 16. En un estudio realizado sobre el tiempo de duración (en años) de ciertos equipos, se determinó que el tiempo de vida de estos equipos es una varia- ble aleatoria X que tiene una función de densidad de probabilidad dada por: 2 , 0 7 ( ) 49 0, en otro caso x x f x ≤ ≤= a. Si de estos equipos se elige al azar a 4 de ellos, hallar la probabilidad de que dos de los equipos elegidos tengan un tiempo de vida de entre 5 y 5.9 años. Solución Se define los eventos: Ai = {El equipo i tiene una vida entre 5 y 5.9 años} B = {Dos de los equipos tienen una vida entre 5 y 5.9 años} P(Ai) = P(5 < X < 5.9) = 5 925 9 5 5 2 0 2002 49 49 x xdx . . . ;= =∫ 0 7998P A i( ) . .= Nos piden: 2 26 6 0 2002 0 7998 0 23952i ii iP B P A A A A( ) ( ) ( . ) ( . ) .= = = b. Si se elige al azar un equipo, del cual se conoce que tiene un tiempo de duración superior a 2.8 años, ¿cuál es la probabilidad de que su tiempo de duración no supere los 5 años? Solución 2 8 5 0 63905 0 75952 8 2 8 0 8413 P XXP X P X ( . ) . .. ( . ) . < ≤ ≤ = = = > > 17. La empresa INNOVA LIGHT S. A. fabrica bombillas LED y acaba de recibir un pedido con 320 semiconductores. Un semiconductor es adecuado si su longitud es superior a 1 mm. Si esta longitud es inferior, se desecha. Sabien- do, además, que la longitud del semiconductor tiene un comportamiento aleatorio cuya función de densidad de probabilidad es: 0 4 8 0 x x f x , ( ) , otro caso < ≤= a. Determine el número de semiconductores correctos que se espera tenga el pedido Solución Se calcula la probabilidad de que un semiconductor sea correcto: 4 4 1 1 2 1 0 9375 8 16 x xP X dx( ) .> = = =∫ Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios194Por lo tanto, el número de semiconductores correctos que se espera tenga el pedido es: 320 0 9375 300( . ) .= b. ¿Cuál es la longitud mínima del 20 % de semiconductores considerados los de mayor longitud? Solución Se debe hallar un valor a tal que: 424 0 2 0 2 0 2 3 2 8 16a a x xP X a dx a( ) . , . . .> = ⇒ = ⇒ = ⇒ =∫ Por lo tanto, la longitud mínima del 20 % que duran más es de 3.2 mm. 18. Un consultor financiero cobra mensualmente honorarios fijos de 100 dóla- res más una comisión del 5 % sobre el beneficio que su empresa obtiene por las gestiones de consultoría que realiza. El beneficio que la empresa recibe mensualmente (en miles de dólares) es una variable aleatoria X con función de probabilidad: 2 2 3 4 3 4 0 x x f x x x ( ) otro caso − < ≤ = − < ≤ a. ¿Cuál es el ingreso esperado del consultor? Solución Se define la variable, Y = Ingreso del consultor, entonces: 100 0 05X.= +Y 3 43 33 4 3 42 2 2 32 3 2 3 2 4 2 3 3 3 x xE X x x dx x x dx x x( ) ( ) ( ) .= − + − = − + − =∫ ∫ 100 0 05 3000 250E( ) . ( )= + =Y dólares. b. Hallar la probabilidad de que el consultor obtenga un ingreso inferior a 240 dólares. Solución 2 8 2 240 100 0 05 240 2 8 2 0 32P P X P X x dx . ( ) ( . ) ( . ) ( ) .< = + < = < = − =∫Y Capítulo 3. Variable aleatoria 195 19. Los gastos médicos anuales (en miles de dólares) en que incurren los em- pleados de una empresa son una variable aleatoria X con función de densi- dad de probabilidad: 4 0 3 9 0 x x x f x ( ) ( ) otro caso < <= a. Construya la función de distribución de X. Solución Usando la definición de la función de distribución se tiene: 2 3 0 0 0 24 9 9 27 x x x t t tF x t dt( ) ( ) ,= − = −∫ luego: 2 3 0 0 2 0 3 9 27 1 3 x x xF x x x , ( ) , , ≤ = − < < ≥ b. Si la compañía de seguros cubre los gastos hasta un máximo de 1000 dólares, ¿cuál es la probabilidad de que el seguro cubra estos gastos? Solución 1 1 0 1852P X F( ) ( ) .≤ = = c. Determine el porcentaje de empleados cuyos gastos médicos superan al promedio en más de 500 dólares. Solución Se calcula primero el valor esperado de X, en efecto: 3 0 4 1 75 9 xE x x x dx( ) ( ) . = − =∫ Luego, 1 75 0 5 2 25 1 2 25 1 0 7032 0 2968P X P X F( . . ) ( . ) – ( . ) – . . .> + = > = = = Por lo tanto, el porcentaje de empleados cuyos gastos médicos supe- ran al promedio en más de 500 dólares es del 29.68%. 20. El retraso o adelanto (en minutos) de un vuelo de Lima a Trujillo es una variable aleatoria cuya función de densidad de probabilidad se encuentra dada por: 1 2 36 6 6 288 0 xxf x ( ) ( ) otro caso − − < <= Donde los valores negativos son indicativos de que el vuelo llega adelan- tado y los valores positivos señalan que el vuelo llega retrasado. Determine: Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios196 a. La probabilidad de que uno de los vuelos llegará cuando menos dos minutos antes. Solución 00 30 2 2 2 2 1 362 0 36 0 259 288 288 864 x xP X x dx( ) ( ) . − − − ≤ ≤ = − = − =∫ b. La probabilidad de que uno de los vuelos llegará entre uno y tres minu- tos retrasado, dado que se sabe llegó retrasado. Solución 0 4398 3 1 2 36 288 0 21991 6 0 50001 2 36 2880 1 31 3 00 dxx dxx P XXP P XX . ( ) . . ( ) ( ) ( ) = = = −∫ −∫ ≤ ≤≤ ≤ = >> c. Suponga que por cada vuelo que llega retrasado, se multa a la aerolínea con US$ 150, ¿cuál es la probabilidad de que en 5 vuelos que realice el avión, la multa sea de US$ 300? Solución Se define los eventos: Ai = {El vuelo i llega retrasado} B = {La multa por retrasos es de US$ 300} 6 2 0 10 36 0 5 0 5 288i i P x x dP A x P A( ) ( ) . .( )) (> = − = =∫= Nos piden: 2 310 10 0 5 0 5 0 3125i i i i iP B P A A A A A( ) ( ) ( . ) ( . ) .= = = 21. Los pesos de un artículo (kg) se consideran una variable aleatoria con fun- ción de densidad: 23 0 2 20 2 4 10 0 x x xf x x( ) en otro caso < < = ≤ < a. Construir la función de distribución de X Solución Basándonos en la definición de la función de distribución: Capítulo 3. Variable aleatoria 197 2 3 0 3 1 2 20 20 x t xF x dt x( ) ;= = < <∫ 2 1 2 22 1 2 4 5 3 20 10 20 x xF x dt dt x tt( ) ;= + = ≤ <∫ ∫ + De donde: 3 2 0 0 0 2 20 1 2 4 20 5 1 4 x x x F x P X x x x x , , ( ) ( ) , , ≤ ≤ < = ≤ = + ≤ < ≥ b. Hallar 3 1P X X( / )< > Solución 1 3 0 603 0 63161 1 0 95 P XXP X P X ( ) . . ( ) . < < < = = = > > c. Hallar e interpretar: x x CV X, , ( ).µ s Solución 2 2 2 43 20 10 2 467 o x dx xx xE X dx( ) .+∫ ∫= = 2 2 2 2 42 23 20 10 6 96 o x dx xx xE X dx( ) .+∫ ∫= = 2 0 87296 96 2 467 0 8739 100 37 89 2 467 V X C V .( ) . . . . . % . = − = → = × = Los pesos de los artículos presentan una alta variabilidad. d. Si el costo por artículo es 4 3C X= + soles, hallar C C, .µ s Solución 4 3 4 3 4 2 467 3 12 904C X E XE ( ) .( .)+ = + = × + =µ = 24 3 4 16 0 8729V C V X V X( ) ( ) ( ) . ;= + = = × por la tanto: 3 7393C . .s = e. Si la utilidad neta por artículo (en soles) es una función tal que: 1 0 1 4 1 3 2 3 4 0 x x g x x , si , si ( ) , si , en otro caso − < < ≤ ≤= = − < < Y Halle e interprete los valores de µY y CV ( ).Y Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios198 Solución La distribución de probabilidad de Y es: y p(y) y × p(y) y2 × p(y) –2 0.35 –0.70 1.40 –1 0.05 –0.05 0.05 4 0.60 2.40 6.40 Total 1.00 1.65 7.85 Por lo tanto: 1 65.µ =Y 2 5 12757 85 1 65 5 1275 100 137 24 1 65 V C V .( ) . . . . . % . = − = → = × =Y Nota. En este caso el valor del coeficiente de variación es superior al 100 %. Esto se debe a que los valores de la variable aleatoria Y son nega- tivos y positivos. 22. La cantidad de harina (en toneladas) que se utiliza diariamente en una panadería es una variable aleatoria X con función de densidad de la forma: 0 250 25 0 0 xe x f x .. ( ) otro caso − ≥= a. ¿En qué porcentaje de días la cantidad utilizada no sobrepasa las tres toneladas? Solución Hay que calcular la probabilidad de que la cantidad de harina utilizada no sea mayor de 3 toneladas: 3 3 0 75 00 25 0 25 0 3 0 25 0 5276 o x xP X e dx e e e.. .( ) . . .− −− −−∫ ≤ = = = = − + El porcentaje de días en los cuales la cantidad de harina que se utiliza no sobrepasa las tres toneladas es del 52 76. %. b. ¿Qué cantidad se debe tener en stock para cubrir la demanda con una probabilidad de 0,9? Solución Hay que hallar un valor k tal que: 0 9P X k( ) . ;≤ = entonces: 0 25 00 25 0 25 0 0 9 0 25 0 9 0 1 9 21034 9 21034 0 25 o k k kx xe eP X k dx e e K k .. .( ) . , . . ln( . ) . . De donde . . − −− −= −∫ ≤ = ⇒ = ⇒ = = = − = − + Capítulo 3. Variable aleatoria 199 1. probleMas propuestos 1. Identifique las siguientes variables como discretas o continuas: a. El número de pacientes que llegan en un día a un hospital. b. La estatura de una persona. c. El contenido de glucosa de una solución. d. El porcentaje de hierro de un material. e. El tiempo de duración de una bombilla de luz. 2. Suponga que un experimento ( )ε consiste en lanzar un tetraedro que tiene las caras marcadas por las letras A, B, C y D, hasta que aparezca en la cara superior la cara C. a. Determine el espacio muestral. b. Sea la variable aleatoria X: número de lanzamientos necesarios para que aparezca la cara C en la parte superior. Determine el rango (valores) de X. 3. Un comerciante tiene 20 unidades de cierto artículo, de los cuales 14 están aptos para su venta y otros 6, no. Al llegar un cliente para comprar cuatro de tales artículos el comerciante escoge al azar sin reposición 5 de los 20 artículos, se define, entonces la variable aleatoria X: número de artículos buenos escogidos. Determine la función de probabilidad de X. 4. Setiene 3 depósitos: en el depósito 1, todos los artículos son de la marca A; en depósito 2, de 500 artículos, 300 son de la marca A y el resto de la marca B; y en el depósito 3 hay la misma proporción de artículos de cada una de las dos marcas. Para inspección, se escoge al azar un artículo de cada depósito. Se define la variable X: número de artículos de la marca A escogidos. Construir la función de probabilidad de X. 5. Para integrar un proyecto se requiere de los servicios de 2 administradores y 3 ingenieros. En la revisión de expedientes presentados por 5 administra- dores y 7 ingenieros, se comprobó que todos ellos tienen la misma capaci- dad profesional para formar parte del proyecto por lo que la elección de los integrantes se hará al azar. El hermano de uno de los ingenieros es admi- nistrador. Sea X la variable que indica el número de hermanos elegidos para integrar el proyecto. Construir la función de probabilidad de X. 6. Se sabe que un grupo de 5 componentes contiene dos defectuosos. Un inspec- tor prueba los componentes uno por uno hasta encontrar los dos defectuosos. Una vez encontrado el segundo, concluye la prueba. Se defina a X, como el Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios200 número de pruebas necesarias hasta encontrar el segundo defectuoso. Cons- truya la función de probabilidad de X. 7. La probabilidad de que el pedido de un cliente no se despache a tiempo es de 0.10. Un cliente realiza 3 pedidos, que pueden considerarse como even- tos independientes. Si X es el número de pedidos que se envían a tiempo. a. Determine la función de probabilidad de X. b. ¿Cuál es la probabilidad de que todos los pedidos se envíen a tiempo? c. ¿Cuál es la probabilidad de que exactamente uno de ellos no se envíe a tiempo? d. ¿Cuál es la probabilidad de que dos o más pedidos no se envíen a tiempo? 8. Una compañía de seguros ofrece a una persona de 50 años una póliza por un año de US$ 150 000 por una prima anual de US$ 1500. Asuma que el número de muertes en este grupo de edad es de 8 por cada 1000. ¿Cuál es la ganancia esperada para la compañía de seguros con una póliza de estas condiciones? 9. La publicidad de ciertos fondos de inversión de alto riesgo afirma que la probabilidad de doblar la cantidad invertida es de 40 %, la probabilidad de triplicarla es de 10 %, la de perder la mitad es de 35 % mientras que sólo un 15 % de los clientes han perdido todo lo invertido. ¿Cuál es la ganancia esperada si decido invertir 10 000 soles? 10. El gerente financiero de una compañía está considerando dos propuestas de inversión. La propuesta A señala ganancias netas de S/ 20 000, S/ 30 000 y S/ 50 000 con probabilidades respectivas de 0.2, 0.4 y 0.4. En el caso de la propuesta B, el gerente piensa que existe un 50 % de oportunidades de una inversión exitosa, que podría producir ganancias netas de S/ 100 000 y que, si resultara mala, se podría alcanzar el punto de equilibrio, sin ga- nar o perder dinero. Asumiendo que cada propuesta requiere la misma cantidad de inversión, ¿cuál sería preferible, considerando el retorno monetario esperado? 11. La gerencia de una compañía minera debe decidir si continuar una ope- ración en cierto lugar. Si la continúa y tiene éxito ganará S/ 1 000 000 y si fracasa perderá S/ 600 000; si abandona un lugar que les habría dado éxito, esto supondrá una pérdida de S/ 400 000 (por razones competitivas); y si no continúa en un lugar donde de todas maneras hubiese fracasado, esto representa S/ 100 000 para la compañía (debido a que los fondos destinados para la operación permanecen intactos). ¿Qué decisión maximizaría las uti- Capítulo 3. Variable aleatoria 201 lidades esperadas de la compañía, si las probabilidades a favor y en contra del éxito son, respectivamente, 0.40 y 0.60? 12. El señor Arias quiere asegurar su casa por US$ 80 000. La compañía de se- guros estima en 0.004 la probabilidad de que ocurra una pérdida total; en 0.02 la de que sufra una pérdida del 50 %, y en 0.08 que la pérdida sea del 25 %. Si la aseguradora no pagará indemnización por otras pérdidas parcia- les; ¿qué prima debe pagar el señor Arias cada año si la empresa de segu- ros quiere lograr una ganancia promedio de US$ 500 anuales en todas las pólizas de ese tipo? 13. En cierto juego de dados se lanza 4 de ellos, y un jugador apuesta sobre la salida de un número que el elige; gana 1 sol cuando el número aparece en un dado, 2 soles cuando el número aparece en dos dados; 3 soles si sale el número en tres dados; 5 soles si sale el número en los cuatro dados y pierde 1 sol cuando el número no coincide en ninguno de los dados. ¿Le conviene jugar? 14. Un contratista estima las probabilidades del número de días necesarios pa- ra concluir un proyecto como sigue: X 27 28 29 30 31 32 Total P(x) 0.05 0.15 0.25 0.40 0.10 0.05 1.0 El proyecto tiene un costo fijo de US$ 2 000 y debe concluirse en 30 días. Si termina en menos de 30 días habrá un ahorro de US$ 200 por cada día por debajo de 30; pero si se termina en más de 30 días habrá un sobrecosto de US$ 300 por cada día por encima de 30. Calcule el costo esperado del pro- yecto y su desviación estándar. 15. Una caja contiene 4 caramelos de sabor fresa y 6 de sabor naranja. Se ex- traen 3 caramelos sucesivamente con reemplazo. Si se gana US$ 5.0 por cada caramelo de sabor fresa y US$ 3.0 por cada caramelo de sabor naranja extraído ¿cuánto se debería pagar por el derecho de jugar para que el juego sea equitativo? 16. Un anuncio luminoso consta de 100 bombillas iguales. Se sabe que la fun- ción de probabilidad de la variable aleatoria X: número de bombillas que se queman en un día es: 0 1 2 100 5050 xP X x x( ) , , , . . . ,= = = Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios202 a. Determinar la probabilidad de que el número de bombillas inutilizadas en un día se encuentre entre 50 y 75 (ambos inclusive). b. Calcule e interprete el valor esperado de X. 17. El contenido de magnesio de una determinada aleación es una variable aleatoria X dada por la siguiente función de densidad de probabilidad: 0 6 18 0 x xf x( ) otro caso < ≤= a. ¿Cuál es la probabilidad de que una aleación tenga un contenido de magnesio entre 2.2 y 4.8? b. ¿Cuál es el contenido máximo de magnesio que se observará en una aleación con una probabilidad de 0.90? c. Calcular e interpretar la mediana de la variable X. d. La utilidad (en soles) que se obtiene de esta aleación es U = 10 + 2X. Se pide: b.1 Calcular el valor esperado, la desviación estándar y el coeficiente de variación de la variable U. b.2 ¿Cuál es la probabilidad de que la utilidad sea superior a 20 soles? 18. Sondeos de mercado realizados por un fabricante para uno de sus produc- tos indican que la demanda proyectada debe considerarse una variable aleatoria X con valores entre 0 y 25 toneladas. La función de probabilidad de X es. 2 3 3 0 25 25 xf x x( ) = ≤ ≤ a. Construir la función de distribución de X. b. ¿Cuál es la probabilidad de tener una demanda entre 10 y 20 toneladas? c. Hallar la demanda esperada y su variación relativa. 19. La temperatura, en grados centígrados con la que se produce la reacción en un experimento químico es una variable aleatoria con la siguiente función de densidad: 2 1 2 3 xf x x( ) si= − < < a. Construir la función de distribución de X. b. Calcular la probabilidad de que la temperatura sea negativa. c. Calcular e interprete el valor esperado y el coeficiente de variación de X. Capítulo 3. Variable aleatoria 203 20. Para una investigación se ha considerado a todas las pequeñas empresas con capital X inferior a 10 000 dólares. Se supone que X, expresada en miles de dólares es una variable aleatoria con función de densidad: 0 10kf x x x ( ) ;= < ≤ a. Calcular el porcentaje de empresa con capital inferior a 6000 dólares b. Si el capital de una empresa es superior a 3000 dólares, ¿cuál es la proba-bilidad que no sobrepase los 7000 dólares? c. Calcule e intérprete: E(X), xs y el C.V. de X d. ¿Qué porcentaje de empresas tienen capitales superiores a la media? 21. El porcentaje de contaminante presente en una muestra de aire es una va- riable aleatoria con función de densidad dada por: 2 0 1f x a bx x( ) = + < < a. Si E(X) = 3/5. Calcular el valor de a y b para que f sea función de densidad. b. Hallar la probabilidad de que el porcentaje de contaminante en una muestra sea mayor a 0.6. 22. Cierto aparato registra el nivel de saturación de la red eléctrica en una co- marca. El error relativo porcentual de la medida dada por el aparato es una variable aleatoria continua X con función de distribución 0 0 21 1 0 1 1 1 x F x x x x , si ( ) ( ) , si , si ≤ = − − < < ≥ Determinar: a. La función de densidad de probabilidad de la variable X. b. La probabilidad de que una medida tenga un error entre el 0.1 % y el 0.2 %. c. El error relativo esperado. 23. La función de distribución de una variable aleatoria X está dada por: 3 0 4 1 4 4 128 2 1 4 x xF x P X x x x , - ( ) ( ) , , ≤ = ≤ = + − < < ≥ a. Calcular el valor del cuartil superior b. Si se realizan 5 observaciones de X, hallar la probabilidad de que solo una de ellas sea negativa. Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios204 24. Suponiendo que la duración en horas de cierto tipo de componente es una variable aleatoria T, con función de densidad de dada por: 2 200 0 200 c t f t t t , ( ) , >= ≤ Hallar: a. El valor de c y P(t < 400/t > 300) b. Si se instalan 5 focos, ¿cuál es la probabilidad de que después de 300 ho- ras tenga que reemplazarse uno de ellos? 25. El peso de un artículo (en kg) tiene una distribución con función de densidad: 23 1 2 20 13 2 3 50 0 x x f x x x , ( ) , , otro caso < < = ≤ < a. Construir la función de distribución de X. b. Hallar P(X < 2/ X > 1.5). 26. Una empresa que se dedica a la fabricación de cierto componente, ha deter- minado que la vida útil en años del componente es una variable aleatoria con función de densidad: 101 0 10 0 xe xf x / ,( ) , otro caso − >= a. Hallar la función de distribución. b. Si se elige al azar un componente, ¿cuál es la probabilidad de que dure por lo menos 6, pero a lo más 18 años? c. Si se eligen 100 componentes, ¿cuántos de estos componentes se espera que tengan una duración superior a 5 años? 27. El tiempo medido en horas que un telar automático está en funcionamiento antes de que se le acabe el hilo y pare es una variable aleatoria cuya función de densidad de probabilidad es: 1 90 x 120= 30 0 otro caso ≤ ≤ f x ,( ) , Capítulo 3. Variable aleatoria 205 Al poner el telar en funcionamiento, el encargado debe decidir cuándo volverá a inspeccionarlo. Si vuelve antes de que se acabe el hilo incurre en un costo de 3 soles por cada hora que pierde hasta que se pare el telar; sin embargo, si cuando llega ya se ha acabado el hilo, el costo es de 9 soles por cada hora que el telar esté parado. ¿Al cabo de cuántas horas le aconsejarías que volviese a revisar el telar? 28. En una empresa fabricante de artefactos, para cierto modelo, se tiene la si- guiente función de probabilidad, para la cantidad de unidades fabricadas en una semana (X). x 100 120 150 180 200 p(x) 1/10 1/10 2/10 3/10 3/10 Si la utilidad neta semanal (en soles) para el modelo antes mencionado está determinada por: 2850 10X;= −Y determine los valores de la media y el coeficiente de variabilidad de la utilidad neta semanal. ¿Qué nos indican los valores hallados? 29. Se hace un orificio en una lámina de metal y luego se inserta un eje. La di- ferencia entre el radio del orificio y el radio del eje es una variable aleatoria X (en mm) cuya función de probabilidad es 41 0 1f x k x x( ) ( )= − < ≤ a. Hallar el valor de k y luego construir la función de distribución acumulada. b. Calcular que la diferencia este entre 0.3 y 0.6. c. Hallar la diferencia promedio y la desviación estándar. 30. El tiempo (en minutos) que necesita un vendedor para atender a un cliente es una variable aleatoria, T. Su función de distribución acumulada es: 20 01 5 5 15F t t t( ) . ( ) , para= − < < a. ¿Cuál es la probabilidad de que el vendedor requiera más de 10 minutos para atender a un cliente? b. En promedio, ¿cuantos minutos necesita el vendedor para atender a un cliente? c. El vendedor ha estado atendiendo a un cliente durante 10 minutos y aún no ha terminado, ¿cuál es la probabilidad de que termine dentro de los próximos 2 minutos? d. El costo C, de atender a un cliente se encuentra en función al tiempo T como sigue: C = 5 + 0.5T2. ¿Cuál es el costo promedio de atención a un cliente? Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios206 31. Ricardo vende equipos médicos cuyo precio mínimo es de US$ 200 000. Él tiene un salario de US$ 6000 dólares anuales. Si vende 5 o menos de estos equipos en un año, no obtiene comisión (gana sólo US$ 6000). Cuando Ri- cardo vende 6 o más equipos en un año, su ingreso total está dado por la siguiente fórmula: Y = US$ 6000 + US$ 5000(X – 5)2 para X ≥ 6 Donde X es la variable aleatoria que indica el número de equipos que puede vender en un año. Por ejemplo, si Ricardo vende 7 equipos en un año, su ingreso será de US$ 26 000. La distribución de probabilidad de X es: x 3 4 5 6 7 8 P(x) 0.10 0.20 0.30 0.20 0.15 0.05 a. ¿Cuál es la probabilidad que Ricardo tenga un ingreso anual superior a US$ 11 000? b. Halle el valor esperado y la desviación estándar del ingreso anual de Ricardo. 32. La función de probabilidad del tiempo en horas para terminar una tarea es 23 117 2 5f t t t( ) / ,= < < a. Hallar la función de distribución acumulada. b. El costo en dólares C para terminar esta tarea es 50 30C t .= + Hallar P(C < 140). c. Si al término de 4 horas un operario A no es capaz de terminar la tarea, se llama a otro operario B para que la termine. ¿Cuál es la probabilidad de que se tenga que llamar al operario B? d. ¿Cuál es el tiempo promedio que necesita el operario A para ter- minar la tarea? 50 30C t .= + El objetivo de este capítulo es conocer las características de las distribuciones de pro- babilidad de variables aleatorias discretas y continuas; así como aprender a calcular las probabilidades de las más importantes distribuciones de probabilidad de varia- bles aleatorias discretas y continuas. La utilidad de los modelos de probabilidad más empleados radica en que de ellos se puede determinar y evaluar las propieda- des de la distribución de probabilidad de una estadística que se utiliza en la estadís- tica inferencial. Sabes Capacidades adquiridas 9 Identificar una variable aleatoria como discreta o continua. 9 Calcular la esperanza y la varianza de una variable aleatoria y aplicar sus pro- piedades. 9 Calcular las probabilidades asociadas a las variables aleatorias discretas y continuas. Piensas Competencias por lograr 9 Identificar las características para la uti- lización de los modelos de distribución de probabilidad como el binomial, de Poisson, hipergeométrica, el exponen- cial, el normal etc. 9 Calcular probabilidades de las distribu- ciones de probabilidad. 9 Interpretar los valores de probabilidad. 9 Calcular la esperanza matemática y la varianza de una distribución de proba- bilidad. 9 Utilización de software para el cálculo de probabilidades. Haces Habilidades por desarrollar 9 Escoger el modelo probabilístico ade- cuado para resolver un problema real. 9 Aprender a simplificar el tratamiento es- tadístico de fenómenos reales utilizando estas distribuciones de probabilidad. Secciones 1. Distribuciones de probabilidad. 2. Distribuciones de probabilidad dis- creta. 3. Distribuciones continuas. 4. Problemas resueltos. 5. Problemaspropuestos. Conocimientos previos Probabilidades básicas, variables alea- toria discreta y continua, función de probabilidad matemática. Distribuciones de probabilidad Capítulo 4 Capítulo 4. DistribuCiones De probabiliDaD 209 1. Distribuciones De probabiliDaD La importancia de las distribuciones de probabilidad radica principalmente en su aplicabilidad en la ingeniería, en física, etc., así como en el diagnóstico por imágenes y el procesamiento de señales entre otros. Estas distribuciones son de dos tipos: discretas y continuas. 2. Distribuciones De probabiliDaD De variables aleatorias Discretas 2.1 Distribución de Bernoulli Jacob Bernoulli, (Suiza, 1654 1705) fue un matemático de renombre, estudió las pruebas independientes con probabilidades iguales de éxito, perteneció a la primera generación de la familia Bernoulli, quienes realizaron grandes aportes a la teoría de probabilidad. Un experimento de Bernoulli es aquel que tiene dos resultados mutuamente ex- cluyentes que se denotan por éxito y fracaso con probabilidades p y 1q p– ,= respectivamente. Función de probabilidad de Bernoulli Si X es una variable aleatoria con una distribución de Bernoulli; entonces, su distribución de probabilidad está dada por: 11 0 1 0 x xp p x P X x ( ) , , ( ) , otro caso − − == = Donde, 0 1p< < Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios210 Esperanza y varianza de una distribución de Bernoulli 2 1 E X p V X p p ( ) ( ) ( ) = µ = = s = − Gráfica de una distribución de Bernoulli: Características para definir una distribución Bernoulli • El experimento se ejecuta una sola vez • El experimento tiene dos resultados posibles; éxito y fracaso. Ejemplo 1 Se sabe que un software que procesa datos produce un error en el 0.1 % de los procesamientos realizados. Se elige al azar un proceso de datos para compro- bar si no existe error. ¿Cómo se distribuye la variable X?, ¿cuáles son la media y la varianza? Solución 1 0 X si el proceso no tiene error si el proceso tiene error = La función de probabilidad es: 10 999 1 0 999 0 1 0 x x x P X x . ( . ) , , ( ) , en otro caso − − == = Dónde: 0 999 0 999 0 001 0 000999E X V X( ) . y ( ) . ( . ) .= = = 2.2 Distribución binomial La distribución binomial es una de las distribuciones discretas más importantes: se utiliza en producción, control de calidad, en investigación de mercados, etc. Está asociada a un experimento aleatorio de Bernoulli cuyos resultados en cada prueba son dos: éxito y fracaso. Un experimento binomial se puede caracterizar como la extracción de n ele- mentos uno a uno con reposición, de una población finita (N) o infinita dividida en dos categorías. Figura 1. Gráfico de la distribución de Bernoulli. 0 1 Capítulo 4. DistribuCiones De probabiliDaD 211 Características de una distribución binomial • El experimento aleatorio se repite n veces con idénticas condiciones. • El resultado de cada prueba es independiente de las demás. • Cada una de las pruebas es un experimento de Bernoulli. • La probabilidad (p) de éxito permanece constante en cada prueba. • La variable X de interés es el número de éxitos en los n ensayos de Bernoulli. Función de probabilidad binomial La distribución binomial se denota por: B (n, p). Tiene dos parámetros, n y p, donde n representa el número de veces que se repite el experimento (tamaño de la muestra) y p, la probabilidad de que se produzca un éxito y se mantiene cons- tante en cada ensayo. Su función de probabilidad está dada por: 0 1 2 0 x n xn p q x n P X x x , , , , ... , ( ) , en otro caso − = = = Donde, 0 1 1p q p;< < = − Esperanza y varianza de una distribución binomial La esperanza viene dada por la siguiente expresión: E(X) = np La varianza viene dada por la siguiente expresión: V(X) = npq Gráfica de una distribución binomial Figura 2: Gráfico de la distribución binomial con n = 12 y p = 0.4. Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios212 Ejemplo 2 Los operarios de un taller descansan un 10 % del tiempo de trabajo. Si en el ta- ller trabajan 10 operarios, calcular la probabilidad de que en un momento dado: a. Estén descansando la mitad de los operarios. Solución Se define la variable aleatoria: X = Número de operarios que descansan. n = número de operarios = 10 p = probabilidad de que un operario descanse = 0.1 Para este caso el valor de X = 5; n = 10, p = 0.1. Se reemplaza en la fórmula y se tiene lo siguiente: 5 5105 0 1 0 9 0 001488 5 P X( ) . ( . ) . = = = Utilizando el Minitab se realiza de la siguiente manera: Ingresar a la opción Calc> Probability Distributions> Binomial… Aparece la siguiente ventana, marcar Probability, en el ítem Number of trials colocar el número 10; en el ítem Event probability colocar 0.1, marcar la opción Input constant y en el recuadro respectivo colocar el número 5 y luego dar clic en OK. Figura 3: Secuencia para calcular la probabilidad de una distribución binomial. Capítulo 4. DistribuCiones De probabiliDaD 213 El resultado que nos proporciona la salida del software es el siguiente: Probability Density Function Binomial with n = 10 and p = 0.1 x P(X = x) 5 0.0014880 b. Estén descansando menos de 4 operarios. Solución 3 10 0 10 4 3 0 1 0 9 0 9872x x x P X P X x ( ) ( ) . ( . ) .− = < = ≤ = =∑ c. Estén descansando más de 4 operarios Solución 10 10 5 10 4 0 1 0 9 0 001635x x x P X x ( ) . ( . ) .− = > = =∑ d. ¿Cuál es el número de operarios descansando más probable? Solución X P(X) 0 0.348678 1 0.387420 2 0.193710 3 0.057396 4 0.011160 5 0.001488 6 0.000138 7 0.000009 8 0.000000 9 0.000000 10 0.000000 El más probable es X = 1 Figura 4. Ingreso de datos de la distribución binomial. Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios214 Ejemplo 3 Un estudiante se ha preparado para un examen de forma que tiene una pro- babilidad 0.7 de hacer bien cualquier problema. Si para aprobar el examen debe resolver correctamente al menos la mitad de los problemas, ¿qué tipo de examen le sería más favorable: uno de 4 problemas o uno de 6? Solución Se define la variable aleatoria: X: Número de problemas resueltos correctamente. Probabilidad de resolver correctamente un problema (p) = 0.7 Número de problemas del examen (n) = 4 problemas. 4 4 2 4 2 0 7 0 3 0 9163x x x P X x ( ) . ( . ) .− = ≥ = =∑ Haciendo uso del software Minitab se procede de la siguiente manera: En el menú principal, hacer clic en Graph> Probability Distribution Plot> View Probability como se indica en la siguiente figura: Luego elegir Binomial en el ítem Distribution. - En la ventana Number of trials, digitar 4 y en la ventana de Event probability digitar 0.7> En la pestaña Shaded Area, dar clic en X Value> en la ventana de X Value digitar 2> OK. Figura 5. Secuencia de comandos. Figura 6. Secuencia de comandos. Capítulo 4. DistribuCiones De probabiliDaD 215 Luego de dar clic en OK, se obtiene el siguiente gráfico con la probabilidad solicitada. Para el caso donde n = 6 6 6 3 6 3 0 7 0 3 0 9295x x x P X x ( ) . ( . ) .− = ≥ = =∑ Conclusión: El examen más favorable es de 6 problemas, la probabilidad de aprobar es mayor. 2.3 Distribución hipergeométrica La distribución hipergeométrica es una distribución de probabilidad de una va- riable aleatoria discreta y es útil donde las extracciones se realizan sin reposi- ción, en cuyo caso las pruebas no son independientes. Características de una distribución hipergeométrica • El tamaño de la población es finito (N). • La población se divide en dos características mutuamente excluyentes. • Cada elemento pertenece a una de estas características. • Se obtiene una muestra aleatoria de tamaño n sin reemplazamiento. Función de probabilidad hipergeométricaUna variable aleatoria hipergeométrica depende de tres parámetros: N: Tamaño de la población M: Número de elementos que pertenecen a la categoría de éxito en la población n: Tamaño de la muestra Figura 7. Resultado de la probabilidad en una distribución binomial con n = 4, p = 0.7. Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios216 Su función de probabilidad es: 0 1 2 0 0 M N M x n x x M n P X x N n , , , ,...min( , ) ( ) , otros casos − − = >= = Esperanza y varianza de una distribución hipergeométrica La esperanza viene dada por la siguiente expresión: nM E X N ( ) = La varianza viene dada por la siguiente expresión: 1 1 M M N nV X n N N N ( ) − = − − Gráfica de una distribución hipergeométrica: Ejemplo 4 Un distribuidor mayorista recibe diariamente un lote de 20 refrigeradoras, de las cuales ocho son de color blanco y las restantes de color plata. Un comer- ciante minorista le solicita, también diariamente, seis refrigeradoras. Supo- niendo que las refrigeradoras son seleccionadas al azar. a. ¿Cuál es la probabilidad de que, en un día cualquiera, el número de refri- geradoras seleccionadas de color blanco sea mayor a tres? Figura 8. Gráfica de la distribución hiper- geométrica con N = 20; M = 8; n = 6. Capítulo 4. DistribuCiones De probabiliDaD 217 b. ¿Cuál es la probabilidad que, para los siguientes cinco días, como máximo en dos días, el minorista reciba exactamente tres refrigeradoras de color plata? Suponer independencia. Solución N = 20 refrigeradoras M = 8 refrigeradoras de color blanco N – M = 12 refrigeradoras de color plata n = 6 refrigeradoras seleccionadas como muestra a. X = número de refrigeradoras de color blanco seleccionadas aleatoriamente. 20 8 6X H( , , )→ 6 4 8 12 6 3 0 1373 20 6 x x x P X( ) . = ∑ − > = = b. X: número de refrigeradoras de color plata seleccionadas aleatoriamente. 20 12 6X H( , , )→ 12 8 3 3 3 0 3178 20 6 P X( ) . = = = Y = número de días donde el minorista recibe exactamente tres refrigera- doras de color plata. 5 0 3178B n p( ; . )→ = =Y 2 5 0 5 ( 2) 0.317 (1 0.3178) 0.8126− = ≤ = − =∑ y y y P Y y Ejemplo 5 En un almacén de aparatos electrónicos se almacenan 10 tostadoras para su distribución, 4 de la marca A y el resto de marcas menos conocidas. Si un em- pleado selecciona al azar 5 tostadoras para llevarlas por encargo a una tienda para su comercialización, calcular la probabilidad de que en las 5 tostadoras seleccionadas: a. Haya exactamente 2 de la marca A. Solución N = Total de tostadoras = 10 M = Marca A = 4 Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios218 N – M = tostadoras de marcas menos conocidas =6 n = Tamaño de la muestra = 5 X = Número de tostadoras de la marca A 4 6 2 3 2 0 4762 10 5 P X( ) . = = = Usando el software Minitab se procede de la siguiente manera. En el menú principal: Calc> Probability Distributions> Hypergeometric… Activar la opción Probability e ingresar la siguiente información: N = 10; M = 4; n = 5; activar la opción Input constant e ingresar el valor de X = 2 como se muestra en la siguiente figura: Figura 9. Secuencia para calcular la proba- bilidad de una distribu- ción hipergeométrica. Figura 10. Ingreso de datos en una distribu- ción hipergeométrica. Capítulo 4. DistribuCiones De probabiliDaD 219 Dar clic en OK, siendo el resultado del Minitab lo siguiente: Probability Density Function Hypergeometric with N = 10, M = 4, and n = 5 x P(X = x) 2 0.476190 b. A lo sumo haya una tostadora de las marcas menos conocidas. X: Número de tostadoras de marcas menos conocida N = 10 tostadoras en total M = 6 tostadoras de la marca menos conocida N – M = 4 tostadoras de marca A n = 5 tostadoras seleccionadas como muestra 1 0 6 4 5 1 0 02381 10 5 x x x x P X( ) . = = ∑ − ≤ = = Una de las formas para calcular las probabilidades usando el software Minitab es de la siguiente manera: En el menú principal: Graph> Probability Distribution Plot…, seleccio- nar la ventana de View Probability> OK. En la siguiente ventana, en la pestaña Distribution seleccionar Hipergeometric y digitar valores en los recuadros como se presenta en la siguiente figura: Figura 11: Secuencia para calcular una proba- bilidad de una distribu- ción hipergeométrica. Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios220 En el botón superior del cuadro, activar Shaded Area> X value>seleccionar Left Tail y en la caja de X value colocar el número 1 y dar OK de acuerdo a la siguiente gráfica: El resultado de Minitab se presenta a continuación: Figura 12. Ingreso de datos para calcular la probabilidad de una distribución hiper- geométrica. Figura 13: Selección del área de probabilidad. Capítulo 4. DistribuCiones De probabiliDaD 221 2.4 Distribución de Poisson Siméon Denis Poisson (Francia, 17811840) fue un matemático, astrónomo y físico. Perteneció a la Academia de Ciencias y fue presidente de la Agencia de longitudes, tiene más de 300 obras con aportaciones importantes en física (elasticidad, magnetismo, calor, mecánica celeste, etc.) y matemática (teoría de números, probabilidad, series de Fourier, etc.). La distribución de Poisson es una distribución de probabilidad de una varia- ble aleatoria discreta y hace referencia a una modelización en la que nos interesa la ocurrencia de un número de eventos finitos de eventos discretos en un inter- valo de tiempo o de espacio. La distribución de Poisson se utiliza para describir procesos, como, por ejemplo: • El número de clientes que llegan a un supermercado en un tiempo de 10 minutos. • Número de faltas ortográficas cometidos en una página. • Número de accesos al servidor web de una empresa en un minuto. Características de una distribución de Poisson • Los sucesos o eventos son independientes entre sí. • El promedio de ocurrencias de un evento en un intervalo de longitud t es la misma que en otro intervalo de la misma longitud y es proporcional a su longitud t( )λ . • La probabilidad de ocurrencia de un evento en un intervalo de tiempo depende de la longitud del intervalo. Figura 14. Resultado de la probabilidad en una dis- tribución hipergeométrica con N = 10, M = 6, n = 5. Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios222 • El interés es analizar el número de ocurrencias en un intervalo. • La distribución de Poisson tiene un parámetro que se denota con λ y se define como el número promedio de ocurrencias en la unidad especificada. Función de probabilidad de Poisson 0 1 2 0 xe xP X x x , , , , ...( ) ! , en otro caso −λ λ == = Donde el valor de e = 2.71828 es conocido como el número de Euler o constante de Napier, y λ representa el promedio de ocurrencias en la unidad especificada. Esperanza y varianza de una distribución de Poisson La esperanza viene dada por la siguiente expresión: E X( ) = λ La varianza viene dada por la siguiente expresión: V X( ) = λ Gráfica de una distribución de Poisson: Figura 15. Gráfica de la distribución de Poisson con promedio 3( )λ = . Capítulo 4. DistribuCiones De probabiliDaD 223 Ejemplo 6 Suponga que en un establecimiento de comida rápida se atiende a 50 clientes por hora siguiendo una distribución de Poisson. a. ¿Cuál es la probabilidad que se tenga que atender a menos de ocho clien- tes entre las 5:00 p.m. y las 5:15 p. m.? Solución X: Número de clientes atendidos en una hora. 50E X( ) = clientes X⇒ → Poisson 50( )λ = por cada hora. Y: Número de clientes atendidos en un cuarto de hora (15 minutos). →Y Poisson 125( . )λ = por cada cuarto de hora. 12 57 0 12 58 0 06983 y y eP y . .( ) . ! − = < = =∑Y b. Hallar la probabilidad de que entre las 4:00 p.m. y 4:30 p.m. se atienda a más de 20 clientes. Solución W → Poisson 25( )λ = por cada media hora. 25 21 2520 0 8145 w w eP W w ( ) . ! −∞ = > = =∑ Ejemplo 7 El promedio de ventas de televisores en las tiendas de Centro Plaza es de 6 cada dos horas. Si se supone que la venta de cada una de las tiendas es inde- pendiente una de otra. a. Si X representa el número de ventas cada 40 minutos, ¿cuál es la proba bilidad de que en un intervalo de 40 minutos no se realice venta alguna? Solución Cada 2 horas (120 minutos) se venden en promedio 6 televisores, enton- ces, cada 40 minutos se venderán en promedio 2 televisores. X: Número de ventas de televisores cada 40 minutos. X → Poisson 2( )λ = cada 40 minutos. 2 020 0 135335 0 eP X( ) . ! − = = = Haciendo uso del software Minitab se procede de la siguiente manera: En el menú principal, abrir la opción Calc> Probability Distributions> Poisson> OK> en la ventana Poisson distribution marcar Probability> en Mean=2 y en Input Constant=0> OK como se detalla en la figura 16. . Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios224 Los resultados se presentan a continuación: Probability Density Function Poisson with mean = 2 x P(X = x) 1 0.135335 b. ¿Cuál es la probabilidad de que se realice al menos 4 ventas en el intervalo de 60 minutos? Solución Cada 2 horas (120 minutos) se venden en promedio 6 televisores, enton- ces, cada 60 minutos se venderán en promedio 3 televisores. Y : Número de ventas de televisores cada 60 minutos. →Y Poisson 3( )λ = cada 60 minutos. 3 4 0 334 528 y y eP y ( ) ! . −∞ = ≥ = =∑Y El procedimiento para calcular las probabilidades usando el software Minitab es de la siguiente manera: En el menú principal: Graph> Probability Distribution Plot. Seleccionar la ventana View Probability> OK. En la siguiente ventana en la pestaña: Distribution seleccionar Poisson y digitar en Mean=3>, en el botón superior activar Shaded Area> X value> Right Tail y en la ventana de X value digitar el número 4 y dar OK como se muestra en la siguiente figura: Figura 16. Secuencias para determinar proba- bilidad de la distribución de Poisson. Capítulo 4. DistribuCiones De probabiliDaD 225 3. Distribuciones De probabiliDaD De variables aleatorias continuas 3.1 Distribución uniforme continua La distribución uniforme continua es la más simple de las distribuciones con- tinuas, cuya variable puede tomar valores comprendidos en el intervalo [ , ]a b . Función de densidad de probabilidad uniforme Se dice que una variable aleatoria X tiene una distribución uniforme si su fun- ción de densidad de probabilidad está dada por: 1 0 x f x , ; ( ) , otro caso a < < b − ∞ < a < b < ∞= b − a Figura 17. Secuencia para el cálculo de pro- babilidad de una dis- tribución de Poisson. Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios226 Características de la distribución uniforme • No tiene moda. • Se distribuye uniformemente en el intervalo donde está definida. • Las probabilidades son iguales en todo el rango de la variable. • También se le conoce como distribución rectangular. Función de distribución acumulada 0 1 x xF x x x , si ( ) , si , si < a − a= a ≤ ≤ b b − a > b Esperanza y varianza de una distribución uniforme La esperanza viene dada por la siguiente expresión: 2 E X( ) a + b= La varianza viene dada por la siguiente expresión: 2 12 V X ( )( ) b − a= Gráfica de una distribución uniforme Ejemplo 8 Un servicio de llamadas telefónicas se ha diseñado de forma tal que el tiem- po mínimo de espera de quien llame sea de 20 segundos y el máximo de 50 (tiempo de respuesta). Si los tiempos de respuesta se distribuyen uniforme- mente, encuentre la probabilidad de que, al llamar una persona, tenga un tiempo de respuesta. Figura 18. Gráfica de una distribución uniforme. 1 / b − a a b Capítulo 4. DistribuCiones De probabiliDaD 227 a. Entre 25 y 45 segundos. Solución X = Tiempo de espera para que ingrese una llamada sigue una distribu- ción Uniforme → U(20,50) 45 25 125 45 0 6667 30 P X dx( ) .≤ ≤ = =∫ b. Menor que 30 segundos o mayor que 40. Solución 30 50 20 40 1 130 40 0 333 0 333 0 666 50 50 P X P X dx dx( ) ( ) . . .< + > = + = + =∫ ∫ Ejemplo 9 Un corredor de inmuebles cobra honorarios fijos de 50 dólares más una co- misión del 6 % sobre el beneficio obtenido por el propietario. Si este beneficio es una variable aleatoria con distribución uniforme en el intervalo 0 12 000[ , ] dólares. a. ¿Cuánto espera obtener de utilidad (honorario fijo + comisión) el agente? Solución X: Beneficio [0,12000]U→ ; 6000 2 E X ( )( ) a + b= = Y: Utilidad = 50 + 0.06X E(Y) = 50 + 0.06E(X) = 50 + 0.06 × 6000 = 410 b. ¿Cuál es la probabilidad de que su utilidad supere los US$ 600? Solución 600 50 0 06 60 0 20 9166 6 617 3P P X P X( ) ( . ) ( .. )> = + × > = > =Y Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios228 c. ¿Qué utilidad máxima podrá obtener el agente con probabilidad 0,90? 500 9 50 0 06 0 9 0 9 0 06 kP K P X k P X( ) . ; ( . ) . ; ( ) . . − ≤ = + ≤ = ≤ =Y 50 0 9 0 06 kP X . . − ≤ = 50 10800 0 06 k . − = , entonces, k = US$ 698 Figura 19. Secuencia para el cálculo de pro- babilidad de la distri- bución uniforme. Figura 20. Resultado de probabilidad de la distribución uniforme. Figura 21. Resultado del valor de k de la distribución uniforme. Capítulo 4. DistribuCiones De probabiliDaD 229 3.2 Distribución triangular Es una distribución de probabilidad de una variable aleatoria continua y se uti- liza para describir una población de la cual se dispone pocos datos, por ejemplo, en la industria petrolera es costoso tomar datos y por lo tanto no es posible en la mayoría de las situaciones modelar la población. Función de densidad de probabilidad triangular 0 2 2 0 x a x a a x c b a c a f X b x c x b b a b c x b , ( ) , ( )( ) ( ) ( ) , ( )( ) , < − ≤ ≤ − − − < ≤ − − ≥ Características Tiene tres parámetros. El valor mínimo (a) El valor máximo (b) El valor modal (c) Función de distribución acumulada 0 1 1 x a x a a x c b a c a F x P X x b x c x b b a b c x b , ( ) , ( )( ) ( ) ( ) ( ) , ( )( ) , < − ≤ ≤ − −= ≤ = − − < ≤ − − > Esperanza y varianza de la distribución triangular 3 a b cE X( ) + += 2 2 2 18 a b c bc ac abV X( ) + + − − −= Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios230 Gráfica de una distribución triangular Ejemplo 10 Considere que el precio de un kilo de carne sigue una distribución triangu- lar, donde el precio mínimo es de 10 dólares, el precio máximo 40 dólares y el precio más común es el de 20 dólares. Determine la probabilidad de que el precio de un kilo de carne sea a lo más de 25 dólares. Solución X: precio de un kilo de carne sigue una distribución triangular. 25 0 625P X( ) .< = Utilizando el software Minitab se procede de la siguiente manera: Figura 22. Función de densidad de una distri- bución triangular. 0 a c b X f(x) 2 / b – a Figura 23. Secuencia para el cálculo de pro- babilidad de una dis- tribución triangular. Capítulo 4. DistribuCiones De probabiliDaD 231 3.3 Distribución normal Abraham de Moivre (Francia, 16671754) fue elegido miembro de la Royal Socie- ty de Londres en 1697, siendo muy reconocido por su trabajo en el campo de la probabilidad y de la distribución normal. Johann Carl Friedrich Gauss (17771855), alrededor de 1820 desarrolló nume- rosas herramientas para el tratamiento de los datos observacionales, entre las cuales destaca la curva de distribución de errores que lleva su nombre, conoci- da también como la distribución normal y que constituye unode los pilares de la estadística, ya que es considerada la más importante de las distribuciones por sus múltiples aplicaciones. Características de la distribución normal • Tiene forma de una campana. • Es simétrica respecto a la media. • La media, mediana y moda coinciden. • Los puntos de inflexión de la curva se dan en x x;= µ − s = µ + s • En el intervalo [ , ]µ − s µ + s incluye el 68.26 % de las observaciones. • En el intervalo 2 2[ , ]µ − s µ + s , incluye el 95.45 % de las observaciones. • En el intervalo 3 3[ , ]µ − s µ + s , incluye el 99.73 % de las observaciones. Función de densidad de probabilidad normal Una variable continua tiene una distribución normal, si su función de densidad de probabilidad es: 2 221 0 2 x f x e x ( ) ( ) ; ; −µ − s= − ∞ < < ∞ −∞ < µ < ∞ s > ps Figura 24. Resultado de la probabilidad de una distribución triangular. Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios232 Esperanza y varianza de una distribución normal La esperanza viene dada por la siguiente expresión: E X( ) = µ La varianza viene dada por la siguiente expresión: 2V X( ) = s Grafica de una distribución normal Distribución normal estándar Toda distribución normal puede ser estandarizada mediante la siguiente transformación: xz − µ= s donde a la variable z se le llama normal estándar y tiene media 0 y varianza unitaria. Función de densidad de probabilidad normal estándar La función de densidad de probabilidad de la variable aleatoria Z es 2 21 2 Z f Z e Z( ) − = − ∞ < < ∞ p Esperanza y varianza de una distribución normal estándar La esperanza viene dada por la siguiente expresión: 0E Z( ) = µ = Figura 25. Gráfica de la distribución normal con promedio 14, des- viación estándar de 1.5. Capítulo 4. DistribuCiones De probabiliDaD 233 La varianza viene dada por la siguiente expresión: 2 1V Z( ) = s = Gráfica de una distribución normal estándar Ejemplo 11 Un constructor afirma que el tiempo necesario para completar un proyecto de construcción se puede representar mediante una variable aleatoria normal con una media de 60 semanas y desviación estándar de 8 semanas. a. Calcular la probabilidad de que el tiempo necesario para terminar un pro- yecto de construcción supere las 70 semanas. Solución 70 0 1056P X( ) .> = Haciendo uso del software Minitab se procede de la siguiente manera: en el menú principal clicar la opción Graph> Normal> View Probability> OK en Distribution elegir Normal> en Mean digitar 60 y en Standard Deviation digitar 8> en la ventana Shaded Area> marcar X value> ventana X value> seleccionar Right tail/ digitar en la ventana X value digitar 70> OK. Figura 26. Gráfica de la distribución normal estándar. Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios234 En la siguiente gráfica se encuentra el valor de la probabilidad que es 0.1056 Figura 27. Pasos para hallar una distribución normal. Figura 28. Resultado de probabilidad de una distribución normal. Capítulo 4. DistribuCiones De probabiliDaD 235 b. Calcular la probabilidad de que la duración del proyecto sea inferior a 52 semanas. Solución De igual forma, se calcula la siguiente probabilidad 52 0 1587P X( ) .< = c. Calcular la probabilidad de que la duración del proyecto esté comprendi- da entre 56 y 64 semanas Solución Haciendo uso del software Minitab y siguiendo las instrucciones del ejerci- cio anterior se obtiene lo siguiente: 56 64 0 3829P X( ) .< < = Figura 29. Resultado de probabilidad de la distri- bución normal. Figura 30. Resultado de probabilidad de una distribución normal. Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios236 Ejemplo 12 En una pizzería se ha determinado que el tiempo que se demora en entregar una pizza al cliente, desde que el cliente realiza el pedido hasta que lo reci- be, se distribuye normalmente con una de media de 12.3 y una desviación estándar de 1.7 minutos. Para atraer clientes se ha diseñado una campaña publicitaria en la que la pizza será gratis si se demoran más de 15 minutos para su entrega. ¿Qué proporción de pizzas no se cobrarían por ese motivo? Solución X: Tiempo que se demora la pizzería en entregar la pizza solicitada. X 12 3 1 7N( . ; . )→ µ = s = 15 0 05612P X( ) .> = Haciendo uso del software Minitab se procede como en el ejercicio anterior de la siguiente manera: Figura 31. Secuencia de una distribución normal. Capítulo 4. DistribuCiones De probabiliDaD 237 Ejemplo 13 Los paquetes grandes de café MÓNACO señalan en la etiqueta un contenido neto que debería ser de 4 kg. En el departamento de empaque saben que el contenido neto en peso es ligeramente variable y han estimado que la des- viación estándar es de 0 04.s = kg. Además, aseguran que sólo 2 % de los paquetes contiene menos de 4 kg. Si se supone una distribución normal. a. Determine el peso promedio y luego calcule el porcentaje de paquetes con un peso superior a 4.13 kg. Solución X : Peso de los paquetes de café MÓNACO 0 04X N ( ; . )→ µ s = Para calcular el promedio se hace uso de la normal estándar de la si- guiente manera: 4 44 0 02 0 04 0 04 XP X P P Z( ) . . . − µ − µ − µ < = < = < = s Utilizando el software Minitab de la siguiente manera: ingresar al me- nú principal, en la opción Graph> seleccionar View Probability> OK> en Distribution, seleccionar Normal> en Mean, digitar 0 y en Standard devia- tion, digitar 1> seleccionar Shaded Area>dar clic en Probability>seleccionar Left Tail>en la ventana de Probability digitar 0.02> OK Figura 32. Resultado de probabilidad de una distribución normal. Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios238 El resultado del valor de 0Z se presenta en la siguiente gráfica. 0 4 2 054 4 08 0 04 Z . ; . . − µ = = − µ = Por lo tanto: 4 08 0 04X N ( . ; . )→ µ = s = Para calcular el porcentaje de paquetes con un peso superior a 4.13 ha- ciendo uso de la normal con los parámetros señalados. 4 13P X ( . )> Haciendo uso del software Minitab y siguiendo el procedimiento del ejemplo 11 se obtiene lo siguiente: Capítulo 4. DistribuCiones De probabiliDaD 239 4 13 0 1056P X ( . ) .> = b. De acuerdo con su peso, los paquetes se clasifican en 3 categorías, como sigue: Categoría A (los más livianos) son el 10 %, Categoría B (los de peso intermedio) son el 85 % y el 5 % restante (los más pesados) están en la ca- tegoría C. Calcule los valores límite del peso en cada categoría. Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios240 Solución Haciendo uso del Minitab y siguiendo el procedimiento del ejemplo an te rior se obtiene lo siguiente: Para la categoría A: Peso máximo es de 4.029 kg. Para la categoría B: Los pesos están entre 4.029 y 4.146 kg. Para la categoría C: Desde 4.146 kg a más. 3.4 Distribución exponencial Se utiliza en casos referentes a tiempo de funcionamiento, vida útil, duración del tiempo de trabajo sin fallas de un componente, etc. Función de densidad de probabilidad exponencial Una variable aleatoria continua tiene una distribución exponencial si su función de densidad es: 1 , 0, 0( ) 0 , x e xf x en otro caso − b > b >= b Características de la distribución exponencial • Solo está definida para valores positivos. • Es asintótica al eje horizontal. • Es monótona decreciente. Función de distribución acumulada 0 0 1 0x x F x e x( / ) , ( ) ,− b <= − ≥ Donde e = 2.71828 Capítulo 4. DistribuCiones De probabiliDaD 241 Esperanza y varianza de una distribución exponencial La esperanza viene dada por la siguiente expresión: E X( ) = b La varianza viene dada por la siguiente expresión: 2V X( ) = b Gráfica de una distribución exponencial Ejemplo 14 Suponga que un diseñador debe decidir entre dos procesos de manufactura para la fabricaciónde cierto componente. Empleando el proceso A, cuesta S/ 2.50 fabricar un componente. Empleando el proceso B, cuesta S/ 3.00 fabri- car un componente. Los componentes tienen una distribución exponencial de tiempo transcurrido hasta la falla con medias de 200 y 350 horas, respec- tivamente, para los dos procesos. Debido a una cláusula de garantía, si un componente dura menos de 400 horas, el fabricante debe pagar una pena de S/ 1.20. ¿Cuál proceso debe adoptar el diseñador? Solución Si analizamos el problema vemos que el costo de producción del proceso A es menor, pero, por otro lado, si analizamos el tiempo de duración vemos que el tiempo de vida promedio del proceso B es mayor. Se tiene incertidumbre en la decisión, y debemos usar un procedimiento estadístico que involucre ambos factores, en este caso es el valor esperado Wi: Tiempo transcurrido hasta que se presente la falla en el componente pro- ducido con el proceso i. i = A, B Figura 33. Gráficas de la distribución exponencial con 1 2 yb = b = . Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios242 Proceso Costo Costo adicional si Wi < 400 horas A 2.5 1.2 B 3.0 1.2 Tabla de probabilidades: Proceso P(Wi ≥ 400 h) P(Wi < 400 h) A 0.1353 0.8647 B 0.3189 0.6811 Sea: Xi: Costo por cada componente producido con el proceso i. E(XA): 2.5(0.1353) + (2.5 + 1.2)(0.8647) = S/ 3.53764 E(XB): 3.0(0.3189) + (3.0 + 1.2)(0.68117) = S/ 3.81732 Se debe adoptar el proceso A, ya que presenta el menor costo esperado de producción. Ejemplo 15 El tiempo de vida de un determinado producto es una variable que tiene una distribución exponencial, con una desviación estándar de 6 horas. Si el tiempo de vida es mayor que 6 horas, la utilidad por producto es el 20 % de su costo de fabricación C en soles; mientras que, si dura menos de 6 horas, se pierde el 10 % de su costo C. ¿Para qué valor de C se tiene una utilidad espe- rada mayor que 0? por producto? Solución X: tiempo de vida del producto. 6X Exponencial ( )→ b = U: utilidad asociada por cada producto. 6X Exponencial ( )→ b = Tiempo de vida X Probabilidad Utilidad U X > 6 P(X > 6) = 0.3679 0.2C X ≤ 6 P(X ≤ 6) = 0.6321 –0.1C Hallar C, tal que: E(U) > 0.1 E(U) = 0.2C(0.3679) + (–0.1C)(0.6321) > 0.1 E(U) = 0.07358C – 0.06321C = 0.01037C > 0.1 Entonces: C > S/ 9.6432 3.5 Distribución gamma La distribución gamma es una generalización del modelo exponencial, y se uti- liza para modelar las variables asociadas al tiempo que transcurre hasta que se produce una determinada cantidad de veces un suceso de interés. Capítulo 4. DistribuCiones De probabiliDaD 243 Función de densidad de probabilidad gamma Una variable continua tiene una distribución gamma si su función de densidad es: 11 0 0 0 0 0 x x e xf x x , , ,( ) ( ) , − a− b a > a > b >= Γ a b ≤ Donde e = 2.71828 Características de la distribución gamma • ( )Γ a es la función gamma y se define como: 1 xX e dx( ) ∞ a− − a Γ a = ∫ , con las siguientes propiedades: Para cualquier entero positivo: 1( ) ( )!Γ a = a − Para cualquier 1 1 1; ( ) ( )! ( )a > Γ a = a Γ a 1 2 Γ = p • Si 1,a = entonces, f x( ) es la función de densidad de la distribución expo- nencial con parámetro .b • Si 2 2a n/ by ,= = entonces, f x( ) es la llamada función de densidad de la distribución ji-cuadrado con n grados de libertad. Gráfica de una distribución gamma Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios244 Ejemplo 16 Supongamos que el tiempo que transcurre entre la entrada y la salida de un cliente a un supermercado sigue una distribución gamma con parámetros 4 1 2 y / .a = b = Si un cliente cualquiera entró a las 11:00 horas, ¿cuál es la probabilidad de que salga del supermercado entre las 12:00 y las 13:00 horas? Solución X: tiempo que transcurre entre la entrada y la salida de un cliente a un su- permercado. X → Gamma 4 0 5 y( . )a = b = 1 2 0 423P X( ) .≤ ≤ = Haciendo uso del software Minitab el procedimiento se presenta a continuación: Figura 34. Gráficas de la distribución gamma con 1 1 2 1, y ,a = b = a = b = . Capítulo 4. DistribuCiones De probabiliDaD 245 3.6 Relación entre las distribuciones de Poisson, exponencial y gamma 3.6.1 Relación de la distribución de Poisson con la distribución exponencial Una de las aplicaciones más importantes de la distribución exponencial es aque- lla en las que se encuentran asociadas al proceso de Poisson y su correspondien- te distribución. Sea X una variable aleatoria de Poisson que representa el número de eventos que ocurren en un intervalo de tiempo con un parámetro ,λ donde λ puede interpretarse como el número promedio de eventos por unidad de tiempo. Con- sideremos ahora la variable aleatoria Y como el tiempo que se requiere para que ocurra el primer evento, entonces se puede demostrar que Y es una variable aleatoria con una distribución exponencial y con parámetro 1b = λ del intervalo de medición considerado. Ejemplo 17 El número promedio de robos que ocurre en una capital de un país es de 5 en 60 minutos. Suponiendo que el número de robos siga una distribución de Poisson. a. Determine la probabilidad de que en 1 hora ocurra exactamente 3 robos. Solución X: número de robos en 60 minutos. X → Poisson 5( )λ = cada 60 minutos. 5 353 0 140374 5 eP X( ) . ! − × = = = b. ¡Acaba de ocurrir un robo! Determine la probabilidad de que transcurra menos de 20 minutos para que ocurra el siguiente robo. Solución 1 1 0 2 5 .b = = = λ de cada 60 minutos, es decir, 12b = minutos. Figura 35. Secuencia para calcular la probabi- lidad de una distribución gamma. Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios246 Y : Tiempo transcurrido entre un robo y otro. Y → Exp( 12b = minutos) 20 12 0 120 0 811 12 y P e( ) . − < = =∫Y 3.6.2 Relación de la distribución de Poisson con la distribución gamma Sea una variable aleatoria X que se distribuye como una de Poisson, donde X representa el número de eventos en un determinado intervalo de tiempo. Esta variable aleatoria X se relaciona con la variable aleatoria Y, que representa el tiempo entre un evento hasta la presencia del siguiente evento, esta variable Y se distribuye como una exponencial. Se define la variable aleatoria W que repre- senta el tiempo hasta que transcurra el késimo evento, entonces W se distribuye como una gamma con parámetro ( , )a b donde a es entero y 1b = λ . Ejemplo 18 A un servidor web llegan en promedio 3 requerimientos cada 30 segundos. Calcule lo siguiente: a. Probabilidad de esperar más de un cuarto de hora para que lleguen 80 requerimientos. b. Probabilidad de esperar menos de 10 minutos para que lleguen 50 requerimientos. Solución X: Número de requerimientos que llegan al servidor cada 30 segundos. X → Poisson 3( )λ = cada 30 segundos. 1 1 3 b = = λ de cada 30 segundos (1/2 minuto), es decir, 1 1 1 3 2 6 b = = minuto a. Y: tiempo de espera, en minutos, hasta que lleguen 80 requerimientos Y → Gamma 80 1 6 0 16667a b /( , . )= = = 15 0 1332P( ) .> =Y b. W: tiempo de espera, en minutos, hasta que lleguen 50 requerimientos W → Gamma 50 0 16667, .( )a = b = P(W < 10) = 0.9156 3.7 Distribución de Weibull La distribución de Weibull fue establecida por el físico suizo del mismo nombre quien demostró, con base a una evidencia empírica, que el esfuerzo al que se someten los materiales se puede modelar apropiadamente mediante el empleo Capítulo 4. DistribuCiones De probabiliDaD 247 de esta distribución. En los últimos años, esta distribución se utiliza como mo- delo para situaciones del tipo tiempo-falla con el objetivo de evaluar una amplia variedad de componentes mecánicos y eléctricos. Función de densidad de probabilidad de Weibull Una variable continua X tiene una distribución de Weibull si su función de densidad es: 1 0 0 0 0 0 xx e xf x x ( ) , , ,( ) , a− a− b a a > a > b >= b ≤ Donde a es conocida como el parámetro de forma, y b como el parámetro de escala, además el valor de e = 2.71828. Características de la distribución de Weibull • El parámetro a indica el comportamiento de la tasa de fallos con el trans- curso del tiempo, tal que: – 1a < indica que la tasa de fallos decrece con el tiempo – 1,a = indica que la tasa de fallos es constante en el tiempo – 1,a > indica que la tasa de fallos crece con el tiempo. • Si 1,a = entonces, f x( ) corresponde a una función de densidad de la dis- tribución exponencial con parámetro .b Función de distribución acumulada Sea x una variable aleatoria continua de Weibull con parámetros ya b , enton- ces su función de distribución es: 0 0 1 0x x F x e x( / ) , ( ) , a− b <= − ≥ Esperanza y varianza de una distribución de Weibull La esperanza viene dada por la siguiente expresión: 11E X( ) = bΓ + a Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios248 La varianza viene dada por la siguiente expresión: 2 2 1 11 1V X( ) = b Γ + − Γ + a a Gráfica de una distribución de Weibull Ejemplo 19 La duración X, en cientos de horas, de cierto tipo de tubo al vacío tiene una distribución de Weibull con parámetros 2 3y .a = b = Calcule: a. El valor esperado y la desviación estándar de X. b. El porcentaje de tubos con duraciones inferiores a 600 horas. c. El porcentaje de tubos con duraciones entre 150 y 500 horas. Solución X: duración, en cientos de horas, del tubo al vacío. X Weibull(a = 2, b = 3) a. 3 3 0 886227 2 65868111 2 E X( ) ( . ) . Γ + = == 2 2 21 13 1 1 2 2 9 0 886227 0 886227 0 907458V X ( . . ) .( ) = Γ + − Γ + = = − b. 6 0 981P X( ) .< = NOTA: 600 horas se representa como 6 cientos de horas Haciendo uso del software Minitab, el procedimiento se muestra a continuación: Figura 36. Gráficas de la distribución de Weibull con 2 5 2 1, y ,a = b = a = b = . Capítulo 4. DistribuCiones De probabiliDaD 249 c. P(1.5 < X < 5) = 0.7166 Figura 37. Secuencia para calcular la probabilidad de una distribución de Weibull. Figura 38. Resultado de la probabilidad de una distribución de Weibull. Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios250 Ejemplo 20 El tiempo en horas para la falla de un material aislante sólido sometido a voltaje de corriente alterna tiene distribución de Weibull con a = 2.5 y b = 200 a. Calcule la probabilidad de que la duración de un material sea de a lo más 200 horas. b. ¿Qué valor es tal que exactamente 50 % de todos los especímenes tengan duraciones que excedan dicho valor? Solución a. X: Tiempo de duración de material aislante ( 2.5; 200)→ a = b =Weibull ( 200)P X ≤ = 0.6321 b. ( ) 0.5; 172.7P X k k> = = 3.8 Distribución ji-cuadrado La distribución ji-cuadrado es muy importante en las aplicaciones de inferencia estadística como las pruebas de independencia y de bondad de ajuste, entre otras. Se dice que una variable aleatoria continua sigue una distribución ji-cuadrado ( 2vχ ) con v grados de libertad si su función de densidad es: 2 1 2 2 1 0 2 2 0 0 v x v x e x v o vf x x / , si , ( ) , si −− > > = Γ ≤ Donde v es un parámetro cuyo nombre es “grados de libertad” y es el tamaño de la muestra, y 2 v Γ representa la función gamma evaluada en v/2. Además, el valor de e = 2.71828. Características: • Es una distribución asimétrica positiva • Las puntuaciones de la ji-cuadrado no pueden ser negativas. • Se aproxima a la distribución normal cuando el tamaño de la muestra es grande. • Si el valor de v = 2, la variable aleatoria ji-cuadrado es igual a una variable aleatoria exponencial con 2b = . • Si el valor de v =2, la variable aleatoria ji-cuadrado es igual a una variable aleatoria gamma con 2 2v / ;a = b = . Capítulo 4. DistribuCiones De probabiliDaD 251 • La distribución ji-cuadrado posee la propiedad reproductiva es decir si: 1 2 3 vX X X X, , ..., son variables aleatorias mutuamente independientes con distribución ji-cuadrado respectivamente, con 1 2 nv v v, ,..., grados de liber- tad, entonces la variable aleatoria 1 2 nX X X...= + + +Y tiene una distribu- ción ji-cuadrado con 1 2 nv v v v...= + + + . • La distribución ji-cuadrado está relacionada con la distribución normal, respecto a lo siguiente: al extraer una muestra aleatoria de una población 2N( ; )µ s , y estandarizar las variables se tiene lo siguiente: 1 2 v xx x ; ; ... − µ− µ − µ s s s , al elevar al cuadrado cada una de ellas y sumarlas 2 2 1 v i v i x = − µ → χ∑ s , este resultado es una variable aleatoria ji-cuadrado con v grados de libertad. Esperanza y varianza de una distribución ji-cuadrado 2 E x v V x v ( ) ( ) = = Gráfica de una distribución ji-cuadrado Ejemplo 21 Considere a X como una variable aleatoria con distribución ji-cuadrado con 18 grados de libertad. a. Determine la probabilidad de que X sea a lo más de 12. b. ¿Cuál es el valor de k, si X sobrepasa a este valor con una probabilidad de 0.95? Figura 39. Gráfica de la distribución de pro- babilidad ji-cuadrado con diversos grados de libertad. Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios252 Solución a. Haciendo uso de Minitab el procedimiento se presenta a continuación: Resultado: 12 0 1528P X( ) .< = Figura 40. Uso del co- mando Chi-Square del software Minitab. Capítulo 4. DistribuCiones De probabiliDaD 253 b. 0 95P X K( ) .> = Haciendo uso del software Minitab, el procedimiento se presenta a conti- nuación: 0 95P X K( ) . ;> = el valor de k = 9.39 Ejemplo 22 Sea X una variable aleatoria con distribución Ji-cuadrado con 20 grados de libertad. a. Determine la probabilidad de que X sea por lo menos 15.35 b. Determine la esperanza y la varianza de X. Figura 41. Uso del comando Chi-Square del software Minitab. Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios254 Solución a. Para calcular ( 15.35) 0.7560> =P X b. 20 4E X V X( ) ; ( )= = 3.9 Distribución t de Student La distribución t de Student fue creada por William Sealy Gosset, más conocido por su pseudónimo literario Student. Esta distribución de probabilidad es muy importante cuando se desea realizar una inferencia para la media poblacional y no se conoce la desviación estándar poblacional con la condición de que la dis- tribución original es aproximadamente normal. Se dice que una variable aleatoria continua sigue una distribución t con v grados de libertad si su función de densidad es: Función de densidad de probabilidad t de Student 1 2 2 1 2 1 0 2 1 v v f x x v v v x v ( ) , ; + + Γ = − ∞ < < ∞ > Γ p + Donde v son los grados de libertad ( )Γ = es la función gamma Características • Es una distribución simétrica. • La distribución t es parecida a una distribución normal estándar. • En una distribución t las colas son más “pesadas” que una distribución norma estándar (Z), es decir, que en la distribución t es más probable en- contrar valores alejados de la media, en comparación a la distribución Z. • La distribución t está relacionada con la distribución normal y la ji-cuadrado de la siguiente manera: v ZT t Y v ( )= → 2(0,1); vZ N Y→ → χ Capítulo 4. DistribuCiones De probabiliDaD 255 Esperanza y varianza de una distribución t de Student 0 2 2 E X vV X v v ( ) ( ) , = = > − Gráfica de una distribución t de Student Ejemplo 23 Sea 18X t( )→ , determine las siguientes probabilidades: a. 2P X( )> b. 2 5P x( . )≤ Solución a. Haciendo uso del software Minitab se procede de la siguiente forma: Figura 42. Gráfica de la distribución de probabi- lidadde la t de Student con 5 y 30 grados de libertad. Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios256 0( 2) .03041=>P X b. Haciendo uso del software Minitab se procede de la siguiente manera: ( 2.5) 0.9777=≤P x 3.10 Distribución F de Fisher-Snedecor La distribución F es muy importante en las aplicaciones de inferencia estadística como en el análisis de varianzas, también se le conoce como la distribución F de Fisher-Snedecor. Capítulo 4. DistribuCiones De probabiliDaD 257 Función de densidad de probabilidad F (Fisher) Se dice que una variable aleatoria continua sigue una distribución F con m y n grados de libertad si su función de densidad es: 2 22 2 2 0 0 0 2 2 1 0 0 mm m n m n m x x m n nm nf x m x n x , si , , ( ) , si − + + Γ > > > = Γ Γ + ≤ Donde m representa los grados de libertad del numerador, y n a los grados de libertad del denominador, y Γ( ) es la función gamma. Características • Notación: X tiene una distribución F con m y n grados de libertad se deno- ta como m nF( , ) • Es una distribución asimétrica a la derecha. • La distribución F es muy parecida a la distribución ji-cuadrado, pero se encuentra centrada respecto a uno. • La distribución F es el resultado de dividir 2 variables aleatorias del tipo ji-cuadrado divididas entre sus grados de libertad mediante el siguiente esquema: Sean 2 2m nX y Y( ) ( )→ χ → χ , la variable X nXmW Y mY n = = tiene una distri- bución F con m y n grados de libertad. Esperanza y varianza de una distribución F 2 nE X n ( ) = − 2 2 42 2 2 4 n m nV X m n n n( )( ) ( ) ( ) con+ −= − − > Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios258 Gráfica de una distribución F Ejemplo 24 Sea X una distribución F con 16 y 20 grados de libertad, calcular las siguien- tes probabilidades: a. P(X< 2.4) b. P(1.2< X <2.2) Solución a. Haciendo uso del software Minitab se procede de la siguiente manera: Figura 43. Gráfica de la distribución F con diver- sos grados de libertad. Figura 44. Secuencia del comando F. Capítulo 4. DistribuCiones De probabiliDaD 259 2 4 0 9670P X( . ) .< = b. Haciendo uso del software Minitab se procede de la siguiente manera: Figura 45. Resultado de la probabilidad. 1 2 2 2 0 2969P X( . . ) .< < = Figura 46. Secuencia del comando F. Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios260 4. probleMas resueltos 1. Un informe del diario Gestión indica que el 58 % de los trabajadores de Lima tienen sueldos superiores al mínimo vital. Si usted entrevista a 50 trabajadores elegidos al azar, hallar la probabilidad de que: a. Más de 36 de ellos tengan sueldos superiores al mínimo vital. Solución X: número de trabajadores son sueldos superiores al mínimo vital X → B (n = 50; p = 0.58) ( ) 36 50 0 36 1 36 1 0 98 50 1 0 58 0 4 58 0 01422x x x X P X x . ( . )– ( ) – . .− = − =∑ > = = ≤ = Usando el software Minitab se obtiene lo siguiente: b. Se observe que a lo más 20 de ellos tengan sueldos inferiores al mínimo vital. Solución X → B(n = 50; p = 0.42) 20 50 0 50 0 42 0 520 0 468 4 1x xP X x ( ) .. ( . ) − =∑ ≤ = c. Más de 30 pero menos de 40 tengan sueldos superiores al mínimo vital Solución X → B(n = 50; p = 0.58) Capítulo 4. DistribuCiones De probabiliDaD 261 30 40 31 39 39 30P X P X P X P X( ) ( ) ( ) – ( )< < = ≤ ≤ = ≤ ≤ = 0 9991 0 6638 0 3353. . .− = 2. Un comerciante ha comprado en un remate de aduanas un lote de 10 tele- visores full HD de 42’’ y pagó USD 3500 por todo el lote. Cada televisor en buenas condiciones lo puede vender a USD 600, pero si el televisor necesita alguna reparación lo vende a USD 250. En remates similares se sabe que el 80 % de los televisores adquiridos están en buenas condiciones. a. ¿Cuál es la probabilidad de que más de la mitad de televisores compra- dos estén en buenas condiciones Solución X: número de televisores buenos RX = 0, 1, 2, …, n X → b(n = 10; p = 0.80) ( ) 10 10 6 1 5 0 0 8 0 26 0 9672x xP X P X x .( ) . ( . ) − ∑ > = = ≥ = b. ¿Cuál es la ganancia neta esperada del comerciante por la compra de los 10 televisores? Solución Y: ganancia neta con los 10 televisores. 600 250 10 3500 350 1000X X X( – ) – –= + =Y 350 8 1000 1800E( ) – USD= × =Y c. ¿Cuál es la probabilidad de que su ganancia neta sea inferior a USD 750? 750 350 1000 750 5 4 0 00637P P X P X P X( ) ( – ) ( ) ( ) .< = < = < = ≤ =Y 3. Los impulsos provenientes de una fuente emisora tienen una intensidad (en kg.m2/s) que es considerada una variable aleatoria X cuya función de distribución es: 4 0 0 0 3 81 1 3 x xF x x x , ( ) , , ≤ = < < ≥ Si se observan 10 de estos impulsos cuyas intensidades se consideran independientes, ¿cuál es la probabilidad de que a lo más 3 de ellos tengan una intensidad superior a 2? Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios262 Solución Y: número de impulsos con intensidad X > 2 n = 10; p = P(X > 2) = 1 – 16/81 = 0.1975 Y → B(n = 10; p = 0.1975) 3 10 0 10 0 1975 0 8025 0 883 35x xP x . ( . )( .) − =∑ ≤ =Y 4. Ciertas piezas deben estar pintadas y para que estén aptas para la venta deben tener la pintura en buenas condiciones. El 4 % de dichas piezas tiene poca pintura y el 5 % tienen en exceso. El 99 % de las que tienen exceso no están aptas para la venta, lo mismo ocurre con el 90 % de las que tienen poca pintura. Calcular: a. La probabilidad de que una pieza esté apta para la venta. b. Si de una producción de 200 piezas se eligen, al azar y sin reposición, 12, ¿cuál es la probabilidad de que a lo más una de ellas esté mal pintada? Solución P: poca pintura, E: exceso de pintura, N: pintura normal A: pieza apta para la venta A A Total P 0.0040 0.0360 0.04 N 0.9100 0.0000 0.91 E 0.0005 0.0495 0.05 Total 0.9145 0.0855 1.00 a. P(A) = 0.9145 b. N = 200, M = (0.04 + 0.05)(200) = 18, n = 12 Y: número de piezas mal pintadas Y → H(N = 200; M = 18; n = 12) 1 0 18 182 12 1 0 7054 200 12 y y y P( ) . = ∑ − ≤ = = Y Capítulo 4. DistribuCiones De probabiliDaD 263 5. Un mayorista que vende focos de 30 vatios aceptará un lote de 120 piezas a un fabricante si no encuentra más de 4 focos defectuosos en una muestra de 20. a. ¿Cuál es la probabilidad de encontrar 3 defectuosos en una muestra de 20, si se sabe que en el lote hay 4 defectuosos? b. ¿Cuál es la probabilidad de aceptar el lote si se sabe que en el lote hay 6 defectuosos? Solución a. X: número de focos defectuosos seleccionados. ( )120 4 20X H N M n ; ;→ = = = 4 116 3 17 3 0 0138778 120 20 P X( ) . = = = Usando el software Minitab se obtiene lo siguiente: Probability Density Function Hypergeometric with N = 120, M = 4, and n = 20 x P(X = x) 2 0.0138778 b. Y: número de focos defectuosos seleccionados. 120 6 20H N M n ( ; ; )→ = = =Y 4 0 6 114 20 4 0 9996 120 20 y y y P( ) . = ∑ − ≤ = = Y 6. Un lote contiene 80 artículos del proveedor A y 100 del proveedor B. Se elige una muestra aleatoria de tamaño 5 sin reemplazo. a. Determine la probabilidad de que en la muestra se elija 2 artículos sean del proveedor A y 3 del proveedor B. b. Cuál es la probabilidad de que en la muestra no haya ninguno del pro- veedor A. Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios264 Solución a. Determine la probabilidad de que en la muestra se elija 2 artículos sean del proveedor A y 3 del proveedor B. X: número de artículos del proveedor A. X H→ (N = 180; M = 80; n = 5) 80 100 2 3 2 0 3432 180 5 P X( ). = = = b. ¿Cuál es la probabilidad de que en la muestra no haya ninguno del pro- veedor A? 80 100 0 5 0 0 0505676 180 5 P X( ) . = = = 7. A una garita de peaje, en promedio, llegan 240 autos por hora. El adminis- trador de la garita ordena atender inicialmente solamente una caseta, pero si en el lapso de 2 minutos llegan por lo menos 10 autos, entonces ordena atender en una caseta más hasta que se produzca el descongestionamiento. ¿Cuál es la probabilidad de que el administrador tenga que ordenar atender en otra caseta? Solución =X Número de autos que llegan a la garita de peaje en 2 minutos. ( )8X P~ λ = cada 2 minutos 88xeP X x x - [ ] ! = = 10 1 10 1 9 1 0 716624 0 283376P X P X P X[ ] [ ] [ ] . .≥ = − < = − ≤ = − = 8. Los accidentes laborales diarios de una empresa siguen una distribución de Poisson con promedio de 0.4. Calcular lo siguiente: a. La probabilidad de que en un día se produzcan por lo menos dos accidentes. b. La probabilidad de que se produzcan 4 accidentes en 6 días. c. La probabilidad de que haya un accidente hoy y ninguno mañana. Capítulo 4. DistribuCiones De probabiliDaD 265 Solución a. La probabilidad de que en un día se produzcan por lo menos dos accidentes X: número de accidentes diarios. 0 4X (Poi s n . )s o→ λ = cada día 0.4 2 0.4( 2) 0.06155 ! −∞ × ≥ = =∑ xeP X X Usando el software Minitab: Graph> Probability Distribution Plot> View Probability> OK> Distribution> Poisson> Mean=0.4> Shaded Area> X value> Right Tail> X value=2> OK, y se obtiene el siguiente valor: b. La probabilidad de que se produzcan 4 accidentes en 6 días. Como en promedio ocurren 0.4 accidentes cada día, entonces, cada se- mana de 6 días ocurrirán 0.4(6) = 2.4 accidentes. 4 2(Poisson . )→ λ =Y cada semana 2.4 42.4( 4) 0.125408 4! − × = = = eP Y Haciendo uso del software Minitab mediante la opción: Calc> Probability Distribution > Poisson >Probability > Mean=2.4 > Input constante=4, se obtiene: Probability Density Function Poisson with mean = 2.4 x P(X = x) 4 0.125408 Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios266 c. La probabilidad de que haya un accidente hoy y ninguno mañana. X: número de accidentes diarios. 0 4X (Poi s n . )s o→ λ = cada día 0.4 0.4 00.4 0.4( 1) ( 0) 0.9384 1! 0! − − × × = = = = e eP X P X 9. Para la fabricación de hojalata mediante el método Bessemer se producen 0.3 imperfecciones por minuto. a. Determinar la probabilidad de no encontrar imperfecciones en un minuto. b. Determinar la probabilidad de encontrar a lo más dos imperfecciones en dos minutos. c. El jefe de planta indica que, si encontraran por lo menos 2 imperfeccio- nes en dos minutos, se tomaría la decisión de cambiar el método. ¿El jefe de planta cambiaría de método? Solución X: número de imperfecciones que se presentan cada minuto. 0 3X (Poi s n . )s o→ λ = cada minuto. a. Determinar la probabilidad de no encontrar imperfecciones en un minuto. 0.3 00.3( 0) 0.740818 0! − × = = = eP X b. Determinar la probabilidad de encontrar a lo más dos imperfecciones en dos minutos. Y: Número de imperfecciones que se presentan cada 2 minutos. 0 6 (Po on )iss .→ λ =Y cada 2 minutos. 0.62 0 0.6( 2) 0.9769 ! − = × ≤ = =∑ y y eP Y y c. El jefe de planta indica que, si encontraran por lo menos 2 imperfeccio- nes en dos minutos, se tomaría la decisión de cambiar el método. ¿El jefe de planta cambiaría de método? 0 6 (Po on )iss .→ λ =Y cada 2 minutos. 0.6 2 0.6( 2) 0.1219 ! −∞ = × ≥ = =∑ y y eP Y y Capítulo 4. DistribuCiones De probabiliDaD 267 10. Por la venta de un producto, una empresa obtiene ingresos diarios que se pueden representar mediante una variable aleatoria X con distribución uniforme. Si se sabe que el ingreso mínimo es de 180 soles y que en 1 de cada 10 días los ingresos superen los 378 soles, calcule el coeficiente de va- riación de X. Solución X: ingreso diario. 180X U ,( )?→ a = b = 1 378378 0 1 400 10 180 P X( ) . ;b −> = ⇒ = b = b − 2180 400 (400 180)( ) 290; ( ) 4 033.33 2 12 63.51 63.51. .( ) 100 21.89% 290 + − = = = = s = = × = F X V X C V X 11. En una determinada zona de la ciudad existen dos bancos comerciales: A y B. A cuenta con el 70 % de los clientes y B con el resto. Los depósitos ban- carios semanales, en dólares, en A tienen distribución uniforme entre 3500 y 18 500 dólares inclusive y los depósitos bancarios semanales en B tienen distribución normal con un promedio 10 000 dólares y una desviación es- tándar de 2500 dólares. a. En el banco A; si se elige al azar un depósito, ¿cuál es la probabilidad de que el valor de dicho depósito sea mayor a 15 500 dólares? Solución En el banco A; si se elige al azar un depósito, ¿cuál es la probabilidad de que el valor de dicho depósito sea mayor a 15 500 dólares? X: Depósitos bancarios semanales en el banco comercial 3500 18500A U[ ; ]→ 15 500 0 2P X( ) .> = Usando el software Minitab, se procede de la siguiente manera: Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios268 b. La semana pasada se realizaron 60 depósitos en el banco A. Si se eligen al azar y sin reposición 10 de dichos depósitos, ¿cuál es la probabilidad de que por lo menos tres de ellos tengan un valor no mayor a US$ 5000? Solución X: Depósitos bancarios → U(3500; 18 500) 5000 0 1P X( ) .< = Capítulo 4. DistribuCiones De probabiliDaD 269 Y: Número de depósitos → H(N = 60; M = 6; n = 10) M = 0.1(60) = 6 3 0 05237P( ) .≥ =Y c. Si se elige al azar un depósito entre todos los depósitos de los dos ban- cos, halle la probabilidad de que dicho depósito sea mayor a US$ 14 000. Solución 14000 0 3 14000 0 05480 A B P X P X ( ) . ( ) . > = > = A: Depósito mayor a 14 000 B1: Clientes del banco comercial A B2: Clientes del banco comercial B P(A) = 0.7 × 0.3 + 0.3 × 0.0548 = 0.22644 12. Se cree que el tiempo X (en minutos) para que un profesor universitario prepare una práctica dirigida para el curso de Estadística, tiene una distri- bución uniforme. En promedio se demora una hora, y como mínimo em- plea 55 minutos para la preparación de la práctica. a. ¿Cuál es la probabilidad de que el tiempo de preparación exceda a 58 minutos? b. Determine el tiempo máximo de preparación, tal que sólo el 10 % de las prácticas excedan este tiempo máximo. Solución a. ¿Cuál es la probabilidad de que el tiempo de preparación exceda a 58 minutos? 55 60 65 2 E X( ) ;+ b= = b = 55 65X U( ; )→ 58 0 7P X( ) .> = b. Determine el tiempo máximo de preparación, tal que sólo el 10 % de las prácticas exceda este tiempo máximo. 0 1 56P X K k( ) . ;< = = 13. Sea X una variable aleatoria con distribución triangular, su valor mínimo es 1, el valor máximo es 6 y el valor modal es 3. a. Determine la función de densidad. b. Determine la función de distribución acumulada. Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios270 Solución a. La función de densidad es: 1 1 3 5 2 6 3 6 15 0 x x xf x , ( )(x) , , en otro caso − ≤ ≤ −= < ≤ b. La distribución de probabilidad acumulada es: 0 1 1 1 3 10 61 3 6 15 1 6 x x x x F x x x x , , ( ) ( ) , , < − ≤ ≤= − − < ≤ > 14. Los sueldos de los trabajadores de una determinada fabrica sigue una dis- tribución triangular con mínimo de 800 soles, el sueldo máximo es de 2200 y la gran mayoría tiene sueldos de 1000 soles. Determine la probabilidad que, al elegir un trabajador, el sueldo sea menor a 1300 soles. Solución Haciendo uso del software Minitab, el procedimiento se presenta a continuación: Capítulo 4. DistribuCiones De probabiliDaD 271 1300 0 5179P X( ) .< = 15. Una máquina que despacha café está programada de forma que descarga una media de 250 cm3 por vaso. Si la cantidad de líquido despachadaestá distribuida normalmente y se sabe que en el 4.78 % de los vasos la cantidad de líquido descargada es inferior a 225 cm3 a. Halle la desviación estándar y luego calcule el mínimo de líquido despa- chado en el 15 % de los vasos más llenos. b. Si se utilizan 12 vasos de 270 cm3 cada uno, ¿cuál es la probabilidad de que se derrame líquido en exactamente dos de ellos? Solución X: Contenido de café 250N( ; )→ µ = s 225 0 0478P X( ) .< = a. Halle la desviación estándar y luego calcule el mínimo de líquido despa- chado en el 15 % de los vasos más llenos. Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios272 225 250 0 0478P Z( ) . ;−< = s 225 250 1 667 14 99 15. ; . ;− = − s = s = s 250 2500 15 1 036 265 54 15 15 k kP Z k( ) . ; . ; .− −> = = = Los resultados previos, obtenidos haciendo uso del software Mini- tab, son: Graph> Probability> Distribution Plot> view Probability> OK> Distribution Normal> Mean=0> Sdev=1> Shaded Area> X value> Left Tail =-1.667> OK b. Si usamos 12 vasos de 270 cm3 cada uno, ¿cuál es la probabilidad de que se derrame líquido en exactamente dos de ellos? 270 0 09121P X( ) .> = Haciendo uso del software Minitab, el procedimiento es el siguiente: Graph> Probability> Distribution Plot> view Probability> OK> Distri- bution Normal> Mean=250> Sdev=15> Shaded Area> X value> Right Tail=270> OK Capítulo 4. DistribuCiones De probabiliDaD 273 X: Número de vasos que se derrame 12 0 09121B n p( ; . )→ = = 2 10122 0 09121 0 90879 0 210991 2 P X( ) . ( . ) . = = = 16. Los sueldos de los empleados de una empresa se consideran una variable aleatoria X que sigue una distribución normal con media igual a 2400 soles. El 97.72 % de empleados tiene sueldos inferiores a 3360 soles. De acuerdo con los sueldos hay tres categorías: alta, intermedia y baja. Se sabe que los porcentajes de empleados en las categorías alta y baja son iguales y que el 82 % del personal pertenece a la categoría intermedia. a. Hallar el sueldo mínimo y el sueldo máximo de los empleados de la ca- tegoría intermedia b. ¿Qué porcentaje de empleados tienen sueldos que se diferencian del pro- medio en a lo más 250 soles? Solución a. Hallar el sueldo mínimo y el sueldo máximo de los empleados de la ca- tegoría intermedia. X: sueldos del personal (soles) 2400X N µ )( ; ?→ = s = 3360 0 9772P X( ) .< = Empleando la distribución normal estándar se tiene que: 3360 24002 00 480. −= ⇒s = s Los porcentajes de empleados en las categorías alta y baja son iguales y deben de sumar 18 %, ya que complementan al 82 % del personal per- tenece a la categoría intermedia. Como son porcentajes iguales, entonces cada categoría corresponde al 9 %. Se hallan los límites de sueldos en la categoría intermedia como sigue: Límite inferior: 1 0 09P X x( ) .=< , de donde resulta que: 1 1756 44x .= Límite superior: 2 0 91P X x( ) .=< , de donde resulta que: 2 3043 56x .= b. ¿Qué porcentaje de empleados tienen sueldos que se diferencian del pro- medio en a lo más 250 soles? Se pide: 250 2150 2650 0 698758 0 301241P X P X( ) ( ) . .− µ ≤ = ≤ ≤ = − Por lo tanto, la probabilidad solicitada es: 0.397517 17. Una máquina produce rodamientos con un diámetro que es una variable normal de media 3.00 pulgadas y desviación estándar 0.01 pulgadas. Los rodamientos con diámetros mayores que 3.02 pulgadas o menores que 2.98 pulgadas no satisfacen las especificaciones de calidad. Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios274 a. En cierto momento, la máquina produjo 38 rodamientos que no cumplían con las especificaciones. Determine el total de rodamientos producidos. b. Si de 10 000 rodamientos producidos por la máquina se escogen al azar y sin reposición 25 de ellos, ¿cuál es la probabilidad de que sólo 2 de ellos no cumplan con las especificaciones? Solución a. En cierto momento, la máquina produjo 38 rodamientos que no cumplían con las especificaciones. Determine el total de rodamientos producidos X: diámetro de rodamiento (en pulgadas). 3 0 01X N ; .( )→ µ = s = Los diámetros que cumplen con las especificaciones presentan un diá- metro comprendido entre 2.98 y 3.02 Haciendo uso del software Minitab, el procedimiento es el siguiente: Gra- ph> Probability> Distribution Plot> view Probability> OK> Distribution Normal> Mean=250> Sdev=15> Shaded Area> X value> Middle=2.98, 3.02> OK 2 98 3 02 0 9545P X( . . ) .≤ ≤ = Los que no cumplen se encuentran comprendidos en 1 0 9545 0 0455– . .= y representan los 38 rodamientos; el total de rodamientos es de: 0 0455 38x. ;= 835 16x . ,= es decir, equivalente a 836. b. Si de 10 000 rodamientos producidos por la máquina se escogen al azar y sin reposición 25 de ellos, ¿cuál es la probabilidad de que solo 2 de ellos no cumplan con las especificaciones? La probabilidad de que no cumplan es de 0.0455 X. Número de rodamientos 10 000 455 25H N M n( ; ; )= =→ = Capítulo 4. DistribuCiones De probabiliDaD 275 455 9545 2 23 2 0 213086 10000 25 P X( ) . = = = 18. La vida útil de dos tipos de máquinas industriales M y N se distribuyen en forma exponencial con media 9 años y de forma normal con media 8 y desviación estándar 1, respectivamente. a. ¿Cuál de las dos máquinas tiene mayor probabilidad de durar menos de 10 años? Sustente su respuesta. b. Si se selecciona 5 máquinas de tipo M solamente. ¿cuál es la probabili- dad de que la quinta máquina seleccionada sea la primera que tenga una duración superior a 10 años? Solución X: vida útil de las máquinas; 29 8 1M NX Exp X N( ); ( ; )→ b = → µ = s = a. ¿Cuál de las dos máquinas tiene mayor probabilidad de durar menos de 10 años? 10 0 6708 10 0 9772M NP X P X( ) . ; ( ) .< = < = La máquina N tiene mayor probabilidad de durar menos de 10 años. b. Si se selecciona 5 máquinas de tipo M solamente, ¿cuál es la probabili- dad de que la quinta máquina seleccionada sea la primera que tenga una duración superior a 10 años? F: Máquina funciona más de 10 años 10 0 3292MP F P X( ) ( ) .= > = 4 1 2 3 4 5 0 6708 0 3292 0 06665P F F F F F( ) ( . ) ( . ) .= = 19. Un sistema de producción opera con tres máquinas (A, B, C) que funcionan de manera independiente. El tiempo que tarda en fallar cada una de ellas es una variable aleatoria X con distribución exponencial con una media de 100 horas. a. ¿La mediana del tiempo de funcionamiento de la máquina A es superior a su promedio? b. ¿Cuál es la probabilidad de que falle al menos una de las tres máquinas en las primeras 120 horas de operación? Solución a. ¿La mediana del tiempo de funcionamiento de la máquina A es superior a su promedio? Sea X: tiempo para la falla (horas) 100X Exp ( )→ b = 100E X( ) = Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios276 0 50P X me( ) . ,≤ = de donde: 69 3me .= FALSO: ME E X( ),< distribución asimétrica sesgada a la derecha. b. ¿Cuál es la probabilidad de que falle al menos una de las tres máquinas en las primeras 120 horas de operación? Hallamos: p = P(falla) = 120 0 699P X( ) . ;< = P(no falla) 0 301.= P(al menos una máquina falle) = 1 – P(ninguna) 31 0 301 0 9727– ( . ) .= = 20. El tiempo que transcurre antes que una persona sea atendida en una ven- tanilla de un banco es una variable aleatoria que tiene una distribución exponencial con media de 5 minutos. ¿cuál es la probabilidad de que una persona sea atendida a lo más en dos minutos? Solución 2 0 3297P X( ) .≤ = 21. Dos variables aleatorias independientes X e Y tienen distribución gamma con parámetros: ( 100, 2); ( 400, 2)X Y→ Γ a = b = → Γ a = b = ¿Cuál de ellas es más asimétrica? Solución 100 2 200E X( ) × == 400 2 800E( ) × ==Y 2 2100 2 400 20 400 2 1600 40V X V( ) ; ( )= × = ⇒ s = = × = ⇒ s =Y 0 0 0 5 199 334 0 5 799 333 Me X P X x Me X Me P y Me ( ) ( ) . ( ) . ( ) ( ) . ( ) . = ≤ = ⇒ = = ≤ = ⇒ =Y Y Y 3 200199 334 3 800 799 3330 0999 0 05 20 40 C A X C A Y( . ) ( . ). .( ) . . .( ) .− −= = = = La distribución de X es más asimétrica que la de Y 22. El tiempo semanal X (en horas) durante el cual cierta máquina industrial no funciona tiene una distribución gamma con 3a = y 2.b = a. Si una máquina no ha estado funcionando más de 5 horas, hallar la probabilidad de que su tiempo de no funcionamiento sea de a lo más 9 horas. Solución Si una máquina no ha estado funcionando más de 5 horas, hallar la probabilidad de que su tiempo de no funcionamiento sea de a lo más 9 horas. Capítulo 4. DistribuCiones De probabiliDaD 277 X: tiempo que la máquina no funciona (está parada). 3 2X ( ; )→ Γ a = b = 5 9 0 370 0 680147 5 0 54 9 5 4 P X P X P X X ( ) .( ) . ( ) . / < = = > ≤ ≤ > = b. La pérdida, en dólares, para la operación industrial debido al no funcio- namiento de la máquina, está dada por: 230 2L X X= + . Calcule el valor esperado de L. Solución Paso previo: 23 126 2XE X V( ) , ( )= = × = , luego: 2 212 6 48E X( ) == + De ahí que: 230 2E L E X X() )( = + = 230 2E X E X( )( )× + × = 30 6 2 48 276× + × = dólares 23. Considere que el tiempo de supervivencia de un animal expuesto a una droga sigue una distribución gamma con 5 10:a = b = (horas). Determine la probabilidad de que el animal sobreviva a lo más 20 horas: Solución ( 20) 0.05265P X ≤ = 24. Suponga que la vida útil de cierto producto es una variable aleatoria que tiene distribución de Weibull con 0.6 y 4a = b = (cientos de horas): a. La vida media útil de ese artículo. Solución La vida media útil de ese producto: 11 4 2 67 4 1 50851 6 03E X( ) ( . ) . . = bΓ + = Γ = × = a b. La variación de la vida útil. Solución 2 2 211 1 16 4 33 2 67 16 6 94347 111 0952V X( ) [ ( . ) ( ( . )) ] . . = b Γ + − Γ + = Γ − Γ = × = a a c. La probabilidad de que el elemento dure más de 500 horas. Solución 500 0 3188P X( ) .> = Haciendo uso del software Minitab, el procedimiento es el siguiente: Gra- ph> Probability> Distribution Plot> view Probability> OK> Distribution Weibull> Shape=0.6> Scale=4> Shaded Area> X value> Right Tail=5> OK Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios278 25. La duración de un radio eléctrico tiene una distribución de Weibull con 2a = y 4b = (miles de horas). a. ¿Cuál es la probabilidad de que un radio dure más 9000 horas? b. ¿Cuál es la probabilidad de que un radio dure menos de 4500 horas? c. ¿Cuál es la probabilidad de que un radio dure entre 3500 y 8000 horas? Solución a. ¿Cuál es la probabilidad de que un radio dure más 9000 horas? 9 0 006330P X( ) .> = b. ¿Cuál es la probabilidad de que un radio dure menos de 4500 horas? 4 5 0 7179P X( . ) .< = c. ¿Cuál es la probabilidad de que un radio dure entre 3500 y 8000 horas? 3 5 8 0 4467P X( . .) .< < = 26. El tiempo de falla de un producto electrónico sigue una distribución de Weibull con 0 6 5. ;a = b = (en miles de horas). Determine la probabilidad de que el tiempo de falla del producto electróni- co sea como mínimo de 3000 horas. Solución 3 0 4790P X( ) .≥ = 27. Si las variables X e Y son independientes con distribuciones ji-cuadrado de 12 y 8 grados de libertad respectivamente, se pide: a. Hallar el valor de k tal que: 5518 35 0P X k[ . ( ) ] .=< + <Y Solución Por propiedad, se tiene que: 220X ( )( ) ;χ+ →Y luego: 2 2018 5 0 355P k( )[ . ] .< χ < = Capítulo 4. DistribuCiones De probabiliDaD 279 Haciendo uso del software Minitab, el procedimiento es el siguiente: Gra- ph> Probability Distribution Plot> view Probability> OK> Distribution> Chi-cuadrada> Degrees of freedom=20> Shaded Area> Left Right => X value=18.5> OK 0 4455 0 355 0 8. . . .+ = Hay que calcular 220 0 2P K( ) .χ > = 2 20 8 25 0K ( ; ) .= χ = b. Calcular: 0 8P X . < Y 8 12 120 8 0 8 0 8 1 2 0 6268 1212 8 8 P P P P F X X X /. . ( . ) . .( ; )/ < = < = < = < = Y Y Y 28. Las variables aleatorias X, Y y Z son independientes con distribuciones: 2 2 30 20 0 1X Z N( ) ( ), , ( , )→ χ →χ →Y . Calcular lo siguiente: a. Los límites del 90 % central de la distribución de X Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios280 Solución Haciendo uso del software Minitab, el procedimiento es el siguiente: Gra- ph> Probability> Distribution Plot> view Probability> OK> Distribution Chi-cuadrada> Degrees of freedom =30> Shaded Area> Middle > Proba- bility 1 =0.05> Probability 2=0.05> OK 0 9P a X b( ) . ;< < = a = límite inferior; b = límite superior; 18 49a . ;= 43 77b .= b. El valor de k tal que 0 08P Z k (| | ) .> = Solución Haciendo uso del software Minitab, el procedimiento es el siguiente: Graph> Probability> Distribution Plot> view Probability> OK> Distribu- tion Normal> Media=0> Desv Est =1> Shaded Area> Both Tail> Probabi- lity=0.08> OK El valor de K es 1.751 Capítulo 4. DistribuCiones De probabiliDaD 281 c. 200 45 2 1 30 P X /. . / < < Y Solución Haciendo uso del software Minitab, el procedimiento es el siguiente: Graph> Probability> Distribution Plot> view Probability> OK> Distribu- tion F> Numerator df=20> Denominator df=30> Shaded Area> Middle> X value 1=0.45> X value 2= 2.1> OK. La probabilidad es de 0.9348 d. El valor de c tal que: P(c < X + Y < 65) = 0.8715 Solución Haciendo uso del software Minitab, el procedimiento es el siguiente: Graph> Probability> Distribution Plot> view Probability> OK> Dis- tribution Chi-cuadrada> Degrees df=50> Shaded Area> Right Tail> X value=65> OK 0 07536 0 8715 0 94686 0 94686P X C . . . ( ) . + = + > =Y Estadística dEscriptiva y probabilidadEs. aplicacionEs En la ingEniEría y los nEgocios282 Para calcular el valor de C se utiliza el software Minitab con el siguiente procedimiento: Graph> Probability> Distribution Plot> view Probabi- lity> OK> Distribution Chi-cuadrada> Degrees df =50> Shaded Area> Right Tail> Probability=0.94686> OK El valor de 35c = 5. probleMas propuestos 1. Para cierto negocio por correo electrónico, la proporción de los pedidos procesados por día tiene la siguiente función de densidad de probabilidad. 2(1 ) , 0 1 ( ) 0 , − ≤ ≤ = x x f x c.c. ¿Cuál es la probabilidad de observar, en una semana de seis días labo- rables, más de dos días en los que la proporción de pedidos procesados sea menor al 80 %? Asumir independencia de ser necesario. 2 La empresa National Oil Company se dedica a operaciones de perforación exploratoria en el sureste de los Estados Unidos. Para financiar su funcio- namiento, los inversionistas forman sociedades que proporcionan financia- miento para perforar una cantidad fija de pozos petroleros. La experiencia en este tipo de exploraciones indica que el 15 % de los pozos perforados fueron productivos. Una sociedad recién formada proporciona el financia- miento para realizar perforaciones exploratorias en 12 lugares. Para hacer rentable la sociedad, por lo menos tres de los pozos de exploración deben ser productivos. ¿Cuál es la probabilidad que el negocio sea rentable? Capítulo 4. DistribuCiones De probabiliDaD 283 3. La función de distribución acumulativa de una variable aleatoria X está dada por: 3 0 4 1 4 4 128 2 1 4 x xF x P X x x x , ( ) ( ) , , < − = ≤ = + − < < > Si se realizan 6 observaciones independientes de la variable X, hallar la probabilidad de que en sólo una de ellas X tome valores negativos. 4. La producción de artículos de una empresa, presenta las siguientes carac- terísticas: • El 85 % de los artículos son buenos. • El 10 % de los artículos son para reprocesar. • El 5 % de los artículos son para desechar. La empresa realiza el control de calidad de la producción en forma periódi- ca, seleccionando un grupo de artículos cada vez. a. ¿Cuál es la probabilidad de encontrar 3 artículos para desechar cuando se inspeccionan 5 artículos en forma