Baixe o app para aproveitar ainda mais
Prévia do material em texto
UNIVERSIDADE DO VALE DO RIO DOS SINOS Ciências Exatas e Tecnológicas CEQ – Profª Karla Faccio 1 Material de apoio – Controle Estatístico da Qualidade Parte I Profa. Karla Faccio 1. INTRODUÇÃO Estuda-se a estatística para aplicar seus conceitos como auxílio na tomada de decisão diante de incertezas, justificando cientificamente as decisões. A estatística é uma parte da matemática aplicada que fornece métodos para a coleta, organização, descrição, análise e interpretação de dados e para a utilização dos mesmos na tomada de decisões. A Estatística é a ciência que estuda os fenômenos multicausais, coletivos ou de massa e procura inferir as leis que os mesmos obedecem. Método estatístico é um processo para se obter, apresentar e analisar características ou valores numéricos para uma melhor tomada de decisão em situações de incerteza. Os passos da metodologia estatística são os seguintes: • Definição do problema; • Formulação de um planejamento para a coleta das unidades de observação. É nessa fase que será escolhido o tipo de levantamento a ser utilizado. Podem existir dois tipos de levantamentos: o censitário, quando a contagem for completa, abrangendo todo o universo (população) e o levantamento por amostragem, quando a contagem for parcial; • Coleta, resumo e apresentação das unidades de observação ou de seus valores numéricos; • Análise dos resultados; • Divulgação de um relatório com as conclusões, de tal modo que estas sejam facilmente entendidas por quem as for usar na tomada de decisões. Como as informações provêm de um conjunto menor do que a população, erros são cometidos ao se fazer uma inferência. Esses erros podem ser quantificados por um valor numérico, denominado de probabilidade. O conhecimento das probabilidades associadas a uma situação fornece a base para o desenvolvimento de técnicas para a tomada de decisão. UNIVERSIDADE DO VALE DO RIO DOS SINOS Ciências Exatas e Tecnológicas CEQ – Profª Karla Faccio 2 A estatística descritiva e a probabilidade são ferramentas para a inferência estatística, a qual interpreta de duas maneiras os resultados obtidos a partir das amostras: ou fazendo uma estimação a respeito de uma característica da população cujo valor se desconhece ou realizando um teste sobre essa característica, da qual se afirma ter um determinado valor. Em geral, a estatística divide-se em dois grupos: estatística descritiva e indutiva. Descritiva: corresponde aos procedimentos relacionados com a coleta, elaboração, tabulação, análise, interpretação e apresentação dos dados, ou seja, inclui técnicas que dizem respeito à sintetização e à descrição de dados numéricos. Tais métodos podem ser gráficos e envolvem a utilização de recursos computacionais. Indutiva (ou inferencial): parte de uma ou mais amostras (subconjuntos da população) e conclui sobre a população. Utiliza técnicas como a teoria das probabilidades, inferência estatística, amostragem. Frequentemente utiliza-se o estudo da amostra do que da população, uma vez que na maioria das vezes não se dispõe de todos os elementos da população, além das informações serem menos dispendiosas e consumirem menos tempo no processamento dos dados. UNIVERSIDADE DO VALE DO RIO DOS SINOS Ciências Exatas e Tecnológicas CEQ – Profª Karla Faccio 3 Definições e conceitos úteis para o estudo da Estatística: - População: Conjunto de elementos com pelo menos uma característica em comum, ou seja, conjunto de todas as unidades elementares de interesse. Se a população é finita dizemos quem tem tamanho N. - Amostra: Uma amostra é um subconjunto de tamanho n da população em estudo usado para obter informação acerca do todo. Obtemos uma amostra para fazer inferências de uma população. Nossas inferências são válidas somente se a amostra é representativa da população. Por que tomamos uma amostra e não utilizamos a população toda? - Custo alto para obter informação da população toda. - Tempo muito longo para obter informação da população toda. - Algumas vezes impossível, por exemplo, estudo de poluição atmosférica. - Algumas vezes é logicamente impossível, por exemplo, em ensaios destrutivos (controle de qualidade de fósforos). - Parâmetro: É uma constante que caracteriza uma população, isto é, é uma medida que descreve uma característica de uma população (Exemplo: média (µ), desvio-padrão (σ), variância (σ2), proporção (π), etc). - Estimador: É uma constante que caracteriza uma amostra, isto é, é uma medida que descreve uma característica da amostra (Exemplo: média amostral )( __ X , desvio-padrão amostral (s), variância amostral (s2), proporção amostral (p), etc). Exemplos de parâmetros e seus respectivos estimadores: Parâmetros Estimadores Média populacional µ Média amostral X Desvio-padrão populacional σ Desvio-padrão amostral s Proporção populacional π Proporção amostral p - Experimento: Tudo aquilo que pode ser repetido sob idênticas condições. Tipos de experimento: - Determinístico: o resultado vai ser sempre o mesmo. - Aleatório: em cada repetição feita não tem como garantir o mesmo resultado. - Variáveis: Uma variável é uma característica de uma população que difere de um indivíduo para outro e da qual temos interesse em estudar. Desta forma, é a característica de interesse dos elementos da população. Cada unidade (membro) da UNIVERSIDADE DO VALE DO RIO DOS SINOS Ciências Exatas e Tecnológicas CEQ – Profª Karla Faccio 4 população que é escolhido como parte de uma amostra fornece uma medida de uma ou mais variáveis, chamadas observações. As variáveis podem ser classificadas em Qualitativas ou Quantitativas. Variáveis Qualitativas (ou Categóricas): são as características que não possuem valores quantitativos, mas, ao contrário, são definidas por várias categorias, ou seja, representam uma classificação dos indivíduos. Podem ser nominais ou ordinais. Variável Qualitativa Nominal: Consiste em nomes, rótulos ou categorias apenas. Os dados não podem ser ordenados. Exemplos: Tipo de defeito (Arranhão, Trinca, Quebrado, Amassado); Time preferido (Grêmio, Internacional, Flamengo); Religião (Católica, Protestante, Evangélica); Estado Civil (Casado, Solteiro, Viúvo, Divorciado); Nacionalidade; Sexo; etc. Variável Qualitativa Ordinal: As variáveis podem ser arranjadas em alguma ordem, mas diferenças entre os valores dos dados não podem ser determinadas. Exemplos: Classe Social (A, B, C, D, E); Grau de Satisfação (Satisfeito, Indiferente, Insatisfeito); Imagem da marca (Ótima, Boa, Regular, Ruim, Péssima); Classificação do Índice de Massa Corporal - IMC (baixo peso, normal, obesidade leve, obesidade severa, obesidade mórbida); Grau de importância (nenhuma, pouca, razoável, muito); Escolaridade; etc. Variáveis Quantitativas: são as características que podem ser medidas em uma escala quantitativa, ou seja, apresentam valores numéricos/quantidades. Podem ser contínuas ou discretas. Variável Quantitativa Discreta: Número de valores finitos ou uma quantidade enumerável e não assumem valores fracionários. São variáveis expressas por números inteiros (0, 1, 2, 3, 4,...). Exemplos: Número de peças não-conformes; Número de acidentes em uma rodovia; Número de filhos; Númerode produtos defeituosos; Número de assassinatos; Número de mensagens enviadas por minutos; etc. Variável Quantitativa Contínua: Infinitos valores possíveis que correspondem a alguma escala contínua que cobre um intervalo de valores sem vazios, interrupções ou saltos. Desta forma, seus resultados podem assumir qualquer valor ao longo de uma escala. São variáveis expressas por números reais. Exemplos: Diâmetro de uma peças (mm); Gasto diário de água (l); Peso (Kg); Altura (m); Temperatura (Grau Celsius); Tempo (min); etc. UNIVERSIDADE DO VALE DO RIO DOS SINOS Ciências Exatas e Tecnológicas CEQ – Profª Karla Faccio 5 2. ESTATÍSTICA DESCRITIVA A Estatística Descritiva pode ser estudada considerando os conjuntos de valores analisados como sendo amostras ou populações. Como o caso mais comum é a obtenção de amostras a notação apresentada será feita considerando os valores como resultados de amostragens. A diferença, considerada do ponto de vista da descrição dos dados, é apenas notacional. Assim o tamanho de uma população (quando finita) é representado, normalmente por N, enquanto que o tamanho de amostra é representado por n. Afora algumas exceções os valores calculados na amostra são representados por letras latinas enquanto que os correspondentes na população o são pelas mesmas letras só que gregas. Para facilitar o estudo da Estatística Descritiva os conjuntos de valores serão considerados como pequenos e grandes. Assim se um conjunto tiver 30 ou menos valores a análise será feita sem o agrupamento. Caso o conjunto tenha mais do que 30 valores então primeiramente será feito o agrupamento de acordo com o tipo de variável considerada. O valor 30 é apenas um ponto de referência escolhido arbitrariamente e dependendo da situação pode-se considerar o agrupamento com mais ou menos valores envolvidos. 2.1 Medidas de Tendência Central ou de Posição As medidas de tendência central são usadas para indicar um valor que tende a representar melhor um conjunto de números. As três medidas mais usadas são a média, a mediana e a moda. Um conjunto de valores (amostra) será representada por: x1, x2, ..., xn, onde n é o número de elementos do conjunto, isto é, o tamanho da amostra. 2.1.1 A MÉDIA (a) MÉDIA ARTIMÉTICA SIMPLES AMOSTRAL ( X ) A média aritmética é o resultado da divisão da soma de todos os valores da amostra pela quantidade total de valores. A média aritmética simples amostral do conjunto x1, x2, ..., xn é representada por X e calculada por: ( ) n xxx n x n n i i X +++ == ∑ = ...211 ___ OBS: __ X lê-se x barra e significa Média. ∑ = n i ix 1 lê-se somatório de xi, com i variando de 1 a n. Na Estatística, é comum utilizar as letras gregas para representar parâmetros populacionais e as letras latinas para representar estimadores amostrais. A média de uma população é representada pela letra grega µ, enquanto que na amostra é representada por X . UNIVERSIDADE DO VALE DO RIO DOS SINOS Ciências Exatas e Tecnológicas CEQ – Profª Karla Faccio 6 Algumas propriedades da média: • A média é afetada por todos os valores do conjunto, assim, se um número se modifica, a média também se modifica. • Multiplicando-se (ou dividindo-se) todos os valores de uma variável por uma constante, a média do conjunto fica multiplicada (ou dividida) por essa constante. • Somando-se uma constante a cada valor do conjunto, a média ficará aumentada do valor constante. Analogamente, extraindo-se um valor constante de cada valor do conjunto, a média também ficará diminuída desse valor. • A soma dos desvios dos números de um conjunto a contar da média é zero. Exemplo: 20 25 22 24 70 25 31 6 186 6 )257024222520( 6 654321 __ == +++++ = +++++ = XXXXXX X Exemplos: Calcular as médias dos seguintes conjuntos de dados: (a) 1 9 (b) 4 6 7 (c) 0,5 0,8 1,5 1,75 Para o conjunto em (a) tem-se: 5 2 )91( 2 21 __ = + = + = XX X Para o conjunto em (b) tem-se: 7,5 3 )764( 3 321 __ = ++ = ++ = XXX X Para o conjunto em (c) tem-se: ( ) 14,1 4 75,15,18,05,0 4 4321 __ = +++ = +++ = XXXX X Exercício: Considere os seguintes gastos (em reais) que 6 pessoas tiveram com compras de supermercado no último mês. R$612,50 R$608,00 R$640,00 R$624,80 R$920,00 R$631,00 a) Qual é o gasto médio? UNIVERSIDADE DO VALE DO RIO DOS SINOS Ciências Exatas e Tecnológicas CEQ – Profª Karla Faccio 7 (b) MÉDIA ARIMÉTICA PONDERADA (map): A fórmula para calcular a média aritmética supõe que cada observação tenha a mesma importância. A média ponderada considera que as informações não têm a mesma importância, ou seja, deve ser levado em conta o peso (w) das informações. A média aritmética ponderada do conjunto x1, x2, ..., xn, com pesos w1, w2, ..., wn, é representada por map e calculada por: ( ) ( )n nn n i i n i ii p www xwxwxw w xw ma +++ +++ == ∑ ∑ = = ... ... 21 2211 1 1 Onde wi é o peso da observação de ordem i. Exemplo: Consideremos que um professor informe a classe de que haverá dois exames parciais, valendo cada um 30% da nota e um exame final valendo 40%. Um aluno obtém desempenho 70 na primeira avaliação, 65 na segunda e 80 no exame final. Qual é a média de desempenho deste aluno? ( ) ( ) 50,72 40,030,030,0 40,08030,06530,070 1 1 = ++ ×+×+× == ∑ ∑ = = n i i n i ii p w xw ma Exercício: Considere uma mesma pesquisa de satisfação de uma determinada empresa prestadora de serviços que foi aplicada durante cinco anos consecutivos. A variável avaliada foi a nota (de 0 a 10) atribuída à Qualidade de um serviço por clientes do mesmo. As avaliações médias de cada ano estão descritas abaixo: ANO AVALIAÇÃO MÉDIA N° de respondentes 2009 8,4 100 2010 7,2 200 2011 8,0 150 2012 8,2 100 2013 8,5 100 Qual é a avaliação média dos 5 anos? UNIVERSIDADE DO VALE DO RIO DOS SINOS Ciências Exatas e Tecnológicas CEQ – Profª Karla Faccio 8 2.1.2 MEDIANA (me) A principal característica da mediana é dividir o conjunto de números ordenados em dois grupos iguais: a metade terá valores inferiores ou iguais à mediana e a metade terá valores superiores ou iguais à mediana. Assim, a mediana de um conjunto ordenado de valores, denotada por me, é definida como sendo o valor que separa o conjunto em dois subconjuntos do mesmo tamanho. Para calcular a mediana inicia-se ordenando os valores em ordem crescente. Para número ímpar de valores a mediana é o valor do meio. Para amostras com número par de unidades, a mediana é a média dos dois valores centrais. Como calcular a Mediana? - Se o n (tamanho da amostra) é ÍMPAR a mediana é o valor central do conjunto de dados ordenado. Tem-se: ( ) 2/1+= ne xm => Representa a posição da mediana no conjunto ordenado - Se o n (tamanho da amostra) é PAR a mediana é a média dos dois elementos centrais do conjunto de dados ordenado. Tem-se: ( ) ( )( ) 2 12/2/ ++ = nn e xx m => Representa a posição da mediana no conjunto ordenado Exemplo1: Para o conjunto: 15 18 21 32 45 46 49 A mediana é: ( ) 3242/17 === + xxme Ou seja, a mediana é o quarto valor na sequência ordenada de elementos. Se o conjuntoacima fosse: 15 18 21 32 45 46 Então a mediana seria: ( ) ( )( ) ( ) ( )( ) ( ) ( ) 50,26 2 3221 222 4312/62/612/2/ = + = + = + = + = ++ xxxxxx m nn e Exemplo2: Amostra Num. de elementos Dados ordenados Mediana _______________________________________________________________________________ 3 4 4 5 3 6 2 5 6 9 elementos -> ÍMPAR 2 3 3 4 4 5 5 6 6 4 2 4 3 1 9 9 3 4 8 elementos -> PAR 1 2 3 3 4 4 9 9 3,5 4 5 3 4 2 6 4 3 7 8 4 2 6 1 3 6 2 1 _______________________________________________________________________________ UNIVERSIDADE DO VALE DO RIO DOS SINOS Ciências Exatas e Tecnológicas CEQ – Profª Karla Faccio 9 Exercício: Considere os seguintes gastos (em reais) que 6 pessoas tiveram com compras de supermercado no último mês. R$612,50 R$608,00 R$640,00 R$624,80 R$920,00 R$631,00 b) Qual é o gasto mediano? 2.1.3 MODA (mo) A moda de um conjunto de valores é definida como sendo “o valor (ou os valores) do conjunto que mais se repete”, ou seja, é o ponto máximo de uma distribuição. Convém lembrar que a moda, ao contrário da mediana e da média, pode não ser única, isto é, um conjunto pode ser bimodal, trimodal, etc. ou mesmo amodal (sem moda). Se a moda existir será representada por mo. Exemplo1: Seja o conjunto de dados: 1 3 3 6 7 3 8 8 7 4 A moda deste conjunto de dados é mo = 3. Pois este valor se repete três vezes e qualquer outro valor se repete duas vezes ou menos. Exemplo2: Seja o conjunto de dados: 1 2 3 4 5 6 Este conjunto de dados é amodal, ou seja, não tem moda. Exemplo3: Seja o conjunto de dados: 0 0 0 0 0 200 A moda deste conjunto de dados é mo = 0. Pois este valor se repete cinco vezes. Exemplo4: Seja o conjunto de dados: 2 3 0 0 1 4 4 Este conjunto de dados é BIMODAL, ou seja, possui a mo = 0 e mo = 4. Exercício: Considere os seguintes dados referentes ao número de disciplinas que os alunos de CEQ estão matriculados no semestre 2017/2. Identifique a moda do conjunto de dados. UNIVERSIDADE DO VALE DO RIO DOS SINOS Ciências Exatas e Tecnológicas CEQ – Profª Karla Faccio 10 2.2 Medidas de Dispersão ou de Variabilidade 2.2.1 AMPLITUDE (r) A mais simples das medidas de dispersão é a amplitude, denotada por r, e definida como sendo a diferença entre os valores extremos do conjunto: r = Xmax - Xmin Exemplo 1: A amplitude do conjunto -5 4 0 3 8 10, vale: r = Xmax - Xmin = 10 – (-5) = 15. Exemplo 2: A amplitude do conjunto 4 8 9 2 8 5 6 3, vale: r = Xmax - Xmin = 9 – (2) = 7. Exercício: Considere os seguintes gastos (em reais) que 6 pessoas tiveram com compras de supermercado no último mês. R$612,50 R$608,00 R$640,00 R$624,80 R$920,00 R$631,00 d) Qual é a amplitude desses gastos? 2.2.2 VARIÂNCIA AMOSTRAL (s2) A medida de dispersão usual é a variância e principalmente sua raiz quadrada que é denominada de desvio-padrão. A variância amostral é denotada por s2 e definida como sendo a média dos quadrados dos desvios em relação a média aritmética. ( ) ( ) ( ) ( ) 1 ... 1 22 2 2 11 2 2 − −++−+− = − − = ∑ = n XXXXXX n XX s n n i i OBS: Quando se deseja a variância populacional (σ2), deve-se substituir n-1 por N na fórmula. Usualmente iremos utilizar a variância amostral. Exemplo: Calcule a variância para os seguintes dados: 2 4 6 8 10 Solução: Primeiro temos que calcular a média: ( ) 6 5 108642__ = ++++ =X Agora vamos aplicar a fórmula da variância: UNIVERSIDADE DO VALE DO RIO DOS SINOS Ciências Exatas e Tecnológicas CEQ – Profª Karla Faccio 11 10 15 40 15 )610()68()66()64()62( 1 )( 22222 1 2 __ 2 = − = − −+−+−+−+− = − − = ∑ = n XX s n i i X 2.2.3 DESVIO PADRÃO AMOSTRAL (s) O desvio padrão é simplesmente a raiz quadrada da variância. ( ) ( ) ( ) 1 ... 1 22 2 2 11 2__ − −++−+− = − − = ∑ = n XXXXXX n XX s n n i i X Como anteriormente, a substituição de n-1 por N produz a fórmula para o desvio padrão populacional (σ). Exemplo: Calcule o desvio padrão para os seguintes dados: -7 4 0 3 8 10 Primeiro temos que calcular a média: ( ) 3 6 1083047__ = +++++− =X Agora vamos aplicar a fórmula do desvio padrão: 07,6 16 184 16 )310()38()33()30()34()37( 1 222222 1 2__ = − = − −+−+−+−+−+−− = − − = ∑ = n XX s n i i X Exercício: Considere os seguintes gastos (em reais) que 6 pessoas tiveram com compras de supermercado no último mês. R$612,50 R$608,00 R$640,00 R$624,80 R$920,00 R$631,00 e) Qual é desvio padrão dos gastos? UNIVERSIDADE DO VALE DO RIO DOS SINOS Ciências Exatas e Tecnológicas CEQ – Profª Karla Faccio 12 2.2.4 COEFICIENTE DE VARIAÇÃO (CV) O coeficiente de variação é uma medida de variação útil para comparar conjuntos de dados diferentes. Ele é usualmente expresso em percentual. O coeficiente de variação é dado pelo quociente entre o desvio padrão e a média dos dados. __ X s Média ãoDesvioPadr CV == OBSERVAÇÃO: O conjunto de dados que tiver o maior CV dentre os demais é dito o conjunto mais heterogêneo, ou seja, o grupo com maior variabilidade. E, por sua vez, o conjunto de dados que tiver o menor CV dentre os demais conjuntos é dito o conjunto mais homogêneo. Exemplo: Entre os conjuntos de dados a seguir apresentados, qual apresenta maior variabilidade? Conjunto A Conjunto B 12 3 25 4 16 5 23 2 Solução: Conjunto A: 19 4 23162512 4 4321 = +++ = +++ = XXXX X A 06,6 3 110 3 )1693649( 3 )1923()1916()1925()1912( 14 )()()()( 1 )( 2222 2 __ 4 2 __ 3 2 __ 2 2 __ 11 2 __ == = +++ = −+−+−+− = = − −+−+−+− = − − = ∑ = XXXXXXXX n XX s n i i A 3187,0 19 06,6 === A A A X s CV Conjunto B: 5,3 4 2543 4 4321 = +++ = +++ = XXXX X B UNIVERSIDADE DO VALE DO RIO DOS SINOS Ciências Exatas e Tecnológicas CEQ – Profª Karla Faccio 13 29,167,1 3 5 3 )25,225,225,025,0( 3 )5,32()5,35()5,34()5,33( 14 )()()()( 1 )( 2222 2 __ 4 2 __ 3 2 __ 2 2 __ 11 2 __ === = +++ = −+−+−+− = = − −+−+−+− = − − = ∑ = XXXXXXXX n XX s n i i B 3688,0 5,3 29,1 === B B B X s CV Conclusão: O conjunto que possui maior variabilidade, ou seja, o conjunto mais heterogêneo é o B, pois é o conjunto com o maior CV = 36,88%. Exercício: Considere as seguintes medidas de uma mesma matéria-prima fabricada por dois fornecedores distintos: Fornecedor A: 9,0 8,9 7,1 6,0 Fornecedor B: 8,5 6,3 8,3 5,6 8,8 Qual fornecedor você escolheria? Justifique. UNIVERSIDADE DO VALE DO RIO DOS SINOS Ciências Exatas e Tecnológicas CEQ – Profª Karla Faccio 14 2.3 TABELAS OU DISTRIBUIÇÕES DE FREQUÊNCIAS Ao se trabalhar com grandes conjuntos de dados, em geral é útil organizá-los e resumi- los emuma tabela, chamada de distribuição de frequência. Uma distribuição de freqüência (ou tabela de freqüência) lista os valores dos dados (individualmente ou por grupos de intervalos), juntamente com suas freqüências correspondentes (ou contagens). Assim, uma distribuição de freqüência nos ajuda a entender a natureza da distribuição do conjunto de dados. A variável (ou conjunto) discreta (valores que são resultados de contagem) e a variável (ou conjunto) contínua (valores que são resultados de uma medida). Em geral variáveis discretas são agrupadas em distribuições por ponto ou valores e variáveis contínuas em distribuições por classes ou intervalos. A separação não é rígida e depende basicamente dos dados considerados. Poderá ser necessário usar uma distribuição por classes ou intervalos mesmo quando a variável é discreta. Distribuições de freqüência: Tipo de frequência: Símbolo Frequência Simples Absoluta fi Frequência Simples Relativa fri Frequência Acumulada Absoluta Fi Frequência Acumulada Relativa Fri Elementos de uma distribuição de frequências: a) Frequência simples relativa ou percentual (fri): é definida como o quociente entre a frequência simples absoluta (fi) e o total de dados n. fri = fi / n b) Frequência acumulada absoluta (Fi): a frequência acumulada absoluta da linha i é definida como sendo a soma das freqüências absolutas até a linha i. Fi = f1 + f2 + ... + fi c) Frequência acumulada relativa ou percentual (Fri): a frequência acumulada relativa da linha i é definida como sendo a soma das freqüências relativas até a linha i. Fri = fr1 + fr2 + ... + fri Ou, então, como sendo o quociente da frequência acumulada absoluta pelo total de dados. Fri = Fi / n UNIVERSIDADE DO VALE DO RIO DOS SINOS Ciências Exatas e Tecnológicas CEQ – Profª Karla Faccio 15 Exemplo de construção de uma Tabela de Frequências genérica: I X: Variável fi fri (%) Fi Fri (%) 1 X1 f1 1001 ⋅ n f f1 1001 ⋅ n f 2 X2 f2 1002 ⋅ n f f1 + f2 ⋅ + ⋅ 100100 21 n f n f 3 X3 f3 1003 ⋅ n f f1+ f2+ f3 ⋅ + ⋅ + ⋅ 100100100 321 n f n f n f ... ... ... ... ... ... K Xk fk 100⋅ n f k n 100% Total (∑ ) n 100% - - 2.3.1 DISTRIBUIÇÃO POR CLASSES OU INTERVALOS 2.3.1.1 Construção de distribuição de frequência para dados contínuos e para dados discretos com muitas categorias As principais etapas compreendem: 1. Determinar a amplitude dos dados: amplitude (r) = maior valor (Xmax) – menor valor (Xmin). 2. Estabelecer a quantidade de classes (k) ou intervalos de grupamento dos dados. O número de classes deve variar entre 5 e 15. Aconselha-se utilizar nk = , onde n é o número de observações. 3. Determinar a amplitude “r” de cada classe “i”. Sempre que possível é recomendável manter as amplitudes iguais. Aconselha-se dividir a amplitude dos dados (r) pelo número de classes (k), ou seja, ri = r / k. 4. Definir a primeira classe (linha) e, consequentemente, as demais, enquadrar os dados nas classes mediante contagem e apresentar os resultados em uma tabela ou gráfico. Em geral, utiliza-se a simbologia (|---), neste caso, está indicando um intervalo fechado à esquerda e aberto à direita. Também poderia ser utilizado o intervalo aberto à esquerda e fechado à direita (---|). Exemplo: O conjunto de dados abaixo representa o tempo (em minutos) que 45 operadores demoraram para realizar uma determinada tarefa. Agrupe os dados em uma distribuição de frequências. 6,5 4,0 7,1 8,3 5,4 7,6 9,0 15,7 16,7 6,4 5,0 8,5 5,7 7,7 7,2 12,4 7,1 5,5 9,7 4,4 7,0 6,3 8,3 6,9 5,7 7,6 7,9 7,9 6,0 8,2 10,4 9,9 3,9 9,8 8,2 5,6 7,9 6,4 7,4 7,0 13,0 8,7 6,4 6,7 7,4 UNIVERSIDADE DO VALE DO RIO DOS SINOS Ciências Exatas e Tecnológicas CEQ – Profª Karla Faccio 16 1. Amplitude dos dados: r = Xmax – Xmin = 16,7 – 3,9 = 12,8 2. Estabelecer o número de classes → 77,645 ≅=== nk classes. 3. Determinar a amplitude h de cada classe i → a amplitude de cada classe i é ri = r / k =12,8 / 7 = 1,83 ≅ 2. 4. Escrever as classes e contar os valores. Classe Tempo (min.) Freq. Simples Absoluta (fi) Freq. Simples Relativa (fri) Freq. Acumulada Absoluta (Fi) Freq. Acumulada Relativa (Fri) 1 3 ---| 5 4 8,9% 4 8,90% 2 5 ---| 7 15 33,3% 19 42,2% 3 7 ---| 9 18 40,0% 37 82,2% 4 9 ---| 11 4 8,9% 41 91,1% 5 11 ---| 13 2 4,4% 43 95,5% 6 13 ---| 15 0 0,0% 43 95,5% 7 15 ---| 17 2 4,4% 45 100,0% TOTAL 45 100,0% - - n = 45 por exemplo, a fr3: fr3 = f3 / n = 18 / 45 = 0,40 * 100 = 40,0% Verifica-se que 40,0% dos operadores executaram uma determinada tarefa depois de 7 minutos e até 9 minutos. a F5: F5 = f1 + f2 + f3 + f4 + f5 = 4 + 15 + 18 + 4 + 2 = 43 Verifica-se que 43 operadores executaram uma determinada tarefa em até 13 minutos. a Fr4: Fr4 = fr1 + fr2 + fr3 + fr4 = 8,9 + 33,3 + 40,0 + 8,9 = 91,1% Verifica-se que 91,1% dos operadores executaram uma determinada tarefa em até 11 minutos. UNIVERSIDADE DO VALE DO RIO DOS SINOS Ciências Exatas e Tecnológicas CEQ – Profª Karla Faccio 17 Gráfico da Distribuição de frequência por classes ou intervalos (HISTOGRAMA) Uma distribuição de frequências por classes ou intervalos é apresentada graficamente através de um diagrama denominado de histograma de frequências. Um histograma é um gráfico de retângulos justapostos onde a base de cada retângulo é a amplitude de cada classe e a altura é proporcional a frequência (simples ou relativa) de modo que a área de cada retângulo seja igual a frequência considerada. O gráfico abaixo ilustra o exemplo do tempo (em minutos) que 45 operadores demoraram para realizar uma determinada tarefa. Pelo histograma abaixo pode-se concluir que 33 operários, ou seja, 73,3% dos operários, executaram uma determinada tarefa entre 5 minutos a 9 minutos. 8,9% 33,3% 40,0% 8,9% 4,4% 0,0% 4,4% 0,0% 10,0% 20,0% 30,0% 40,0% 50,0% 3 ---| 5 5 ---| 7 7 ---| 9 9 ---| 11 11 ---| 13 13 ---| 15 15 ---| 17 Tempo de execução de uma tarefa Também pode ser construído um histograma utilizando-se as frequências acumuladas. Neste caso o diagrama resultante é denominado de ogiva. As figuras abaixo são exemplos de histogramas de frequências relativas acumuladas. UNIVERSIDADE DO VALE DO RIO DOS SINOS Ciências Exatas e Tecnológicas CEQ – Profª Karla Faccio 18 Exercício: O conjunto de dados amostrais a seguir lista o número de minutos que 50 usuários de Internet gastam na rede durante sua mais recente sessão. 7 7 11 17 17 18 19 20 21 22 23 28 29 29 30 30 31 31 33 34 36 37 39 39 39 40 41 41 42 44 44 46 50 51 53 54 54 56 56 56 59 62 67 69 72 73 77 78 80 83 a) Construa uma tabela de frequência por Classes para estes dados. fi fri Fi Fri Total b) Construa o Histograma para estes dados e conclua. c) Identifique e interprete as seguintes frequências: f6, fr4, F4, Fr3. UNIVERSIDADE DO VALE DO RIO DOS SINOSCiências Exatas e Tecnológicas CEQ – Profª Karla Faccio 19 2.3.2 DISTRIBUIÇÃO POR PONTOS OU VALORES 2.3.2.1 Construção de distribuição de frequência para dados discretos Na construção de uma distribuição de freqüência utilizando dados contínuos perde-se certa quantidade de informação porque os valores individuais perdem sua identidade quando são agrupados em classes. Isso pode ou não ocorrer com dados discretos, dependendo da natureza dos dados e os objetivos do analista. Considere um conjunto de valores resultados de uma contagem. Poderia ser, por exemplo, o número de irmãos dos alunos da disciplina de Controle Estatístico da Qualidade (CEQ). Número de irmãos dos alunos da disciplina de CEQ: 0 1 1 6 3 1 3 1 1 0 4 5 1 1 1 0 2 2 4 1 3 1 2 1 1 1 1 5 5 6 4 1 1 0 2 1 4 3 2 2 1 0 2 1 1 2 3 0 1 0 Esta coleção de valores não constitui informação, mas pode ser transformada em informação mediante sua representação em uma distribuição de freqüências por pontos ou valores. Para tal, coloca-se o conjunto em uma tabela em que a coluna da esquerda é representada pelos diferentes números ordenados (os pontos ou valores) e a coluna da direita pelo número de vezes que cada valor se repetiu (as freqüências simples ou absolutas). Para o exemplo, tem-se: Número de irmãos Frequência de alunos 0 7 1 21 2 8 3 5 4 4 5 3 6 2 TOTAL 50 Na tabela abaixo, estão ilustrados os cálculos das frequências relativas e acumuladas. Classe Número de irmãos fi fri Fi Fri 1 0 7 14,0% 7 14,0% 2 1 21 42,0% 28 56,0% 3 2 8 16,0% 36 72,0% 4 3 5 10,0% 41 82,0% 5 4 4 8,0% 45 90,0% 6 5 3 6,0% 48 96,0% 7 6 2 4,0% 50 100,0% TOTAL 50 100,0% - - UNIVERSIDADE DO VALE DO RIO DOS SINOS Ciências Exatas e Tecnológicas CEQ – Profª Karla Faccio 20 n = 50 por exemplo, a fr3: fr3 = f3 / n = 8 / 50 = 0,16 * 100 = 16,0% Verifica-se que 16,0% dos alunos da disciplina de CEQ possuem 2 irmãos. a F5: F5 = f1 + f2 + f3 + f4 + f5 = 7 + 21 + 8 + 5 + 4 = 45 Verifica-se que 45 alunos da disciplina de CEQ possuem no máximo 4 irmãos. a Fr4: Fr4 = fr1 + fr2 + fr3 + fr4 = 14,0 + 42,0 + 16,0 + 10,0 = 82,0% Verifica-se que 82,0% dos alunos da disciplina de CEQ possuem no máximo 3 irmãos. Gráfico da Distribuição de frequência por pontos ou por valores Uma distribuição de frequências por pontos ou valores é apresentada graficamente através de um diagrama de linhas ou colunas, onde a variável Xi é representada no eixo das abcissas (horizontal) e as frequências no eixo das ordenadas (vertical). Abaixo veja o diagrama de colunas simples da variável número de irmãos dos alunos da disciplina de CEQ. Pelo gráfico de colunas abaixo pode-se concluir que 36 alunos, ou seja, 72,0% dos alunos, possuem até 2 irmãos. Sendo que destes, 42,0% possuem 1 irmão, 14,0% nenhum irmão e os restantes (16,0%) possuem 2 irmãos. 14,0% 42,0% 16,0% 10,0% 8,0% 6,0% 4,0% 0,0% 10,0% 20,0% 30,0% 40,0% 50,0% 0 1 2 3 4 5 6 Número de irmãos UNIVERSIDADE DO VALE DO RIO DOS SINOS Ciências Exatas e Tecnológicas CEQ – Profª Karla Faccio 21 3.2.3 Medida de posição ou tendência central de uma distribuição de frequências 3.2.3.1 Média Aritmética para uma distribuição de freqüência A média aritmética de uma distribuição de frequências por pontos ou valores (dados discretos) ou por classes ou intervalos (dados contínuos) é dada por: ( ) n xfxfxf n xf X nn i n i i ⋅++⋅+⋅ = ⋅ = ∑ = ...22111__ Exemplo1: Cálculo da média do número de irmãos dos alunos da disciplina de CEQ. Classe Número de irmãos (xi) fi fixi 1 0 7 0 2 1 21 21 3 2 8 16 4 3 5 15 5 4 4 16 6 5 3 15 7 6 2 12 TOTAL 50 95 90,1 50 951__ == ⋅ = ∑ = n xf X n i ii irmãos Ou seja, o número médio de irmãos dos alunos da disciplina de CEQ é 1,90. Exemplo2: Cálculo da média de tempo que os operadores executam uma determinada tarefa. Classe Tempo (min.) fi Ponto médio da classe (xi) fixi 1 3 ---| 5 4 4 16 2 5 ---| 7 15 6 90 3 7 ---| 9 18 8 144 4 9 ---| 11 4 10 40 5 11 ---| 13 2 12 24 6 13 ---| 15 0 14 0 7 15 ---| 17 2 16 32 TOTAL 45 346 7,7 45 3461__ == ⋅ = ∑ = n xf X n i ii minutos Ou seja, o tempo médio que os operadores executam uma determinada tarefa é 7,7 minutos. 3.2.4 Medidas de variabilidade ou dispersão de uma distribuição de frequências 3.2.4.1 Variância UNIVERSIDADE DO VALE DO RIO DOS SINOS Ciências Exatas e Tecnológicas CEQ – Profª Karla Faccio 22 2__ 1 2 2 1 X n xf s n i ii − − ⋅ = ∑ = 3.2.4.2 Desvio padrão O desvio padrão é determinado extraindo-se a raiz quadrada da variância. 2__ 1 2 1 X n xf s n i ii − − ⋅ = ∑ = Exemplo1: Para o exemplo do número de irmãos dos alunos da disciplina de CEQ. Classe Número de irmãos (xi) xi 2 fixi 2 1 0 0 0 2 1 1 21 3 2 4 32 4 3 9 45 5 4 16 64 6 5 25 75 7 6 36 72 TOTAL 309 64,190,1 150 309 1 2 2__ 1 2 =− − =− − ⋅ = ∑ = X n xf s n i ii Exemplo2: No caso do tempo de execução de uma determinada tarefa pelos operadores. Classe Tempo (min.) fi Ponto médio da classe (xi) xi 2 fixi 2 1 3 ---| 5 4 4 16 64 2 5 ---| 7 15 6 36 540 3 7 ---| 9 18 8 64 1152 4 9 ---| 11 4 10 100 400 5 11 ---| 13 2 12 144 288 6 13 ---| 15 0 14 196 0 7 15 ---| 17 2 16 256 512 TOTAL 45 2956 81,27,7 145 2956 1 2 2__ 1 2 =− − =− − ⋅ = ∑ = X n xf s n i ii UNIVERSIDADE DO VALE DO RIO DOS SINOS Ciências Exatas e Tecnológicas CEQ – Profª Karla Faccio 23 EXERCÍCIOS (ESTATÍSTICA DESCRITIVA): 1. (2015/2) Os tempos de espera (em minutos) de clientes do Banco A (onde os clientes esperam em fila única) e do Banco B (onde os clientes esperam em filas individuais para três caixas diferentes) estão listados abaixo. Tempo de espera (em minutos) por Banco Banco A 6,1 6,4 6,4 7,3 7,6 6,4 Banco B 5,2 5,2 6,5 5,5 6,4 5,4 a) Calcule o tempo de espera médio para os clientes do Banco A e do Banco B. b) Calcule o desvio padrão do tempo de espera para os clientes do Banco A e do Banco B. c) Calcule o tempo de espera mediano para os clientes do Banco A e do Banco B. d) Qual banco apresenta o tempo de espera com maior variabilidade? Justifique com cálculo. 2. Um concurso realizado simultaneamente nos locais A, B e C, apresentou as médias: 70, 65 e 45, obtidos por 30, 40 e 30 candidatos, nessa ordem. Qual foi a média geral do concurso? 3. Uma pesquisa levantou os dados sobre o mercado imobiliário de determinado centro urbano, do ano 1990 a 1997, e os valores obtidos sobre o número de lançamentos (em mil unidades) e o total em vendas (em milhões de Reais) estão dispostos abaixo: Ano 1990 1991 1992 1993 1994 1995 1996 1997 Lançamentos 14,6 12,8 10,2 21,7 24,9 26,6 31,0 38,8 Vendas 5,1 4,0 4,5 10,1 12,6 9,7 10,2 11,7 a) Quem são as variáveis desse estudo? Quem é a amostra estudada? b) Calcule e interprete a média a mediana e a moda. 4. Os dados abaixo representam o número de crianças nascidas vivas, no 1º semestre do ano de 1994, segundo os dados colhidos pelo IBGE: Mês/1994 Jan Fev Mar Abr Mai Jun Nº de Nascidos Vivos 222779210667 249204 234322 242449 224171 Fonte: IBGE a) Calcule o valor da média e interprete. b) Calcule o valor da mediana e da moda e interprete. 5. Uma coleta de dados realizada com 15 empresas do setor têxtil foi realizada com o objetivo de verificar o número de funcionários existentes em cada uma delas, resultando nos seguintes dados: 1000 3600 110 820 232 850 320 200 120 2500 130 156 210 1500 112 UNIVERSIDADE DO VALE DO RIO DOS SINOS Ciências Exatas e Tecnológicas CEQ – Profª Karla Faccio 24 a) Calcule e interprete a média, mediana e moda para estes dados. b) Neste caso o valor da média é uma boa medida para representar este conjunto de informações? Por quê? 6. Uma pesquisa foi realizada com 12 empresas do ramo alimentício, com o objetivo de verificar o número de funcionários que estas possuem, os dados obtidos estão abaixo: 32 35 45 50 30 22 15 25 10 15 30 21 Calcule e interprete a média, mediana e moda. 7. Duas turmas de Estatística apresentam as seguintes estatísticas para as notas na prova G1: Turma A: média = 7,8 pontos e desvio-padrão = 1,4 pontos Turma B: média = 8,2 pontos e desvio-padrão = 2,5 pontos. Qual das duas turmas teve um desempenho mais homogêneo na prova G1? Justifique. 8. Os dados abaixo se referem o número de compras realizadas via Internet de uma amostra de 7 indivíduos do sexo feminino: 10 15 22 10 16 10 25 Calcule e interprete: a) Média b) Desvio-padrão c) Coeficiente de Variação 9. Um grupo de 100 estudantes tem uma estatura média de 163,8 cm e um coeficiente de variação de 3,3%. Qual o desvio – padrão para as estaturas desse grupo? 10. Abaixo, estão as rendas mensais (em Reais) de 10 empresários do setor calçadista do RS: 7500 3600 3300 5000 4100 5500 4000 3500 5600 10400 Calcule e interprete a renda média mensal e o desvio-padrão da renda mensal desses empresários. 11. João deseja calcular a média das notas que tirou em cada uma das quatro matérias a seguir. Calcule a média ponderada de suas notas, sendo que as duas primeiras provas valem 2 pontos e as outras duas valem 3 pontos: Inglês 1ª prova 6,5 2ª prova 7,8 3ª prova 8,0 4ª prova 7,1 UNIVERSIDADE DO VALE DO RIO DOS SINOS Ciências Exatas e Tecnológicas CEQ – Profª Karla Faccio 25 Português 1ª prova 7,5 2ª prova 6,9 3ª prova 7,0 4ª prova 8,2 História 1ª prova 5,4 2ª prova 8,3 3ª prova 7,9 4ª prova 7,0 Matemática 1ª prova 8,5 2ª prova 9,2 3ª prova 9,6 4ª prova 10,0 12. Determinar a moda dos seguintes conjuntos: a) 6, 5, 5, 7, 5, 6, 5, 6, 3, 4 e 5 b) 23, 28, 35, 17, 28, 35, 18, 18, 17, 18, 18, 18, 28, 28 e 18 13. Calcule a média e o desvio padrão para as vendas diárias. R$ 8100 R$ 9000 R$ 4580 R$ 5600 R$ 7680 R$ 4800 R$ 10640 14. Os dados abaixo são referentes às taxas de desemprego de 16 países separados em dois grupos: Grupo 1: Países da América do Sul e América do Norte: Brasil Uruguai Chile Argentina México Canadá EUA Venezuela 11.4 12.1 5.6 7.3 21.0 4.8 5.3 7.3 Grupo 2: Países da Europa: Espanha Portugal Itália Alemanha Suécia Inglaterra Holanda França 4.8 5.2 4.3 3.8 2.5 5.8 4.6 3.6 COMPARAÇÃO DAS TAXAS DE DESEMPREGO Grupo Taxa Média de desemprego Desvio-padrão do desemprego Coeficiente de Variação Grupo1: América do Sul e do Norte Grupo2: Europa UNIVERSIDADE DO VALE DO RIO DOS SINOS Ciências Exatas e Tecnológicas CEQ – Profª Karla Faccio 26 Qual dos dois grupos possui maior variabilidade, ou seja, qual é o grupo mais heterogêneo em relação à taxa de desemprego? Que medida você utilizou para chegar nesta conclusão? 15. (2015/2) Um feirante possuía 50 Kg de maçã para vender numa manhã. Começou a vender as frutas por R$ 2,50 ao quilo e, com o passar das horas, reduziu o preço em duas ocasiões para não haver sobrar. A tabela seguinte informar a quantidade de maçãs vendidas em cada período, bem como os diferentes preços cobrados pelo feirante. Período Preço por Kg Número de Kg de maçã vendido Até as 10hs 2,50 32 Das 10hs às 11hs 2,00 13 Das 11hs às 12hs 1,40 5 Naquela manhã, por quanto foi vendido, em média, o quilo da maçã? 16. (2015/1) Para comparar dois métodos de ensino, J e K, um professor tomou um conjunto de alunos, dividiu-os ao acaso em dois grupos e utilizou o método de ensino J para um grupo, e utilizou o método de ensino K para o outro grupo. Terminado o período de aula, o professor submeteu os dois grupos de alunos à mesma prova. Os alunos obtiveram, nessa prova, as notas apresentadas na tabela a seguir. Notas dos alunos segundo os dois métodos de ensino J 6 7,3 4 4,5 5 4 4 6 K 7,2 8 5 7 6,2 7,5 9 6,1 Nessas condições, julgue os itens a seguir (os itens devem ser comprovados matematicamente): a) As médias das notas dos métodos J e K são, respectivamente, 5,1 e 7,0. b) Na amostra observada, as notas dos alunos que foram ensinados pelo método de ensino J são mais homogêneas do que as notas dos alunos que foram ensinados pelo método de ensino K. Calcule os seguintes itens: c) A nota mediana dos alunos que foram ensinados pelo método J e pelo método K. d) A moda das notas dos alunos que foram ensinados pelo método J e pelo método K. 17. (2015/2) Em um estudo sobre consumo de combustível de automóveis do mesmo ano e modelo tiveram seu consumo observado. Quilômetros por litro 8 9 10 11 12 Quantidade de automóveis 19 21 5 3 2 Nessas condições, um automóvel desse ano e modelo faz quantos quilômetros a cada litro de combustível? UNIVERSIDADE DO VALE DO RIO DOS SINOS Ciências Exatas e Tecnológicas CEQ – Profª Karla Faccio 27 18. Uma pessoa comprou 4 lâmpadas diferentes e observou que, na média, o preço de uma lâmpada saía por R$ 8,00. Antes de efetuar o pagamento, aproveitou uma oferta e comprou mais duas lâmpadas, ambas de mesmo preço. Considerando-se as 6 lâmpadas compradas, o preço médio de cada uma ficou em R$ 7,50. Portanto, o valor de uma lâmpada da oferta era de quanto? 19. (2016/2) A nota final para uma disciplina de uma instituição de ensino superior é a média ponderada das notas A, B, e C, cujos pesos são 3, 1, e 2, respectivamente. Paulo obteve A = 6,0 e B = 3,0. Quanto ele deve obter em C para que sua nota final seja 6,0? 20. O tempo que uma máquina leva, em segundos, para executar certa operação em cada unidade produzida é sujeito a variações. Para verificar se as condições de funcionamento estão dentro das normas, registrou-se 12 vezes o referido tempo. Os resultados, em segundos, foram os seguintes: 29, 33, 36, 35, 36, 35, 40, 32, 37, 31, 30, 36 Calcule e interprete: a) Média b) Mediana c) Moda d) Desvio padrão 21. (2015/2) A seguir, lista-se uma amostra das notas de seis alunos nas disciplinas de Química e Biologia de uma determinada escola. Química: 6,6 5 5 7 6 4 Biologia: 7 8 6 7 5,6 9 Complete a seguinte tabela com as informações para cada disciplina: Disciplinas Moda Mediana Média Desvio-padrão Coeficiente de Variação (CV) Química Biologia Indique qual disciplina (Química ou Biologia) apresenta notas mais heterogêneas. Justifique matematicamente. 22. Uma coleta de dados realizada com 15 empresas do setor calçadista de Novo Hamburgo foi realizada com o objetivo de verificaro número de funcionários existentes em cada uma delas, resultando nos seguintes dados: 1500 3600 110 820 232 850 320 200 120 2500 130 156 210 1500 112 a) Calcule a média, mediana e moda para estes dados. b) Neste caso o valor da média é uma boa medida para representar este conjunto de informações? Qual seria a medida mais adequada e Por quê? UNIVERSIDADE DO VALE DO RIO DOS SINOS Ciências Exatas e Tecnológicas CEQ – Profª Karla Faccio 28 23. Abaixo estão relacionados os saldos médios de 48 contas de clientes do BB Novo S/A (em reais): 450 500 150 1000 250 275 550 500 225 475 150 450 800 275 600 750 375 650 150 500 1150 700 475 900 600 750 375 650 150 500 225 150 150 360 230 250 375 470 600 1150 270 250 300 275 350 950 800 500 a) Quem é a variável de estudo? Classifique-a. b) Construa uma tabela para estes dados considerando 5 faixas de valores. 24. (2015/2) O histograma abaixo ilustra o teor de nicotina (em miligramas) em 40 cigarros de certa marca: 2 2 5 18 8 5 0 5 10 15 20 0,7 -| 1,0 1,0 -| 1,3 1,3 -| 1,6 1,6 -| 1,9 1,9 -| 2,2 2,2 -| 2,5 Teor de nicotina (mg) em cigarros Construa a distribuição de frequências para o histograma acima e conclua. fi fri Fi Fri TOTAL UNIVERSIDADE DO VALE DO RIO DOS SINOS Ciências Exatas e Tecnológicas CEQ – Profª Karla Faccio 29 25. (2016/1) Foi feito um levantamento dos salários dos funcionários de uma empresa e, em seguida, foi elaborada uma tabela de frequências com os valores da variável salário (R$) em classes. Complete a tabela de frequências abaixo. Salário (R$) fi fri Fi Fri |- 10,0% |- 20 |- 40 50,0% |- 8 3350 |- 3950 3950 |- 4550 2,5% TOTAL - - 26. (2015/2) O histograma abaixo descreve as notas de 60 alunos no exame final de um curso elementar de estatística: 5,0% 5,0% 8,3% 6,7% 16,7% 21,7% 28,3% 8,3% 0% 5% 10% 15% 20% 25% 30% 1,0 |- 2,1 2,1 |- 3,2 3,2 |- 4,3 4,3 |- 5,4 5,4 |- 6,5 6,5 |- 7,6 7,6 |- 8,7 8,7 |- 9,8 Notas em uma disciplina de Estatística Construa a distribuição de frequências para o histograma acima e conclua. fi fri Fi Fri TOTAL UNIVERSIDADE DO VALE DO RIO DOS SINOS Ciências Exatas e Tecnológicas CEQ – Profª Karla Faccio 30 RESPOSTAS: 1. a) Banco A = 6,7 Banco B = 5,7 b) Banco A = 0,60 Banco B = 0,5933 c) Banco A = 6,4 Banco B = 5,45 d) CVA = 8,96% e CVB = 10,41% Logo, o banco que apresenta tempo de espera com maior variabilidade é o Banco B, pois CVB > CVA. 2. 60,5 3. a) Variáveis: Lançamentos e Total em vendas Amostra: 8 anos b) Lançamentos: Em média foram lançadas 22,6 mil unidades neste período por ano. Metade do período foi lançada menos que 23,3 mil unidades e metade mais que 23,3 mil unidades Não tem moda. Total em vendas: Em média foram vendidos 8,5 milhões de reais neste período por ano. Metade do período foi vendido menos que 9,9 milhões de reais e metade mais que 9,9 milhões de reais Não tem moda. 4. a) O nº médio de crianças nascidas vivas por ano é de 230.598,7 crianças. b) Metade do período nasceu menos que 229.246,5 crianças vivas e metade mais que 229.246,5 crianças vivas. Não tem moda. 5. a) Em média estas empresas possuem 790,7 funcionários Metade das empresas possui menos que 232 funcionários e metade mais que 232 funcionários. Não tem moda b) “A média não é uma boa medida, pois é muito influenciada por valores extremos, a mediana seria uma medida mais representativa para este caso”. 6. Em média estas empresas possuem 27,5 funcionários Metade das empresas possui menos que 27,5 funcionários e metade mais que 27,5 funcionários. Os números de funcionários que ocorrem com maior frequência são 15 e 30 funcionários 7. CVA = 17,9% CVB = 30,5% CVA < CVB A turma A teve um desempenho mais homogêneo na prova G1, comparada com a turma B. 8. a) 4,15=X O Número médio de compras realizadas via Internet é de 15,4 compras. b) s = 6,1 UNIVERSIDADE DO VALE DO RIO DOS SINOS Ciências Exatas e Tecnológicas CEQ – Profª Karla Faccio 31 O Número médio de compras realizadas via Internet é de 15,4 compras com uma variação de 6,1 em torno da média. c) CV = 39,6¨% Existe uma variação de 39,6% ao redor do Número médio de compras realizadas via Internet. 9. s = 5,4 cm. 10. a) 00,5250$RX = A renda média doe empresários do setor calçadista do RS é de R$ 5250,00. b) s = R$ 2218,7 A renda média doe empresários do setor calçadista do RS é de R$ 5250,00 com uma variabilidade em torno da média de R$ 2218,70. 11. Média nota inglês = 7,4 Média nota português = 7,4 Média nota história = 7,2 Média nota matemática = 9,4 12. a) 5 b) 18 13. Média = R$7200,00 e Desvio Padrão = R$ 2283,94 14. COMPARAÇÃO DAS TAXAS DE DESEMPREGO Grupo Taxa Média de desemprego Desvio-padrão do desemprego Coeficiente de Variação Grupo1: América do Sul e do Norte 9,35 5,44 58,2% Grupo2: Europa 4,33 1,03 23,7% O grupo mais heterogêneo é o grupo 1, pois possui o maior CV (coeficiente de variação). E a medida utilizada foi o CV. 15. R$ 2,26 ao quilo. 16. a) Correto, pois 1,5=JX e 0,7=KX b) Errado, pois CVJ = 24,0% e CVK = 17,7%, logo as notas dos alunos que foram ensinados pelo método de ensino K são mais homogêneas, pois CVK < CVJ. c) meJ = 4,75 e meK = 7,1 d) moJ = 5,0 e moK = Amodal 17. 8,96 Km/l. 18. R$ 6,50. 19. 7,5 20. a) O tempo médio que a máquina leva, em segundos, para executar a operação é de 34,2 segundos. UNIVERSIDADE DO VALE DO RIO DOS SINOS Ciências Exatas e Tecnológicas CEQ – Profª Karla Faccio 32 b) Metade das máquinas levou para executar a operação menos de 35 segundos e metade mais de 35 segundos c) O tempo de execução da operação que ocorreu com maior freqüência foi de 36 segundos. d) Existe uma variação em torno da média de 3,2 segundos 21. Disciplinas Moda Mediana Média Desvio-padrão CV Química 5,0 5,5 5,6 1,1314 20,2% Biologia 7,0 7,0 7,1 1,257 17,7% A disciplina que apresenta notas mais heterogêneas é Química, pois CVQ > CVB. 22. a) Média: 824 Mediana: 232 Moda: 1500 b) Devido a grande variação dos dados a melhor medida seria a Mediana, pois esta não é influenciada por valores extremos. 23. a) Saldos médios das contas do cliente – Quantitativa contínua b) Saldos Médios Nº Contas % 150 ├ 350 17 35,4 350 ├ 550 15 31,3 550 ├ 750 7 14,6 750 ├ 950 5 10,4 950 ├| 1150 4 8,3 Total 48 100 24. Teor de Nicotina fi fri Fi Fri 0,7 ├ 1,0 2 5,0% 2 5,0% 1,0 ├ 1,3 2 5,0% 4 10,0% 1,3 ├ 1,6 5 12,5% 9 22,5% 1,6 ├ 1,9 18 45,0% 27 67,5% 1,9 ├ 2,2 8 20,0% 35 87,5% 2,2 ├ 2,5 5 12,5% 40 100,0% TOTAL 40 100,0% - - Conclusão: Verifica-se que 65,0% dos cigarros possuem entre 1,6 mg a 2,2 mg de nicotina. Apenas 10,0% possuem menos de 1,3 mg de nicotina. UNIVERSIDADE DO VALE DO RIO DOS SINOS Ciências Exatas e TecnológicasCEQ – Profª Karla Faccio 33 25. Salário (R$) fi fri Fi Fri 950 |- 1550 8 10,0% 8 10,0% 1550 |- 2150 20 25,0% 28 35,0% 2150 |- 2750 40 50,0% 68 85,0% 2750 |- 3350 8 10,0% 76 95,0% 3350 |- 3950 2 2,5% 78 97,5% 3950 |- 4550 2 2,5% 80 100,0% TOTAL 80 100,0% - - 26. Notas fi fri Fi Fri 1,0 ├ 2,1 3 5,0% 3 5,0% 2,1 ├ 3,2 3 5,0% 6 10,0% 3,2 ├ 4,3 5 8,3% 11 18,3% 4,3 ├ 5,4 4 6,7% 15 25,0% 5,4 ├ 6,5 10 16,7% 25 41,7% 6,5 ├ 7,6 13 21,7% 38 63,4% 7,6 ├ 8,7 17 28,3% 55 91,7% 8,7 ├ 9,8 5 8,3% 60 100,0% TOTAL 60 100,0% - - Conclusão: Verifica-se que 66,7% dos alunos tiraran com notas entre 5,4 até 8,7. Apenas 8,3% dos alunos tiraram notas acima de 8,7. E nota-se que 10,0% dos alunos tiraram notas entre 1,0 e menos de 3,2. UNIVERSIDADE DO VALE DO RIO DOS SINOS Ciências Exatas e Tecnológicas CEQ – Profª Karla Faccio 34 3. PROBABILIDADE O cálculo das probabilidades pertence ao campo da Matemática. Sua inclusão nesse estudo, cujo objetivo é essencialmente a Estatística, encontra explicação no fato de que a maioria dos fenômenos de que trata a Estatística é de natureza aleatória ou probabilística. Consequentemente, o conhecimento dos aspectos mais fundamentais do cálculo de probabilidades é uma necessidade essencial para o estudo da Estatística. 3.1 Experimento Aleatório (E) Experimentos aleatórios são aqueles que, mesmo repetidos várias vezes sob condições semelhantes, apresentam resultados imprevisíveis. Características dos experimentos aleatórios: 1. Podem ser repetidos indefinidamente sob as mesmas condições. 2. Não se pode adiantar um resultado particular, mas pode-se descrever todos os resultados possíveis. 3. Se repetidos muitas vezes apresentarão uma regularidade em termos de freqüência de resultados. Exemplos: lançamento de uma moeda, lançamento de um dado, aposta na loteria, disputa de par ou ímpar etc. Exemplos: Ao descrever um experimento aleatório deve-se especificar não somente que operação ou procedimento deva ser realizado, mas também o que deverá ser observado. (Note a diferença entre o E2 e o E3). E1: Joga-se um dado e observa-se o número obtido na face superior. E2: Joga-se uma moeda 4 vezes e o observa-se o número de caras obtido. E3: Joga-se uma moeda 4 vezes e observa-se a seqüência de caras e coroas. E4: Um lote de 10 peças contém 3 defeituosas. As peças são retiradas uma a uma (sem reposição) até que a última defeituosa seja encontrada. Conta-se o número de peças retiradas. E5: Uma lâmpada nova é ligada e observa-se o tempo gasto até queimar. E6: Lança-se uma moeda até que ocorra uma cara e conta-se então o número de lançamentos necessários. E7: Lançam-se dois dados e anota-se o total de pontos obtidos. E8: Lançam-se dois dados e anota-se o par obtido. 3.2 Espaço amostral (S) É o conjunto de todos os resultados possíveis de um experimento aleatório. Anota-se por S ou Ω. n(S) é o número de elementos do conjunto S, ou o número de resultados possíveis. Exemplo1: Seja o experimento: Efetivar 3 lançamentos de uma moeda (cara: c ou coroa: k) e observar a fase resultante. Qual o espaço amostral? Espaço amostral: S = {ccc,cck,ckc,kcc,ckk,kck,kkc,kkk} e n(S) = 8. UNIVERSIDADE DO VALE DO RIO DOS SINOS Ciências Exatas e Tecnológicas CEQ – Profª Karla Faccio 35 Exemplo2: Determinar o espaço amostral dos experimentos anteriores. S1 = {1, 2, 3, 4, 5, 6} S2 = {0, 1, 2, 3, 4} S3 = {cccc, ccck, cckc, ckcc, kccc, cckk, kkcc, ckck, kckc, kcck, ckkc, ckkk, kckk, kkck, kkkc, kkkk} S4 = {3, 4, 5, 6, 7, 8, 9 , 10} S5 = { t ℜ∈ / t ≥ 0 } S6 = {1, 2, 3, 4, 5, ...} S7 = {2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12} S8 = {(1, 1), (1, 2), (1, 3), (1, 4), (1, 5), (1, 6) (2, 1), (2, 2), (2, 3), (2, 4), (2, 5), (2, 6) (3, 1), (3, 2), (3, 3), (3, 4), (3, 5), (3, 6) (4, 1), (4, 2), (4, 3), (4, 4), (4, 5), (4, 6) (5, 1), (5, 2), (5, 3), (5, 4), (5, 5), (5, 6) (6, 1), (6, 2), (6, 3), (6, 4), (6, 5), (6, 6)} Exemplo3: No lançamento de um dado, o espaço amostral é S = {1,2,3,4,5,6} e o número de elementos de S é n(S) = 6. Exemplo4: Na jogada de uma moeda, o espaço amostral é S = {Ca, Co} e o número de elementos de S é: n(S) = 2. Exemplo5: Um experimento é o lançamento de uma moeda. Os possíveis resultados são cara ou coroa, então, S={cara, coroa}. Em dois lançamentos de uma moeda, sendo interessante observar a ordem dos resultados, os possíveis resultados são: 1) cara e cara, 2) cara e coroa, 3) coroa e cara e 4) coroa e coroa. O espaço amostral é S={(c,c), (c,k), (k,c) e (k,k)} e n(S)=4. 3.3 Eventos Chama-se de evento qualquer subconjunto do espaço amostral S de um experimento aleatório, ou seja, qualquer resultado do espaço amostral. n(A) é o número de resultados associados ao evento A. Seja A um evento. A probabilidade deste evento ocorrer é dada por P(A), que é um número entre 0 e 1. Quanto mais próxima a probabilidade estiver de 1, maior será sua chance de ocorrência. A um evento impossível atribui-se probabilidade 0, enquanto que um evento certo tem probabilidade 1. Exemplo1: no lançamento de uma moeda S = {cara, coroa}. Um evento de interesse A pode ser “obter cara no lançamento de uma moeda” e n(A)=1. No lançamento de um dado, o evento de interesse (A) pode ser obter face par e n(A)=3. Exemplo2: No lançamento de um dado, onde S = {1,2,3,4,5,6}, temos, por exemplo: - Evento A: Apareçam números pares, ou seja, A = {2,4,6} e n(A) = 3; - Evento B: Apareçam números ímpares, ou seja, B = {1,3,5} e n(B) = 3; - Evento C: Apareçam números maiores que 6, ou seja, C = ∅ e n(C) = 0; - Evento D: Apareça o número 4. ou seja, D = {4} e n(D) = 1. UNIVERSIDADE DO VALE DO RIO DOS SINOS Ciências Exatas e Tecnológicas CEQ – Profª Karla Faccio 36 3.4 Conceitos de Probabilidade Existem três formas de se definir probabilidade. A definição clássica, a frequencial e a axiomática. 3.4.1 Definição Clássica Seja S um espaço amostral formado por n(S) resultados igualmente prováveis. Seja A ⊆ S (A está contido em S) um evento com n(A) elementos. A probabilidade de A, denotada por P(A), é definida como sendo: )( )( )( Sn An AP = , 0 ≤ P(A) ≤ 1 Isto é, a probabilidade do evento A é o quociente entre o número de casos favoráveis e o número de casos possíveis. Exemplo: Calcular a probabilidade de no lançamento de um dado equilibrado obter-se: S = {1,2,3,4,5,6} n(S) = 6 a) Um resultado igual a 4. A = {4} n(A) = 1 então P(A) = n(A) / n(S) = 1 / 6 = 16,67% b) Um resultado ímpar. S = {1, 2, 3, 4, 5, 6} e n(S) = 6 B = {1, 3, 5} n(B) = 3 então P(B) = n(B) / n(S) = 3 / 6 = 50% 3.4.2 Definição Frequencial Seja E um experimento e A um evento de um espaço amostral S. Suponha-se que E seja repetido n vezes e seja fA o número de vezes que A ocorre nas n repetições de E. Então a freqüência relativa do evento A, anotada por frA, é o quociente: frA = fA / n = (número de vezes que A ocorre) / (número de vezes que E é repetido) Exemplo1: Uma moeda foi lançada 200 vezes e forneceu 102 caras. Então a freqüência relativa de “caras” é: frA = 102 / 200 = 0,51 = 51% Exemplo2: Um dado foi lançado 100 vezes e a face 6 apareceu 18 vezes. Então a freqüência relativa do evento A = {face 6} é: frA = 18 / 100 = 0,18 = 18% UNIVERSIDADE DO VALE DO RIO DOS SINOSCiências Exatas e Tecnológicas CEQ – Profª Karla Faccio 37 3.4.3 Definição Axiomática Seja E um experimento aleatório com um espaço amostra associado S. A cada evento A ⊆ S associa-se um número real, representado por P(A) e denominado “probabilidade de A”, que satisfaz as seguintes propriedades (axiomas): (i) 0 ≤ P(A) ≤ 1; (ii) P(S) = 1; (iii) P(AUB) = P(A) + P(B) se A e B forem eventos mutuamente excludentes*. * Eventos Mutuamente Excludentes (ou Disjuntos ou Exclusivos): Dois eventos A e B são denominados mutuamente exclusivos ou excludentes ou disjuntos, se eles não puderem ocorrer juntos, isto é, se A ∩ B = ∅ . Como A ∩ B = ∅ , então, substituindo na fórmula da adição, que será apresentada na sequencia, temos: ∅ P(A ∪ B) = P(A) + P(B) – P(A ∩ B) Então, P(A ∪ B) = P(A) + P(B) quando os eventos forem disjuntos ou mutuamente excludentes. 3.5 Operação com Eventos Pode-se realizar operações entre eventos da mesma forma que elas são realizadas entre conjuntos. Para apresentar os eventos utilizam-se os Diagramas de Venn, que representam os espaços amostrais e os eventos como círculos, quadrados, ou outra figura geométrica conveniente. Seja E um experimento com um espaço amostral associado S. Seja A um evento de S. É dito que o evento A ocorre se realizada a experiência, isto é, se executado E, o resultado for um elemento de A. Sejam A e B dois eventos de um mesmo espaço amostral S. Diz-se que ocorre o evento: 1. A união B ou A soma B, anotado por A ∪ B, se e somente se A ocorre ou B ocorre. 2. A produto B ou A interseção B, anotado por A ∩ B ou AB, se e somente A ocorre e B ocorre. UNIVERSIDADE DO VALE DO RIO DOS SINOS Ciências Exatas e Tecnológicas CEQ – Profª Karla Faccio 38 3. A menos B ou A diferença B, anota-se A - B, se e somente se A ocorre e B não ocorre. 4. Probabilidade Complementar: O complementar de A, anotado por __ A , AC ou ainda A’ se e somente se A não ocorre. Ou seja, a probabilidade complementar de A é o evento formado por todos os resultados do espaço amostral que não pertencem à A. A probabilidade de não ocorrência de A é descrita como P( __ A ) e é expressa da forma: P( __ A ) = 1 – P(A) 5. Eventos Independentes: Sejam A e B dois eventos de um espaço amostral S. A e B são ditos independentes se a probabilidade de um deles ocorrer não afetar a probabilidade do outro ocorrer, isto é, se: P(A/B) = P(A) ou P(B/A) = P(B) ou ainda se P(A ∩ B) = P(A) . P(B) Qualquer uma das três relações acima pode ser usada como definição de independência. 3.6 TEOREMAS 3.6.1 Teorema da adição O teorema da adição leva em conta a ocorrência do evento A ou do evento B ou de ambos os eventos e é denotada por P(A ∪ B) e dada por: P(A ∪ B) = P(A) + P(B) – P(A ∩ B) UNIVERSIDADE DO VALE DO RIO DOS SINOS Ciências Exatas e Tecnológicas CEQ – Profª Karla Faccio 39 Quando os eventos são mutuamente excludentes (não tem elementos em comum), então a probabilidade de ambos é nula e o termo P(A ∩ B) será zero. Se A e B são mutuamente excludentes → P(A ∪ B) = P(A) + P(B) A extensão para três eventos será: O teorema da adição leva em conta a ocorrência do evento A ou do evento B ou do evento C ou de todos os três eventos e é denotada por P(A ∪ B ∪ C) e dada por: P(A ∪ B ∪ C) = P(A) + P(B) + P(C) – P(A ∩ B) – P(A ∩ C) – P(B ∩ C) + P(A ∩ B ∩ C) Se A e B e C são mutuamente excludentes → P(A ∪ B ∪ C) = P(A) + P(B) + P(C) Exemplo 1: Ao retirar uma carta do baralho considere os eventos: A – retirar um Ás e B – retirar uma carta do naipe Espadas. Qual a probabilidade de selecionar aleatoriamente uma carta deste baralho e ela ser um Ás ou uma carta do naipe de espadas? P(A ou B) = P(A) + P(B) – P(A e B) P(A ∪ B) = P(A) + P(B) – P(A ∩ B) 4/52 + 13/52 – 1/52 = 16/52 = 0,3077 UNIVERSIDADE DO VALE DO RIO DOS SINOS Ciências Exatas e Tecnológicas CEQ – Profª Karla Faccio 40 Exemplo 2: Ao retirar uma carta do baralho considere os eventos: A – retirar um Ás e B – retirar um Rei. Qual a probabilidade de selecionar aleatoriamente uma carta deste baralho e ela ser um Ás ou um Rei? Como A e B são mutuamente excludentes: P(A ∪ B) = P(A) + P(B) = 4/52 + 4/52 = 8/52 = 0,1538 Exercício 1: Numa urna existem 10 bolas numeradas de 1 a 10. Uma bola é retirada ao acaso. Determine a probabilidade: a) De um número ser par ou maior do que 4. b) De um número ser primo ou maior do que 8. UNIVERSIDADE DO VALE DO RIO DOS SINOS Ciências Exatas e Tecnológicas CEQ – Profª Karla Faccio 41 Exercício 2: De 100 pessoas que solicitaram emprego de programador de computador, durante o ano passado, 65 possuíam experiência anterior, 30 pessoas possuíam um certificado profissional. Vinte candidatos possuíam tanto experiência anterior como certificado profissional. Qual a probabilidade de um candidato selecionado ao acaso deste grupo tenha experiência anterior ou certificado profissional? 3.6.2 Teorema da multiplicação: Considerando-se dois eventos A e B de um mesmo espaço amostral, a probabilidade de A e B ocorrerem P(A ∩ B) é dada por: Se A e B são dois eventos dependentes então: P(A ∩ B) = P(A) . P(B/A) Onde a probabilidade condicional P(A/B) lê-se a probabilidade de B ocorrer dado que A já ocorreu. E quando A e B forem independentes → P(A ∩ B) = P(A) . P(B) A extensão para três eventos será: Se A e B e C são três eventos dependentes então: P(A ∩ B ∩ C) = P(A) . P(B/A) . P(C/ A ∩ B) E quando A e B e C forem independentes → P(A ∩ B ∩ C) = P(A) . P(B) . P(C) OBS: Dois eventos são independentes quando a ocorrência ou não de um evento não tem efeito algum na probabilidade de ocorrência do outro evento. Dois eventos são dependentes quando a ocorrência ou não-ocorrência de um evento afeta a probabilidade de ocorrência do outro. Exemplo 1: Em uma linha de produção a probabilidade de uma peça fabricada estar fora das especificações em relação a sua largura é 2%, em relação ao seu comprimento é 5%. Considere que a ocorrência de defeito na largura ou comprimento acontece de forma independente. Uma peça foi aleatoriamente selecionada desta linha de produção e seu comprimento e largura verificados pelo controle de qualidade, qual a probabilidade desta peça: Vamos considerar: A: defeito na largura A : largura perfeita B: defeito no comprimento B : comprimento perfeito UNIVERSIDADE DO VALE DO RIO DOS SINOS Ciências Exatas e Tecnológicas CEQ – Profª Karla Faccio 42 P(A) = 0,02 P( A ) = 0,98 P(B) = 0,05 P( B ) = 0,95 a) Apresentar defeito na largura e no comprimento. P(A ∩ B) = P(A) . P(B) = 0,02 x 0,05 = 0,001 b) Apresentar defeito apenas na largura. P(A ∩ B ) = P(A) . P( B ) = 0,02 x 0,95 = 0,019 c) A peça ser perfeita na largura e no comprimento. P( A ∩ B ) = P( A ) . P( B ) = 0,98 x 0,95 = 0,931 d) A peça apresentar pelo menos um destes defeitos. P(A ∩ B ) ou P( A ∩ B ) ou P(A ∩ B) = (0,02x 0,95) + (0,98 x 0,05) + (0,02 x 0,05) = 0,019 + 0,049 + 0,001 = 0,069 ou P(A ∪ B) = P(A) + P(B) – P(A ∩ B) = 0,02 + 0,05 – (0,02x0,05) = 0,069 Exemplo 2: Um lote de 10 peças produzidas por uma fábrica contém 8 peças boas e 2 defeituosas. Duas peças são retiradas aleatoriamente, sem reposição, pelo comprador do lote. Qual é a probabilidade de: a) As duas peças serem boas. P(B1 ∩ B2) = P(B1) . P(B2/B1) = 8/10 x 7/9 = 56/90 = 0,6222 b) A primeira peça ser boa e a segunda defeituosa. P(B1 ∩ D2) = P(B1) . P(D2/B1) = 8/10 x 2/9 = 16/90 = 0,1777 c) As duas peças serem defeituosas. P(D1 ∩ D2) = P(D1) . P(D2/D1) = 2/10 x 1/9 = 2/90 = 0, 0222 Exemplo 3: Uma urna contém 10 bolas, sendo 7 amarelas e 3 verdes. Se uma amostra de 2 bolas for selecionada ao acaso, sem reposição, qual é a probabilidade de que: a) Ambas sejam verdes. P(V1 e V2) = P(V1 ∩ V2) = P(V1 ∩ V2) = P(V1) . P(V2/V1) = 3/10 . 2/9 = 6/90 b) Ocorra uma de cada cor. P[(V1 ∩ A2) ∪ (A1 ∩ V2)] = P(V1) . P(A2/V1) + P(A1) . P(V2/A1) = = 3/10 . 7/9 + 7/10 . 3/9 = 42/90 UNIVERSIDADE DO VALE DO RIO DOS SINOS Ciências Exatas e Tecnológicas CEQ – Profª Karla Faccio 43 Exercício 1: Considere uma urna que contem 15 bolas, das quais 9 são azuis e 6 são verdes. a) Duas bolas são retiradas, sem reposição, qual a probabilidade de retirar a primeira bola azul e a segunda verde. b) Duas bolas são retiradas, com reposição, qual a probabilidade de retirar a primeira bola azul e a segunda verde. c) Três bolas são retiradas, sem reposição, qual a probabilidade de retirar as duas primeiras bolas verdes e a terceira ser azul. d) Duas bolas são retiradas, sem reposição, qual a probabilidade de ocorrer uma bola de cada cor. Exercício 2: João tem dois velhos automóveis. Nas manhãs frias, há 20% de probabilidade de um deles não pegar, e 30% de outro não pegar. Em uma manhã fria, qual a probabilidade de: a) Nenhum dos automóveis pegar. b) Os dois automóveis pegarem. UNIVERSIDADE DO VALE DO RIO DOS SINOS Ciências Exatas e Tecnológicas CEQ – Profª Karla Faccio 44 c) Apenas um automóvel pegar. d) Ao menos um dos automóveis pegar. Exercício 3: As falhas de diferentes equipamentos são independentes uma das outras. Se há três equipamentos e suas respectivas falhas são: 2,5%, 3% e 4%. Em um determinado dia, calcule a probabilidade de: a) Todos falharem. (R: 0,00003) b) Nenhum falhar. (R: 0,90762) UNIVERSIDADE DO VALE DO RIO DOS SINOS Ciências Exatas e Tecnológicas CEQ – Profª Karla Faccio 45 3.7 Probabilidade Condicional Sejam A e B dois eventos de um espaço amostral S, associado a um experimento E, onde P(A) > 0. A probabilidade de B ocorrer condicionada a A ter ocorrido, será representada por P(B/A), e lida como: “probabilidade de B dado A” ou “probabilidade de B condicionada a A” ou “probabilidade de ocorrer o evento B, dado que tenha ocorrido o evento A”, e calculada por: )( )( )/( AP BAP ABP ∩ = ou P(A ∩ B) = P(A) . P(B/A) Exemplo: A probabilidade de um voo regular partir no horário é 0,83; a probabilidade deste voo chegar no horário é 0,82, e a probabilidade de que parta e chegue no horário é 0,78. Calcule: a) A probabilidade de o voo chegar no horário tendo partido no horário. b) A probabilidade de o voo ter partido o no horário dado que chegou no horário. Resolução: A: Voo partir no horário P(A) = 0,83 B: Voo chegar no horário P(B) = 0,82 A e B: Ambos (partir e chegar no horário) P(A ∩ B) = 0,78 a) 94,0 83,0 78,0 )( )( )/( == ∩ = AP BAP ABP a) 95,0 82,0 78,0 )( )( )/( == ∩ = BP BAP BAP Exercício. De 100 pessoas que solicitaram emprego de programador de computador, durante o ano passado, 65 possuíam experiência anterior, 30 pessoas possuíam um certificado profissional. Vinte candidatos possuíam tanto experiência anterior como certificado profissional. Calcule a probabilidade de um candidato que possui certificado profissional, selecionado aleatoriamente deste grupo, possuir também experiência anterior? UNIVERSIDADE DO VALE DO RIO DOS SINOS Ciências Exatas e Tecnológicas CEQ – Profª Karla Faccio 46 3.8 Teoremas da Probabilidade Total e de Bayes O conceito de probabilidade condicional pode ser utilizado para calcular a probabilidade de um evento simples A ao invés da probabilidade da interseção de dois eventos A e B. Para tanto é necessário o conceito de partição de um espaço amostral. Definição: Dizemos que os eventos B1, B2, ... , Bk formam uma partição do espaço amostral S se e somente se: i) Bi ∩ Bj =∅ , para todo i ≠ j; ii) B1 ∪ B2 ∪ ... ∪ Bk = S; iii) P (Bi) > 0, para todo i. OBS: Na figura abaixo verifica-se que o B9 não traz informação para o evento A, logo B9 não é uma partição de A. Exemplo: Considere o espaço amostra obtido pelos números das faces no lançamento de um dado equilibrado e sejam os eventos: B1 = {1, 2, 3}, B2 = {4, 5} e B3 = {6} Então, pode-se verificar facilmente que os eventos acima formam um partição do espaço amostral S = {1, 2, 3, 4, 5, 6}. UNIVERSIDADE DO VALE DO RIO DOS SINOS Ciências Exatas e Tecnológicas CEQ – Profª Karla Faccio 47 3.8.1 Teorema da Probabilidade Total Seja S um espaço amostral e B1, B2, ... , Bk uma partição de S e A um evento qualquer. Então, A = (A ∩ B1) ∪ (A ∩ B2) ∪ ... ∪ (A ∩ Bk) Alguns destes conjuntos (A ∩ Bi) poderão ser vazios, mas isto não representa nenhum problema na decomposição de A. O importante é que todos os conjuntos (A ∩ B1), (A ∩ B2), .... , (A ∩ Bk) são dois a dois mutuamente excludentes ou disjuntos. Por isto, pode-se aplicar a propriedade da adição de eventos mutuamente excludentes ou disjuntos e escrever: P(A) = P [(A ∩ B1) ∪ (A ∩ B2) ∪ ... ∪ (A ∩ Bk)] = = P(A ∩ B1) + P(A ∩ B2) + ... + P(A ∩ Bk) = Mas cada um dos termos P(A ∩ Bi) pode ser escrito na forma: P(A ∩ Bi) = P(Bi) . P(A/Bi), pela definição de probabilidade condicional, obtém-se então o denominado teorema da probabilidade total: P(A) = P(B1) . P(A/B1) + P(B2) . P(A/B2) + ... + P(Bk) . P(A/Bk) P(B1 ∩ A) P(Bk ∩ A) P(Bk ∩ A) Logo, P(A) = ∑ = ⋅ k i BiAPBiP 1 )/()( Exemplo: Uma urna contém 3 bolas brancas e 2 amarelas. Uma segunda urna contém 4 bolas brancas e 2 amarelas. Escolhe-se ao acaso uma urna e dela retira-se também ao acaso, uma bola. Qual é a probabilidade de que seja branca? Solução: Evento A = Bola Branca Evento B1 = Urna 1 Evento B2 = Urna 2 P(A) = P(B1) . P(A/B1) + P(B2) . P(A/B2) = 1/2 . 3/5 + 1/2 . 4/6 = 19/30 UNIVERSIDADE DO VALE DO RIO DOS SINOS Ciências Exatas e Tecnológicas CEQ – Profª Karla Faccio 48 Exercício: Uma determinada peça
Compartilhar