Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 AULAS DE ESTATÍSTICA: Edson Diniz Ferreira Filho 2 Sumário Sobre a Estatística................................................................................................................5 1. Introdução à Estatística Descritiva....................................................................................6 1.1 Alguns Conceitos Básicos...............................................................................................6 1.2 Variáveis .........................................................................................................................7 1.3 Indicadores......................................................................................................................8 1.3.1 Dados Absolutos ..........................................................................................................9 1.3.2 Dados Relativos............................................................................................................9 1.3.2.1 Coeficientes................................................................................................................9 1.3.2.2 Taxas..........................................................................................................................9 1.3.2.3 Índices.......................................................................................................................10 1.4 Apresentação Tabular de Dados....................................................................................11 1.4.1 Elementos Essenciais..................................................................................................11 1.4.2 Elementos Complementares........................................................................................11 1.4.3 Sinais Convencionais...................................................................................................12 1.5 Séries Estatísticas e Gráficos.........................................................................................13 1.5.1 Série Temporal ou Cronológica...................................................................................13 1.5.2 Série Geográfica ou de Localização............................................................................14 1.5.3 Série Especificativa ou Categórica..............................................................................15 1.5.4 Gráfico em Setores......................................................................................................16 1.5.5 Séries Estatísticas Conjugadas...................................................................................17 1.5.6 Atividade......................................................................................................................20 1.6 Medidas de Tendência Central.......................................................................................22 1.6.1 Introdução....................................................................................................................22 1.6.2 Média Aritmética..........................................................................................................22 1.6.2.1 Média Aritmética de Valores Isolados Simples.........................................................22 1.6.2.2 Média Aritmética de Valores Isolados Ponderados ou com Frequência...................22 1.6.2.3 Média Aritmética de Valores Agrupados em Classe.................................................24 1.6.2.4 Propriedade da Média Aritmética..............................................................................25 1.6.3 Mediana...................................................................................................................... 26 1.6.3.1 Mediana de Valores Isolados................................................................................... 27 3 1.6.3.2 Mediana de Valores Agrupados em Classe.............................................................28 1.6.4 Moda ..........................................................................................................................29 1.6.4.1 Moda de Valores Isolados........................................................................................29 1.6.4.2 Moda de Valores Agrupados em Classe..................................................................30 1.6.5 Atividade......................................................................................................................30 1.7 Medidas de Dispersão ou Variabilidade ........................................................................33 1.7.1 Introdução ...................................................................................................................33 1.7.2 Variância......................................................................................................................33 1.7.2.1 Variância de Valores Isolados Simples.....................................................................34 1.7.2.2 Variância de Valores Isolados com Frequência ou Ponderados..............................35 1.7.2.3 Variância de Valores Agrupados em Classe............................................................36 1.7.3 Desvio Padrão.............................................................................................................36 1.7.4 Coeficiente de Variação de Pearson...........................................................................37 1.7.5 Atividade......................................................................................................................39 2. Introdução à Probabilidade..............................................................................................41 2.1 Modelos Matemáticos.....................................................................................................41 2.1.1 Modelos Matemáticos Determinísticos .......................................................................41 2.1.2 Modelos Matemáticos Não Determinísticos (ou Probabilísticos) ................................41 2.1.3 Atividade......................................................................................................................44 2.2 Distribuições de Probabilidade ......................................................................................45 2.2.1 Introdução....................................................................................................................45 2.2.2 A Distribuição Binomial de Probabilidade....................................................................45 2.2.2.1 Introdução.................................................................................................................45 2.2.2.2 Características da Distribuição Binomial...................................................................45 2.2.2.3 Cálculo da Probabilidade de Sucessos.....................................................................46 2.2.2.4 Cálculo da Esperança e Variância ...........................................................................46 2.2.2.5 Atividade..... ..............................................................................................................47 2.2.3 Distribuição de Poisson................................................................................................50 2.2.3.1 Introdução.................................................................................................................50 2.2.3.2 Calculo da Probabilidade do Número de Ocorrências..............................................512.2.3.3 Cálculo da Esperança e Variância............................................................................51 4 2.2.3.4 Atividade...................................................................................................................52 2.2.4 Aproximação da Distribuição Binomial pela Distribuição de Poisson..........................54 2.2.5 Distribuição Normal de Probabilidade..........................................................................55 2.2.5.1 Introdução.................................................................................................................55 2.2.5.2 A Curva Normal de Probabilidade.............................................................................55 2.2.5.3 A Curva Normal Padrão – a variável Z......................................................................58 2.2.5.4 Atividade...................................................................................................................67 3. Introdução à Inferência Estatística..................................................................................74 3.1 Introdução.......................................................................................................................74 3.2 Noções sobre Amostragem.............................................................................................74 3.3 Distribuições Amostrais...................................................................................................74 3.3.1 Distribuição de Médias Amostrais................................................................................75 3.3.1.1 Teorema do Limite Central........................................................................................76 3.4 Estimação da Média de uma População.........................................................................77 3.4.1 Introdução....................................................................................................................77 3.4.2 Intervalo de Confiança para a Média Populacional – ........................................77 3.4.2.1 Intervalo de confiança para média populacional , quando o desvio padrão populacional, é conhecido...................................................................................77 3.4.2.2 Intervalo de confiança para média populacional , quando o desvio padrão populacional, é desconhecido: A distribuição t (Student)....................................81 3.4.3 Atividade......................................................................................................................87 4. Correlação e Regressão Linear .......................................................................................90 4.1 Introdução.......................................................................................................................90 4.2 Regressão Linear Simples..............................................................................................90 4.3 O Gráfico de Dispersão...................................................................................................91 4.4 Estimação dos Parâmetros da Equação de Regressão.................................................92 4.5 O Coeficiente de Correlação Linear de Pearson – r.......................................................95 4.6 O Coeficiente de Determinação ou Explicação – R².......................................................97 4.7 Atividade.........................................................................................................................98 Bibliografia...........................................................................................................................99 5 Sobre a Estatística Estatística: Conceito e Divisão A necessidade de tratar e interpretar dados culminou com a origem da Estatística. Estatística Pode-se dizer sinteticamente que Estatística é a ciência dos dados. Ela envolve coleta, classificação, síntese, organização, análise, inferência e interpretação de dados. Estatística Descritiva A coleta, a organização, a sumarização e a descrição dos dados são tratadas pela estatística descritiva. Assim: a apresentação de dados através de uma tabela, a representação de dados através de um gráfico, o resumo de um conjunto de dados através de uma medida, são realizações da estatística descritiva. Estatística Indutiva ou Inferência Estatística A parte da estatística que tem como finalidade tirar conclusões (Inferir) sobre as características de uma população, tomando por base os dados de uma amostra, dela extraída, é chamada estatística inferencial ou estatística Indutiva. Logo, afirmar que 25% dos eleitores do país têm a intenção de votar em certo candidato, tomando por base uma amostra de 2500 eleitores, é realização da inferência estatística. Concluir baseado em uma amostra de 120 universitários, que a renda média de todos os 5320 estudantes da universidade está compreendida entre R$1800,00 e R$2400,00, com certo grau de certeza, é papel da estatística inferencial. O estudo dos dados da área da saúde usando a ciência estatística é, por muitos, chamado de Bioestatística. 6 1. Introdução a Estatística Descritiva 1.1 Alguns Conceitos Básicos População - O conjunto de todos os elementos que possuem pelo menos uma característica em comum, que possa ser contada, medida, pesada ou ordenada de algum modo e que sirva de base para as propriedades que se deseja investigar. Amostra – Subconjunto de uma população em estudo. Amostra representativa - Aquela que apresenta as mesmas características gerais da população da qual foi extraída Amostra probabilística – Aquela em que cada elemento da população tem probabilidade de ser escolhido para a mesma (amostra) Parâmetro - Uma característica numérica estabelecida para toda população Estatística ou um estimador - Uma característica numérica estabelecida para a amostra. Censo - Tipo de levantamento em que são investigados todos os elementos da população. Amostragem - Conjunto de técnicas utilizadas para extração de amostras de uma população. Variáveis - São características, propriedades ou atributos que podem ser observados ou (medidos) em cada elemento de uma população ou de uma amostra e deverá produzir um e apenas um resultado. Uma variável pode ser quantitativa ou qualitativa. Variável quantitativa – Aquela cujo resultado da observação gera uma quantidade, um número. Exemplo: A idade de uma pessoa. Variável qualitativa - Aquela cujo resultado da observação gera um atributo, uma qualidade. Exemplos: A cor dos olhos de uma pessoa; o sexo; o nível de escolaridade. Dados absolutos - São valores obtidos através de uma medida ou contagem sem qualquer manipulação. Dados relativos - São valores obtidos através da transformação de dados absolutos, geralmente através de razões (divisões). São dados relativos os coeficientes, as taxas e os índices. Rol – Conjunto de dados sob alguma ordenação (crescente ou decrescente). 7 1.2 Variáveis Variáveis são características, propriedades ou atributos que podem ser observados (ou medidos) em cada elemento de uma população ou de uma amostra e deve gerar um e apenas um resultado (dado). Exemplo: Para a população de professores de uma escola, podem-se definir, para cada um de seus elementos, variáveis como: - Tempo de serviço na profissão: cinco anos e dois meses; quatro anos e conco5 meses. - Idade: 25 anos e 3 meses; 28 anos e 1mês. - Estado civil: Casado, solteiro, viúvo. - Religião: católica, protestante, budista. - Sexo:masculino, feminino. - Número de filhos: 3, 2, 1. - Cor dos olhos: verde, preto. - Nível de escolaridade: Ensino Fundamental; Ensino médio; Ensino Superior - Classe social: classe A, classe B, classe C - Renda: R$1835,28 Uma variável pode ser classificada em: Qualitativa (que pode ser nominal ou ordinal) ou Quantitativa (que pode ser discreta ou contínua) Nominal Qualitativa Ordinal Variável Discreta Quantitativa Contínua 1.2.1 A Variável é Qualitativa – Quando a característica observada é um atributo, Isto é, quando o dado se apresenta sob o aspecto qualitativo. 8 Exemplos: Na população de professores acima referida, as variáveis: cor dos olhos, estado civil, religião, sexo, nível de escolaridade e a classe social são variáveis qualitativas por que exprimem ou uma qualidade, ou um atributo, ou uma categoria. 1.2.1.1 A variável qualitativa é nominal - Quando a característica é uma qualidade sem expressar nenhuma ordem hierárquica de classificação. Exemplos: Na população de professores acima referida, as variáveis, cor dos olhos, estado civil, religião e sexo são exemplos de variáveis qualitativas nominais. 1.2.1.2 A variável qualitativa é ordinal – Quando as características observadas denotam uma ordenação natural. Exemplos: Na população de professores acima referida, a classe social, e o nível de escolaridade são variáveis qualitativas ordinais. 1.2.2 A variável é Quantitativa – Quando a característica observada é uma quantidade. Exemplos: As variáveis: Número de filhos, tempo de serviço na profissão, Idade e renda, na população de professores acima referida, são variáveis quantitativas. 1.2.2.1 A variável quantitativa é discreta – Quando assume determinados valores no intervalo de observação. De certa forma, pode-se dizer que são todas as variáveis quantitativas cujos valores são obtidos a partir do procedimento de contagem. (são números inteiros). Exemplo: A variável, número de filhos, na população de professores acima referida, é uma variável quantitativa discreta. 1.2.2.2 A variável é quantitativa contínua – Quando pode assumir qualquer valor em um intervalo de observação. Nesse caso os valores assumidos pela variável são obtidos através, do procedimento de mensuração, de forma que os resultados são capazes de variações, as mínimas possíveis (contínuas). (são números fracionários). Exemplos: As variáveis: tempo de serviço na profissão, Idade e renda, na população de professores acima referida, são variáveis quantitativas contínuas. 1.3 Indicadores Em qualquer planejamento ou na tomada de decisão é indispensável que exista um sistema de informação, alimentado com dados absolutos que posteriormente 9 devem ser transformados em dados (valores) relativos. Dados absolutos ou relativos são costumeiramente chamados de indicadores. Os indicadores são classificados da seguinte forma: a) Dados Absolutos Indicadores Coeficientes b) Dados Relativos Taxas Índices 1.3.1 Dados Absolutos - São valores obtidos através de uma medida ou contagem, sem qualquer manipulação. Exemplo: A empresa Alfa possui 102 empregados, dos quais 50 são homens e 52 mulheres. Esses dados são resultados de simples contagem, são dados absolutos 1.3.2 Dados Relativos - São valores obtidos através da transformação de dados absolutos, geralmente através de razões (divisões). São dados relativos os coeficientes, as taxas e os índices. Quando há necessidade de se fazer comparações entre duas grandezas, pode-se obter tanto um índice quanto um coeficiente ou mesmo uma taxa. Esses termos apresentam significados diferentes, embora, na pratica, muitas vezes sejam utilizados erradamente como sinônimos. 1.3.2.1 Coeficientes – São razões entre valores de variáveis da mesma espécie numa relação de parte para o todo. No caso da empresa Alfa referida anteriormente, o coeficiente de empregados do sexo feminino é 52/102 = 0,51; enquanto que o coeficiente de empregados do sexo masculino é 50/102 = 0,49. 1.3.2.2 Taxas – São coeficientes multiplicados por uma potência de 10 (em geral 100 ou 1000) (por cento ou por mil), para facilitar a interpretação dos resultados. Logo a taxa de empregados do sexo feminino da empresa Alfa é 0,51x100 = 51% e a taxa de empregados do sexo masculino é 0,49x100 = 49%. 10 Alguns coeficientes são multiplicados por mil para se transformarem em taxa, é o caso da taxa de mortalidade. Lê-se, nesse caso, por exemplo, 11‰ (11 por mil). (Isto é: 11 mortos em cada 1000 habitantes). 1.3.2.3 Índices - São razões entre valores de variáveis de espécies ou características diferentes, portanto não existe relação de parte para o todo. Exemplos: Índice de renda per capita = Renda (R$) / População (hab) = 15200000,00 = R$1169,2 / cabeça, (1169,20 reais por pessoa). 13000 Índice de densidade demográfica = População(hab) / Área(km²) = 1254871 = habitantes = 924,0 hab / km² 1358 km² Índice de aluno por professor = N° de alunos / N° de professores 12354 = __Alunos__ = 42 alunos /professor 294 Professores 11 1.4 Apresentação Tabular de Dados As tabelas estatísticas são formas resumidas de apresentar dados. Possuem elementos essenciais e complementares. 1.4.1 Elementos Essenciais – São elementos fundamentais para a existência da tabela Título: Refere-se à parte escrita que precede a tabela e que contém o fenômeno observado, o local e a época em que foi registrado. Corpo: Conjunto de colunas e linhas que contém em ordem vertical e horizontal os dados sobre o fenômeno observado. Cabeçalho: Parte superior da tabela que especifica o conteúdo das colunas. Coluna indicadora: Parte da tabela que especifica o conteúdo das linhas. 1.4.2 Elementos Complementares – São elementos que apenas complementam a tabela. Fonte: Entidade responsável pelo levantamento dos dados e/ou pela sua elaboração. Nota: Observação de natureza geral, sobre todos os dados da tabela, tendo por finalidade esclarecer os dados, ou indicar a metodologia usada no levantamento, ou na sua elaboração. 12 Chamada: Observação de natureza específica, sobre determinada parte da tabela, destinada a esclarecer o dado. As chamadas são indicadas em algarismos arábicos, em ordem crescente, à esquerda das casas e à direita da coluna indicadora. 1.4.3 Sinais Convencionais– Os sinais convencionais são aqueles cuja presença já indica a razão de sua utilização. Convencionaram os órgãos responsáveis pelo fornecimento de dados estatísticos que toda casa, em uma tabela estatística, deve ter um dado, ainda que seja um sinal convencional. (convenção regulamentada pelo IBGE). Com essa exigência, alguns sinais foram convencionados. Exemplos: - (traço): usado quando não existir o dado pelo fato de o fenômeno não ter ocorrido. (Na tabela acima se não tivesse havido exportação em 1988, no lugar de 169666 seria colocado um traço) ... (três pontos): Neste caso sabe-se que o dado existe, isto é, o fenômeno ocorreu, porém não foi possível obter a informação até o momento da apresentação dos dados. 0 (zero): Quando o dado for menor que a metade da unidade de medida usada para expressão dos dados. (Se a unidade de medida é tonelada e o dado a ser apresentado em dada casa é de apenas 450 kg, pode-se neste caso usar o sinal convencional 0(zero) em lugar de 450 kg). x (letra x): Quando o dado for confidencial ou sua divulgação implicar em individualização da informação. 13 1.5 Séries Estatísticas e Gráficos No título de uma tabela estatística três informações são fundamentais: O fenômeno observado, o local de referência e a época de registro dos dados (fenômeno, local e tempo). As tabelas estatísticas foram classificadas em séries de acordo com a variação de cada um desses elementos. 1.5.1 Série Temporal ou Cronológica – quando os dados variam de acordo com o tempo, permanecendo fixos o fenômeno e o local. Exemplo: Fonte: IBGE 52 70 93 119 156 170 1950 1960 1970 1980 1991 2000 População do Brasil registrada nos censos demográficos: 1940 - 2000 Ano População (em milhões) 1940 41 Um gráfico que se adéqua bem a uma série cronológica com cinco ou mais dados é o gráfico linear. A partir de cinco informações o gráfico começa dá ideia da tendência. 14 Se houver, entretanto, menos de cinco informações na série temporal, um gráfico que melhor se adéqua é o de colunas, fazendo bem a comparação dos dados. Poucas informações ainda não dão ideia da tendência. Exemplo: 1.5.2 Série Geográfica ou de Localização – quando os dados variam de acordo com o local, permanecendo fixos o fenômeno e o tempo. Exemplo: País China Índia EUA Indonésia Brasil Fonte: IBGE População dos países mais populosos 275 225 170 do mundo - 1999 População(milhões) 1280 1010 O importante, neste caso, é estabelecer comparações, portanto um gráfico bem adequado para esse fim é o de colunas. 15 1.5.3 Série Especificativa ou Categórica - quando os dados variam de acordo com a espécie do fenômeno, permanecendo fixos o local e o tempo. Exemplo: Observa-se, também neste caso, que os dados são comparativos, adequando-se bem um gráfico de colunas. 16 1.5.4 Gráfico em Setores Quando se deseja comparar as partes entre si ou as partes com o todo, um gráfico que se enquadra bem é o de setores circulares, que mostra as proporções relativas. Entretanto, muitas informações podem congestionar demais o gráfico, dificultando a sua interpretação. Os dados da tabela a seguir totalizam a matrícula do Maranhão por nível e modalidade de ensino permirindo, assim, representa-los, também, por um gráfico em setores. 17 1.5.5 Séries Estatísticas Conjugadas – quando os dados apresentam mais de uma variação: tempo e local - tempo e fenômeno – local e fenômeno, ou local, tempo e fenômeno. As séries conjugadas são geralmente representadas por gráficos lineares ou de colunas. Os gráficos de setores só representam uma variável. Exemplo 1: 18 19 Exemplo 2 20 1.5.6 Atividade (Use o a opção de gráfico do programa Excel para esta atividade) 1. Um estudo com 80 passageiros que desembarcaram no aeroporto de Brasília revelou as origens apresentadas na tabela seguinte. Pede-se construir um gráfico de colunas e um de setores. Estado Número de passageiros São Paulo 23 Rio de janeiro 22 Bahia 14 Rio Grande do Sul 12 Paraná 7 Mato Grosso do Sul 2 Soma 80 2. Um grupo formado por 78 turistas estrangeiros passou o último verão em um hotel de Maceió- Alagoas. As nacionalidades dos turistas estão apresentadas na tabela seguinte. Pede-se construir um gráfico de barras e um de colunas. País Número de turistas Argentina 26 França 14 Inglaterra 8 Estados Unidos 26 Alemanha 7 3. As indústrias de Engrenagens Ltda., verificaram que uma amostra formada por 385 funcionários, apresentava a distribuição de escolaridade indicada na tabela a seguir. Construa um gráfico de colunas e um de setores. Escolaridade Número funcionários Superior 36 Médio 79 Fundamental 108 Outra 162 21 Soma 385 4. As vendas de um dia do mês de abril da lanchonete Quentão estão apresentadas na tabela seguinte por produto. Pede-se construir gráficos de barra, de coluna e de setores. Produto Número de turistas Sanduíches 15 Pizzas 65 Refrigerante 84 Salgado 48 Doce 13 5. A tabela seguinte mostra a relação existente entre altura (x) e peso (y) de uma amostra de indivíduos. Pede-se construir um gráfico de dispersão para os dados. Altura 1,72 1,83 1,56 1,65 1,74 1,75 1,68 1,70 1,88 Peso 65 79 54 62 84 70 62 65 78 6. A tabela seguinte mostra a relação existente entre o nível de colesterol, em mmol/l, (x), e o nível de triglicerídeos, mmol/l, (y), de uma amostra de nove pacientes em estudo na Itália.Pede-se construir um gráfico de dispersão para os dados. Colesterol 5,12 6,18 6,77 6,65 6,36 5,90 5,48 6,02 10,34 Triglicerídeos 2,30 2,54 2,95 3,77 4,18 5,31 5,53 8,83 9,48 7. A Associação Nacional de Produtores de Veículo de certo país apresentou os seguinte dados sobre a produção de veículos daquele país no período de 1987/99. (1000 veículos). Pede-se construir um gráfico linear. Ano 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 Produção 31 61 96 133 146 191 174 184 185 189 192 192 22 1.6 Medidas de Tendência Central 1.6.1 Introdução Até o momento observou-se que os valores de uma variável podem ser apresentados através de tabelas, representados sob a forma de gráficos, que são de extrema importância para análise e interpretação de dados. Entretanto, em muitas ocasiões, há a necessidade de representá-los por apenas um número. Esse número pode ser uma medida de tendência central. Estudaremos aqui três dessas importantes medidas: a média aritmética, a mediana e a moda. 1.6.2 Média Aritmética De forma bem simples pode-se conceituar a média aritmética de um conjunto de valores, como sendo a divisão entre: a soma de todos os valores e o número deles. Como os valores de uma variável podem- se apresentar de várias formas, para cada uma dessas formas há um procedimento de cálculo diferente, ainda que seja respeitado o conceito geral. 1.6.2.1Média Aritmética de Valores Isolados Simples Neste caso é possível observar os valores da variável individualmente isto é: x1, x2, x3, . . . , xn. Ademais os valores tem o mesmo grau de importância. Usando o conceito geral de média aritmética, denotada por , tem-se = = . Se os salários dos cinco diretores de certa empresa são: 5200,00; 5200; 6300,00; 6300,00; 7500,00 então, a média dos salários ou o salário médio dos diretores é: = = 6100,00 1.6.2.2. Média Aritmética de Valores Isolados Ponderados (ou com Frequência) Neste caso, os valores x1, x2, x3, . . . , xn, não têm o mesmo grau de importância, isto é, cada um tem o seu respectivo peso p1, p2, p3, . . . , pn ou freqüência de ocorrência, f1, f2, f3, . . . , fn. 23 Para o cálculo da média aritmética, neste caso, há que se levar em consideração o grau de importância de cada valor, ou seja, o seu peso ou sua freqüência. Dessa forma a média aritmética passa a ser calculada pela seguinte expressão: ou Exemplo 1: As notas abaixo foram obtidas por um candidato em um concurso para analista de certa instituição. Determinar a nota média do candidato, considerando que as disciplinas avaliadas apresentam os pesos considerados. Usando a expressão , obtém-se = = 8,1 Exemplo 2: Considere os salários dos empregados da empresa de Cosméticos Lívia Ltda, onde fi significa a freqüência de ocorrência do salário xi. 24 Usando a expressão , tem-se = = 2549,76 Ou seja, em média, cada empregado da empresa tem salário em torno de 2549,76. 1.6.2.3 Média Aritmética de Valores Agrupados em Classe Neste caso os valores não se encontram isolados, mas agrupados em classe do tipo: 20 |---- 30 com freqüência de ocorrência na classe igual a 5, por exemplo. Os valores extremos da classe são chamados respectivamente limite inferior (Li) e limite superior (Ls). A frequência com que ocorrem valores na classe é chamada de fi. No exemplo mencionado tem-se: Li = 20, Ls = 30 e fi = 5. Exemplo: Suponha que os empregados de certa empresa tenham as idades distribuídas de acordo com a tabela abaixo: Como os dados já se apresentam dessa forma, isto é, não apresenta as idades individuais, precise-se escolher em cada classe, uma idade que represente todas as idades nela contidas. O valor que melhor representa todas as idades da classe é seu ponto médio, PM, muitas vezes apelidado de x’i, que é a média aritmética dos limites da classe. Isto é: x’i = (Li +Ls)/2. Assim, na tabela acima tem-se x’1 = (18+22)/2 = 20 é o primeiro ponto médio; x’2 = (22+26)/2 = 24 é o segundo ponto médio, ... , x’6 = (40+47)/2 = 43,5 é o último ponto médio. Agora, há um representante de cada classe, com sua respectiva freqüência, o que permite utilizar a fórmula de valores isolados com frequência para o cálculo da média 25 neste caso, bastando para isso substituir o xi por x’i. Assim, a expressão para o cálculo da média de valores agrupados em classe toma a seguinte forma: Logo, a média das idades é: = 32,07 anos Obs: Como o ponto médio da classe, x’i, é apenas um representante dos valores, a média de valores agrupados em classe embute certa quantidade de erro. Uma forma de minimizar esse tipo de erro é usar pequenos intervalos nas classes. 1.6.2.4 Propriedade da Média Aritmética Propriedade: A soma algébrica dos desvios calculado em relação à média aritmética é igual a zero. Isto é: Demonstração: = 0 Um exemplo de funcionamento dessa propriedade: Considere os valores: 1320; 1350; 1500; 1580; 1750. Observa-se na tabela abaixo que a propriedade se verifica, isto é, a soma dos desvios calculados em relação à média é igual a zero. 26 1.6.3 Mediana Ordenados os valores de forma crescente, pode-se dizer que a mediana é a medida que separa o conjunto em dois subconjuntos, de igual quantidade de valores, de modo que o seu valor seja igual ou superior aos valores do 1° subconjunto e igual ou inferior aos valores do 2° subconjunto. Graficamente: 1.6.3.1 Mediana de Valores Isolados a) Se n, o número de elementos, for ímpar, a mediana será o elemento que ocupa a posição central e terá ordem (n+1)/2 b) Se n, o número de elementos, for par, a mediana será a média aritmética dos dois elementos centrais de ordem: n/2 e n/2 +1 Exemplo 1. Determinar a mediana do seguinte conjunto de valores: 85 ; 88 ; 95 ; 105 ; 110 ; 112 ; 118. Sendo n = 7, a mediana é o número que ocupa a posição central de ordem (7+1)/2 = 4°. Como os valores já estão ordenados a mediana, Md = 105. Exemplo 2. Determinar o salário mediano dos 61 empregados da empresa Alfa Consórcios, apresentados a seguir: Neste caso, n = 61 também é ímpar, portanto, o salário mediano é aquele que ocupa a posição central de ordem (61+1)/2 = 31°.Como os salários estão apresentados com Md Menor Maior valor valor 0 50 % 100 % 27 freqüência, precisa-se do auxílio da freqüência acumulada crescente(fac) para localizar o salário que ocupa a posição 31. Os valores estão ordenados, é fácil verificar. A freqüência acumulada fornece as posições de todos 61 valores. Há quatro salários iguais a 1200 que ocupam as 4 primeiras posições(veja a fac); há 12 salários iguais a 1350 que ocupam as 12 posições seguintes(da 5ª a 16ª posição, veja a fac); há 18 salários iguais a 1520 que ocupam as 18 posições seguintes(da 17ª a 34ª, veja a fac), este intervalo 17ª a 34ª inclui a posição 31 que é a posição da mediana, logo Md = 1520. Exemplo 3. Os dados a seguir são reativos às idades, em anos, dos oito empregados de certa micro-empresa: 18 ; 20 ; 21 ; 25 ; 28 ; 32 ; 36 ; 41. Determine a idade mediana. Agora há uma quantidade par de elementos, n = 8. Neste caso a mediana será a média aritmética das duas idades centrais de ordem 8/2 = 4ª e 8/2 + 1 = 5ª. Logo a mediana é Md = (25 + 28)/2 = 26,5 anos. Exemplo 4. Os pesos, em kg, dos 72 empregados de certa empresa estão apresentados a seguir. Determine o peso mediano. Como n = 72, um número par, a mediana será novamente a média aritmética dos dois valores de posições centrais, de ordem 72/2 = 36° e 72/2 +1 = 37°. Observando a freqüência acumulada, verifica-se que o peso 63 com freqüência simples 19 ocupa as posições de 18ª a 36ª, portanto, é o primeiro elemento central. E o peso 68 com freqüência de ocorrência 15 ocupa as posições de 37ª a 51ª é o segundo central. Então a Md = (63 + 68)/2 = 65,5 kg. 28 1.6.3.2 Mediana de Valores Agrupados em Classe Suponha que as informações que se dispõe sobre as alturas de um grupo de 71 estudantes, candidatos ao treinamento de basquete, estejam dispostas em classes de valores, como na tabela a seguir: Como não se dispõe das alturas individuais dos alunos, não há como utilizar os procedimentos vistos anteriormente para calcular a mediana. Neste caso, deve-se usar a seguinte expressão: Onde: Md = mediana Li = limite inferior da classe que contém a mediana n = número de elementos, tamanho da amostra, soma dasfreqüências simples h = amplitude ou intervalo da classe que contém a mediana fi = freqüência simples da classe que contém a mediana facant = freqüência acumulada na classe anterior à da mediana. Observa-se que a aplicação dessa fórmula requer a identificação imediata da classe onde se encontra a mediana, o que é feita usando a ordem ou posição da mediana n/2 e a freqüência acumulada (fac). Cálculo da mediana 1° Passo: Calcular a posição ou ordem da mediana 29 Sendo os valores agrupados em classe, a posição ou ordem da mediana será n/2, independente de n ser par ou ímpar, isto é, 71/2 = 35,5°. 2° Passo: Identificar a classe que contém a mediana, pela freqüência acumulada fac. Na primeira classe encontram-se os elementos de ordem 1ª a 5ª (fac), são os cinco primeiros números. Na segunda classe encontram-se os 9 elementos seguintes, de ordem 6ª a 14ª (fac). Na terceira classe estão os 12 elementos que se seguem, de ordem 15ª a 26ª (fac). Na quarta classe estão os 25 elementos seguintes, de ordem 27ª ao 51ª(fac). Entre estas ordens, 27ª e 51ª, está a 35,5ª que é a ordem da mediana, logo a Md está na 4ª classe, 165 |---- 175, indicada na tabela. Ou seja, a mediana é uma altura entre 165 e 175 cm. 3° Passo: Calcular a mediana usando a fórmula indicada 1.6.4 Moda A moda é definida como sendo o valor que apresenta a maior freqüência de ocorrência dentre todos do conjunto. 1.6.4.1 Moda de Valores Isolados Se 18 ; 19 ; 22 ; 22 ; 22 ; 22 ; 22 ; 23 ; 24 ; 26 ; 28 ; 32 ; 32 ; 32 ; 35 ; 35 ; 36 ; 37 ; 38 ; 38 ; 40 ; 41 e 42 são as idades, em anos, dos alunos de uma turma do curso de Administração, pode-se dizer que a idade modal ou a moda das idades é 22 anos, uma vez que a idade 22 anos ocorreu o maior número de vezes (f22 = 5), (isto é, a freqüência do número 22 é igual a 5), enquanto que f32 = 3, f35 = 2, f38 = 2 e a freqüência dos demais é igual a 1. De acordo com a definição acima, um conjunto de valores pode apresentar mais de uma moda e, neste caso, é chamado de bimodal, tri-modal, tetra-modal, etc. Considere os salários, em reais, dos empregados de uma pequena empresa a seguir: 800 ; 850 ; 900 ; 900 ; 900 ; 1200 ; 1300 ; 1450 ; 1520 ; 1750 ; 1750 ; 1800 ; 1800 e 1800. Como os salários 900 e 1800 apresentam as maiores freqüências (f900 = 3 e f1800 = 3), tem-se um conjunto bimodal em que Mo1 = 900, 00 e Mo2 = 1800, 00. 30 1.6.4.2 Moda de Valores Agrupados em Classe Se os valores estão agrupados em classe, não há com identificar o valor que ocorreu com maior freqüência. A priori, só é possível identificar a classe de maior freqüência que é a que contém a moda, Istoé: a classe modal. Naturalmente, pode haver mais de uma classe modal. Há várias fórmulas de cálculo da moda de valores agrupados. Daremos ênfase à fórmula de Czuber a seguir: Onde: Mo = moda; Li = limite inferior da classe modal; fmáx = maior freqüência simples fant = freqüência simples anterior à máxima; fpost = freqüência simples posterior à máxima; h = Amplitude ou intervalo da classe modal Exemplo: Considere os dados abaixo, relativos ao quociente de inteligência (QI), dos empregados de certa empresa. Determinar a moda dos QIs desses empregados ou o QI modal. 31 1.6.5 Atividade 1. Um gerente de lanchonete calculou a média aritmética de suas vendas mensais no primeiro semestre deste ano. Obteve um valor igual a R$1100,00. Sabendo que nos cinco primeiros meses as vendas foram iguais a R$880,00; R$660,00; R$625,00; R$1210,00; R$1540,00, calcule o valor das vendas no mês de junho. Resposta = R$1685,00 2. Um estudante da Faculdade de Administração de São Lourenço obteve as seguintes notas de acordo com a matéria. Calcule a média aritmética desse aluno considerando os pesos. Resposta = 8,2 Matéria Nota Peso Estatística 7,5 4 Cálculo 8,0 2 Mat. Financeira 8,5 1 TGA 9,0 3 3. Uma fábrica tem 100 operários. 50 recebem R$60,00; 20 recebem R$40,00; e 30 recebem R$50,00, por hora. Determine o salário médio por hora. Resposta = R$53,00 32 4. A direção de uma empresa pensa em instalar uma nova filial no Rio de Janeiro ou em São Paulo. Para escolha do local alguns critérios se destacam: Proximidade do centro consumidor, com peso 7; Benefícios fiscais oferecidos, com peso 9, e Custo das instalações, com peso 4. Ao passar pela avaliação as duas cidades obtiveram as seguintes notas nos critérios acima definidos. Com base na média ponderada, qual deveria ser a cidade escolhida? Resposta = Rio de Janeiro, que tem maior média ponderada: 7,1 Notas: Critério São Paulo Rio de Janeiro Proximidade do Centro Consumidor 9,0 6,0 Benefícios Fiscais Oferecidos 2,0 8,0 Custo das Instalações 8,0 7,0 5. Os valores referentes a sinistros ocorridos e, posteriormente, pagos por uma seguradora no mês passado foram: R$880,00; R$1540,00; R$2090,00; R$2860,00 e R$17600,00. Calcule a média aritmética e a mediana. Que comentários podem ser feitos sobre os valores encontrados. Resposta: Média aritmética = R$4994,00 Mediana = R$2090,00 Comentários: Ao usar a média como representante do conjunto, interpreta-se que em média cada sinistro custou em torno de R$4994,00. Neste caso estaríamos fazendo uma interpretação bastante longe da realidade uma vez que a média está muito distante de todos os valores que ela deveria representar. Isso corre por que a média aritmética é afetada pelos valores extremos, neste caso, notadamente pelo valor 17600,00 muito dispare em relação aos outros. Observe-se que, ao retirar o valor 17600,00, a média passa ser 1842,50, muito mais próxima dos seus representados. 33 Usando a mediana, a interpretação é que, aproximadamente, metade dos sinistros tem valor inferior 2090,00 e metade tem valor superior a 2090,00. Isso é extremamente verdadeiro. A mediana não é afetada pelos valores extremos. 6. A tabela abaixo apresenta a distribuição das importações de 50 empresas de plástico em toneladas. Pede-se calcular a média aritmética a mediana e moda. Quantidade importada - xi Nº de empresas - fi 50000 |----- 60000 5 60000 |----- 70000 10 70000 |----- 80000 20 80000 |----- 90000 10 90000 |----- 100000 5 Soma 50 Resposta: 75000; 75000; 75000 34 7. Os dados abaixo são relativos ao peso ao nascer de 77 recém- nascidos vivos em certa maternidade pública, em kg. Determine o peso médio, o peso mediano e o peso modal, dando suas respectivas interpretações. Classes de peso - xi fi 1,50 |------2,00 8 2,00 |------2,50 12 2,50 |------3,00 25 3,00 |------3,50 22 3,50 |------4,00 6 4,00 |------5,00 4 Soma 77 Resposta: a) média = 2,88 kg (Em média cada recém nascido nessa maternidade pesou em torno de 2,88kg) b) mediana = 2,87kg (aproximadamente 50% das crianças recém-nascidas tiveram peso ≤ 2,87 kg) c) moda = 2,91 (o peso mais freqüente das crianças recém nascidas está em torno de 2,91 kg) 1.7 Medidas de Dispersão ou Variabilidade 1.7.1 Introdução Considere os dados abaixo relativos a quatro conjuntos de dados: Observa-se que: No conjunto A, não há diferença entre os valores e a média que os representa, isto é, a dispersão é zero, a variabilidadeé zero. No conjunto B, existe diferença entre os valores e a média, mas são pequenas diferenças, isto é, a dispersão ou a variabilidade é próxima de zero. 35 No conjunto C, existe diferença entre os valores e a média, e essas diferenças já não são pequenas, são bastante consideráveis. No conjunto D, já se verifica que há grande diferença entre os valores e a média que os representa. Neste caso, há alta dispersão ou variabilidade entre os valores. Se o que se deseja medir é a variabilidade dos valores em relação à média, nada melhor que analisar os desvios de cada valor i em relação à média , isto é, = i - . Uma medida de dispersão ou variabilidade serve, exatamente, para determinar, de forma geral, o tamanho dessa variabilidade ou dispersão, isto é, o grau de homogeneidade ou heterogeneidade de um conjunto de valores. São várias as medidas de dispersão, absolutas e relativas, estudaremos as de maior utilização: Absolutas - Variância e Desvio padrão; Relativa – Coeficiente de variação. 1.7.2 Variância Como a soma dos desvios calculados em relação à média é zero, a variância é calculada levando em consideração à soma dos quadrados dos desvios. 1.7.2.1 Variância de Valores Isolados Simples Sejam x1, x2, x3, . . . xn e a sua média aritmética. a) Se os dados em referência são relativos a uma população, a variância populacional das n medidas é definida pela seguinte expressão: σ² = Obs: demonstra-se que: σ² = = , que simplifica as contas b) Se os dados em referência são relativos a uma amostra, a variância amostral das n medidas é definida pela seguinte expressão: s² = , Obs: demonstra-se que: 36 s² = , que simplifica as contas Exemplo1: Considere os dados a seguir: 25 ; 28 ; 32 ; 38 ; 41, relativos às idades, em anos, de cinco empregados de certa empresa. a) Se a empresa só tem cinco empregados, esses dados são relativos à população das idades dos empregados. Nesse caso usa-se a fórmula relativa à população. xi x²i 25 625 28 784 32 1024 38 1444 41 1681 Soma 164 5558 σ²= unidades quadradas. b) Se a empresa tem mais de cinco empregados, esses dados são relativos apenas à uma amostra das idades dos empregados. Nesse caso usa-se a fórmula relativa à uma amostra. s²= unidades quadradas. 1.7.2.2 Variância de Valores Isolados com Freqüência ou Ponderados Aqui os valores se apresentam da seguinte forma: Xi X1 X2 X3 , . . . , Xn fi f1 f2 f3 , . . . , fn Onde, fi é a freqüência de ocorrência do valor xi: 37 Neste caso, as fórmulas são adaptadas para utilização das freqüências de ocorrência e passam a ter as seguintes expressões: a) Se os dados em referência são relativos a uma população, a variância populacional das n medidas é definida pela seguinte expressão: , Onde, n = . Obs: demonstra-se que: , que simplifica as contas. Onde, n = . b) Se os dados em referência são relativos a uma amostra, a variância amostral das n medidas é definida pela seguinte expressão: , Onde, n = . Obs: demonstra-se que: , que simplifica as contas Onde, n = . Exemplo2: Considere os dados abaixo, relativos ao número de horas extras trabalhadas em dezembro, por 46 empregados de certa empresa. Calcular a variância, considerando que os dados são: a) de uma população b) de uma amostra. a) Considerando que os dados são de uma população: 38 unidades quadradas b) Considerando que os dados são de uma amostra = = unidades quadradas. 1.7.2.3 Variância de Agrupados em Classe Observação: para o cálculo da variância de valores agrupados em classe, usam-se as mesmas expressões utilizadas para valores isolados com freqüência, tanto no cálculo populacional como no cálculo amostral, basta usar o ponto médio da classe, x’i, no lugar de xi. 1.7.3 Desvio Padrão Viu-se no cálculo da variância que, todas as suas fórmulas levam em consideração a soma dos quadrados dos desvios, uma vez que a soma simples desses desvios é igual a zero. Isso significa que o resultado da variância está em unidade quadrada de medida. Para que se tenha uma medida de dispersão na mesma unidade original, resolveu-se extrair a raiz quadrada da variância, dando origem ao desvio padrão. Portanto, o desvio padrão (σ ou s) é igual à raiz quadrada da variância. Assim: a) No caso de desvio padrão de dados referentes a uma população tem-se: σ = b) No caso de desvio padrão de dados referentes a uma amostra tem-se s = Exemplo: No cálculo da variância dos exemplos 1 e 2 acima, tem-se: Exemplo 1: σ² = 35,76 unidades quadradas, então o desvio padrão é: σ = unidades. 39 s² = 44,7 unidades quadradas, então o desvio padrão é: s = = unidades Exemplo 2: σ² = 37,07 unidades quadradas, então o desvio padrão é: σ = unidades s² = 37,66 unidades quadradas, então o desvio padrão é: s = = unidades 1.7.4 Coeficiente de Variação de Pearson O desvio padrão é reconhecido como uma das medidas mais importantes de dispersão absoluta. Entretanto, por varias razões, não é possível comparar dispersão de grupos usando as medidas absolutas. Uma dessas razões é que as variáveis em estudo podem estar em unidades de medidas diferentes (não se pode comparar o desvio padrão das alturas (cm) de uma amostra de estudantes, com o desvio padrão dos pesos (kg) de outra amostra de estudantes, ou da mesma amostra. As medidas relativas de dispersão resolvem esse problema. Essa é uma das razões principais para priorizá-las. Estudaremos aqui uma das principais: O coeficiente de variação de Pearson (CV). Esse coeficiente é definido como a divisão entre o desvio padrão e a média, tanto em uma amostra como em uma população. No caso amostral tem-se: Onde: s = desvio padrão amostral e é a média da amostral Ao multiplicar essa relação por 100 (o que não é rigorosamente necessário), o coeficiente de variação toma conotação porcentual, o que facilita comparações, mesmo que as variáveis originais a comparar estejam em unidades de media diferentes. É evidente que menor coeficiente de variação significa menor dispersão entre os valores. Alguns autores sugerem regras empíricas para interpretação do coeficiente de variação. Exemplo: Se: CV < 15 %, tem-se baixa dispersão; Se: 15 % ≤ CV < 30 %, tem-se média dispersão; Se: CV ≥ 30%, há elevada dispersão 40 Exemplo: Considere os dados abaixo relativos às variáveis: Salário, Idade e Quociente de Inteligência (QI), de uma amostra de empregados de certa empresa. Analisemos o grau de dispersão das variáveis. Observe que a variável que apresenta a maior dispersão absoluta é o salário dos empregados (220), enquanto que a variável idade apresenta a menor (8), medidas pelo desvio padrão. Entretanto, não podemos comparar o desvio padrão do salário com o desvio padrão da idade. Ao analisar as variáveis através da dispersão relativa, verifica-se que o salário apresenta a menor dispersão (12,2%) enquanto que a idade apresenta a maior (25,0%) e, agora, pode-se comparar: O salário apresenta a menor dispersão(12,2%),seguido pelo QI(15,8%) e pela Idade(25,0%). Daí a importância do coeficiente de variação nesse tipo de análise. 1.7.5 Atividade 41 1) Os dados abaixo são relativos aos salários nuais, em R$1000,00, de empregados de empresas. a) Calcule a variância e o desvio padrão considerando que os dados são populacionais. b) Calcule a variância e o desvio padrão considerando que os dados são amostrais. c) Calcule o coeficiente de variação considerando que os dados são populacionais e amostrais. Dados: 25 - 28 - 29 - 30 - 32 - 35 - 37 Resposta: a) 14,52 e 3,81 Resposta: b) 17,14 e 4,14 Resposta: c) 12,35% e 13,42% 2) Os dados abaixo são relativos à quatidade de horas extras semanais trabalhadas pelos empregados de certa empresa: Horas extras Número de a) Calcule a variância e o desvio padrão xi empregados (fi) considerando que os dados são populacionais 10 8 Resposta = 3,52 e 1,88 11 12 12 15 b) Calcule a variância e o desvio padrão 14 10 considerando que os dados são amostrais 16 6 Resposta = 3,50 e 1,87 soma 51 3) Os dados abaixo são referentes aos salários dos empregados de certa empresa. Calcule a variância e o desvio padrão considerando que os dados são amostrais. Classes de fi x'i x'i.fi x'i².fi X (mil) 1,2 |----- 1,8 3 1,5 4,50 6,75 1,8 |----- 2,4 7 2,0 14,00 28,00 2,4 |----- 3,0 10 2,7 27,00 72,90 3,0 |----- 3,6 15 3,3 49,50 163,35 3,6 |----- 4,2 8 3,9 31,20 121,68 4,2 |----- 4,8 4 4,5 18,00 81,00 Soma 47 - 144,2 473,68 x'i = ponto médio da classe = (Li+ Ls)/2 Resposta = 0,68 e 0,82 42 Para as questões 4 a 6 assinale a alternativa correta 4) Ocoeficiente de variação é uma medida que expressa a razão entre: a) Desvio padrão e a média ( ) c) Amplitude total e média ( ) b) Média e desvio padrão ( ) d) Desvio padrão e a variãncia ( x ) 5) O cálculo da variância supõe o conhecimento de : a) Desvio médio ( ) c) média ( x ) b) Desvio interqurtílico ( ) d) Intervalo total ( ) 6) Numa distribuição de valores iguais, o desvio padrão e a variância são : a) Negativos ( ) c) Positivos ( ) b) Iguais à unidade ( ) d) Iguais zero ( x ) 7) Realizou-se uma prova de Matemática para duas turmas. Os resultados foram os seguintes : Turma A : média = 5 e desvio padrão = 2,5 CV = 50% Turma B : média = 4 e desvio padrão = 2,0 CV = 50% Com esses resulttados podemos afirmar que : V OU F a) A turma B apresentou a maior dispersão absoluta ( F ) b) A dispersão relativa é igual à dispersão absoluta ( F ) c) Tanto a dispersão absoluta quanto a relativa são maiores para a turma B ( F ) d) A dispersão absoluta de A é maior que a de B, mas em termos relativos as ( V ) duas turmas não diferem quanto ao grau de dispersão das notas Aqui 43 2. Introdução à Probabilidade 2.1 Modelos Matemáticos Os modelos matemáticos são classificados em duas categorias: Determinísticos e não determinísticos ou probabilísticos. 2.1.1 Modelos Matemáticos Determinísticos - são modelos através dos quais, conhecido o valor de uma ou mais variáveis é possível determinar o valor de outra, ou de outras, que das primeiras sejam dependentes. Por essa razão são chamados de determinísticos. São, normalmente, as funções do cálculo diferencial e integral como, y = f (x) ou y = f (x, z) etc. A função f(x) = 2x + 1 é um modelo determinístico. Atribuindo o valor 1 à variável x, é possível determinar o valor de f(1) = 2.(1)+3 = 5. Esses experimentos não serão estudados aqui. 2.1.2 Modelos Matemáticos Não Determinísticos (ou Probabilísticos) - São modelos para os quais os determinísticos não se adaptam. Esses experimentos constituem o alvo do estudo de introdução à probabilidade. Para facilidade do entendimento alguns conceitos básicos são dados a seguir: 1) Exemplos de experimentos (E) para os quais os modelos determinísticos não se adaptam. Experimentos probabilísticos E1 - Lance um dado e observe o número mostrado na face de cima. E2 - Jogue uma moeda três vezes e observe o número de caras que aparece. E3 - Jogue uma moeda três vezes e observe a sequência de caras e coroas, obtida. E4 - Em uma linha de produção fabrique peças em série. Conte o número de peças defeituosas produzidas em um período de 24 horas. E5 - Peças são fabricadas até que 10 perfeitas sejam produzidas. Conte o número total de peças fabricadas. E6 - Um lote é formado de 10 peças das quais três são defeituosas. As peças são retiradas, uma a uma, sem reposição da peça retirada, até que a última defeituosa seja encontrada. Conte o número total de peças retiradas do lote. Características dos experimentos não determinísticos ou probabilísticos 44 a) Todo experimento aleatório poderá ser repetido indefinidamente sob as mesmas condições. b) Não é possível prever a priori que resultado particular ocorrerá ao se realizar o experimento, mas é possível descrever o conjunto de todos os seus resultados possíveis. c) Ao realizar-se o experimento, os resultados individuais parecerão ocorrer de forma acidental. 2) Espaço Amostral (S) Definição: Um espaço amostral associado a um particular experimento E, é definido como: "O conjunto de todos os resultados possíveis de E". Exemplos: Como exemplos, serão determinados os espaços amostrais dos experimentos dados anteriormente. (a cada experimento Ei associaremos o espaço amostral Si). S1 = {1, 2, 3, 4, 5, 6 } S2 = { 0, 1, 2, 3 } S3 = {ccc, cck, ckc, kcc, ckk, kck, kkc, kkk } S4 = {0, 1, 2, 3, 4, 5, ... ,N }, onde N é o número máximo de peças que podem ser produzidas em um período de 24 horas. S5 = {10, 11, 12, 13, 14, 15, ... }. Este é um conjunto infinito S6 = {3, 4, 5, 6, 7, 8, 9, 10 }. 3) Evento Definição: Um evento A, relativo a um particular espaço amostral S associado a um experimento E, é definido como "Um conjunto de resultados possíveis de E". Isto é, A é subconjunto de S. Observação: De acordo com essa definição podemos afirmar que: a) O conjunto vazio é um evento, chamado evento impossível e b) O espaço amostral S é um evento, chamado evento certo. Exemplos de eventos: A1 = {Em E1, um número par ocorre } = { 2, 4, 6 } S A2 = {Em E2, pelo menos duas caras ocorrem } = { 2, 3 } S A3 = {Em E3 exatamente, duas caras ou duas coroas, seguidas, ocorrem } = { cck,kcc,kkc,ckk } S 45 4) Eventos Mutuamente Excludentes Definição: Dois eventos A e B são ditos mutuamente excludentes quando eles não puderem ocorrer juntos. Isto é, Exemplo: Considere o lançamento de um dado equilibrado, seu espaço amostral S e os seguintes eventos A = {Um número par ocorre } e B = { Um número ímpar ocorre }. Observe que: S = {1, 2, 3, 4, 5, 6 } ; A = { 2, 4, 6 } e B = { 1, 3, 5 } . Como , então A e B são mutuamente excludentes. Por outro lado, os eventos C = {1, 2, 5} e D = { 2, 4, 3, 6 } , não são mutuamente excludentes pois, C = { 2 } ≠ ∅. 5) Frequência Relativa de um Evento Definição: Suponha que um experimento E seja repetido n vezes. Sejam A e B dois eventos relativos a esse experimento. Sejam, ainda, e o número de vezes que os eventos A e B ocorreram, respectivamente, nas n experimentações, então: é definida como a frequência relativa do evento A nas n experimentações de E. Propriedades da Frequência relativa: 6) Probabilidade Definição: Seja E um experimento e S um espaço amostral associado a esse experimento. A cada evento A é associado um número real P(A), denominadoprobabilidade de A, que deve satisfazer às seguintes condições: a) b) P(S) = 1 A BÇ =f A BÇ =f nA nB f n n A A= 0 1£ £P A( ) 46 c) Se A e B forem dois eventos mutuamente excludentes, então: Teorema 1: Se for o evento vazio, então : P( ) = 0 Teorema 2: Se for o evento complementar de A, então : Teorema 3: Se A e B forem dois eventos quaisquer, então : Teorema 4 : Se , então : 7) Leis de Morgann e Consequências Exemplo de aplicação dos teoremas e leis de Morgann: Sejam A e B eventos tais que P(A) = 1/3, P(B) = 1/5 e P(A B) = 1/15 Determine: Solução 2.1.3 Atividade 1) Sejam A e B eventos tais que: = 1/7, 4/5 e = 34/35. Determine: P A B P A P B( ) ( ) ( )È = + A P A B P A P B P A B( ) ( ) ( ) ( )È = + - Ç A BÌ P A P B( ) ( )£ 47 respostas: (a) 6/7 (b)1/5 (c)34/35 (d)1/35 (e)11/35 (f)24/35 (g)24/35 (h)6/35 (i)4/35 (j)31/35 (k)29/35 2.2 Distribuições de Probabilidade 2.2.1 Introdução Viu-se nos cálculos de probabilidade realizados anteriormente, que todos foram feitos para eventos bastante genéricos: P(A), P(B), P(C), . . ., etc, isto é, A, B, C eram eventos quaisquer. Para determinar probabilidade de ocorrência de eventos específicos, desses fenômenos que ocorrem no cotidiano, foram desenvolvidos modelos, também específicos, de cálculo de probabilidade, identificados como “Distribuições de probabilidade”. As distribuições podem ser discretas e contínuas. Trabalharemos aqui duas discretas (Binomial e Poisson) e uma contínua (A distribuição normal). 2.2.2 A Distribuição Binomial de Probabilidade 2.2.2.1 Introdução Usa-se o termo "binomial" para caracterizar situações em que os resultados de uma variável aleatória podem ser agrupados em duas classes ou categorias. Exemplos: a) Respostas a um teste do tipo Verdadeiro ou Falso, b) Respostas do tipo Sim ou Não a um questionário c) Classificação de produtos manufaturados como: defeituosos e não defeituosos. d) Classificação de pacientes em uma clínica como: psicóticos e não psicóticos. e) Resultado de classificação de remessas de peças produzidas como: Aceitas e não aceitas, . . . , etc. 2.2.2.2 Características da Distribuição Binomial 1) Há n experimentações, observações ou provas, idênticas 2) Cada experimentação ou prova tem apenas dois resultados possíveis: um chamado "sucesso" e o outro "insucesso ou falha". 3) As probabilidades p de sucesso e 1- p = q de falha, permanecem constantes em todas as provas. 4) Os resultados das experimentações ou provas são independentes uns dos 48 outros. 2.2.2.3 Cálculo da Probabilidade de Sucessos O cálculo da probabilidade da ocorrência de uma quantidade x = k sucessos, é realizado através do seguinte teorema: Teorema1: Seja X uma variável aleatória binomial, com parâmetro p, baseado em n repetições de um experimento. Então: Onde: p, na expressão, é considerada a probabilidade de sucesso, a probabilidade que está sendo pedida. Logo a outra q = 1 – p é a probabilidade contrária. 2.2.2.4 Cálculo da Esperança e Variância Os cálculos, da esperança matemática de sucessos (média de sucessos) e da variância de sucessos, são realizados através do seguinte teorema: Teorema2: Se X tiver distribuição binomial com parâmetro p, baseado em n Experimentações, então: E(X) = np e V(X) =npq. Exemplo Suponha que 5% das peças que saiam de uma linha de produção sejam defeituosas. Se10 dessas peças forem escolhidas e inspecionadas: a) Qual a probabilidade de que no máximo 2 defeituosas sejam encontradas? b) Quantas se esperam sejam defeituosas? c) Qual a variância e o desvio padrão do número de peças defeituosas? Solução Sabe-se que: 1) A probabilidade de peças defeituosas é: (Pd = 5% = 5/100 = 0,05), isto é, Pd = 0,05. Logo a probabilidade de peças não defeituosas é: (Pnd = 1- 0,05 = 0,95), ou seja, Pnd = 0,95. 2) Temos, então, duas probabilidades. Uma que será usada como de sucesso e a outra como de insucesso ou falha. 3) O número de experimentações é n = 10 49 a) Qual a probabilidade de que no máximo 2 defeituosas sejam encontradas? Obs: Como se quer calcular a probabilidade de peças defeituosas, ser peça defeituosa passou a ser o sucesso, enquanto que ser peça não defeituosa passou a ser insucesso. Tem-se, então: p = Pd =0,05 e q = Pnd = 0,95. Logo: P(x ≤ 3d ) = P( x = 0d ) + P( x = 1d ) + P( x = 2d ) = = P(x = 0 ) + P( x = 1 ) + P( x = 2 ) Usando o teorema binomial para cada caso, obtem-se: b) Quantas se esperam sejam defeituosas? A pergunta se refere à esperança matemática de peças defeituosas, a média esperada de peças defeituosas, isto é: E(x) = n.p = 10.(0,05) = 0,5 c) Qual a variância e o desvio padrão do número de peças defeituosas? A variância é dada pela expressão: V(x) = n.p.q Logo, V(x) = n.p.q = 10(0,05)(0,95) = 0,475 O desvio padrão é igual à raiz quadrada da variância, Portanto, s = = 2.2.2.5 Atividade 1) Uma firma exploradora de petróleo acha que 7% dos poços que perfura acusam depósito de gás natural. Se ela perfurar 6 poços, determine a probabilidade de ao menos um dar resultado positivo. Dica: P(x ≥ 1) = 1 – P(x < 1) = 1 – P(x = 0) n= 6 ; p = 0,07 ; q = 0,93 resposta = 0,5160 2) Pesquisa recente indica que apenas 15% dos médicos de certa localidade são fumantes. Escolhidos dois médicos de um grupo de 8 constantes de uma relação fornecida pelo conselho de medicina, constatou-se serem fumantes. Admitindo correta a pesquisa, qual a probabilidade de chegar ao resultado acima? 50 Dica: P(x = 2) =? n= 8 ; p = 0,15 ; q = 0,85 resposta = 0,2376 3) Remessas de 500 buchas cada são aceitas se uma amostra aleatória de 10 acusa menos de 2 defeituosas. Se uma remessa tem na realidade 6% de buchas defeituosas, qual a probabilidade de ser aceita? E de não ser aceita? Dica: P(x < 2) = P(x =0) + P(x =1) n= 10 ; p = 0,06 ; q = 0,94 resposta = 0,8824 4) Doze por cento dos que reservam lugar num vôo sistematicamente faltam ao embarque. O avião comporta 15 passageiros. a) Determine a probabilidade de que todos os 15 que reservaram lugar compareçam ao embarque. b) Se houve 16 pedidos de reserva, determine a probabilidade: b1) de uma pessoa ficar de fora. b2) de nenhuma ficar de fora. b3) de mais de uma ficar de fora. Dica: P(faltar) =12% = 12/100 = 0,12 ; P(Comparecer) = 0,88 a) N° de experimentações = n° de reservas = 15 ; p =0,88 ; q=0,12, P(x = 15 comparecimentos) = resposta = 0,14697 b) b1) n = 16, só há 15 vagas. p=0,88 ; q=0,12 ; P(x=16) = ? resposta = 0,12933 b2) n = 16, P( 15) = 1 - P(x>15) = 1 - P(x=16) = 1 – 0,12933 = 0,87067b3) n = 16, há 15 vagas. Evento impossível = , logo P ( ) = 0 4) A probabilidade de um homem acertar um alvo é 1/4. Se ele atira 7 vezes: a) Qual a probabilidade de acertar o alvo pelo menos 2 vezes? b) Qual o número médio esperado de acertos? E a variância? c) Qual a probabilidade de não acertar o alvo no mínimo 1 vez? Dica: n = 7, Prob. acertar o alvo = Pa = ¼ = 0,25 , Prob. não acertar o alvo = Pna = 0,75. a) P(x ≥ 2) = 1 - P(x < 2) = 1 – { P(x=0) + P(x=1)}; p = 0,25 e q = 0,75 resposta =055505 b) E(x) = np e V(x) = npq resposta =1,75 e 1,31 c) P(x ≥ 1) = 1 - P(x < 1) = 1 – P(x=0) ; p = 0,75 e q = 0,25 resposta =0,999938 5) Um órgão governamental credencia a firma A para fazer vistorias em carros recuperados ou construídos particularmente e dar aprovação ou não para que o 51 determinado carro possa ser lacrado no DETRAN. O órgão resolve testar se a firma A está trabalhando de acordo com suas especificações. De um lote de 250 carros vistoriados e aprovados por A, escolhe 15 e faz novas vistorias. Se encontrar no mínimo 2 que não mereçam a aprovação, descredencia A . Sabendo-se que no lote de 250 há 10 carros que foram aprovados irregularmente, qual a probabilidade do descredenciamento? Dica: - Probabilidade de um carro ser aprovado irregularmente = Pair = 10/250 = 0,04 - Probabilidade de um carro ser aprovado regularmente = Pare = 1 - 0,04 = 0,96 - Probabilidade do descredenciamento = P(x ≥ 2) = 1 - P(x < 2) = 1 – { P(x=0) + P(x=1)}, onde: n = 15, p = 0,04 e q = 0,96 resposta = 0,119109 6) Seja X uma variável aleatória com distribuição binomial. Se E(x) = 12 e V(x) = 3 determine P(x < 2). Dica: , resolva esse sistema e determine: q=0,25, p = 0,75 e n = 16. Calcule P(x < 2) = P(x = 0) + P(x = 1). resposta = 0,0000000114 7) Um fabricante de peças de automóveis garante que uma caixa de suas peças conterá, no máximo, duas defeituosas. Se a caixa contém 18 peças, e a experiência tem demonstrado que esse processo de fabricação produz 5% de peças defeituosas, qual a probabilidade de que uma caixa não satisfaça a garantia? Dica Pd = 0,05 (prob. uma peça ser defeituosa) = 0,05, (prob. uma peça ser não defeituosa) =0,95 P(caixa satisfaça a garantia) = P(x ≤ 2d) P(caixa não satisfaça a garantia) = P(x>2d) = 1 - P(x ≤ 2d) = 1 – { P(x = 0) + P(x = 1) + P(x = 2) }, com, p = 0,05, q = 0,95 e n = 18. resposta = 0,0581289 8) Um técnico visita os clientes que compraram assinatura de um canal de TV para verificar o decodificador. Sabe-se, por experiência, que 90% desses aparelhos não apresentam defeitos. a) Determine a probabilidade de que em 12 aparelhos visitados no máximo 2 apresentem defeitos. b) Em 80 aparelhos visitados quantos se esperam sejam defeituosos? 52 Dica: a) Probabilidade de o aparelho não apresentar defeito, Pnd = 0,90 Probabilidade de o aparelho apresentar defeito, Pd = 1 - 0,90 = 0,10 n = 12 ; p = 0,10 ; q = 0,90 ; P(x ≤ 2) = P(x = 0) + P(x = 1) + P(x = 2) resposta = 0,88913 b) E(x) = n.p resposta = 8 9) A probabilidade de que um cliente seja atendido imediatamente ao chegar em uma loja de departamento é de 20%. A loja aguarda para a próxima hora a chegada de 80 clientes. a) Determine a média e o desvio padrão do número de clientes que deverão ser imediatamente atendidos. b) Em média, qual é o percentual de clientes que a loja deixa de atender se 25% dos clientes que não são imediatamente atendidos, se aborrecem e procuram outra loja? Dica: a) Probabilidade de um cliente ser atendido imediatamente = Pai = 0,20 Probabilidade de um cliente não ser atendido imediatamente = Pnai = 0,80 n=80 ; E(x) = np e desvio padrão = raiz de V(x) . V(x) = npq resposta = 16 e 3,58 b) Número de clientes não imediatamente atendidos = 80 – 16 = 64 Média dos que se aborrecem = 64(0,25) = 16 (se aborrecem) Percentual = 16/80x100 = 20%. resposta = 20% 2.2.3 Distribuição de Poisson 2.2.3.1 Introdução A distribuição de Poisson é útil para descrever as probabilidades do número de ocorrências num campo ou intervalo contínuo (em geral tempo ou espaço). Exemplos de variáveis que podem ter como modelo a distribuição de Poisson: a) Número de defeitos por centímetro quadrado. b) Número de acidentes por dia c) Número de clientes por hora d) Número de chamadas telefônicas por minuto e) Número de erros por página em um livro, etc. Observa-se que a unidade de medida (tempo, área) é contínua, mas a variável aleatória (número de ocorrências) é discreta. Além do mais as falhas não são 53 contáveis. Isto é, não é possível contar o número de acidentes por dia que não ocorreram; nem o número de chamadas telefônicas por minuto que não foram feitas; nem o número de defeitos por centímetro quadrado que não ocorreram; nem o número de clientes por hora que deixaram de comparecer; nem o número de erros que deixaram de ocorrer em uma pagina de livro, etc. 2.2.3.2 Calculo da Probabilidade do Número de Ocorrências Teorema1: Seja X uma variável aleatória discreta, tomando os valores: 0, 1, 2, 3, ... , n..., Se X tiver distribuição de Poisson com parâmetro , então: , onde: X = k = 0, 1, 2, 3,..., n..., é o número de ocorrências; e = base do logaritmo neperiano e = número médio de ocorrências, como explicado no teorema 2 2.2.3.3 Cálculo da Esperança e Variância Teorema 2: Se X tiver distribuição de Poisson com parâmetro ,então : . Onde: = número médio de ocorrência e = variância do número de ocorrências Exemplo Certo posto de bombeiros recebe em média 3 chamadas por dia.Calcular a probabilidade de: a) receber 4 chamadas num dia b) receber 3 ou mais chamadas num dia c) receber exatamente 2 chamadas em 12 horas d) receber no máximo 1 chamada em 12 horas Solução 54 a) Já se sabe a média do número de ocorrências no espaço pedido de um dia. Isto é, . Logo, basta aplicar a fórmula de cálculo: ,onde x = 4 e . Então: P(X = 4) = b) Aqui também já sabemos a média do número de ocorrências no espaço pedido de um dia. Isto é, . Logo basta calcular P(x ≥ 3) usando a mesma expressão. P(x ≥ 3) = 1 – P(x < 3) = 1 - { P(x = 0) + P(x = 1) + P(x = 2) } = 1- { + + } = 1- { + + } = 1- { + + } = 1- = 0,5768099 c) Neste item deseja-se calcular P(x = 2), mas em um período de 12 horas. Não se sabe a média de ocorrências em 12 horas. Se, em 24 horas a média é 3, então, proporcionalmente, em 12 horas a média será 1,5 ( ). Aplicando a mesma fórmula de cálculo: P(x = 2) = = = 0,25102 d) Neste caso pede-se P(x ≤ 1), também em um período de 12 horas ( ). Logo: P(x ≤ 1) = P(x = 0) + P(x = 1) =
Compartilhar