Baixe o app para aproveitar ainda mais
Prévia do material em texto
� PAGE �28� Apostila de Estatística e Probabilidade Profª Cristiane Leitão Capítulo I - Conceitos Iniciais Estatística A Estatística está interessada nos métodos científicos para coleta, organização, resumo, apresentação e análise de dados, bem como na obtenção de conclusões válidas e na tomada de decisões razoáveis baseadas em tais análises. A Estatística tem por objetivo, fornecer métodos e técnicas para lidarmos, racionalmente com situações sujeitas a incertezas. Bioestatística é a Estatística aplicada as Ciências Médicas e Biológicas. População e amostra. Estatística indutiva e descritiva Ao coletar os dados referentes às características de um grupo de objetos ou indivíduos, tais como as alturas e pesos dos estudantes de uma universidade ou os números de parafusos defeituosos ou não produzidos por uma fábrica em certo dia, é muitas vezes impossível ou impraticável observar todo o grupo, especialmente se for muito grande. Em vez de examinar todo o grupo, denominado população ou universo, examina-se uma pequena parte chamada amostra. Se uma amostra é representativa de uma população, conclusões importantes sobre a população podem ser inferidas de sua análise. 1.3.Variáveis Uma variável é o conjunto de resultados possíveis de um fenômeno. Tratando-se de estatística de variável, é possível distinguir duas categorias de variável: Qualitativa – quando seus valores são expressos por atributos. Esse tipo de variável, se divide ainda em: Variável Nominal – quando este atributo não admite uma ordenação. Ex: Cor dos olhos (pretos, castanhos, azuis, etc) Variável Ordinal – quando este atributo admite algum tipo de ordenação. Ex: Classe social (alta, média ou baixa) Quantitativa – quando seus valores são expressos por números. Esse tipo de variável, se divide ainda em: Variável Contínua – quando seus valores são expressos por números que podem assumir, teoricamente, qualquer valor entre dois limites. Ex: peso corporal, altura... Variável Discreta – quando seus valores são expressos por números pertencentes a um conjunto enumerável. Ex: quantidade de alunos de uma turma, número de crianças de uma família. Os dados que podem ser descritos por meio de uma variável discreta ou contínua são chamados dados discretos ou dados contínuos, respectivamente. O número de crianças em cada uma de 1.000 famílias é um exemplo de dados discretos, enquanto o peso de 100 estudantes universitários é um exemplo de dados contínuos. Em geral, as medições dão origem a dados contínuos, enquanto as enumerações ou contagens resultam em dados discretos. ESTATÍSTICA DESCRITIVA Vamos apresentar os principais conceitos sobre o levantamento de dados; destacar as técnicas de apresentação, por meio de tabelas e gráficos; oferecer as medidas próprias para análises e as técnicas usadas para a interpretação dos dados numéricos. Fases do Método Estatístico Método é um conjunto de meios dispostos convenientemente para se chegar a um fim que se deseja. O Método Estatístico usa o conjunto de meios listados abaixo, para uma tomada de decisão. As fases dos método estatístico: •Definição do problema; •Planejamento; •Coleta dos dados; •Crítica dos dados; •Apresentação dos dados; •Análise e Interpretação dos dados. A Estatística Descritiva pode ser resumida do diagrama: 1.4. Coleta de dados Após a definição do problema a ser estudado e o estabelecimento do planejamento da pesquisa (forma pela qual os dados serão coletados; cronograma das atividades; custos envolvidos; exame das informações; delineamento da amostra etc.), o passo seguinte é a coleta de dados, que consiste na busca ou compilação dos dados das variáveis, componentes do fenômeno a ser estudado. 1.5. Crítica dos dados Objetivando a eliminação dos erros capazes de provocar futuros enganos de apresentação e análise, procede-se a uma revisão crítica dos dados, suprindo os valores estranhos ao levantamento. 1.6. Apresentação dos dados Após a crítica, convém organizarmos os dados de maneira prática e racional, para o melhor entendimento do fenômeno que se está estudando. Os dados, geralmente, são apresentados de duas formas: Tabelas e/ou Gráficos. 1.6.1. Tabelas É um quadro que resume informações. A elaboração de tabelas obedece à uma resolução do Conselho Nacional de Estatística. Uma tabela deve apresentar o cabeçalho, o corpo e o rodapé. O cabeçalho deve conter o suficiente para que sejam respondidas as seguintes questões: o quê? (referente ao fato), onde? (relativo ao lugar) e quando? (correspondente à época). O corpo é representado por colunas e subcolunas dentro das quais serão registrados os dados. O rodapé é reservado para as observações pertinentes, bem como a identificação da fonte dos dados. 1.6.2. Séries Estatísticas Denominamos série estatística a organização de dados referentes a uma mesma ordem de classificação. Geralmente, as séries estatísticas são representadas por meio de tabelas. Conforme o critério de agrupamento, as séries classificam-se em: Temporal, Geográfica, Específica e Distribuição de Freqüências. Série Temporal (Cronológica, Evolutiva ou Histórica) – É a série estatística em que os dados são observados segundo a época de ocorrência. Vendas da Empresa Alfa –2001 a 2008 Ano Vendas (em R$) 2001 2002 2003 2004 2005 2006 2007 2008 2.181,00 3.948,00 5.642,00 7.550,00 10.000,00 11.728,00 18.790,00 29.076,00 Fonte: Departamento de Vendas da Empresa Série Geográfica (ou de Localização) – É a série estatística em que os dados são observados segundo a localidade de ocorrência. INSS – Empresas fiscalizadas em 1990. Regiões Empresas fiscalizadas Norte Nordeste Sudeste Sul Centro-Oeste 7.495 107.783 281.207 53.661 15.776 Fonte: Mensário Estatístico Série Específica (ou categórica) – É a série estatística em que os dados são agrupados segundo a modalidade da ocorrência. Matrícula no Ensino do Terceiro Grau- Brasil 1975 Áreas de Ensino Matriculas Ciências Biológicas Ciências Exatas e Tecnologia Ciências Agrárias Ciências Humanas Letras Artes Duas ou mais áreas 32.109 65.949 2.419 148.842 9.883 7.464 16.323 Fonte: Serviço de Estatística da Educação e Cultura Distribuição de Freqüências – É a série estatística em que os dados são agrupados com suas respectivas freqüências absolutas. Obs: Freqüência é o número de “elementos” que pertencem a uma determinada classe. Por se tratar do tipo mais importante de série estatística, a estudaremos isoladamente no próximo capítulo. 1.6.3. Gráficos O gráfico estatístico é uma forma de apresentação dos dados estatísticos, cujo o objetivo inicial é o de produzir em geral, uma impressão mais rápida do fenômeno em estudo. A representação gráfica de um fenômeno deve obedecer a certos requisitos fundamentais, para ser realmente útil: Simplicidade – o gráfico deve ser destituído de detalhes de importância secundária, que possam levar o observador a uma análise errônea. Clareza – o gráfico deve possibilitar uma correta interpretação dos valores representativos do fenômeno em estudo. Veracidade – o gráfico deve sempre expressar a verdade sobre o fenômeno em estudo. Os principais gráficos indicados para a representação de uma série estatística são: Gráfico em linhas Gráficos em barras verticais ou horizontais Gráfico em setores - Gráficos em Linhas- Gráficos em Colunas (barras verticais) Obs: Geralmente os gráficos de barras verticais são chamados também de gráficos em colunas. - Gráfico em Barras (barras horizontais) - Gráficos em Setores: É a representação gráfica de uma série estatística, em um círculo, por meio de setores. É utilizado principalmente quando se pretende comparar cada valor da série com o total. Para construir divide-se o círculo em setores, cujas áreas serão proporcionadas aos valores da série. Essa divisão pode ser obtida pela solução da regra de três. - Cartogramas É a representação sobre uma carta geográfica. Este gráfico é empregado quando o objetivo é o de figurar os dados estatísticos diretamente relacionados com áreas geográficas ou políticas. - Gráfico Polar: É a representação de uma série estatística por meio de um polígono. Geralmente usamos para apresentação de séries temporais. Para construí-lo, divide-se uma circunferência em tantos arcos iguais quantos forem os dados a representar. Pelos pontos de divisas traçam-se raios. Em cada raio é representado um valor da série, marcando-se um ponto cuja distância ao centro é diretamente proporcional a esse valor . A seguir unem-se os pontos. - Pictogramas São construídos a partir de figuras representativas da intensidade do fenômeno. Este tipo de gráfico tem a vantagem de despertar a atenção do público leigo, pois sua forma é atraente e sugestiva. Os símbolos devem ser auto-explicativos. A desvantagem dos pictogramas é que apenas mostram uma visão geral do fenômeno, e não de detalhes minuciosos. Veja o exemplo abaixo: Fonte: IBGE Exercícios 1) A Tabela abaixo mostra o número de toneladas de trigo e de milho produzidos na fazenda Cris, durante os anos de 1980 a 1990. Anos Toneladas de trigo Toneladas de milho 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 200 185 225 250 240 195 210 225 250 230 235 75 90 100 85 80 100 110 105 95 110 100 Com referência a esta tabela, determine o ano, ou anos, durante os quais: foi produzido o menor número de toneladas de trigo; foi produzido o maior número de toneladas de milho; ocorreu o maior declínio na produção de trigo; foi produzido o mesmo número de toneladas de trigo; a produção total de trigo e milho foi máxima. 2) Exprimir os dados de produção de trigo e de milho do Problema 1 em percentagem da produção anual total no ano de 1980, e representar graficamente as percentagens, utilizando o gráfico de setores: 3) A tabela abaixo apresenta as vendas da Empresa X no ano de 2008. Meses Vendas R$ Jan Fev Março Abril Maio Junho Julho Agosto Setembro Outubro Novembro Dezembro 1.000.000,00 800.000,00 1.500.000,00 300.000,00 2.000.000,00 500.000,00 800.000,00 1.000.000,00 1.300.000,00 1.800.000,00 2.000.000,00 3.000.000,00 Fonte: Dep de Vendas Capítulo II - Distribuição de Freqüências Por se tratar do tipo de tabela mais importante para a Estatística Descritiva, faremos um estudo completo sobre as distribuições de freqüências, incluindo sua construção. Uma distribuição de freqüências pode ser: Distribuição de freqüências sem intervalos de classes. Distribuição de freqüências com intervalos de classes. Representação da Amostra A seguir definiremos alguns procedimentos comuns para a representação das distribuições de freqüências: 1. Dados brutos ou Tabela Primitiva – É o conjunto de dados numéricos obtidos após a crítica dos valores coletados não ordenados numericamente. Ex1: Os dados abaixo representam a taxa de glicose, em miligramas por 100ml de sangue, em uma amostra de 42 ratos machos da raça Wistar, com 20 dias de idade. 88,5 97,5 80,0 97,0 85,0 80,5 88,0 92,0 88,5 92,5 94,5 100,5 94,0 89,0 85,5 85,0 95,0 89,0 87,0 94,0 87,5 98,5 84,5 95,5 99,0 84,0 93,0 103,5 91,0 91,0 86,0 91,5 87,0 90,5 86,0 87,0 90,0 88,0 89,5 83,5 89,5 96,5 2. Rol – É o conjunto de dados após sua ordenação numérica. 80,0 85,0 87,0 89,0 91,0 94,0 97,0 80,5 85,5 87,5 89,0 91,0 94,0 97,5 83,5 86,0 88,0 89,5 91,5 94,5 98,5 84,0 86,0 88,0 89,5 92,0 95,0 99,0 84,5 87,0 88,5 90,0 92,5 95,5 100,5 85,0 87,0 88,5 90,5 93,0 96,5 103,5 3. Amplitude total ou “range” (R) - É a diferença entre o maior e o menor valor observados. R = 103,5 – 80,0 = 23,5 4. Números de classes (K) – não há uma fórmula exata para o cálculo do número de classes. Uma boa aproximação é a Regra de Sturges: onde n é o tamanho da amostra No nosso exemplo temos: 5. Amplitude das classes (h) – É o tamanho de classes É mais apropriado que aproximamos o número de classes e a amplitude das classes para o maior número inteiro. Assim, se . Usamos h = 4. 6. Freqüência absoluta ( ) – É o número de vezes que o elemento aparece na amostra. Exemplo de uma distribuição de freqüência com variável discreta. 22 23 24 28 33 34 2 2 2 1 1 2 10 Obs: X representa a variável onde n = tamanho da amostra Exemplo de distribuição de freqüência para variável contínua: Classes Fi 80 |----- 84 84 |----- 88 88 |----- 92 92 |----- 96 96 |----- 100 100 |----- 104 3 11 13 8 5 2 Total (n) 42 7. Freqüência absoluta acumulada ( - É a soma das freqüências dos valores inferiores ou iguais ao valor dado. 8. Limites das classes 80 |----- 84 compreende todos os valores entre 80 e 84 excluindo o 84. 9. Pontos médios das classes ( ) – É a média aritmética entre o limite superior e o inferior da classe. Assim se a classe for 80 |----- 84, teremos: 10. Freqüência relativa - A freqüência relativa de um valor é dada por , ou seja, é a porcentagem daquele valor da amostra. Obs: Montando a distribuição do nosso exemplo: Classes Fi xi Fac fi 80 |----- 84 84 |----- 88 88 |----- 92 92 |----- 96 96 |----- 100 100 |----- 104 3 11 13 8 5 2 82 86 90 94 98 102 3 14 27 35 40 42 0,07 0,26 0,31 0,19 0,12 0,05 Total (n) 42 ---- ---- 1 11. Histograma – É a representação gráfica de uma distribuição de freqüência por meio de retângulos. 12. Polígono de freqüência – É a representação da distribuição por meio de um polígono. Exemplo 1: As notas de 35 estudantes de uma classe estão descritas a seguir: 0,0 – 0,0 – 1,0 – 1,5 – 2,0 - 2,0 – 2,5 – 3,5 – 3,5 – 4,0 4,0 – 4,0 – 4,0 – 4,5 – 4,5 – 4,5 – 5,0 – 5,0 – 5,0 – 5,0 5,0 – 5,5 – 5,5 – 5,5 – 6,0 – 6,0 – 6,0 – 6,5 – 6,5 – 7,0 7,0 – 7,5 – 8,0 – 8,0 – 8,5 Determinar: as distribuições de freqüências amplitude total qual a porcentagem dos alunos que tiveram nota menor que 4,0? o histograma e o polígono de freqüência. Exemplo 2: Dado um rol de 50 notas, agrupar os elementos em classes: 30 – 35 – 35 – 39 – 41 – 41 – 42 – 45 – 47 - 48 50 – 52 – 53 – 54 – 55 –55 – 57 – 59 – 60 – 60 61 – 64 – 65 – 65 – 65 – 66 – 66 – 66 – 67 – 68 69 – 71 – 73 – 73 – 74 – 74 – 76 – 77 – 77 – 78 80 – 81 – 84 – 85 – 85 – 88 – 89 – 91 – 94 – 94 Solução: Amplitude total: R = 94 – 30 = 64 Nº de classes: 1 + 3,22 .(1,7) Amplitude das classes: �� EMBED Equation.3 Classes 30 |– 40 40 |– 50 50 |– 60 60 |– 70 70 |– 80 80 |– 90 90 |– 100 4 6 8 13 9 7 3 4 10 18 31 40 47 50 0,08 0,12 0,16 0,26 0,18 0,14 0,06 35 45 55 65 75 85 95 50 1 Exemplo 3: Os pesos de 40 alunos estão relacionados a seguir: 45 – 49 – 50 – 53 – 53 – 53 – 54 – 57 – 58 – 58 59 – 60 – 60 – 60 – 62 – 63 – 63 – 64 – 64 – 65 65 – 66 – 67 –67 – 68 – 68 – 69 – 70 – 71 – 72 72 – 73 – 74 – 75 – 76 – 80 – 81– 81– 83 – 93 Construir a tabela de distribuição de freqüência . Dado . OBS: Dados não agrupados: Exemplo 4: Complete a tabela abaixo com os seus elementos e determine: Estaturas de 80 pacientes da Clínica de Fisioterapia São José (SP) - 1997 Estatura (cm) Fi 150 |----- 156 156 |----- 162 162 |----- 168 168 |----- 174 174 |----- 180 180 |----- 186 186 |----- 192 192 |----- 198 7 18 22 15 10 5 2 1 Total (n) 80 Fonte: Clínica São José Capítulo III - Medidas de Posição O estudo que fizemos sobre distribuições de freqüências, até agora, permite-nos descrever, de modo geral o comportamento de uma variável. Ocorre, todavia que trabalhar com uma distribuição de freqüências completa, muitas vezes, é difícil, razão pela qual costuma-se lançar mão de determinadas medidas. Essas medidas sumarizam certas características importantes da distribuição de freqüências. Há diversas medidas que possibilitam condensar as informações dentro da fase analítica da Estatística Descritiva. Dentre as medidas de posição mais importantes estão as medidas de tendência central. 3.1. Índices ou notação por índice O símbolo (lê-se “X índice i) representa qualquer um dos N valores, . A letra i, em , pode representar qualquer dos números 1,2,3,...,N, é denominada índice. Evidentemente, pode ser usada qualquer outra letra além de i, como j, k, p ou s. 3.2. Notação de Somatório O símbolo é usado para representar a soma de todos os desde i =1 até ij = N, isto é, por definição = 3.3. Medidas de Tendência Central As medidas de tendência central recebem tal denominação pelo fato de os dados observados tenderem, em geral, a se agrupar em torno dos valores centrais. Dentre as medidas de tendência central, destacamos: média ou (Ma) moda ou (Mo) mediana ou (Md) A média aritmética é, de modo geral, a mais importante e mais comum de todas as mensurações numéricas descritivas. Estas medidas podem ser calculadas, tanto para dados não agrupados em classes, quanto para dados agrupados em classes. 3.3.1. Dados não agrupados em classes - Média Aritmética A média aritmética, ou média, de um conjunto de N números é representado por (lê-se “x barra”) e é definida por = Ex: A média aritmética dos números 8, 3, 5,12,10 é: = Propriedade da Média Aritmética A soma algébrica dos desvios de um conjunto de números, em relação à média aritmética, é zero. Ex: Os desvios dos números 8, 3, 5, 12, 10, em relação à sua média aritmética 7,6 são: 8 – 7,6 ; 3 –7,6; 5 – 7,6 ; 12 – 7,6 ; 10 – 7,6 ou 0,4 ; –4,6 ; –2,6 ; 4,4 ; 2,4 com soma algébrica igual a zero. - Moda A moda de um conjunto de números é o valor que ocorre com maior freqüência, ou seja, é o valor mais comum. A moda pode não existir e, mesmo que exista pode não ser única. Ex1: O conjunto 2, 2, 5, 7, 9, 9, 9, 10, 10, 11, 12, 13 tem moda 9. Ex2: O conjunto 3, 5, 8, 10, 12, 15, 17 não tem moda. Ex3: O conjunto 2, 3, 4, 4, 4, 5, 5, 7, 7, 7, 9 tem duas modas 4 e 7. Uma distribuição que não tem moda é denominada amodal. Uma distribuição que tem apenas uma moda é denominada unimodal. - Mediana A mediana de um conjunto de números, organizados em ordem de grandeza (isto é, em um rol) , é o valor central ou a média aritmética dos dois valores centrais. * Quando o tamanho da amostra é ímpar, a mediana será o elemento de ordem . Ex1: O conjunto dos números 3, 4, 5, 6, 7, 8, 8 tem mediana 6. Pois é o elemento que ocupa a 4ª posição, basta ver que n = 7, então , ou seja, 4ª posição. * Quando o tamanho da amostra é par, a mediana será a média dos elementos de ordens e . Ex2: O conjunto dos números 5, 5, 7, 9, 11, 12, 15, 18 tem mediana . Pois é a média dos elementos que ocupam a 4ª e 5ª posição, basta ver que n = 8, então = e = , ou seja 4ª e 5ª posições. Geometricamente, a mediana é o valor de X (abscissa) correspondente à vertical que divide o histograma em duas partes de áreas iguais. Esse valor de x, é às vezes, representado por . 3.3.2. Dados agrupados em classes - Média Aritmética Se estivermos trabalhando com uma distribuição de freqüências com intervalos de classes, para calcularmos a média aritmética dessa distribuição, utilizaremos a seguinte fórmula: - Moda Se estivermos trabalhando com uma distribuição de freqüências com intervalos de classes, para calcularmos a moda dessa distribuição, utilizaremos a seguinte fórmula: Onde: - limite inferior da classe modal - freqüência da classe modal menos freqüência da classe anterior - freqüência da classe modal menos freqüência da classe posterior - amplitude da classe modal Obs: Classe Modal – classe com maior freqüência. - Mediana Se estivermos trabalhando com uma distribuição de freqüências com intervalos de classes, para calcularmos a mediana dessa distribuição, utilizaremos a seguinte fórmula: Onde: - limite inferior da classe mediana - freqüência acumulada na classe anterior à classe mediana - amplitude da classe mediana - freqüência da classe mediana Obs: Classe Mediana – classe que contém o elemento = , chamado Elemento Mediano. - Separatrizes São medidas que dividem uma seqüência ordenada de dados em partes que contêm a mesma quantidade de elementos. As separatrizes, por sua vez, se dividem em: quartis; decis; percentis. Os Quartis dividem a série em quatro partes, cada uma representa 25% da série. Os quartis são: 1º Quartil ( ) – é o termo precedido por 25% dos termos da série 2º Quartil ( ) – coincide com a mediana. 3º Quartil ( ) – é o termo precedido de 75% dos termos da série. Os Decis dividem em 10 partes, representadas por 10% da série. Os decis são: 1º Decil ( ) – é o termo precedido por 10% dos termos da série 2º Decil ( ) – é o termo precedido por 20% dos termos da série. 3º Decil ( ) – é o termo precedido de 30% dos termos da série, e etc. Os Percentis dividem em 100 partes de 1% da série. Os percentis são: . Cálculo das separatrizes em uma Distribuição de Freqüências A fórmula para se determinar o termo de uma série que represente uma Separatriz é análoga à fórmula usada para a determinação da Mediana. Até mesmo porque, a Mediana é ela própria uma Separatriz. Qualquer Separatriz é determinada pela fórmula: Onde: S – Separatriz desejada - limite inferior da classe que contém a separatriz. - freqüência acumulada na classe anterior à classe que contém a separatriz - amplitude da classe que contém a separatriz.- freqüência da classe que contém a separatriz. P – posição da separatriz, sendo P calculado por , sendo i o número percentual da separatriz. Exercício: A tabela abaixo representa as taxas de colesterol (mg/dl) de 90 indivíduos da Cidade de Framingham, EUA em 1998. Classes Fi 100 |----- 150 150 |----- 200 200 |----- 250 250 |----- 300 300 |----- 350 350 |----- 400 400 |----- 450 450 |----- 500 2 24 35 14 10 3 1 1 Total (n) 90 Agora, pede-se: média aritmética moda mediana o 1º quartil acima de qual taxa encontram-se 80% dos indivíduos? Qual o percentil correspondente? Capítulo IV - Medidas de Dispersão Servem para verificarmos a representatividade das medidas de posição, pois é muito comum encontrarmos séries que, apesar de terem mesma média, são compostas de maneira distinta. Assim para as séries: a) 20, 20, 20, 20, 20 b) 15, 10, 20, 25, 30 temos . Note que os valores da série “a” se concentram totalmente na média 20, enquanto que os valores da série “b” se dispersam em torno do mesmo valor. Ou seja, a série “a” não apresenta dispersão entre os valores e os valores da série “b” estão dispersos em torno de 20. Vamos agora medir o grau de concentração ou dispersão dos dados em torno da média. - Desvio Médio e Variância Desvio Médio – Neste caso considera-se o módulo de cada desvio , evitando com isso que . Assim o Desvio Médio é dado por: Trata-se da média aritmética dos desvios considerados em módulos. Variância – Neste caso considera-se o quadrado de cada desvio , evitando com isso que . Assim, a definição da variância é dada por: Obs: indica variância e lê-se sigma ao quadrado e é a média da população. Para o caso do cálculo da variância de valores amostrais é conveniente usarmos a seguinte fórmula: Como podemos notar, as diferenças entre as fórmulas são: para o caso da variância populacional , utiliza-se a média populacional tendo como denominador o tamanho da população N. Para o cálculo da variância amostral , utiliza-se a média amostral tendo no denominador o tamanho da amostra menos um. Temos também outras fórmulas para o cálculo da variância: - Desvio Padrão O Desvio Padrão de um conjunto de dados é uma medida que nos fornece a variação dos valores em relação à média aritmética. Para o cálculo do Desvio Padrão deve-se primeiramente determinar o valor da variância e, em seguida extrair a raiz quadrada desse resultado. é o desvio padrão populacional é o desvio padrão amostral - Coeficiente de Variação Trata-se de uma medida relativa de dispersão, útil para a comparação em termos relativos do grau de concentração em torno da média de séries distintas. É dado por: C.V = ou Obs: Geralmente multiplica-se a coeficiente de variação por 100, para darmos o resultado em porcentagem. Para classificarmos uma distribuição em relação à sua variabilidade, usaremos o seguinte critério: Baixa dispersão: CV ( 15% Média dispersão: 15% < CV < 30% Alta dispersão: CV ( 30% Exercícios: Dada a distribuição de freqüência: Classes Fi 100 |----- 150 150 |----- 200 200 |----- 250 250 |----- 300 300 |----- 350 5 24 26 15 10 Total (n) 80 De acordo com a amostra. Pede-se: a) construir o histograma e o polígono de frequência b) calcular a média (225,62) c) calcular a mediana (205,08) d) calcular o desvio médio (43,36) e) determinar a variância e o desvio-padrão (S2=3.132,52 e S=55,97) f) qual é o coeficiente de variação (24,81%) g) D2 , P75 , Q1 (D2=155,5 e P75=254 e Q1=157,5) 2) Na série abaixo que representa o peso de um grupo de 440 pessoas, determinar: Classes Fi Fac 60 |--- 66 66 |--- 72 72 |--- 78 78 |--- 84 84 |---|90 120 180 80 40 20 120 300 380 420 440 440 Média, Mediana e Moda (70,36 e 69,33 e 68,25) A separatriz que representa o 3º quartil (74,25) A separatriz que representa o 9º decil (80,4) Acima de que peso estão situadas 20% das pessoas (75,9) A variância e o Desvio Padrão Amostral (S2=42,418733 e S=6,51) O coeficiente de variação e sua classificação (9,3%) 3) Uma pesquisa realizada em uma certa comunidade, com relação a uma amostra de 500 pessoas revelou a seguinte série com relação a idade da população: Classes Fi Fac 0 |--- 12 12 |--- 24 24 |--- 36 36 |--- 48 48 |---|60 60 140 180 80 40 60 200 380 460 500 500 Determine: A idade média (27,6) A idade que aparece com maior freqüência (27,43) A idade mediana (27,33) A separatriz que representa o 4º Decil (24) Acima de que idade estão 25% da comunidade (35,67) O Desvio Médio e sua interpretação (10,56) A Variância (173,1463) O Desvio Padrão e sua interpretação (13,16) O Coeficiente de Variação e classifique o grau de dispersão. (47,67%) 4) Dada a Distribuição abaixo: Tempo de auditoria de uma empresa Tempo de auditoria (em Min) NºBalanços Fi 10 |-----20 20 |----- 30 30 |----- 40 40 |----- 50 50 |-----|60 5 3 12 10 20 Total (n) 50 Determine: O tempo médio dos balanços A Moda A Mediana O percentil 20 e sua interpretação O desvio médio e sua interpretação O desvio padrão e sua interpretação O coeficiente de variação e sua classificação Capítulo V – Medidas de Assimetria e Curtose 5.1. Observações sobre a Distribuição Normal Muitas medidas extraídas de pesquisas na área biomédica, medidas de produtos fabricados em série e também os erros de algumas medidas dão origem a gráficos semelhantes ao apresentado na figura abaixo. Todas essas medidas têm distribuições que se aproximam da Distribuição Normal. A Distribuição Normal é uma distribuição conhecida e muito estudada, tendo inclusive todas as suas probabilidades calculadas. Assim, é importante sabermos se uma distribuição está próxima da Normal, pois, neste caso recairíamos em uma distribuição muito conhecida, onde poderíamos estudar a distribuição inicial utilizando a distribuição normal. 5.2. Assimetria Denominamos assimetria o grau de deslocamento lateral de uma distribuição em relação a uma distribuição simétrica, denominada distribuição normal. - Coeficiente de Assimetria de Pearson Este coeficiente determina o grau de deslocamento lateral de uma distribuição normal e será calculado através da fórmula: As = - Classificação quanto à Assimetria Para classificarmos uma distribuição quanto à intensidade de sua assimetria, usaremos o seguinte critério: Assimetria muito fraca: 0 < |As| ( 0,5 Assimetria fraca: 0,5 < |As| ( 1,5 Assimetria forte: |As| > 1,5 Obs: Se uma distribuição de freqüência for assimétrica muito forte, a medida de posição mais adequada para ser utilizada é a mediana. 5.3. Curtose Denominamos curtose o grau de achatamento de uma distribuição em relação a uma distribuição simétrica, denominada curva normal. - Coeficiente de Curtose Este coeficiente determina o grau de achatamento de uma distribuição normal e será calculado através da fórmula: K = - Classificação quanto à Curtose Para classificarmos uma distribuição quanto à curtose, usaremos o seguinte critério: K = 0,263 ( distribuição mesocúrtica (achatamento normal) K < 0,263 ( distribuição leptocúrtica (achatamento pequeno) K > 0,263 ( distribuição platicúrtica (achatamento grande) Exercício: Uma pesquisa sobre a renda anual familiar realizada com uma amostra de 1000 pessoas na cidade de Tangará resultou na seguinte distribuiçãode freqüência. Calcule a assimetria e a curtose com as suas classificações. Salário Anual (Em R$1000) Fi 0,00 |---- 10,00 10,00 |---- 20,00 20,00 |---- 30,00 30,00 |---- 40,00 40,00 |---- 50,00 50,00 |---- 60,00 60,00 |---- 70,00 70,00 |---- 80,00 250 300 200 120 60 40 20 10 Total 1000 Capítulo VI – Correlação e Regressão Linear 6.1. Análise de Regressão Linear e de Correlação Esta parte da Estatística, lida com uma amostra (parte de uma população) de dados emparelhados, o objetivo principal da análise de regressão é predizer o valor de uma variável (a variável dependente), dado que seja conhecido o valor de uma variável associada (variável independente). A equação de regressão é a fórmula algébrica pela qual se determina o valor previsto da variável dependente. 6.2. Equação de Regressão Linear para dados de uma amostra: é o valor estimado da variável dependente, dado um valor específico da variável independente X a é o ponto de interseção da linha de regressão linear com o eixo Y (X = 0) b é a declividade (inclinação) da linha de regressão 6.3. Método dos Mínimos Quadrados para ajustar uma linha de regressão: Pelo critério dos mínimos quadrados, a linha (e a equação) de regressão que melhor ajusta é aquela que é mínima a soma dos quadrados dos desvios entre os valores observados e estimados da variável dependente. As fórmulas de cálculo pelas quais os valores de a e b da equação linear podem ser determinados, de tal forma que satisfaça o critério dos mínimos quadrados é: onde: é a média aritmética dos valores da variável X, isto é, ; é a média aritmética dos valores da variável Y, isto é, . Uma vez formulada a equação de regressão, podemos utilizá-la para estimar o valor da variável dependente Y dado um valor da variável independente X . Contudo, tal estimação deve ser feita apenas dentro do intervalo de variações dos valores amostrais. 6.4. Coeficiente de Correlação Linear de Pearson: O coeficiente de correlação linear de Pearson (r), mede o grau de relacionamento linear entre os valores de duas variáveis em uma amostra. Para calcularmos o coeficiente de correlação de Pearson, entre duas variáveis (X e Y), usaremos a fórmula abaixo: Obs.: Devemos arredondar o coeficiente de correlação linear (r) para três casas decimais O valor de r poderá variar de -1 a 1, isto é, -1 ( r ( 1. Se r ( 0, diremos que a correlação linear é positiva. Se r ( 0, diremos que a correlação linear é negativa. Se r = 0, diremos que não existe correlação linear entre as variáveis. 6.5. Diagrama de Dispersão: É um gráfico no qual cada ponto plotado representa um par observado de valores para as variáveis dependente e independente. Variável independente – X Variável dependente – Y A forma da relação representada pelo diagrama de dispersão pode ser curvilínea em lugar de linear, o que não trataremos aqui. Exemplos: Uma linha de regressão com uma inclinação positiva, indica uma relação direta entre as variáveis; Uma linha de regressão com uma inclinação negativa, indica uma relação inversa entre as variáveis; e Uma inclinação nula indica que a s variáveis não estão relacionadas. Além disso, a extensão da dispersão dos pontos com relação à linha de regressão indica o grau de relacionamento entre as variáveis. 6.6. Erro Padrão de Estimação e intervalos de predição O erro padrão de estimação é uma medida das diferenças (ou distâncias) entre os valores amostrais Y observados e os valores preditos obtidos através da reta de regressão. Este erro será calculado através da seguinte fórmula: Para fins de cálculos, é mais conveniente uma versão alternativa da fórmula que não requer a determinação do desvio entre casa valor observado de Y e o valor sobre a linha de regressão , é ela: O erro padrão de estimação , pode ser usado para estabelecer um intervalo de predição para a variável dependente, dado um valor específico da variável independente: Intervalo de predição para a variável dependente Y . Os graus de liberdade para a distribuição t são n-2 . Quando , podemos utilizar a distribuição normal: Exercícios: 1) Um analista toma uma amostra aleatória de 10 carregamentos recentes por caminhão feitos por uma companhia e anota a distância em quilômetros e o tempo de entrega ao meio-dia mais próximo: Carregamento amostrado 1 2 3 4 5 6 7 8 9 10 Distância X, em km Tempo de Entrega Y, em dias 825 3,5 215 1,0 1070 4,0 550 2,0 480 1,0 920 3,0 1350 4,5 325 1,5 670 3,0 1215 5,0 Construir o diagrama de Dispersão Determinar a Equação de regressão de mínimos quadrados Usando a equação de regressão desenvolvida acima, estimar o tempo de entrega para um carregamento para 1.000 Km. Resp: = 3,72 dias Esta equação de regressão poderia ser usada para estimar o tempo de entrega para um carregamento de 2.500 Km? Calcular o erro padrão de estimação para o problema de análise do tempo de entrega. Resp: = 0,42 Calcular o Coeficiente de Correlação Construir um intervalo estimado de predição de 95% para o tempo de entrega, envolvendo um carregamento para 1.000 Km, sem considerar a incerteza associada com a própria posição da linha de regressão. Resp: = 3,72 (2,306).(0,42) = 3,72 0,96 = 2,76 a 4,68 dias 2) A tabela abaixo apresenta dados de uma amostra referentes ao número de horas de estudo fora de classe para determinados alunos de um curso de Estatística de 3 semanas, bem como suas notas obtidas em uma prova no final do curso: Estudante Amostrado 1 2 3 4 5 6 7 8 Horas de estudo, X 20 16 34 23 27 32 18 22 Nota na prova, Y 64 61 84 70 88 92 72 77 Construir o diagrama de Dispersão Determinar a Equação de regressão de mínimos quadrados Resp: Usando a equação de regressão desenvolvida acima, estimar a nota na prova de um aluno que estudou 30 horas fora da classe Resp: = 85 Esta equação de regressão poderia ser usada para estimar a nota de um aluno que estudo 40 horas fora de classe? Porquê? Calcular o erro padrão de estimação. Construir um intervalo estimado de predição de 90% para a nota na prova, dado que o aluno estudou 30 horas fora da classe. Capítulo VII – Probabilidade 7.1. Exemplos de Experimentos Não-Determinísticos (aleatórios) Experimentos Aleatórios (E) são aquelas que, mesmo repetidos várias vezes sob condições semelhantes, apresentam resultados imprevisíveis. Jogue um dado e observe o número mostrado na face de cima. Jogue uma moeda quatro vezes e observe o número de caras obtido. Jogue uma moeda quatro vezes e observe a seqüência de caras e coroas. Em uma linha de produção, fabrique peças em série e conte o número de peças defeituosas produzidas em um período de 24 horas. Peças são fabricadas até que 10 peças perfeitas sejam produzidas. O número total de peças fabricadas é contado. De uma urna, que só contém bolas pretas, tira-se umabola e verifica-se sua cor. 7.2. O Espaço Amostral Definição: Para cada experimento do tipo que estamos considerando, definiremos o espaço amostral como o conjunto de todos os resultados possíveis de E. Geralmente representamos esse conjunto por S. Vamos considerar cada um dos experimentos acima e descrever um espaço amostral para cada um deles. O espaço amostral se refere ao experimento . , onde N é o número máximo que pode ser produzido em 24 horas. A fim de descrever um espaço amostral associado a um experimento, devemos ter uma idéia bastante clara daquilo que estamos mensurando ou observando. Por isso, devemos falar de “um’ espaço amostral associado a um experimento e não de “o” espaço amostral. 7.3. Eventos Outra noção fundamental é o com eito de evento. Um evento A (relativo a um particular espaço amostral S, associado a um experimento E) é simplesmente um conjunto de resultados possíveis. Na terminologia de conjuntos, um evento é um subconjunto de um espaço amostral. Qualquer resultado individual pode ser considerado como um evento. . ; isto é duas caras ocorrem. ; isto é, mais caras do que coroas ocorrem. ; isto é, todas as peças são perfeitas. Agora, poderemos empregar as várias técnicas de combinar conjuntos (isto é, eventos), os quais já apresentamos anteriormente. Se A e B forem eventos, será o evento que ocorrerá se, e somente se, A ou B (ou ambos) ocorrerem. Se A e B forem eventos, será o evento que ocorrerá se, e somente se, A e B ocorrerem. Se A for um evento será o evento que ocorrerá se, e somente se, A não ocorrer. Se for qualquer coleção finita de eventos, então, será o evento que ocorrerá se, e somente se, ao menos um dos eventos ocorrer. Se for qualquer coleção finita de eventos, então, será o evento que ocorrerá se, e somente se, todos os eventos ocorrerem. Definição: Dois eventos A e B são denominados mutuamente excludentes, se eles não puderem ocorrer juntos. Escrevemos isso como , isto é, a interseção de A e B é o conjunto vazio. 7.4. Noções Fundamentais de Probabilidade Definição: Seja E um experimento. Seja S um espaço amostral associado a E. A cada evento A associaremos um número real representado por P(A) e denominado probabilidade de A, que satisfaça as seguintes propriedades: (1) . (2) P(S) = 1. (3) Se A e B forem eventos mutuamente excludentes, (4) Se ,.... forem dois a dois eventos mutuamente excludentes, então, Teorema 1: Se for o conjunto vazio, então . Teorema 2: Se o evento complementar de A, então . Teorema 3: Se A e B forem dois eventos quaisquer, então . Teorema 4: Se A, B e C forem três eventos quaisquer, então . Teorema 5: Se . 7.5. Probabilidade de um evento ocorrer: O método de avaliar P(A) é freqüentemente enunciado da seguinte maneira: . 7.6. Probabilidade Condicionada Vamos examinar agora a diferença entre extrair peças de um lote ao acaso, com ou sem reposição. C/ reposição S/ reposição Definição: Sejam A e B dois eventos associados a um experimento. Denotaremos P(A/B) a probabilidade condicionada do evento B dado que o evento A ocorreu, e definimos como: Teorema da Multiplicação ( ( ( ( Ex1: Suponha que o escritório possua 100 máquinas de calcular. Algumas dessas máquinas são elétricas (E), enquanto outras manuais (M); e algumas são novas (N) e outras usadas (U). A tabela abaixo dá o número de máquina de cada categoria. Uma pessoa entra no escritório, pega uma máquina ao acaso, e descobre que é nova. Qual será a probabilidade de que seja elétrica? P(E/N) = ? E M N 40 30 70 U 20 10 30 60 40 100 Definição: Dizemos que os eventos representam uma partição do espaço amostral S quando: a) b) c) Por exemplo: Na jogada de um dado: Representam uma partição. Como os são eventos mutuamente excludentes, podemos escrever: Assim; Ex2: Consideremos o lote de 20 peças defeituosas e 80 não defeituosas, do qual extrairemos duas peças sem reposição. Sejam A e B os eventos: A = {a primeira peça extraída é defeituosa} B = {a segunda peça extraída é defeituosa} Podemos agora calcular P(B), assim: Ex3: Uma determinada peça é manufaturada por três fábricas, digamos 1, 2 e 3. Sabe-se que 1 produz o dobro de peças que 2, e 2 e 3 produzem o mesmo número de peças. Sabe-se também que 2% das peças produzidas por 1 e 2 são defeituosas, enquanto 4% daquelas produzidas por 3 são defeituosas. Todas as peças produzidas são colocadas em um depósito, e depois uma peça é extraída ao caso. Qual é a probabilidade de que essa peça seja defeituosa? Vamos introduzir os seguintes eventos: D = {a peça é defeituosa} = {a peça provém de 1} = {a peça provém de 2} = {a peça provém de 3} Pede-se P(D), então podemos escrever: Suponha agora que a peça retirada é defeituosa. Calcular a probabilidade dela ter sido manufaturada pela fábrica 1? ? 7.7.Teorema de Bayes Seja uma partição do espaço amostral S e seja A um evento associado a S. Aplicando a definição de probabilidade condicionada, podemos escrever: Este resultado é conhecido como Teorema de Bayes. Assim voltando ao problema anterior: Exercício: Dadas 5 caixas , contendo bolas brancas e bolas pretas. Temos duas caixas do tipo I, duas caixas do tipo II e uma caixa do tipo III; a caixa do tipo I possui 2 bolas brancas e 4 bolas pretas, a caixa do tipo II possui 3 bolas brancas e 3 bolas pretas e a caixa do tipo III só possui bolas brancas. Se retirarmos ao acaso uma bola branca, qual a probabilidade dessa bola ter vindo da caixa III? 37,5% 7.8. Eventos Independentes Dois eventos A e B são eventos independentes quando estão inteiramente não relacionados. Saber que B ocorreu não fornece qualquer informação sobre a ocorrência de A. Assim a probabilidade absoluta (ou não condicionada) P(A) é igual à probabilidade condicionada P(A/B). Daí poderíamos dizer que A e B serão independentes se, e somente se, P(A/B) = P(A) e P(B/A) = P(B). Assim: Logo: Definição: A e B serão eventos independentes se, e somente se, . Exercícios 1) Um grupo de 50 elementos apresenta a seguinte composição: Homens Mulheres Menores 15 5 Adultos 18 12 Um elemento é escolhido ao acaso. Pergunta-se: Sabendo-se que o elemento escolhido é adulto, qual a probabilidade de ser homem? Dada que a escolhida é mulher, qual é a probabilidade de ser menor? c) Qual a probabilidade de ser menor e mulher? a) 60% b) 29% c) 10% 2) Um lote é formado de 25 artigos bons, 10 com defeitos menores e 5 com defeitos graves. Um artigo é escolhido ao acaso. Ache a probabilidade de que: ele não tenha defeitos? 62,5% ele não tenha defeitos graves? 87,5% ele ou seja perfeito ou tenha defeitos graves? 75% 3) Três jornais, A, B e C são publicados em uma cidade e uma recente pesquisa entre os leitores indica o seguinte: 20% lêem A 26% lêem B 14% lêem C 8% lêem A e B 5% lêem A e C 4% lêem B e C 2% lêem A,Be C Para um adulto escolhido ao acaso, calcule a probabilidade de que: ele não leia qualquer dos jornais? 55% ele leia exatamente um dos jornais? 32% ele leia somente o jornal A ? 9% ele leia pelo menos dois jornais? 13% ele leia apenas dois jornais? 11% f) ele leia pelo menos um jornal? 45% 4) Uma Faculdade tem 1000 alunos. Desses, 200 estudam Matemática, 180 estudam Física, 150 estudam Química, 20 estudam Matemática, Física e Química, 50 estudam Física e Química, 70 estudam somente Química, 50 estudam Matemática e Química, 60 estudam Matemática e Física. Um aluno dessa Faculdade foi escolhido ao acaso. Qual a probabilidade dele estudar só Matemática? 5) Em uma fábrica de parafusos, as máquinas A, B e C produzem 35%, 40% e 25% do total produzido, respectivamente. Da produção de cada máquina, 6%, 5% e 3%, respectivamente, são parafusos defeituosos. Escolhe-se ao acaso um parafuso e verifica-se ser defeituoso. Qual será a probabilidade de que o parafuso venha da máquina A? Da B? Da C? P(A/D) = 43,3% P(B/D) = 41,2% P(C/D) = 15,5% 6) Dada 6 caixas todas contendo bolas brancas e bolas pretas, temos 2 caixas do tipo I, 3 caixas do tipo II e 1 caixa do tipo III. A caixa I possui 2 bolas brancas e 4 bolas pretas, a caixa II possui 3 bolas brancas e 3 bolas pretas e a caixa III só possui bolas brancas. Se extrairmos uma bola ao acaso e verificamos que ela é preta. Qual a probabilidade dessa bola ter vindo da caixa II? 53% 7) Suponha que você tenha duas moedas em seu bolso, sabe-se que uma é honesta e a outra apresenta duas cara. Extraindo ao acaso uma moeda e jogando-a obtém-se cara. Qual a probabilidade da moeda ser honesta? 33,33% 8) Em um certo colégio, 5% dos homens e 2% das mulheres têm mais do que 1,80m de altura. Por outro lado, 60% dos estudantes são homens. Se um estudante é selecionado aleatoriamente e tem mais de 1,80m de altura, qual a probabilidade de que o estudante seja mulher? 9) Suponha que 5% das pessoas com sangue tipo O sejam canhotas, 10% das pessoas com outro tipo de sangue sejam canhotas, e 40% das pessoas tenham sangue tipo O. Selecionando um canhoto aleatoriamente, qual a probabilidade dele ter sangue tipo O? 25% 10) Suponha que 70% das pessoas com olhos castanhos, 20% das pessoas com olhos verdes e 5% das pessoas com olhos azuis tenham todas cabelos castanhos. Suponha ainda que 75% das pessoas tenham olhos castanhos, 5% tenham olhos azuis e 20% tenham olhos verdes. Qual é a probabilidade de uma pessoa de cabelos castanhos, escolhida ao acaso, ter olhos verdes? 11) Segundo a OMS existem dois exames (A e B) para detectar o vírus HPV. Além disso, informou-se que as probabilidades de ser detectado adequadamente a existência do vírus valem 0,90 e 0,95, se utilizado o exame A e B respectivamente. Por ser mais barato 70% das brasileiras optam por fazer o exame A. Dessa forma: a) Qual a probabilidade de uma brasileira não ser detectada adequadamente) como tendo o vírus HPV? 8,5% b) Que percentual das brasileiras, que foram detectadas como tendo HPV, optaram pelo exame B? 31,15% 12) Um aluno responde a um exame de múltipla escolha no qual cada questão tem quatro alternativas das quais uma resposta é correta. A probabilidade de que ele saiba a resposta correta é de 60%. Caso contrário, ele seleciona ao caso uma resposta entre as quatro possíveis. Se o aluno seleciona a resposta correta para uma questão, qual é a probabilidade de que ele realmente saiba a resposta correta? 86% 13) Uma clínica especializada trata de 3 tipos de moléstias; X, Y e Z. 50% dos que procuram a clínica são portadores de X, 40% são portadores de Y e 10% de Z. As probabilidades de cura, nesta clínica, são: moléstia X: 0,8 moléstia Y: 0,9 moléstia Z: 0,95 Um enfermo saiu curado desta clínica. Qual a probabilidade de que ele tenha sofrido a moléstia Y? 42% 14) A probabilidade de um indivíduo de classe A comprar um carro é , de classe B é e de classe C é . A probabilidade do indivíduo de classe A comprar um carro da marca D é ; de B comprar da marca D é e de C é . Em certa loja comprou-se um carro da marca D. Qual a probabilidade de que o indivíduo da classe B o tenha comprado? 52,63% 15) Suponha que esteja em curso uma eleição com dois candidatos, João e Pedro. Dos habitantes da cidade, apóiam Pedro, mas dos habitantes do interior apóiam João. Metade dos habitantes vivem no interior e metade na cidade. Se você inicia uma conversa com um eleitor que se revela a favor de Pedro, qual é a probabilidade desse eleitor viver no interior? 40% 16) Os analistas de acidentes de trânsito afirmam que a probabilidade de um motorista provocar um acidente vale 3/4 se ingerir alguma bebida alcoólica e 1/4, caso contrário. É sabido que no RJ (durante os fins de semana) 60% dos motoristas se servem de bebidas alcoólicas. Com essas informações: a) Qual a probabilidade de um motorista do RJ não sofrer acidente no fim de semana? 45% b) E sabendo que houve um acidente grave no RJ no sábado à noite, qual a probabilidade do motorista ter ingerido bebida alcoólica? 81,81% 17) Wallace, ao volante de seu conversível, encontra-se em uma encruzilhada numa zona rural. Ele sabe que uma dessas estradas leva à cidade mais próxima, para onde ele deseja ir, e que a outra leva até uma fazenda vizinha, porém não sabe qual é a correta a seguir. Na encruzilhada ele encontra quatro camponeses A, B, C e D que conhecem bem a estrada, e decide dirigir-se ao acaso a um deles para perguntar qual estrada deve seguir. O que ele não sabe é que, enquanto A fala sempre a verdade, B fala a verdade só 70% das vezes, C 50% das vezes e D sempre mente. Determine a probabilidade de Wallace ser enviado ao caminho certo. Se ele descobrir que foi enviado ao caminho errado, qual a probabilidade de que o camponês B tenha sido o que lhe deu a informação? Mesma pergunta para o camponês C. Mesma pergunta para o camponês D. Capítulo VIII – Distribuição Normal Coleta de dados Crítica de dados Apresenta-ção dos dados Tabelas Gráficos Análise Total ----360 graus Parte ---- X graus Qual a porcentagem das vendas em janeiro em relação a venda anual da empresa? Qual a porcentagem das vendas em dezembro em relação a venda anual da empresa? Em que mês houve uma maior queda percentual nas vendas? De quanto foi essa queda? Polígono de freqüência � Distribuição assimétrica para a direita (ou distribuição assimétrica positiva): A média, e a mediana estão à direita da moda, isto é, As > 0. Distribuição simétrica (ou assimetria nula): A média, a moda e a mediana coincidem, isto é, As = 0 Distribuição assimétrica para a esquerda (ou distribuição assimétrica negativa): A média, e a mediana estão à esquerda da moda, isto é, As < 0. 2 bolas A = {1ª bola extraída é B} B = {2ª bola extraídaé B} 7 V 3 B � EMBED Equation.3 ��� o ponto médio da sexta classe; a freqüência absoluta da quarta classe; a freqüência relativa em percentual da classe com maior número de pacientes; a freqüência acumulada da quinta classe; o número de pacientes cuja altura não atinge 180 cm; a percentagem de pacientes cuja altura não atinge 168cm; a percentagem de pacientes cuja altura atinge e ultrapassa 162 cm, mas é inferior a 192 cm; a classe do 52º paciente. B1 B2 B3 B4 � EMBED Equation.3 ��� Teorema da Probabilidade Total P(D) =0,025 _1087774325.unknown _1125491465.unknown _1264631860.xls Gráfico1 105361 124791 148818 299585 512900 REGIÕES NÚMERO DE CRIANÇAS CRIANÇAS NÃO-VACINADAS CONTRA A PÓLIO - BRASIL / 1989 Plan1 Sul 105,361 Centro-Oeste 124,791 Norte 148,818 Sudeste 299,585 Nordeste 512,900 Plan1 0 0 0 0 0 REGIÕES NÚMERO DE CRIANÇAS CRIANÇAS NÃO-VACINADAS CONTRA A PÓLIO - BRASIL / 1989 Plan2 Plan3 _1305791795.unknown _1322620947.unknown _1322621221.unknown _1322621410.unknown _1453076640.unknown _1453076809.unknown _1453076638.unknown _1322621440.unknown _1322621362.unknown _1322621395.unknown _1322621228.unknown _1322621204.unknown _1322621212.unknown _1322620965.unknown _1322620914.unknown _1322620935.unknown _1305794263.unknown _1322620896.unknown _1305802876.unknown _1305793703.unknown _1295246131.unknown _1295248056.unknown _1295249038.unknown _1295249120.unknown _1295249119.unknown _1295248997.unknown _1295248184.unknown _1295246294.unknown _1295247533.unknown _1295247680.unknown _1295246157.unknown _1295245553.unknown _1295245974.unknown _1295245996.unknown _1295245807.unknown _1264633172.unknown _1264633705.unknown _1264632987.unknown _1128858331.unknown _1137410508.unknown _1137413906.unknown _1137414242.unknown _1137414868.unknown _1137414693.unknown _1137414735.unknown _1137414769.unknown _1137414350.unknown _1137414069.unknown _1137412755.unknown _1137412776.unknown _1137412447.unknown _1137412478.unknown _1137411275.unknown _1128948939.unknown _1137410480.unknown _1128858342.unknown _1128858258.unknown _1128858294.unknown _1128858306.unknown _1128858281.unknown _1125491692.unknown _1128858243.unknown _1125491700.unknown _1125491613.unknown _1087851163.unknown _1087941988.unknown _1106688631.unknown _1106689461.unknown _1106689697.unknown _1106690107.unknown _1107157611.unknown _1107157644.unknown _1106693804.unknown _1106690054.unknown _1106689642.unknown _1106689668.unknown _1106689474.unknown _1106688897.unknown _1106689443.unknown _1106688851.unknown _1106688427.unknown _1106688545.unknown _1106688599.unknown _1106688443.unknown _1099078975.unknown _1099079051.unknown _1099079085.unknown _1099079102.unknown _1099078997.unknown _1099078936.unknown _1087904931.unknown _1087905600.unknown _1087906217.unknown _1087941967.unknown _1087906087.unknown _1087905371.unknown _1087905403.unknown _1087905342.unknown _1087904175.unknown _1087904774.unknown _1087904830.unknown _1087904209.unknown _1087904490.unknown _1087851685.unknown _1087904012.unknown _1087851213.unknown _1087847043.unknown _1087847592.unknown _1087847813.unknown _1087851095.unknown _1087848458.unknown _1087847689.unknown _1087847467.unknown _1087847556.unknown _1087847304.unknown _1087774534.unknown _1087776719.unknown _1087846955.unknown _1087775498.unknown _1087774353.unknown _1087774367.unknown _1087774338.unknown _1078580223.unknown _1079211141.unknown _1087771404.unknown _1087774089.unknown _1087774193.unknown _1087774252.unknown _1087774182.unknown _1087771541.unknown _1087771749.unknown _1087771419.unknown _1079214573.unknown _1079215170.unknown _1079215297.unknown _1079215684.unknown _1083536694.unknown _1087770792.unknown _1079215838.unknown _1079215393.unknown _1079215258.unknown _1079214904.unknown _1079215118.unknown _1079214698.unknown _1079211863.unknown _1079211998.unknown _1079212579.unknown _1079211947.unknown _1079211985.unknown _1079211417.unknown _1079211791.unknown _1079211306.unknown _1078582083.unknown _1079210412.unknown _1079210641.unknown _1079210808.unknown _1079210575.unknown _1078582433.unknown _1078582465.unknown _1078582136.unknown _1078581875.unknown _1078581953.unknown _1078582036.unknown _1078581900.unknown _1078580425.unknown _1078581692.unknown _1078580276.unknown _1076761781.unknown _1076765299.unknown _1076765742.unknown _1076765982.unknown _1078580163.unknown _1076765944.unknown _1076765397.unknown _1076765522.unknown _1076765329.unknown _1076764872.unknown _1076765048.unknown _1076765237.unknown _1076764998.unknown _1076764206.unknown _1076764446.unknown _1076764118.unknown _1076764158.unknown _1076757408.unknown _1076758167.unknown _1076758947.unknown _1076761481.unknown _1076758826.unknown _1076757553.unknown _1076757898.unknown _1075735064.xls _1075738274.unknown _1076757021.unknown _1076757148.unknown _1075738417.unknown _1075738515.unknown _1075737493.unknown _1075738227.unknown _1075737127.unknown _1006397134.xls Gráfico3 29 29 24 24 21 21 13.5 13.5 12.5 12.5 AS ARMAS CONTRA O FUMO - CANADÁ / 1990 Plan1 Goma de mascar com nicotina 29 Internamentos em hospital 24 Acupuntura 21 Hipnose 13.5 Injeções de Clonidina 12.5 100 Plan1 AS ARMAS CONTRA O FUMO - CANADÁ / 1990 Plan2 Plan3 _1028303125.doc _1028524256/ole-[42, 4D, F6, E3, 05, 00, 00, 00] _1006418519.xls Gráfico3 259 226 185 196 130 100 144 96 82 80 82 121 Plan1 JAN 259 FEV 226 MAR 185 ABR 196 MAI 130 JUN 100 JUL 144 AGO 96 SET 82 OUT 80 NOV 82 DEZ 121 Plan1 Plan2 Plan3 _1006393222.xls Gráfico1 865 967 1056 920 1069 513 ANOS NÚMERO DE PESSOAS NÚMERO DE PESSOAS, ACIMA DE 40 ANOS ATENDIDAS NO SETOR DE CARDIOLOGIA DO HOSPITAL SÃO JORGE (RS) NO 1o. SEMESTRE DE CADA ANO (1994/1999) Plan1 1994 865 1995 967 1996 1056 1997 920 1998 1069 1999 513 865 1994 967 1995 1056 1996 920 1997 1069 1998 513 1999 Plan1 ANOS NÚMERO DE PESSOAS NÚMERO DE PESSOAS, ACIMA DE 40 ANOS ATENDIDAS NO SETOR DE CARDIOLOGIA DO HOSPITAL SÃO JORGE (RS) NO 1o. SEMESTRE DE CADA ANO (1994/1999) Plan2 Plan3
Compartilhar