Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 APOSTILA ESTATÍSTICA E PROBABILIDADE CURSOS: ADMINISTRAÇÃO E RECURSOS HUMANOS 2 SUMÁRIO 1 TÓPICOS DE ESTATÍSTICA 1.1 INTRODUÇÃO 1.2 DEFINIÇÃO DE ESTATÍSTICA 1.2.1 ESTATÍSTICA DESCRITIVA 1.2.2 PROBABILIDADE ESTATÍSTICA 1.2.3 INFERÊNCIA ESTATÍSTICA 1.3 FASES DE UMA PESQUISA 1.4 POPULAÇÃO E AMOSTRA 1.5 AMOSTRAGEM PROBABILÍSTICA 1.5.1 ALEATÓRIA SIMPLES 1.5.2 PROPORCIONAL ESTRATIFICADA 1.5.3 AMOSTRAGEM SISTEMÁTICA 1.5.4 POR CONGLOMERADO 1.6 AMOSTRAGEM NÃO PROBABILÍSTICA 1.6.1 POR CONVENIÊNCIA 1.6.2 POR COTAS 2 ESTATÍSTICA DESCRITIVA 2.1 VARIÁVEIS CONTÍNUAS E DISCRETAS 2.2 DADOS ABSOLUTOS E DADOS RELATIVOS 2.3 TABELAS 2.3.1 SÉRIES ESTATÍSTICAS 2.3.2 DISTRIBUIÇÃO DE FREQÜÊNCIA 2.3.3 ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQÜÊNCIA 2.4 NÚMERO DE CLASSES 2.5 TIPOS DE FREQÜÊNCIAS 2.6 GRÁFICOS 2.6.1 GRÁFICO DE LINHA 2.6.2 GRÁFICO DE BARRAS 2.6.3 GRÁFICO DE SETORES 2.6.4 GRÁFICO DE PARETO 2.6.5 REPRESENTAÇÃO GRÁFICA DE DISTRIBUIÇÃO DE FREQÜÊNCIA 2.6.5.1 HISTOGRAMA 2.6.5.2 POLÍGONO DE FREQÜÊNCIA 2.6.5.3 POLÍGONO DE FREQÜÊNCIA ACUMULADA (OGIVA DE GALTON) 2.6.5.4 CURVA DE FREQÜÊNCIA POLIDA 2.6.6 FORMAS DAS CURVAS DE FREQÜÊNCIA 2.7 MEDIDAS DE POSIÇÃO 2.7.1 MÉDIAS 2.7.2 MEDIANA 2.7.3 MODA 2.7.4 SEPARATRIZES 2.7.5 VARIÂNCIA 2.7.6 DESVIO PADRÃO 2.7.7 COEFICIENTE DE VARIAÇÃO 2.8 ASSIMETRIA E DE CURTOSE 2.8.1 MEDIDA DE ASSIMETRIA 2.8.2 COEFICIENTE DE ASSIMETRIA 2.8.3 MEDIDA DE CURTOSE 2.8.4 COEFICIENTE DE CURTOSE 2.9 CORRELAÇÃO 2.9.1 COEFICIENTE DE CORRELAÇÃO 2.10 REGRESSÃO 2.10.1 AJUSTAMETO DA RETA 3 3 INTRODUÇÃO DE PROBABILIDADE ESTATÍSTICA 3.1 EXPERIMENTO ALEATÓRIO 3.2 ESPAÇO AMOSTRAL 3.3 EVENTO 3.3.1 EVENTOS INDEPENDENTES 3.2.1 EVENTOS MUTUAMENTE EXCLUSIVOS 3.4 PROBABILIDADE 3.4.1 PROPRIEDADES 3.4.2 PROBABILIDADE DA UNIÃO DE EVENTOS 3.4.3 MULTIPLICAÇÃO DE PROBABILIDADES 3.5 VARIÁVEL ALEATÓRIA, DISTRIBUIÇÃO DE PROBABILIDADE E VALOR ESPERADO 3.5.1 DISTRIBUIÇÃO DE BERNOULLI 3.5.2 DISTRIBUIÇÃO BINOMIAL 3.5.3 DISTRIBUIÇÃO DE POISSON 3.5.4 DISTRIBUIÇÃO NORMAL (CURVA NORMAL) 4 INTRODUÇÃO DE INFERÊNCIA ESTATÍSTICA 4.1 DISTRIBUIÇÃO AMOSTRAL DA MÉDIA 4.2 ESTIMATIVA 4.2.1 ESTIMATIVAS PONTUAIS 4.2.2 ESTIMATIVAS POR INTERVALOS 4.3 INTERVALO DE CONFIANÇA PARA MÉDIA 4.4 INTERVALO DE CONFIANÇA PARA UMA PROPORÇÃO 4 1 TÓPICOS DE ESTATÍSTICA 1.1 ORIGEM DA ESTATÍSTICA E O SEU USO COMO FERRAMENTA DE GESTÃO A Matemática, considerada “a ciência que une à clareza do raciocínio a síntese da linguagem”, originou-se do convívio social, das trocas e da contagem, com caráter prático, utilitário e empírico. A Estatística, parte da Matemática Aplicada, teve origem semelhante. No passado, o estudo de fatos como batizados, casamentos e funerais, originaram as primeiras tábuas e tabelas e os primeiros números relativos e foram assim, adquirindo feições científicas. Com o passar dos anos, as tabelas tornaram-se mais completas, surgindo as representações gráficas e os cálculos das probabilidades, e a Estatística deixou de ser simples catalogação de dados numéricos para se tornar o estudo de como chegar a conclusões sobre o todo, partindo da observação de parte desse todo. Atualmente, a Estatística auxilia, por exemplo, a Geografia na descrição da população, a Economia procurando estabelecer harmonia entre produção, circulação e consumo da riqueza e a Sociologia no estudo dos movimentos, atitudes e agitações da massa humana. A análise e interpretação de dados estatísticos torna possível, por exemplo, o diagnóstico de uma empresa ou instituição, o conhecimento de seus problemas, a formulação de soluções apropriadas e um planejamento objetivo de ação. 1.2 DEFINIÇÃO DE ESTATÍSTICA É a parte da Matemática Aplicada que fornece métodos para coleta, organização, descrição, análise e interpretação de dados, para a utilização dos mesmos na tomada de decisões. Pode ser dividida em três: Estatística Descritiva, Probabilidade Estatística e Inferência Estatística. 1.2.1 ESTATÍSTICA DESCRITIVA Descreve e analisa um conjunto de dados através de tabelas e gráficos sem a preocupação em tirar conclusões. 1.2.2 PROBABILIDADE ESTATÍSTICA Auxilia a quantificar o erro na tomada de decisões, e a principal vantagem nas situações de incerteza é quantificar a possibilidade de ocorrência de um acontecimento. 1.2.3 INFERÊNCIA ESTATÍSTICA É a parte que trata das inferências e conclusões a partir da análise dos dados. 1.3 FASES DE UMA PESQUISA São as fases do método estatístico: 1.3.1 COLETA DE DADOS A coleta pode ser direta ou indireta. A coleta é direta quando feita sobre elementos informativos de registro obrigatório, tais como: nascimentos, casamentos e óbitos, importação e exportação de mercadorias, ou ainda, quando os dados são coletados pelo próprio pesquisador através de questionários sendo classificada relativamente ao fator tempo em: I - Contínua - quando feita continuamente, tal como a de nascimento ou de óbitos e a de freqüência dos alunos às aulas. II - Periódica - quando feita em intervalos constantes de tempo, como os censos, as eleições e as avaliações mensais dos alunos. III - Ocasional - quando feita a fim de atender a uma conjuntura ou a uma emergência, como nos casos das epidemias que assolam ou dizimam rebanhos inteiros. 5 Dizemos que a coleta é indireta quando é inferida de elementos conhecidos da coleta direta. Por exemplo, a pesquisa sobre a mortalidade infantil, que é feita através de dados colhidos pela coleta direta. 1.3.2 CRÍTICA DOS DADOS A crítica pode ser externa ou interna. A crítica é externa quando visa às causas dos erros por parte do informante, por distração ou má interpretação das perguntas que lhe foram feitas; e é interna quando visa observar os elementos originais dos dados da coleta. 1.3.3 APURAÇÃO DOS DADOS É a soma e o processamento dos dados obtidos e a disposição mediante critérios de classificação. Pode ser manual, eletromecânica ou eletrônica. 1.3.4 EXPOSIÇÃO OU APRESENTAÇÃO DOS DADOS Os dados devem ser apresentados sob forma adequada, tabelas ou gráficos, tornando mais fácil o exame daquilo que está sendo objeto de tratamento estatístico. 1.3.5 ANÁLISE DOS RESULTADOS O objetivo último da Estatística é tirar conclusões sobre o todo a partir de informações fornecidas por parte representativa do todo. Assim, realizadas as fases anteriores (Estatística Descritiva), fazemos uma análise dos resultados obtidos, através dos métodos da Inferência Estatística, e tiramos desses resultados conclusões e previsões. 1.4 POPULAÇÃO E AMOSTRA Como em qualquer estudo estatístico temos em mente pesquisar uma ou mais características dos elementos de algum universo, esta característica deve estar perfeitamente definida. E isso se dá quando consideramos um elemento qualquer e podemos afirmar sem ambigüidade se esse elemento pertence ou não ao universo. Ao conjunto de entes portadores de, pelo menos, uma característica comum denominamos população. Para o número de elementos da população, denotamos N. Na maioria das vezes, por impossibilidade ou inviabilidade econômica ou temporal, limitamos as observações referentes a uma determinada pesquisa a apenas uma parte da população. A essa parte proveniente da população em estudo denominamos amostra, que é um subconjunto finito da população. Para o número de elementos da amostradenotamos n. É preciso que as amostras usadas sejam obtidas através de processos adequados e todas as vezes que as informações provêm de um conjunto menor que a população, cometem-se erros, e estes erros são quantificados pelo cálculo das probabilidades, o qual proporciona uma base racional para lidar com essa situação. O conhecimento das probabilidades fornece a base para o desenvolvimento das técnicas da tomada de decisão, explicam seu funcionamento e indicam como as conclusões podem ser apresentadas e interpretadas corretamente. 1.5 AMOSTRAGEM PROBABILÍSTICA É uma técnica especial para colher amostras, que garante, tanto quanto possível, o acaso na escolha e tem por finalidade permitir fazer inferências sobre uma população após inspeção de apenas parte dela. As principais técnicas de amostragem são: 1.5.1 AMOSTRAGEM ALEATÓRIA SIMPLES A amostragem aleatória simples pode ser realizada numerando-se a população de 1 a um número real a e sorteando-se, a seguir, por meio de um dispositivo aleatório qualquer, k números dessa seqüência, os quais concorrerão aos elementos pertencentes à amostra. 6 1.5.2 AMOSTRAGEM PROPORCIONAL ESTRATIFICADA Muitas vezes a população se divide em subpopulações, ou seja, estratos. Como é provável que a variável em estudo apresente, de estrato em estrato, um comportamento heterogêneo e, dentro de cada estrato, um comportamento homogêneo, convém que o sorteio dos elementos da amostra leve em consideração tais estratos. É exatamente isso que fazemos quando empregamos a amostragem proporcional estratificada, que, além de considerar a existência dos estratos, obtém os elementos da amostra proporcional ao número de elementos dos mesmos. 1.5.3 AMOSTRAGEM SISTEMÁTICA Quando os elementos da população já se acham ordenados, não há necessidade de construir o sistema de referência. A seleção dos elementos que constituirão a amostra pode ser feita por um sistema imposto pelo pesquisador. A esse tipo de amostra denominamos sistemática. Assim, no caso de uma linha de produção, podemos, a cada dez itens produzidos, retirar um para pertencer a uma amostra da produção diária. Neste caso, estaríamos fixando o tamanho da amostra em 10% da população. 1.5.4 AMOSTRAGEM POR CONGLOMERADO A amostragem por conglomerado pressupõe a disposição dos itens de uma população em subgrupos heterogêneos representativos da população global. Cada conglomerado pode ser encarado como uma minipopulação. Se a formação dos conglomerados for bem feita, cada um sendo exatamente semelhante ao outro, basta examinar apenas um conglomerado para fazer inferências sobre a população. A amostragem por conglomerado tem duas vantagens muito distintas sobre a amostragem aleatória. Uma é que na amostragem aleatória, os itens da população se acham muito dispersos, enquanto que na amostragem por conglomerado, os itens estão próximos uns dos outros. Uma segunda vantagem da amostragem por conglomerado é que não é necessário uma listagem dos itens da população. Basta uma lista dos conglomerados. 1.6 AMOSTRAGEM NÃO PROBABILÍSTICA Este tipo de amostra, é determinada por ordem do pesquisador, ou seja não há uma aleatoriedade para a escolha de um elemento da população. 1.6.1 AMOSTRAGEM POR CONVENIÊNCIA Indicada para estudos exploratórios. Frequentemente utilizados em supermercados para testar produtos. 1.6.2 AMOSTRAGEM POR COTAS Na realidade, trata-se de uma variação da amostragem intencional. Necessita-se ter um prévio conhecimento da população e sua proporcionalidade. Por exemplo, deseja-se entrevistar apenas indivíduos da classe A, que representa 10% da população. Esta será a cota para o trabalho. 7 2 ESTATÍSTICA DESCRITIVA A Estatística Descritiva estuda a descrição das observações coletadas e permite fazer comentários simples a seu respeito sem se preocupar com a abrangência das interpretações dos resultados obtidos. Sua finalidade é descrever as variáveis em estudo da maneira mais informativa e significativa possíveis. 2.1 VARIÁVEIS CONTÍNUAS E DISCRETAS Variável é o conjunto de resultados possíveis de um fenômeno. Uma variável pode ser: I - Qualitativa - quando seus valores são expressos por atributos: sexo, cor da pele, etc... II - Quantitativa - quando seus valores são expressos em números: salário, idade, etc ... Uma variável que pode assumir qualquer valor real entre dois valores dados é uma variável contínua. Caso isso não seja possível, a variável é chamada discreta. Em geral, as contagens resultam nas variáveis discretas, e as medições, nas variáveis contínuas. 2.2 DADOS ABSOLUTOS E DADOS RELATIVOS Os dados estatísticos resultantes da coleta direta da fonte, sem outra manipulação senão a contagem ou medida, são chamados dados absolutos. Dados relativos são os resultados de comparações por quociente que se estabelecem entre dados absolutos e têm por finalidade realçar ou facilitar as comparações entre quantidades. Traduzem-se os dados relativos, em geral, por meio de taxas, percentagens, índices e coeficientes e, que é de grande valia quando o intuito é destacar a participação da parte no todo. Veremos, agora, como calculamos esses dados relativos: I - TAXA PERCENTUAL Taxa percentual é o valor que representa a quantidade de unidades tomadas em cada 100: x% = x 100 II - ÍNDICES Os índices são razões entre duas grandezas tais que uma não inclui a outra. São exemplos de índices: Densidade demografica populacao erficie sup Renda per capita renda populacao III - COEFICIENTES Os coeficientes são razões entre o número de ocorrências e o número total (número de ocorrências e o número de não-ocorrências). São exemplos de coeficientes: Coeficiente de natalidade numero de nascimentos populacao total Coeficiente de evasao escolar numero de alunos evadidos numero inicial de matriculas 8 2.3 TABELAS Um dos objetivos da Estatística é sintetizar os valores que uma ou mais variáveis podem assumir, para que tenhamos uma visão global da variação dessa ou dessas variáveis. E isso ela consegue, inicialmente, apresentando esses valores em tabelas e gráficos, que irão nos fornecer rápidas e seguras informações a respeito das variáveis em estudo. A tabela é um quadro que resume um conjunto de observações, que compõe-se de: 1 - corpo - conjunto de linhas e colunas que contém informações sobre a variável em estudo; 2 - cabeçalho - parte superior da tabela que especifica o conteúdo das colunas; 3 - coluna indicadora - parte da tabela que especifica o conteúdo das linhas; 4 - linhas - retas imaginárias que facilitam a leitura, no sentido horizontal, de dados que se inscrevem nos seus cruzamentos com as colunas; 5 - célula - espaço destinado a um só número; 6 - título - conjunto de informações, as mais completas possíveis, localizada no topo da tabela. Há ainda a considerar os elementos complementares da tabela, que são: a fonte, as notas e as chamadas, colocadas, preferencialmente, no seu rodapé. Exemplos: PRODUÇÃO DE CAFÉ SALÁRIOS DOS FUNCIONÁRIOS BRASIL 2002 – 2010 DA EMPRESA EMPATECOL ANOS PRODUÇÃO (1.000 t) SALÁRIOS (em reais) Frequência 2002 2.535 1.300 1.400 3 2003 2.666 1.400 1.500 5 2004 2.122 1.500 1.600 8 2005 3.750 1.600 1.700 11 2006 2.007 1.700 1.800 15 2007 2.783 1.800 1.900 10 2008 2.991 1.900 2.000 7 2009 3.124 2.0002.100 4 2010 3.050 2.100 2.200 2 Dados fictícios Dados fictícios De acordo com a Resolução 886 da Fundação IBGE, nas células devemos colocar: um traço horizontal ( - ) quando o valor é zero, não só quanto à natureza das coisas, como quanto o resultado do inquérito; três pontos ( ... ) quando não temos os dados; um ponto de interrogação ( ? ) quando temos dúvida quanto à exatidão de determinado valor; zero ( 0 ) quando o valor é muito pequeno para ser expresso pela unidade utilizada. Nota: Se os valores são expressos em numerais decimais, precisamos acrescentar à parte decimal um número correspondente de zeros ( 0,0; 0,00; 0,000; ... ). 2.3.1 SÉRIES ESTATÍSTICAS São tabelas associadas aos seguintes fenômenos: tempo (a época a que ele se refere), espaço (a região onde se passam os fatos) e espécie (o fenômeno que é descrito). Conforme varie cada um desses elementos, podemos classificar as séries estatísticas em: Série temporal, Cronológica, Evolutiva ou Histórica: É a série cujos dados estão dispostos de acordo com o tempo. 9 Série Geográfica ou Territorial: É a série cujos dados estão dispostos em correspondência com a região geográfica. Série Específica ou Qualitativa: É a série cujos dados estão em correspondência com a espécie do fenômeno. Série Composta ou Mista: As combinações entre as séries constituem novas séries que estão representadas nas tabelas de dupla entrada. 2.3.2 DISTRIBUIÇÃO DE FREQÜÊNCIA Para construir uma tabela de distribuição de freqüências com intervalo de classe, devemos utilizar uma amostra de dados estatísticos resultante de variáveis quantitativas. Utilizaremos como exemplo, para construção de nossa tabela, uma amostra coletada de dados relativos às estaturas de quarenta alunos de nossa universidade. ESTATURA DE 40 ALUNOS DE NOSSA UNIVERSIDADE 166 160 161 150 162 160 165 167 164 160 162 161 168 163 156 173 160 155 164 168 155 152 163 160 155 155 169 151 170 164 154 161 156 172 153 157 156 158 158 161 Quando os dados de uma amostra não estão numericamente organizados, a esse conjunto de dados chamamos de tabela primitiva. A tabela obtida após a ordenação dos dados estatísticos recebe o nome de rol. ESTATURA DE 40 ALUNOS DA UNIVERSIDADE A 150 154 155 157 160 161 162 164 166 169 151 155 156 158 160 161 162 164 167 170 152 155 156 158 160 161 163 164 168 172 153 155 156 160 160 161 163 165 168 173 Com isso, podemos observar facilmente qual a menor ou maior estatura; que as estaturas variaram em 23cm; e, ainda, a ordem que um valor particular da variável ocupa no conjunto. O processo visto é ainda inconveniente, já que é muito extensa, mesmo quando o número de valores da variável ( n ) é de tamanho razoável. Sendo assim, a solução mais aceitável, pela própria natureza da variável contínua, é o agrupamento dos valores em vários intervalos. Assim, os dados da tabela anterior podem ser dispostos da seguinte forma: ESTATURA DE 40 ALUNOS DA UNIVERSIDADE A ESTATURAS ( cm ) FREQÜÊNCIA 150 154 4 154 158 9 158 162 11 162 166 8 166 170 5 170 174 3 Total 40 O que pretendemos com a construção desse tipo de tabela é realçar o que há de essencial nos dados e, também, tornar possível o uso de técnicas analíticas para sua total descrição, até porque a Estatística tem por finalidade específica analisar o conjunto de valores, desinteressando-se por casos isolados. Quando os dados estão organizados em uma distribuição de freqüência, são denominados dados agrupados. 10 2.3.3 ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQUÊNCIA Classe - São intervalos de variação da variável. Limites de classe – São os extremos de cada classe. Amplitude de um intervalo de classe - É a medida do intervalo que define a classe. Amplitude total da distribuição - É a diferença entre o limite superior da última classe e o limite inferior da primeira classe (AT). Amplitude amostral - É a diferença entre o valor máximo e o valor mínimo da amostra (AA). Ponto médio de uma classe – É o ponto que divide o intervalo de classe em duas partes iguais. Freqüência simples ou freqüência absoluta - É o número de observações correspondentes a essa classe ou a esse valor. 2.4 NÚMERO DE INTERVALOS DE CLASSES Na construção da distribuição de frequência, foi necessária a determinação do número de classes e, consequentemente, sua amplitude. Para a determinação do número de classes usamos a regra de Sturges, que nos deu o número de classes em função do número de valores da variável: ni log3,31 onde i é o número de classe e n é o tamanho da amostra, mas cabe ao pesquisador determinar o número de intervalos de classe que pretende organizar. Após a determinação do número de classes da distribuição, calculamos a amplitude dos intervalos de classe, recorrendo a fórmula: h AA i Em nosso exemplo, temos: para n = 40, temos i = 6 classes. Logo: h 173 150 6 23 6 3 8, Quando o resultado não é exato, devemos arredondá-lo para mais. h = 4 cm. 2.5 TIPOS DE FREQUÊNCIAS I - FREQUÊNCIAS SIMPLES OU ABSOLUTAS Frequências simples ou absolutas(fi) são os valores que realmente representam o número de dados de cada classe. A soma das frequências simples é igual ao número total dos dados: f ni II - FREQUÊNCIAS RELATIVAS Frequências relativas (fri) são os valores das razões entre as frequências simples e a frequência total: fr f f i i i 11 III - FREQUÊNCIA ACUMULADA Frequência acumulada (Fi) é o total das frequências de todos os valores inferiores ao limite superior do intervalo de uma dada classe: F fi i Podemos ter dois tipos de frequência acumulada: “abaixo de” (FAB), onde efetuamos o somatório das frequências da primeira classe em diante e “acima de”(FAC), onde efetuamos o somatório a partir da última classe. IV - FREQUÊNCIA ACUMULADA RELATIVA Frequência acumulada relativa (Fri) de uma classe é a frequência acumulada da classe, dividida pela frequência total da distribuição: Fr F f i i i A partir da tabela vista na página 10, obtivemos uma nova tabela com as frequências estudadas: ESTATURA DE 40 ALUNOS DA UNIVERSIDADE A i ESTATURAS (cm) fi xi fri Fi Fri 1 150 154 4 152 0,100 4 0,100 2 154 158 9 156 0,225 13 0,325 3 158 162 11 160 0,275 24 0,600 4 162 166 8 164 0,200 32 0,800 5 166 170 5 168 0,125 37 0,925 6 170 174 3 172 0,075 40 1,000 = 40 = 1,000 O conhecimento dos vários tipos de freqüência ajuda-nos a responder a muitas questões com relativa facilidade, como as seguintes: Quantos alunos têm estatura entre 166 cm, inclusive, e 170 cm? Qual a percentagem de alunos cujas estaturas são inferiores a 154 cm? Quantos alunos têm estatura abaixo de 162 cm? Qual o percentual de alunos com estatura superior a 158 cm? EXERCÍCIOS 1 – Utilizando as amostras a seguir, construa a tabela de distribuição de frequência com intervalo de classe para cada uma e complete-as com as colunas de ponto médio, frequência relativa, frequência acumulada e frequência acumulada relativa. AMOSTRA 1 200 225 241 253 260 274 292 209 229 243 253 263 278 297 213 232 244 255 266 283 312 218 235 247 257 270 288 315 220 238 252 259 270 292 318AMOSTRA 2 800 850 850 900 920 960 990 1.000 1.000 1.000 1.050 1.050 1.050 1.050 1.100 1.100 1.150 1.150 1.180 1.200 1.200 1.200 1.220 1.250 1.250 1.250 1.270 1.280 1.300 1.330 1.350 1.370 1.370 1.390 1.400 1.410 1.460 1.490 1.500 1.500 1.530 1.550 1.580 1.580 1.610 1.650 1.700 1.720 1.750 1.790 1.800 1.880 1.970 2.100 2.190 12 2.6 GRÁFICOS Os gráficos permitem a representação de uma relação entre variáveis e facilitam a compreensão de dados, desde que apresentados de forma clara e objetiva. Os gráficos devem ser auto-explicativos e de fácil compreensão, de preferência sem comentários inseridos. Devem ser simples, atrair a atenção do leitor e inspirar confiança na veracidade do fenômeno em estudo. Alguns pontos devem ser respeitados na construção de um gráfico: Ter o tamanho adequado à sua publicação em revistas. Ter sempre título. Ser construído em uma escala que não desfigure os fatos ou as relações que se deseja destacar. 2.6.1 GRÁFICO DE LINHA Este tipo de gráfico se utiliza da linha poligonal para representar a série estatística. O gráfico de linha constitui uma aplicação do processo de representação das funções num sistema de coordenadas cartesianas. Os dados, geralmente de uma tabela, são colocados num sistema cartesiano ortogonal, que graficamente, temos pontos ligados por segmentos de reta. Vejamos o gráfico de linha a seguir: A tabela e o gráfico representam os percentuais de intenção de votos de três candidatos comparativamente: ELEIÇÕES PRESIDENCIAS - 2006 Desempenho (%) Candidatos Mês A B C Janeiro 12 30 40 Fevereiro 16 25 36 Março 20 20 40 Abril 24 18 32 Maio 30 20 35 Dados fictícios. ELEIÇÕES PRESIDENCIAS 2006 0 5 10 15 20 25 30 35 40 J F M A M Mês Desempenho % A B C No eixo de x marcamos os meses e no eixo de y os percentuais dos candidatos A, B e C. São três gráficos de linha no mesmo sistema cartesiano, o que permite comparar o desempenho dos três candidatos. 2.6.2 GRÁFICO DE BARRAS Nesse tipo de gráfico usamos retângulos com bases da mesma medida e separados por distâncias iguais. As frequências dos fatos observados são dadas pelas alturas dos retângulos, anotadas no eixo de y, se as barras forem verticais. Se as barras forem horizontais, pelos comprimentos dos retângulos, anotados no eixo de x. 13 Um gráfico de barras também pode ser usado de forma comparativa, apresentando dois ou mais conjuntos de dados: VENDAS DE APARTAMENTOS DE UMA IMOBILIÁRIA Unidades vendidas Mês 2006 2007 Janeiro 15 12 Fevereiro 10 18 Março 12 20 Abril 18 22 Dados fictícios. VENDAS DE APARTAMENTOS DE UMA IMOBILIÁRIA 0 5 10 15 20 25 J F M A Mês Un. vendidas 2006 2007 O gráfico de barras comparativas acima, mostra claramente que existe uma comparação nas vendas de apartamentos de uma imobiliária no ano de 2006 e 2007. Os dados em gráficos de barras também podem ser representados por diferentes figuras, como pessoas, objetos etc. Esses gráficos recebem o nome de pictóricos. 2.6.3 GRÁFICO DE SETORES Os dados são apresentados em setores circulares proporcionais aos valores. Para representar os setores, fazemos corresponder a uma volta do círculo (360º) o total (100%) dos dados e estabelecemos uma relação com o ângulo relativo ao setor de acordo com cada valor. Vejamos o gráfico de setores a seguir, relativo a produção agrícola do Brasil em 2002: PRODUÇÃO AGRÍCOLA - 2002 Produtos Quantidade produzida (Toneladas) A 32,4 B 21,6 C 43,2 D 10,8 Total 108,0 Dados fictícios. 14 PRODUÇÃO AGRÍCOLA - 2002 C 40% D 10% A 30% B 20% 2.6.4 GRÁFICO DE PARETO É um gráfico gerado através da associação de um gráfico de barras que identifica as frequências dos registros ou ocorrências em um processo de forma decrescente, com um gráfico de linhas das correspondentes frequências relativas acumuladas, que permite a priorização no que diz respeito sobre as ações na tomada de decisões. Podemos, através do gráfico de Pareto, filtrar os problemas menores dos maiores, onde é claro as falhas maiores necessitam de ações mais dinâmicas e urgentes, os problemas ou falhas menores necessitam de ações por igual, mas quando podemos visualizar o grau de importância de cada falha sempre devemos originar a ação sobre a mais crítica. 2.6.5 REPRESENTAÇÃO GRÁFICA DE UMA DISTRIBUIÇÃO DE FREQUÊNCIA As tabelas com grande número de dados não dão ao leitor uma visão rápida e global de um fenômeno. Uma forma de amenizar esse problema é organizar seus dados, que serão apresentados agrupados em intervalos de classe. Para isso, é preciso que os dados estejam organizados em uma tabela de distribuição de frequências. Uma distribuição de frequência pode ser representada através de gráficos (histograma, polígono de frequências e polígono de frequências acumuladas ou ogiva de Galton). Construímos qualquer dos gráficos mencionados utilizando o primeiro quadrante do sistema de eixos coordenados cartesianas ortogonais. No eixo das abscissas, colocamos os valores da variável e no eixo das ordenadas, as frequências. Vamos ver algumas formas de representar uma distribuição de frequências. 2.6.5.1 HISTOGRAMA O histograma é um gráfico formado por retângulos justapostos, sendo o número de retângulos igual ao número de intervalos de classe. A largura de cada retângulo é igual à amplitude do intervalo de classe, enquanto sua altura representa a frequência do intervalo de classe. 15 Ao se fazer qualquer tipo de gráfico, perde-se algumas informações, pois já não mais existem as observações originais. Entretanto, essa perda de informações, se comparada com a concisão e facilidade de interpretação ganha com o uso da distribuição de frequências e histograma, se torna desprezível. Vejamos o histograma para distribuição de frequências relativo aos pesos de uma classe escolar: PESOS DOS ALUNOS DE UMA CLASSE ESCOLAR Peso (kg) Freqüência 40 50 6 50 60 10 60 70 18 70 80 12 80 90 4 Dados fictícios. PESOS DOS ALUNOS DE UMA CLASSE ESCOLAR 0 2 4 6 8 10 12 14 16 18 40 50 60 70 80 90 Pesos fi Notas: A área de um histograma é proporcional à soma das frequências. No caso de usarmos as frequências relativas, obtemos um gráfico de área unitária. Quando queremos comparar duas distribuições, o ideal é fazê-lo pelo histograma de frequências relativas. 2.6.5.2 POLÍGONO DE FREQUÊNCIA O polígono de frequência é um gráfico de linha em que cada ponto é obtido considerando-se como valor do eixo das abscissas (x), o ponto médio do intervalo de classe e como valor do eixo das ordenadas (y), a respectiva freqüência do intervalo. Consideramos também uma classe anterior a primeira e outra posterior à ultima. Ligando todos os pontos teremos o polígono de frequências. Vejamos o polígono de frequência para distribuição de frequências, relativo, também, aos pesos dos alunos de uma classe escolar: PESOS DOS ALUNOS DE UMA CLASSE ESCOLAR Peso (kg) Freqüência 4050 6 50 60 10 60 70 18 70 80 12 80 90 4 Dados fictícios. 16 PESOS DOS ALUNOS DE UMA CLASSE ESCOLAR 0 2 4 6 8 10 12 14 16 18 35 45 55 65 75 85 95 Pesos fI O polígono de frequência também apresenta área proporcional à soma das frequências. 2.6.5.3 POLÍGONO DE FREQUÊNCIA ACUMULADA ou OGIVA DE GALTON O polígono de frequência acumulada ou ogiva de Galton é um gráfico de linha em que são consideradas as frequências acumuladas. Anotamos a frequência nula para o limite inferior da primeira classe e os limites superiores de todas as classes, da primeira à última. Vejamos a ogiva de Galton para distribuição de frequências, a seguir: PESOS DOS ALUNOS DE UMA CLASSE Classe Freqüência Fi 30 40 3 3 40 50 5 8 50 60 8 16 60 70 12 28 70 80 7 35 80 90 3 38 90 100 2 40 Dados fictícios. PESOS DOS ALUNOS DE UMA CLASSE ESCOLAR 0 5 10 15 20 25 30 35 40 30 40 50 60 70 80 90 10 Pesos Fi 17 Uma distribuição de frequência sem intervalos de classe é representada graficamente por um diagrama onde cada valor da variável é representado por um segmento de reta vertical e de comprimento proporcional à respectiva frequência. fi I xi fi Fi 1 2 4 4 2 3 7 11 3 4 5 16 4 5 2 18 5 6 1 19 6 7 1 20 =20 Dados fictícios. 1 2 3 4 5 6 7 xi Também podemos representar a distribuição pelo gráfico da frequência acumulada, o qual se apresentará com pontos de descontinuidade nos valores observados da variável. fr 20 10 0 1 2 3 4 5 6 7 xi 2.6.5.4 CURVA DE FREQUÊNCIA POLIDA Em geral, os dados de uma amostra são extraídos de uma população. Se tornarmos as amostras cada vez mais amplas, sua amplitude ficaria cada vez menor, o que nos permite verificar a sua tendência em se transformar numa curva, o que nos deixa mais evidente a verdadeira natureza da distribuição da população. Esse procedimento não nos dará uma certeza absoluta de que a curva obtida seja tal qual a curva resultante de um grande número de dados. Porém, podemos afirmar que a distribuição assemelha-se mais à curva de freqüência do que ao polígono de frequência obtido de uma amostra limitada. Essa transformação corresponde na eliminação dos vértices da linha poligonal através do emprego de uma fórmula bastante simples, a qual, a partir das frequências reais, nos fornece novas frequências que se localizarão, assim como no polígono de frequência, nos pontos médios dos intervalos de classe. A fórmula para encontrar a frequência calculada (fci) é: fc f f f i i i i 1 12 4 18 Quando fazemos uso da curva polida, convém mostrar as frequências realmente observadas por meios de pontos ou pequenos círculos, de modo que qualquer interessado possa, por si mesmo, julgar até que ponto os dados originais foram ajustados. Para distribuição da tabela à seguir, temos: ESTATURA DE 40 ALUNOS DA UNIVERSIDADE A i ESTATURAS ( cm ) fi fci 1 150 154 4 4,25 2 154 158 9 8,25 3 158 162 11 9,75 4 162 166 8 8,00 5 166 170 5 5,25 6 170 174 3 2,75 = 40 fc x fc x fc x 1 2 3 0 2 4 9 4 17 4 4 25 4 2 9 11 4 33 4 8 25 9 2 11 8 4 39 4 9 75 , , , fc x fc x fc x 4 5 6 11 2 8 5 4 32 4 8 8 2 5 3 4 21 4 5 25 5 2 3 0 4 11 4 275 , , EXERCÍCIOS 2 – Utilizando as tabelas do exercício 1 (página 12), construa o Histograma, o Polígono de Frequência, a Ogiva de Galton e a Curva de Frequência. 19 2.6.6 FORMAS DAS CURVAS DE FREQUÊNCIA I - Curva em forma de sino São curvas que caracterizam-se pelo fato de apresentarem um valor máximo na região central e podem ser simétricas ou assimétricas: Curva simétrica Caracteriza-se por apresentar o valor máximo no ponto central e as pontos equidistantes desse ponto terem a mesma frequência. Curva assimétrica Apresentam a cauda de um lado da ordenada máxima mais longa do que o outro. Se a cauda mais alongada fica à direita, a curva é chamada assimétrica positiva. Se a cauda se alonga à esquerda, a curva é chamada assimétrica negativa. II - Curva em forma de jota Caracteriza-se por apresentar o ponto de ordenada máxima em uma das extremidades. 20 III - Curva em forma de U Caracteriza-se por apresentar ordenadas máximas em ambas as extremidades. IV - Distribuição retangular Caracteriza-se por apresentar todas as classes com a mesma frequência. Tal distribuição seria representada por um histograma em que todas as colunas teriam a mesma altura ou por um polígono de frequência reduzido a um segmento de reta horizontal. 2.7 MEDIDAS DE POSIÇÃO São medidas que resumem o comportamento de uma variável em uma distribuição, através de um ou mais valores de forma representativa. As mais usadas são a média, a mediana, a moda, a variância, o desvio padrão e o coeficiente de variação. 2.7.1 MÉDIAS São utilizadas quando desejamos obter a medida de posição que possui a maior estabilidade. I - MÉDIA ARITMÉTICA É o quociente da soma dos valores de uma variável pela quantidade números somados. x x x x n n 1 2 ... II - MÉDIA ARITMÉTICA PARA UMA DISTRIBUIÇÃO DE FREQUÊNCIA Temos que considerar dois casos: II.1 - Sem intervalos de classe Se os elementos x1,x2,...,xn apresentam, respectivamente, frequências f1, f2,...,fn, então: 21 M f x f x f x f f f f x f a i i n n n i i i n i i n 2 2 1 2 1 1 ... ... Vejamos a média aritmética para uma distribuição de frequências sem intervalos de classe a seguir: NOTAS DE ESTATÍSTICA Notas fi 3 3 4 5 5 6 6 7 7 6 Dados fictícios. x f x f x x x x xi i i 3 3 4 5 5 6 6 7 7 6 3 5 6 7 6 143 27 5 296, II.2 - Com intervalos de classe Neste caso, consideramos todos os valores de um determinado intervalo como coincidentes com o ponto médio ( xi ) do intervalo. Assim: x f x f i i i , para uma amostra. Vejamos a médiaaritmética para uma distribuição de frequência com intervalos de classe à seguir: NOTAS DE MATEMÁTICA Notas fi xi fixi 0 2 3 1 3 2 4 5 3 15 4 6 18 5 90 6 8 14 7 98 8 10 10 9 90 fi = 50 fixi = 296 Dados fictícios. x f x f i i i 296 50 5 92, II.3 - PROCESSO BREVE Com o intuito de eliminarmos o grande número de cálculos que às vezes se apresentam na determinação da média, empregamos o que denominamos processo breve, baseado na mudança da variável x por outra y, tal que: h xx y i 0 22 onde x0 é uma constante arbitrária escolhida convenientemente dentre os pontos médios da distribuição, de preferência o de maior frequência. Fazendo essa mudança de variável, somamos x0 à média da nova variável e, ao mesmo tempo, multiplicamos a mesma por h. Resultando a fórmula modificada: x x f y f h i i i 0 Assim, para distribuição à seguir, tomamos para o valor de x0 o ponto médio de maior frequência: x0 = 160. Como h = 4, temos para valores da nova variável: 3 4 160172 0 4 160160 2 4 160168 1 4 160156 1 4 160164 2 4 160152 63 52 4 yy yy yyi ESTATURA DE 40 ALUNOS DA UNIVERSIDADE A ESTATURAS ( cm ) fi xi yi yifi 150 154 4 152 -2 -8 154 158 9 156 -1 -9 158 162 11 160 0 0 162 166 8 164 1 8 166 170 5 168 2 10 170 174 3 172 3 9 = 40 =10 Dados fictícios. Temos, então, x0 = 160, yifi = 10, fi = 40 e h =4. Substituindo os valores na fórmula, temos: cmxx 16111604 40 10 160 _ Notas: O processo breve, com a nova variável definida, só pode ser usada em distribuições que apresentam intervalos de classe de mesma amplitude. O processo breve pode, também, ser aplicado para as distribuições sem intervalos de classe, bastando fazer h = 1. PROPRIEDADES DA MÉDIA ARITMÉTICA 1ª Somando-se ou subtraindo-se uma constante de todos os valores de uma variável, a média do conjunto fica aumentada ou diminuída dessa constante. 23 2ª Multiplicando-se ou dividindo-se todos os valores uma variável por uma constante, a média do conjunto fica multiplicada ou dividida por essa constante. 2.7.2 MEDIANA Empregamos a mediana (Md) quando desejamos obter o ponto que divide a distribuição em partes iguais. Dispondo os elementos em ordem crescente, a mediana é o valor intermediário ou a média aritmética dos valores intermediários. Vejamos as medianas a seguir: Para o conjunto de valores 3, 4, 5, 6, 7, 8, 10, 11 e 12, Md = 7, pois temos quatro valores menores que 7 e quatro maiores que 7. Para 1, 2, 3, 4, 5, 6, 7 e 8, Md = 4,5, ou seja, a média aritmética dos dois valores intermediários (4 e 5). I - MEDIANA PARA UMA DISTRIBUIÇÃO DE FREQUÊNCIA Temos que considerar dois casos: I.1 - Sem intervalo de classe Basta considerar a frequência acumulada e localizar o elemento intermediário. Vejamos a mediana para uma distribuição de frequências sem intervalos de classe à seguir: Salários fi Fi 1500 12 12 2000 10 22 2500 8 30 3000 4 34 3500 1 35 Dados fictícios. Como fi = 35, temos: fi 2 35 2 17 5, Assim, a mediana é um valor entre o 17º e o 18º elemento. Esses valores ocorrem o salário de 2000. Portanto, Md = 2000. I.2 - Com intervalos de classe Devemos inicialmente localizar a classe mediana, ou seja, a que contém o elemento equivalente à posição f i 2 . Em seguida, calculamos seu valor utilizando a fórmula: M l f F f hd d i ant d d 2 . em que: ld: limite inferior da classe mediana Fant: soma das frequências das classes anteriores à classe mediana hd: amplitude da classe mediana fd: frequência da classe mediana 24 Vejamos a mediana para uma distribuição de frequência com intervalos de classe a seguir: Salários fi Fi 1000 1200 20 20 1200 1400 12 32 1400 1600 10 42 1600 1800 6 48 1800 2000 2 50 Dados fictícios. Como: f F f i i i 50 2 50 2 25 Assim, a classe mediana é a segunda, isto é, a que contém o 25º elemento. Então: M xd 1200 25 20 12 200 1283 33. . , 2.7.3 MODA A moda (Mo) é utilizada quando desejamos obter uma medida rápida e aproximada de posição. Em um conjunto de elementos é o elemento que ocorre com maior frequência. Vejamos as modas a seguir: A moda do conjunto de números 2, 3, 4, 4, 5, 6, 6, 6, 7 e 8 é Mo = 6, que ocorre com frequência 3. (modal) No conjunto 2, 3, 3, 4, 5, 5, 6, 7, 7 e 8, temos os números 3, 5 e 7 com frequência 2. Temos, portanto, três modas: 3, 5 e 7. (trimodal) O conjunto dos números 2, 3, 4, 6, 8 e 9 não tem nenhum elemento com maior frequência que os demais. Portanto, não tem moda. (amodal) I - MODA PARA UMA DISTRIBUIÇÃO DE FREQUÊNCIAS Temos que considerar dois casos: I.1 - Sem intervalos de classe Uma vez agrupados os dados, é possível determinar imediatamente a moda: basta fixar o valor da variável com maior frequência. Vejamos a moda para uma distribuição de frequência sem intervalos de classe a seguir: Salários fi 1.550 5 2.100 8 2.580 6 3.250 4 3.570 2 Dados fictícios. Como a maior frequência é 8, Mo = 2.100. 25 I.2 - Com intervalos da classe A classe que apresenta a maior frequência é denominada classe modal. Consideramos como moda de uma distribuição de frequências o valor compreendido entre os limites da classe modal. Tal valor é dado por: M l D D D ho o o 1 1 2 . em que: lo: limite inferior da classe modal ho: amplitude da classe modal D1: frequência da classe modal menos frequência da classe anterior à modal D2: frequência da classe modal menos frequência da classe posterior à modal Vejamos a moda para uma distribuição de frequências com intervalos de classe a seguir: Tempo (s) fi 10 12 3 12 14 4 14 16 7 16 18 12 18 20 6 Dados fictícios. Como a classe modal é a quarta classe, pois tem maior freqüência, temos: 91,16 11 10 162 65 5 16 21618 6612 5712 16 2 1 xM h D D l o o o EXERCÍCIOS 3 – Para o conjunto de valores 213, 213, 213, 215, 215, 216, 216, 218, 220 e 221, calcule a média, a mediana e a moda. 4 – Na tabela a seguir, determine a média, a mediana e a moda e construa o Gráfico de Pareto. 5 – Calcule a média, a mediana e a moda na tabela da primeira amostra do exercício 1. 6 – Calcule a média, a mediana e a moda, utilizando o Histograma, o Polígono de Frequência e Ogiva, respectivamente, da segunda amostra do exercício 2. 26 2.7.4 SEPARATRIZES A mediana é a medida de posição que separa a série estatística dois gruposque apresentam o mesmo número de valores. Existem outras medidas de posição que estão ligadas à mediana devido a essa característica, já que se baseiam em sua posição na série. Essas medidas são os quartis, os percentis e os decis que, juntamente com a mediana, são conhecidas pelo nome de separatrizes. I - OS QUARTIS Denominamos quartis os valores de uma série que a dividem em quatro partes iguais. Há, portanto, três quartis: O primeiro quartil ( Q1) – valor situado de tal modo na série que uma quarta parte (25%) dos dados é menor que ele e as três quartas partes restantes (75%) são maiores. O segundo quartil ( Q2) – evidentemente, coincide com a mediana. O terceiro quartil ( Q3) – valor situado de tal modo que as três quartas partes (75%) dos termos são menores que ele e uma quarta parte (25%) é maior. Quando os dados são agrupados, para determinar os quartis usamos a mesma técnica do cálculo da mediana, bastando substituir, na fórmula da mediana, f i 2 por: k fi 4 sendo k o número de ordem do quartil. Assim, temos: Q l f F f h e Q l f F f h i ant i ant 1 3 4 3 4 * * . * * . II - OS DECIS Denominamos decis os nove valores que separam uma série em 10 partes iguais. Indicamos por: D1, D2, ... , D9. O cálculo de um decil segue a mesma técnica do cálculo da mediana, porém, a fórmula f i 2 será substituída por k fi 10 , sendo k o número de ordem do decil. III - OS PERCENTIS Denominamos percentis os noventa e nove valores que separam uma série em 100 partes iguais. Indicamos por: P1, P2, ... , P55, ... , P99. O cálculo de um percentil segue a mesma técnica do cálculo da mediana, porém, a fórmula f i 2 será substituída por k fi 100 , sendo k o número de ordem do percentil. EXERCÍCIO 7 – Utilizando a tabela da segunda amostra do exercício 1 (página 12), calcule Q1, Q3, D4, D7, P20 e P82. 27 2.7.5 VARIÂNCIA A variância é a medida de posição baseada nos desvios em torno da média aritmética, porém determinando a média aritmética dos quadrados dos desvios. Assim, temos: s x X n i2 2 1 ( ), para uma amostra. 2 2 ( )x N i , para uma população. 2.7.6 DESVIO PADRÃO O desvio padrão também determina a dispersão dos valores em torno da média. A exemplo da variância, o desvio padrão leva em consideração a totalidade dos valores da variável em estudo, sendo também, um índice de variabilidade bastante estável, por isso é bastante usado. Fazendo s s 2 , temos: 1 )( 2 n Xxf s ii , para uma amostra. N xf ii 2) ( , para uma população. Notas: Tanto o desvio padrão como a variância são usados como medidas de variabilidade. O uso de uma ou de outra dependerá da finalidade que se tenha em vista. A variância é uma medida que tem pouca utilidade como estatística descritiva, porém é extremamente importante na inferência estatística e em combinações de amostras. Exemplo: Calcule o desvio padrão da distribuição dada: Custo em R$ fi xi fixi fi( xi - ) 2 400 500 1 450 450 62.500 500 600 3 550 1.650 67.500 600 700 5 650 3.250 12.500 700 800 7 750 5.250 17.500 800 900 4 850 3.400 90.000 = 20 = 14.000 = 250.000 Então: 700 20 000.14 i ii f xf e 8,111500.12 20 000.250) ( 2 N xf ii Estudos mostram que, para determinadas distribuições chamadas normais, no intervalo [ sxsx , ] estão 68,27% dos elementos da distribuição, no intervalo [ sxsx 2,2 ] estão 95,45% dos elementos da distribuição e no intervalo [ sxsx 3,3 ] estão 99,73% dos elementos da distribuição. 28 PROCESSO BREVE Podemos obter o desvio padrão pelo processo breve de cálculo. Basta substituir a variável x pela variável y, tal que: h xx y i 0 e depois multiplicar pela amplitude do intervalo de classe. PROPRIEDADES DO DESVIO PADRÃO 1ª Somando-se ou subtraindo-se uma constante de todos os valores de uma variável, o desvio padrão não se altera. 2ª Multiplicando-se todos os valores uma variável por uma constante diferente de zero, o desvio padrão fica multiplicado por essa constante. 2.7.7 COEFICIENTE DE VARIAÇÃO Para contornar as dificuldades e limitações quando o desvio padrão for muito pequeno em relação à média, podemos caracterizar a variabilidade ou dispersão dos dados em termos relativos a seu valor médio, medida essa denominada coeficiente de variação (CV), que normalmente é dado em forma de porcentagem: x s CV , para uma amostra. CV , para uma população. Exemplo: Tomando os resultados das medidas das estaturas e dos pesos de um mesmo grupo de indivíduos, verifique qual dos coeficientes de variação é o maior: ESTATÍSTICAS x _ s ESTATURAS 175 cm 5,0 cm PESOS 68 kg 2,0 kg Temos: %94,20294,0 68 2 %85,20285,0 175 5 P E CV CV Logo, nesse grupo de indivíduos, os pesos apresentam maior grau de dispersão ou variabilidade que as alturas. EXERCÍCIOS 8 – Calcule o desvio padrão e o coeficiente de variação do exercício 3 (página 28). 9 – Calcule o desvio padrão e o coeficiente de variação do exercício 4 (página 28). 29 10 – Calcule o desvio padrão e o coeficiente de variação da tabela abaixo: Salários fi 800 1.000 7 1.000 1.200 12 1.200 1.400 15 1.400 1.600 10 1.600 1.800 6 1.800 2.000 3 2.000 2.200 2 2.8 ASSIMETRIA E CURTOSE 2.8.1 MEDIDA DE ASSIMETRIA Quando temos uma distribuição simétrica, a média e a moda coincidem; sendo a distribuição assimétrica à esquerda ou negativa, a média é menor que a moda; e sendo assimétrica à direita ou positiva, a média é maior que a moda. Daí, temos que: Na distribuição simétrica MoMdx Na distribuição assimétrica negativa MoMdx Na distribuição assimétrica positiva MoMdx Baseando-se nessas relações entre a média e a moda, podemos empregá-las para determinar o tipo de assimetria. Assim, bastando calcular o valor da diferença Mox temos que, se: 0Mox assimetria nula ou distribuição simétrica; 0Mox assimetria negativa ou à esquerda; 0Mox assimetria positiva ou à direita. Veja os exemplos das amostras abaixo: DISTRIBUIÇÃO A DISTRIBUIÇÃO B DISTRIBUIÇÃO C PESOS (kg) fi PESOS (kg) fi PESOS (kg) fi 2 6 3 2 6 3 2 6 5 6 10 8 6 10 6 6 10 10 10 14 12 10 14 9 10 14 13 14 18 12 14 18 14 14 18 9 18 22 8 18 22 10 18 22 6 22 26 3 22 26 4 22 26 3 = 46 = 46 = 46 Temos: x = 14 kg Md = 14 kg Mo = 14 kg S = 5,32 kg x = 14,96 kg Md = 15,43 kg Mo = 16,22 kg s = 5,43 kg x = 12,87 kg Md = 12,46 kg Mo = 11,71 kg s = 5,59 kg 30 Logo: A - 14 – 14 = 0 a distribuição é simétrica. B - 14,96 – 16,22 = – 1,26 kg a distribuição é assimétrica negativa. C - 12,87 – 11,71 = 1,16 kg a distribuição é assimétrica positiva. 2.8.2 COEFICIENTE DE ASSIMETRIAA medida anterior, por ser absoluta, apresenta a mesma deficiência do desvio padrão, isto é, não permite a possibilidade de comparação entre as medidas de duas distribuições. Por esse motivo, daremos preferência aos coeficientes de assimetria de Pearson, dado por: s Mox As e As x Md s 3. Se 0,15 < /As/ < 1, a assimetria é considerada moderada; se 0 < /As/ < 0,15, é considerada fraca; e se /As/ > 1, é considerada forte. EXERCÍCIO 11 – Represente graficamente as distribuições do exemplo da página 33 através da curva de frequência e determine seus coeficientes de assimetria. 2.8.3 MEDIDA DE CURTOSE Denominamos medida de curtose, ou simplesmente curtose, o grau de achatamento de uma distribuição em relação a uma distribuição padrão, denominada curva normal. Quando a distribuição apresenta uma curva de freqüência mais fechada que a normal ou mais aguda em sua parte superior, ela recebe o nome de leptocúrtica. Quando a distribuição apresenta uma curva de freqüência mais aberta que a normal ou mais achatada em sua parte superior, ela recebe o nome de platicúrtica. A curva normal, que é nossa base referencial, recebe o nome de mesocúrtica. 2.8.4 COEFICIENTE DE CURTOSE Uma fórmula para a medida da curtose é: K Q Q P P 3 1 90 102. Essa fórmula é conhecida como coeficiente percentílico de curtose. Relativamente à curva normal, temos: K = 0,263 Assim: K = 0,263 curva mesocúrtica K < 0,263 curva leptocúrtica K > 0,263 curva platicúrtica 31 Exemplo: Sabendo-se que uma distribuição apresenta as seguintes medidas: Q1 = 24,4 cm, Q3 = 41,2 cm, P10 = 20,2 cm e P90 = 49,5 cm temos: K 41 2 24 4 2 49 5 20 2 16 8 58 6 0 287 , , , , , , , Como: 0,287 > 0,263, concluímos que a distribuição é platicúrtica, em relação à normal. EXERCÍCIOS 12 – Considere as seguintes estatísticas relativas a três distribuições de freqüência: DISTRIBUIÇÕES x Mo Md s A 52 52 52 2,92 B 45 50 47 3,07 C 48 46 47 3,14 a) Classifique cada distribuição quanto ao tipo de assimetria. b) Calcule em cada distribuição o coeficiente de assimetria. 13 – Considerando a distribuição de freqüência relativa aos pesos de 100 operários de uma fábrica: PESOS (kg) 50 ├ 58 ├ 66 ├ 74 ├ 82 ├ 90 ├ 98 Nº DE OPERÁRIOS 10 15 25 24 16 10 a) Determine o grau de assimetria. b) Determine o grau de curtose. c) Classifique a distribuição em relação à curva normal. 32 2.9 CORRELAÇÃO Quando duas variáveis estão ligadas por uma relação estatística, dizemos que existe uma correlação entre elas. Representando, em um sistema coordenado cartesiano ortogonal, os pares formados pelas duas variáveis, obtemos uma nuvem de pontos que denominamos diagrama de dispersão. Esses pontos obtidos podem formar uma elipse em diagonal e que quanto mais fina for, mais ela se aproxima de uma reta denominada correlação linear. Uma correlação pode ser: - Linear positiva, se os pontos do diagrama têm como “imagem” uma reta ascendente; - Linear negativa, se os pontos do diagrama têm como “imagem” uma reta descendente; - Não-linear, se os pontos têm como “imagem” uma curva. Se os pontos apresentam-se dispersos, não oferecendo uma “imagem” definida, concluímos que não há relação alguma entre as variáveis em estudo. 2.9.1 COEFICIENTE DE CORRELAÇÃO O grau de intensidade da correlação entre duas variáveis pode ser determinado fazendo uso do coeficiente de correlação de Pearson: 2222 . iiii iiii yynxxn yxyxn r , com r [-1, 1]. Assim: Se r = 1, dizemos que há uma correlação perfeita e positiva. Se r = -1, dizemos que há uma correlação perfeita e negativa. Se r = 0, dizemos que não há correlação. Importante: Se 16,0 r , há uma correlação relativamente forte. Se 0 3 0 6, , r , há uma correlação relativamente fraca. Se 3,00 r , há uma correlação muito fraca, o que não permite a tirada de conclusões sobre as variáveis em estudo. EXERCÍCIOS 14 – Considerando uma amostra aleatória de 10 alunos de uma turma da universidade, determine o grau do coeficiente de correlação para as notas dadas: MATEMÁTICA ESTATÍSTICA 5 6 8 9 7 8 10 10 6 5 7 7 9 8 3 4 8 6 2 2 33 15 – Considerando uma amostra aleatória de 7 crianças que fazem tratamento contra a obesidade em uma certa clínica, determine o grau do coeficiente de correlação para as variáveis dadas: PESO (kg) ESTATURA (m) 50 1,23 53 1,45 59 1,58 63 1,65 65 1,60 67 1,63 69 1,68 2.10 REGRESSÃO Toda vez que desejamos estudar determinada variável em função de outra, fazemos uma análise de regressão, que tem por objetivo descrever, através de um modelo matemático, a relação entre duas variáveis. 2.10.1 AJUSTAMENTO DA RETA A determinação do ajustamento da reta é obtido através da função definida por: Y aX b , supondo X a variável dependente e Y a independente. Os valores dos parâmetros de a e b são adquiridos através das fórmulas: 22 i iiii xxn yxyxn a e xayb onde: x x n i e y y n i . Como estamos utilizando uma amostra para obter ao valores dos parâmetros a e b, o resultado encontrado é uma estimativa da verdadeira equação de regressão, portanto devemos escrever: Y aX b ^ Para traçar a reta do gráfico, devemos determinar dois de seus pontos. EXERCÍCIO 16 – Utilizando os exercícios 14 e 15 da página 38, estabeleça as equações de regressão das retas ajustadas e esboce seus gráficos. 34 3 INTRODUÇÃO DE PROBABILIDADE ESTATÍSTICA Veremos agora os conceitos necessários que servem de ponto de apoio para os primeiros passos da inferência estatística. 3.1 EXPERIMENTO ALEATÓRIO Ao lançar um dado uma ou mais vezes, não podemos saber com antecedência o número que se vai obter; sabemos apenas que os possíveis resultados são 1, 2, 3, 4, 5 ou 6. Esse tipo de experimento, cujo resultado não pode ser previsto, é chamado Experimento Aleatório, pois pode resultar em diferentes resultados, mesmo que repetido da mesma maneira e em qualquer ocasião. Na teoria das probabilidades, estudamos os experimentos aleatórios eqüiprováveis, ou seja, aqueles em que qualquer resultado pode ocorrer com a mesma chance. As probabilidades são utilizadas para exprimir a chance de ocorrência de um determinado evento e é dada por um número que pode variar de 0 (zero) a 1,00. 3.2 ESPAÇO AMOSTRAL Espaço amostral ou conjunto universo é o conjunto U de todos os resultados possíveis de um experimento aleatório. O número de elementos desse conjunto é indicado por n(U). Vejamos alguns exemplos: no lançamento de um dado, U = {1, 2, 3, 4, 5, 6} e n(U) = 6; no sorteio de uma das dezenas da loto, U = {00, 01, 02, ... , 99} e n(U) = 100; no lançamento de dois dados diferentes, U = {(1, 1), (1, 2), ... , (6, 5), (6, 6)} e n(U) = 36. 3.3 EVENTO Qualquer subconjunto do espaço amostral U é um evento. No lançamento de um dado, por exemplo, o evento obter um número maior ou igual a 4 é representado por A = {4, 5, 6}, subconjunto de U = {1, 2, 3, 4, 5, 6}. Observações: 1 - Quando A é igual a U, o evento é certo;no lançamento de uma moeda, A = {cara, coroa} é um evento certo: n(A) = n(U). 2 - Se A = , o evento é impossível; por exemplo, obter 7 no lançamento de um dado. 3 - Quando, para dois eventos A e A , A A = U e A A = , esses dois eventos são complementares. No lançamento de um dados, sendo A = {2, 4, 6} o evento obter um número par e A = {1, 3, 5} o evento obter um número ímpar, temos: A A = {1, 2, 3, 4, 5, 6} = U e A A = Portanto, A e A são eventos complementares. Exemplo: Determine o espaço amostral do experimento aleatório lançamento simultâneo de duas moedas. Solução: Indicando cara por C e coroa por D, temos: U = {(C, C), (C, D), (D, C), (D, D)} n(U) = 4 EXERCÍCIO 17 – Considerando o experimento aleatório nascimento de três filhos de um casal, determine o espaço amostral e o subconjunto que representa o evento nascimento de exatamente dois meninos em três filhos do casal. 35 3.3.1 EVENTOS INDEPENDENTES Dizemos que dois eventos são independentes quando a realização ou não de um dos eventos não afeta a probabilidade de realização do outro e vice-versa. Exemplo: No lançamento de dois dados distintos, a probabilidade de obtermos 1 no primeiro dado e 5 no segundo, é: P 1 6 1 6 1 36 3.3.2 EVENTOS MUTUAMENTE EXCLUSIVOS Dizemos que dois ou mais eventos são mutuamente exclusivos quando a realização de um exclui a realização do(s) outro(s). Assim, no nascimento de uma criança, o evento “nascer menino” e o evento “nascer menina”, são mutuamente exclusivos, pois na realização de um deles, o outro não se realiza. 3.4 PROBABILIDADE Num experimento aleatório eqüiprovável, sendo n(U) o número de elementos do espaço amostral U e n(A) o número de elementos do evento A, a probabilidade de que ocorra o evento A é dada pelo número real: P A n A n U ( ) ( ) ( ) Então, a probabilidade de um evento é dada pelo quociente da divisão do número de casos favoráveis pelo número de casos possíveis, ou seja: sempre que um espaço amostral consiste de N resultados possíveis que são igualmente prováveis, a probabilidade de cada resultado será 1 N . Exemplo: No lançamento de duas moedas e o evento ocorrer cara pelo menos uma vez. Representando para cara C e para coroa D, temos: U C C C D D C D D n U A C C C D D C n A {( , ),( , ),( , ),( , )} ( ) {( , ),( , ),( , )} ( ) 4 3 3 casos em 4 possíveis P( A n A n U ) ( ) ( ) 3 4 EXERCÍCIOS 18 – Na escolha de um número de 1 a 30, qual a probabilidade de ser sorteado um múltiplo de 5? 19 – Qual a probabilidade de, no lançamento simultâneo de dois dados, obter soma igual a 7? 36 3.4.1 PROPRIEDADES 1ª) Se A = , então n(A) = 0 e, portanto, P(A) = 0 (probabilidade do evento impossível). 2ª) Se A = U, então n(A) = n(U) e P(A) = 1 (probabilidade do evento certo). 3ª) Se A U, então 0 n(A) n(U). Dividindo a desigualdade por n(U) 0, temos: 0 0 1 n U n A n U n U n U P A ( ) ( ) ( ) ( ) ( ) ( ) 4ª) Se A e A são eventos complementares, então n(A) + n( A ) = n(U). Dividindo a igualdade por n(U) 0, temos: n A n U n A n U n U n U P A P A ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) 1 3.4.2 PROBABILIDADE DA UNIÃO DE EVENTOS Se A e B são dois eventos de um espaço amostral U, sabemos que n(A B) = n(A) + n(B) - n(A B): U A B Dividindo essa igualdade por n(U) 0, temos: n A B n U n A n U n B n U n A B n U P A B P A P B P A B ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) Se A B = , os eventos são mutuamente exclusivos, isto é, P(A B) = 0. Daí: P(A B) = P(A) + P(B) EXERCÍCIOS 20 – Sorteando um número de 1 a 30, qual a probabilidade de que ele seja par ou múltiplo de 3? 21 – Lançando-se simultaneamente dois dados não viciados, calcule a probabilidade de que suas faces superiores exibam soma igual a 7 ou 9. 37 3.4.3 MULTIPLICAÇÃO DE PROBABILIDADES A probabilidade do produto é dada por um princípio análogo ao princípio fundamental da contagem, quando os eventos A e B são independentes. Se ocorre um evento A de probabilidade p e, em seguida, ocorre o evento B de probabilidade q (ambos independentes), então a probabilidade de que ocorram os eventos A e B na ordem indicada é p.q: P A B P A P B p q( ) ( ) ( ) Essa regra pode ser generalizada para n eventos A1, A2, ... , An com probabilidades p1, p2, ... , pn, respectivamente. Exemplo: Determine a probabilidade de sair o número 5 em dois lançamentos sucessivos de um dado. Solução: Sendo A o evento obter 5 no primeiro lançamento e B o evento obter 5 no segundo lançamento, vem: U n U n A n B { , , , , , } ( ) ( ) ( ) 1 2 3 4 5 6 6 1 1 Temos P A e P B( ) ( ) , 1 6 1 6 com A e B independentes. Logo, a probabilidade pedida é dada por: P(A) x P(B) = 1 6 1 6 1 36 x EXERCÍCIOS 22 – Em uma urna há 5 bolas azuis e 9 bolas brancas. Retiramos uma bola da urna e, em seguida, sem repor a bola retirada, retiramos uma segunda bola. Determine a probabilidade de: 23 – Numa certa comunidade, 52% dos habitantes são mulheres e destas 2,4% são canhotas. Dos homens, 2,5% são canhotos. Calcule a probabilidade de que um indivíduo escolhido ao acaso seja canhoto. 3.5 VARIÁVEL ALEATÓRIA E DISTRIBUIÇÃO DE PROBABILIDADE Definimos variável aleatória de um espaço amostral, a função onde a cada elemento desse espaço é atribuído um número real. Seja X uma variável aleatória que pode assumir qualquer valor x R, e a cada valor xi correspondem pontos do espaço amostral. Associamos, então, a cada valor xi a probabilidade pi de ocorrência de tais pontos no espaço amostral. Assim, temos: pi 1 Os valores x1, x2, ... , xn e seus correspondentes p1, p2, ... , pn, definem uma distribuição de probabilidade. Exemplo: Sendo c o evento cara e k o evento coroa. S = {(c, c), (c, k), (k, c), (k, k)} é o espaço amostral que representa o lançamento simultâneo de duas moedas. Construa a tabela de distribuição de probabilidade do evento que representa o número de caras. 38 PONTO AMOSTRAL X Número de caras ( X ) p(X) (c, c) 2 2 1/4 (c, k) 1 1 1/2 (k, c) 1 0 1/4 (k, k) 0 1 Ao definir a distribuição de probabilidade, estabelecemos uma correspondência entre os valores da variável aleatória X e os valores da variável P. Essa correspondência define uma função que determina a distribuição de probabilidade da variável aleatória X. EXERCÍCIO 24 – Uma determinada moeda viciada apresenta cara duas vezes mai frequentemente que coroa. Essa moeda é jogada quatro vezes. Seja X o número de caras que aparece. Estabeleça a distribuição de probabilidade de X. 3.5.1 DISTRIBUIÇÃO DE BERNOULLI Dados dois eventos complementares, A e A_ , temos: P A P A P A P A( ) ( ) ( ) ( ) _ _ 1 1 Sendo P( A ) = p, podemos escrever: P A p() _ 1 A variável aleatória X, que pode assumir apenas os valores p e (1 – p) é chamada variável aleatória de Bernoulli. 3.5.2 DISTRIBUIÇÃO BINOMIAL Chamamos de experimento binomial ao experimento formado por n ensaios de Bernoulli. Assim, se P(A) = p, a probabilidade de o evento A ocorrer exatamente k vezes em n experiências é dada por: P A n k p pk k n k( ) ( ) 1 Observação: A lei binomial só pode ser aplicada a experiências aleatórias discretas que obedeçam às seguintes condições: 1. Fixado um número n, a experiência é repetida n vezes nas mesmas condições. 2. Na experiência, só dois resultados são possíveis: ou ocorre A ou ocorre A . 3. Os eventos A e A têm sempre, respectivamente, as probabilidades p e 1 - p em todas as tentativas. 4. Cada experiência é independente das outras. Exemplo: Jogando um dado 4 vezes, qual a probabilidade de sair o número 5 exatamente 3 vezes? 39 Solução: A n A A n A U n U { } ( ) { , , , , } ( ) { , , , , , } ( ) 5 1 1 2 3 4 6 5 1 2 3 4 5 6 6 P A p P A p( ) ( ) 1 6 1 1 1 6 5 6 Se: P A n k p pk k n k( ) ( ) 1 324 1 6 5 6 1 4 6 5 . 6 1 . 3 4 )(: 3 343 3 xxAPLogo . EXERCÍCIOS 25 – Uma prova consta de 6 questões com 4 opções cada uma e uma única alternativa correta. Qual a probabilidade de acertar duas das 6 questões? 26 – Um jogador tem 2 3 de probabilidade de vencer uma partida sempre que joga. Sabendo que ele vai jogar 5 partidas, determine a probabilidade de ele vencer no máximo duas. 3.5.3 DISTRIBUIÇÃO DE POISSON Na teoria da probabilidade a distribuição de Poisson é uma distribuição de probabilidade discreta. Ela expressa, por exemplo, a probabilidade de um certo número de eventos ocorrerem num dado período tempo, caso estes ocorram com uma taxa média conhecida e caso cada evento seja independente do tempo decorrido desde o último evento. A probabilidade de que existam exatamente k ocorrências, sendo k um inteiro não negativo, é onde: e é base do logaritmo natural (e = 2.71828...), k! é o fatorial de k, λ é um número real, igual ao número esperado de ocorrências que ocorrem num dado intervalo de tempo. Por exemplo, se o evento ocorre a uma média de 4 minutos, e estamos interessados no número de eventos que ocorrem num intervalo de 10 minutos, usariámos como modelo a distribuição de Poisson com λ = 10/4 = 2.5. 40 EXERCÍCIO 27 – Certo evento ocorre em média de 3 minutos. Usando como modelo a distribuição de Poisson, determine a probabilidade desse evento ocorrer até 10 vezes num intervalo de 20 minutos. Esboce o gráfico dessa situação. 3.5.4 DISTRIBUIÇÃO NORMAL (curva normal) Entre as distribuições teóricas de variável aleatória contínua, uma das mais empregadas é a distribuição normal. Entretanto, podem ocorrer algumas distorções porque essa distribuição leva ao raciocínio de que todos os fenômenos se comportam segundo esse modelo, o que não é verdade, porém, muitas das variáveis correspondem à distribuição normal ou dela se aproximam. Também conhecida como distribuição de Gauss-deMoivre-Laplace, possui como parâmetros a média e o desvio padrão. É uma distribuição simétrica em torno da média e a média, a mediana e a moda são iguais. Uma variação na média causa uma mudança na localização da distribuição. Quando a média aumenta, o gráfico de distribuição desloca-se para direita e, quando diminui, desloca-se para esquerda, sem alterar sua forma. Se a variância ou o desvio padrão aumenta ou diminui, a distribuição torna-se mais plana ou mais pontiaguda em torno da média. O aspecto gráfico de uma distribuição normal vem a seguir: x Para uma perfeita compreensão da distribuição normal, observe o gráfico e procure visualizar as seguintes propriedades: 1. A variável aleatória X pode assumir todo e qualquer valor. 2. A representação gráfica da distribuição normal é uma curva em forma de sino, simétrica em torno da média, que recebe o nome de curva normal. 3. A área total limitada pela curva e pelo eixo das abscissas é igual a 1, já que essa área corresponde a probabilidade de uma variável aleatória X assumir qualquer valor real. 4. A curva normal é assintótica em relação ao eixo das abscissas, isto é, aproxima-se indefinidamente do eixo das abscissas sem, no entanto, tocá-lo. 5. Como a curva é simétrica em torno de x , a probabilidade de ocorrer valor maior do que a média é igual a probabilidade de ocorrer valor menor que a média, isto é, ambas as probabilidades são iguais a 0,5. P(X > x ) = P(X < x ) Quando temos em mãos uma variável aleatória com distribuição normal, nosso principal interesse é obter a probabilidade dessa variável aleatória assumir um valor num determinado intervalo. Se X é uma variável aleatória com distribuição normal de média x e desvio padrão s, então a variável z x x s tem distribuição normal reduzida, isto é, tem distribuição normal de média 0 e desvio padrão 1. O valor de z, ou valor padronizado, como também é conhecido, representa o número de desvios padrão que um valor X dista da média considerada. Pode ser positivo, zero ou negativo: se positivo, o valor original está à direita da média; se zero, o valor é igual à média e, se negativo, está à esquerda da média. As probabilidades associadas à distribuição normal padronizada são encontradas em tabelas, não havendo necessidade de serem calculadas. É uma tabela de distribuição normal reduzida, que nos dá a probabilidade de Z, entre a média 0 e um dado valor z, isto é: P(0 < Z < z) 41 Temos, então, que se X é uma variável aleatória com distribuição normal de média x e desvio padrão s, podemos escrever: P( x < X < x) = P(0 < Z < z), com z x x s . Exemplo: Seja X a variável aleatória que representa os diâmetros dos parafusos produzidos por certa máquina. Sabe-se que essa variável tem distribuição normal com x = 2 cm e s = 0,04 cm. Calcule a probabilidade de um parafuso ter um diâmetro com valor entre 2 e 2,05 cm. É fácil notar que essa probabilidade indicada por P(2 < X < 2,05), corresponde à área hachurada do gráfico a seguir: 2 2,05 Como queremos calcular P(2 < X < 2,05), para obter essa probabilidade, precisamos, em primeiro lugar, calcular o valor de z que corresponde a x = 2,05 (x = 2 z = 0, pois x = 2). Temos, então: z x x s 2 05 2 0 04 0 05 0 04 1 25 , , , , , , onde: P(2 < X < 2,05) = P(0 < Z < 1,25) Procurando o valor de z = 1,25 na tabela, temos que: P(0 < Z < 1,25) = 0,3944. Assim, a probabilidade é de 0,3944, ou seja 39,44%. EXERCÍCIOS 28 – Utilizando os dados do exemplo acima, determine as seguintes probabilidades: a) P(1,93 < X < 2,05) b) P(2,02 < X < 2,05) c) P(1,93 < X < 1,97) d) P(X > 2,02) e) P(X > 1,97) 29 – Os salários semanais dos operários industriais são distribuídos normalmente, em torno da média de R$ 500,00, com desvio padrão de R$ 40,00. Calcule a probabilidade de um operário ter um salário semanal situado entre R$ 490,00 e R$ 520,00. 30 – Considerando que as estatísticas
Compartilhar