Prévia do material em texto
FUNDAMENTOS DE ESTATÍSTICA Jerônimo Flores ISBN: 978-85-67027-16-6 SUMÁRIO Esta é uma obra coletiva organizada por iniciativa e direção do CENTRO SU- PERIOR DE TECNOLOGIA TECBRASIL LTDA – Faculdades Ftec que, na for- ma do art. 5º, VIII, h, da Lei nº 9.610/98, a publica sob sua marca e detém os direitos de exploração comercial e todos os demais previstos em contrato. É proibida a reprodução parcial ou integral sem autorização expressa e escrita. CENTRO UNIVERSITÁRIO UNIFTEC Rua Gustavo Ramos Sehbe n.º 107. Caxias do Sul/ RS REITOR Claudino José Meneguzzi Júnior PRÓ-REITORA ACADÊMICA Débora Frizzo PRÓ-REITOR ADMINISTRATIVO Altair Ruzzarin DIRETOR DE ENSINO A DISTÂNCIA (EAD) Rafael Giovanella Desenvolvido pela equipe de Criações para o Ensino a Distância (CREAD) Coordenadora e Designer Instrucional Sabrina Maciel Diagramação, Ilustração e Alteração de Imagem Thais Magnus Munhoz Revisora Luana dos Reis INTRODUÇÃO À ESTATÍSTICA 4 NOÇÕES FUNDAMENTAIS 5 ESTATÍSTICA DESCRITIVA 6 DISTRIBUIÇÃO DE FREQUÊNCIA 14 ESTATÍSTICA BÁSICA 21 REGRESSÃO LINEAR SIMPLES 33 INTERVALO DE CONFIANÇA 37 TABELAS 42 3FUNDAMENTOS DE ESTATÍSTICA APRESENTAÇÃO Olá, graduando! Você se considera uma pessoa azarada? A fila em que você está no supermercado sempre anda mais devagar? Ou sempre chove quando você esquece o guarda-chuva? A maior parte dos fenômenos que as pessoas atribuem à “sorte” ou ao “azar” podem ser calculados, medidos e mesmo previstos por meio de procedimentos estatísticos. 4 INTRODUÇÃO À ESTATÍSTICA A estatística é um ramo da Matemática que se propõe a coletar, organizar, sistematizar, descrever, analisar e interpretar dados para o auxílio no processo de tomada de decisão. 5FUNDAMENTOS DE ESTATÍSTICA SUMÁRIO A estatística vem sendo utilizada há séculos. Na Bíblia Sagrada existem re- latos de história de contagem de pessoas com finalidades militares e de cobrança de impostos. Podemos dividir a estatística em três grandes áreas: a estatística descritiva, a es- tatística inferencial e a estatística probabilística. Na estatística descritiva, os procedi- mentos resumem-se a descrever os dados, o que exige organização, síntese e apresenta- ção. Na estatística inferencial, procuramos generalizar um fenômeno a partir do estudo com uma fração ou pedaço dele. Já, a estatística probabilística, mede as tendências de um fenômeno acontecer, partindo de observações preliminares (CORREA, 2003). NOÇÕES FUNDAMENTAIS Neste item estudaremos alguns conceitos e ideias que serão de suma importân- cia para o nosso sucesso na disciplina. Como: • Variável: uma característica que pode assumir distintos valores, de acordo com os sujeitos e o contexto (CORREA, 2003). Por exemplo: o crescimento de uma planta, a distância que o vendedor percorre com o carro da empresa, o desgaste de uma peça, etc. • População: é o conjunto formado por elementos que tenham pelo menos uma variável comum (MORETTIN, 2010). • Amostra: após a população ser definida, um subconjunto ou “recorte” dessa será a amostra. Utiliza-se n para indicar o número que foi amostrado (MORETTIN, 2010). • Amostragem: é o processo utilizado para a composição da amostra (MORETTIN, 2010). • Dados brutos: são os dados na forma com que foram coletados, sem qualquer tratamento mate- mático (CORREA, 2003). • Frequência: é o número de vezes que um fenômeno se repete (CORREA, 2003). • Rol: é a organização dos dados brutos na forma crescente ou decrescente (CORREA, 2003). • Parâmetro: é uma medida utilizada para descrever as características de uma população de forma numérica. A média e a variância são exemplos de parâmetros (MORETTIN, 2010). • Censo: é uma pesquisa em que a população é igual à amostra (COR- REA, 2003). O IBGE se propõe a fa- zer um censo da população brasi- leira, ou seja, entrevistar todos os habitantes do país. Vamos exemplificar: 6FUNDAMENTOS DE ESTATÍSTICA SUMÁRIO ESTATÍSTICA DESCRITIVA A estatística descritiva visa descrever os fenômenos. Assim, gráficos, tabelas e histogramas são valiosos para que isto seja possível. TABELAS Tabelas podem ser muito úteis no processo de organização, sistemati- zação e apresentação dos dados. A maior parte das tabelas apresenta as va- riáveis e a sua frequência. Uma tabela pode ser de entrada simples, quando conter apenas uma variável ou de entrada dupla quanto conter mais de uma. Vale a pena lembrar que a estatística descritiva parte de um processo de contagem. Você conta algo, para posteriormente seguir com os demais pro- cessos. Por exemplo, verificou-se a distância que o vendedor da empresa em que você trabalha anda com o carro da empresa. Refletindo Você trabalha no restaurante de uma empresa onde, diariamente, almoçam 300 funcionários. O seu interesse é mudar o cardápio, mas não tem certeza se aprovarão. Você não tem tempo nem recursos para fazer um almoço para todos. Assim, sorteia 30 pessoas, faz um almoço teste e pede para que eles atribuam uma nota de zero a dez ao cardápio. Para estimar uma nota geral, faz-se uma média das notas. Assim, temos: População: 300 pessoas Amostra: 30 pessoas Amostragem: sorteio Parâmetro: média Distância Dia Distância (Km) Segunda-feira 80 Terça-feira 75 Quarta-feira 120 Quinta-feira 100 Sexta-feira 84 Sábado 67 7FUNDAMENTOS DE ESTATÍSTICA SUMÁRIO Considerando, unicamente, os números 80, 75, 120, 100, 84 e 67 podemos dizer que temos os dados brutos da distância percorrida. No momento em que eles forem organizados seguindo um padrão matemático: 67, 75, 80, 84, 100 e 120 temos um rol. Outro conceito importante é o de amplitude total (h). Assim, podemos dizer que a amplitude total da distância percorrida pelo vende- dor é dada por h= 120 -67 h= 53 km. Quando o nosso processo de contagem exigir a consideração de mais de uma variável significativa, podemos montar uma tabela de entrada dupla. Por exemplo, você foi responsabilizado para verificar se os funcionários da empresa desejam re- alizar horas extras. A sua experiência anterior, indica que homens e mulheres têm opiniões diferentes a respeito desse assunto. Então, a tabela é organizada com as va- riáveis “homens” e “mulheres”. Amplitude, refere-se ao tamanho, ou seja, o maior valor menos o menor. GRÁFICOS Gráficos, além de fornecerem a organização dos dados, são excelentes para apresentações e palestras, pois produzem um efeito visual interessante e revelam o comportamento do fenôme- no. Entretanto, são necessários alguns cuidados na sua elaboração, dentre os quais destacamos: veracidade, clareza e simplicidade. Lembre-se que os gráficos podem ser apresentados para pes- soas que não conhecem a sua pesquisa, logo, eles precisam fornecer uma ideia do que aconteceu. Entrada dupla Interesse em realizar horas extras Homens Mulheres Total Não 16 35 51 Sim 45 5 50 Total 61 40 101 8FUNDAMENTOS DE ESTATÍSTICA SUMÁRIO GRÁFICO EM COLUNAS Observe que o gráfico a seguir, apesar de representar o fenômeno, pode conter proble- mas para uma apresentação. Veja que alguns vendedores não têm a sua venda indicada, le- vando o leitor a precisar supor o valor exato da venda. Além disso, seria necessário especificar o período para termos uma noção de como as vendas aconteceram. GRÁFICO EM BARRAS Assemelha-se ao gráfico em colunas, porém, os retângulos são dispostos horizontal- mente (CORREA, 2003, p.25). A escolha do modelo depende exclusivamente do interesse e da preferência de quem fez o gráfico, pois são representações muito similares. Entenda mais sobre os tipos de gráficos: O gráfico indica as vendas dos representantes comerciais da empresa “Sul Metais” Ltda. O gráfico indica as vendas dos representantes comerciais da empresa “Sul Metais” Ltda. Vendas Vendas 9FUNDAMENTOS DE ESTATÍSTICA SUMÁRIO GRÁFICO EM SETORES É o famoso gráfico em “pizza”. Consiste em repartir um círculo em vários setoresou fatias. Utilizamos prin- cipalmente quando queremos comparar os valores encontrados com o total (CORRREA, 2005, p.25). Esse gráfico produz um bom aspecto visual, sendo muito utilizado em apresentações. O gráfico, apesar de produzir um bom efeito visual, também apresenta algumas limitações. Por exemplo, observe a quantia de tons de azul e roxo utilizadas, o que pode confundir o leitor. Mesmo que tenhamos uma legenda, pois ela não indica exatamente em que lo- cal está o mês inicial, podendo causar uma certa confusão. Dessa for- ma, é possível dizermos que ele falha no aspecto clareza. Sobretudo, para apresentações, devemos estar muito atentos ao modo pelo qual as pessoas o entenderão. GRÁFICO EM LINHAS Constitui uma aplicação do processo de representação das fun- ções num sistema de coordenadas cartesianas (CORREA, 2003, p.24). São bastante úteis quando almejamos visualizar a variação de um fe- nômeno, por exemplo, as vendas da empresa, subiram, baixaram e mantiveram-se constantes. Comparações entre dois fenômenos tam- bém são interessantes. Gastos de papel no escritório Exemplo: O gráfico revela os gastos com papel em um escritório de uma determinada empresa. Exemplo: O gráfico a seguir indicará as vendas de João Carlos durante os primeiros meses do ano de 2016. 10FUNDAMENTOS DE ESTATÍSTICA SUMÁRIO Perceba que com esse tipo de gráfico é possível observar com clareza os períodos de queda e de crescimento nas vendas do representante. AMOSTRAGEM Podemos entender a população como a totalidade dos sujeitos envolvi- dos na pesquisa. A amostra é um “recorte” dessa população. A amostragem é a forma como efetuamos esse “recorte”. Existem outros tipos de gráficos que devem ser usados, de acordo com a necessidade do pesquisador, mas, sobretudo, com o uso do bom senso. Amostragem é a forma ou técnica utilizada para compormos a amostra. Veja as classificações de amostragem! 11FUNDAMENTOS DE ESTATÍSTICA SUMÁRIO AMOSTRAGENS PROBABILÍSTICAS São técnicas que envolvem elementos estatísticos durante a composição da amostra. Aqui, procuramos eliminar o viés da aleatoriedade. AMOSTRAGEM ALEATÓRIA SIMPLES Nesse processo, precisamos identificar todos os elementos da população, selecionando a amostra a partir de um sorteio. É imprescindível que todos os elementos da população tenham a mesma chance de pertencerem à amostra (BARBETTA, 2002). Para isso, é muito importante a realização de um sorteio honesto. Uma boa ideia é a utilização de geração de números aleatórios. Na planilha eletrônica, você pode utilizar o comando ALEATÓRIOENTRE. Por exemplo, você de- seja sortear um número aleatório entre 1 e 120. Basta digitar “=ALEATÓRIOENTRE(1;120)”. AMOSTRAGEM SISTEMÁTICA É similar à amostragem aleatória simples, sendo utilizada quando almejamos compor a amostra a partir de ciclos. É necessário ordenar os elementos, fornecendo uma cobertura mais ampla do fenômeno (BARBETTA, 2002). 1. Numerar aleatoriamente os funcionários. Exemplo: a construtora “JBF construções” tem 30 funcionários e deseja entrevistar 5 deles em relação às condições de segurança no trabalho. A amostragem será a sistemática. Vamos aos passos: 1) Beto 7) Cristiane 13) Alexandre 19) Andrei 25) Marcelo 2) Marilene 8) Daniel 14) Bruna 20) Débora 26) Tiago 3) Carlos 9) Márcio 15) Gláucia 21) Janice 27) Ana Paula 4) Ângela 10) Simone 16) Ivo 22) Marluce 28) Max 5) Alfredo 11) Monique 17) Dener 23) Jaqueline 29) Sinara 6) Vicente 12) Maicon 18) João 24) Patrícia 30) Marília 12FUNDAMENTOS DE ESTATÍSTICA SUMÁRIO Perceba que essa técnica de amostragem “varreu” todos os estratos considerados, já, com outra técnica, isso não seria possível. AMOSTRAGEM POR CONGLOMERADOS Nesse tipo de amostragem, elegemos conglomerados da população, que consistem em agrupamentos da população. Após selecionados os conglomerados, um deles é sorte- ado por amostragem aleatória simples e todos os elementos dele são analisados. 2. Construir um intervalo de seleção (K), dividindo-se o número da população (N) pelo da amostra (n): 3. Sortear um funcionário aleatoriamente entre 1 e 6. Suponha que o número sorteado foi 5. O primeiro funcionário da amostra será “Alfredo”. Os demais serão obtidos a partir do inter- valo de seleção, sendo adicionados 6. Assim, entrevistaremos: 5) Alfredo; 11) Monique; 17) Dener; 23) Jaqueline; 29) Sinara. AMOSTRAGEM ESTRATIFICADA Consiste em dividir a população em grupos, denominados estratos, que devem ser homogê- neos em relação às características das variáveis de estudo (BARBETTA, 2002). K= N/n K= 30/5 K=6 Este número sempre deve ser arredondado. A composição dos estratos deve considerar a realidade do cenário pesquisado, bem como os valores da amostra devem ser arredondados. Exemplo: desejamos pesquisar a satisfação de administradores de empresa na cidade de Caxias do Sul, e utilizamos a amostragem por conglomerados. Inicialmente, devemos compor os conglomerados, que são os possíveis “lugares” em que estão os administradores. Vamos supor: Exemplo: para eleger um representante para o sindicato, do qual a sua empresa é filiado, foi realizada uma pesquisa em relação ao estilo de liderança que os funcionários preferem. Você decidiu entrevistar 20%, e percebeu que cada função pode ter uma opinião diferente. Assim, foi feita uma amostragem estratificada, considerando que na empresa tem 10 mecânicos, 10 auxiliares de escritório e 30 operários. Componha a amostra: Função População Amostra Mecânico 10 2 Auxiliar de escritório 10 2 Operário 30 6 Total 50 10 13FUNDAMENTOS DE ESTATÍSTICA SUMÁRIO 1. Indústrias 2. Comércio 3. Instituições de Ensino Superior 4. Empresas de Consultoria Realizamos um sorteio aleatório entre os números 1 e 4. Suponha que o número 2 foi sorteado. Assim, precisamos entrevistar todos os administradores que trabalham no comér- cio na cidade de Caxias do Sul. AMOSTRAGENS NÃO PROBABILÍSTICAS Em muitas situações não é possível conhecer a priori, a probabilidade de um elemen- to da população pertencer à amostra. Em outras, é muito difícil numerar-se toda a população (BARBETTA, 2002). Exemplo: Em uma pesquisa sobre a saúde dos peixes em um rio, não é possível determinarmos nem fazermos a numeração da população. Nesses casos, utilizamos as amostragens não probabilísticas. AMOSTRAGEM A ESMO Como o nome sugere, consiste em escolher a esmo, sem um critério matemático previs- to anteriormente. Nesse caso, contamos com o acaso para escolhermos os representantes da população. AMOSTRAGEM INTENCIONAL Pode ser utilizada quando o pesquisador visa uma determinada característica dentro da população. É um tipo de pesquisa bastante utilizada no mercado consumir, pois visa um de- terminado tipo ou perfil de cliente. Exemplo: Queremos testar a resistência de parafusos ao calor. Temos 5.000 parafusos e queremos analisar 250. Seria inviável numerar os parafusos e utilizar a amostragem aleatória simples, por exemplo. Assim, sorteamos os 250 parafusos ao acaso ou a esmo, que justifica o nome da técnica. Exemplo: Você trabalha no setor de qualidade de uma empresa que manufatura tabaco, e almeja conferir a satisfação sobre uma nova marca de cigarro disponível no mercado. Assim, devem ser entrevistados, intencionalmente, fumantes. Uma amostragem composta de outra forma, além de poder formar uma amostra pequena, pode causar uma série de constrangimentos para o pesquisador. 14FUNDAMENTOS DE ESTATÍSTICA SUMÁRIO DISTRIBUIÇÃO DE FREQUÊNCIA Podemos entender a frequência como o número de vezes que um fenômeno se repete. Uma distribuição de frequência é uma tabela na qual os possíveis valores de uma variável se encontram agrupados em classes, registrando-se o número de valores observados em cada classe (KAZMIER, 1982, p.8). DISTRIBUIÇÃO DE FREQUÊNCIA SEM AGRUPAR DADOS A distribuição de frequência sem agrupar dados é feita, a partir da observaçãodo número de acontecimentos em determinados intervalos de uma amostra. Podemos organizar estes dados considerando o número de funcionários que faltou e o número de vezes que isto ocorreu (frequência absoluta). AMOSTRAGEM POR COTAS Assemelha-se à amostragem estratificada, também trabalhando com subcon- juntos, em que a população é dividida. Seleciona-se para participar da amostra uma cota de cada subgrupo, sendo proporcional ao seu tamanho. Entretanto, a seleção não tem a necessidade de ser aleatória (BARBETTA, 2002). Perceba que um dos estratos (masculino com mais de 40 anos) foi de certa forma pri- vilegiado, com um percentual maior de entrevistas, o que pode “contaminar” a pesquisa. Exemplo: uma empresa deseja promover um estudo sobre o “peso” dos seus funcionários. Levou-se em conta o sexo e a idade. Como não era possível obrigar todos os funcionários a realizar o exame, a instituição chegou aos seguintes números de entrevistados: Exemplo: o departamento pessoal da empresa “PL Calçados” efetuou um levantamento dos funcionários que estiveram ausentes no decorrer de dois anos. Sexo Mais de 40 anos Menos de 40 anos Masculino 48% 14% Feminino 26% 12% Em pesquisas eleitorais são utilizadas amostragens por cotas. Consideram-se sexo, escolaridade e renda, por exemplo. Jan. Fev. Mar. Abr. Mai. Jun. Jul. Ago. Set. Out. Nov. Dez. Ano 1 6 7 1 6 9 2 7 9 1 8 10 9 Ano 2 8 8 5 1 7 4 10 9 4 10 6 10 Funcionários ausentes 15FUNDAMENTOS DE ESTATÍSTICA SUMÁRIO DISTRIBUIÇÃO DE FREQUÊNCIA COM DADOS AGRUPADOS Uma distribuição de frequência com dados agrupados consiste em realizar agrupamentos, sendo muito utilizada quando temos muitas informações. No entanto, a construção desses grupos exige pro- cedimentos matemáticos e o conhecimento de alguns conceitos: • Classes (k): são os grupos que serão formados. • Amplitude do intervalo de classe (h): é o tamanho da classe. • Intervalo de classe: são os limites da classe. Temos o limite inferior e o superior. • Ponto médio do intervalo de classe (xi): é o limite superior mais o limite inferior dividido por dois. A tabela ao lado é denominada distribuição de frequência, sem agrupar dados. Número de funcionários que faltaram. Número de meses (frequência) 1 3 2 1 4 2 5 1 6 3 7 3 8 3 9 4 10 4 Total: 52 Distribuição de frequência • Frequência absoluta (fi): são os números de observações dos elementos de uma determinada classe. • Frequência relativa (fr): é a proporção que a frequência absoluta da classe ocu- pa em relação ao total. Ela é obtida a partir da divisão da frequência absoluta pelo total. • Frequência percentual (fp): indica o percentual que cada classe ocupa em rela- ção ao todo. É obtida a partir da multiplicação da frequência relativa por cem. • Frequência acumulada (fa): é a soma da frequência absoluta da classe com a da classe anterior. É comumente utilizada quando queremos ter uma ideia de várias classes conjuntamente. • Frequência acumulada percentual (fap): é a soma da frequência percentual da classe com a da classe anterior. É comumente utilizada quando queremos ter uma ideia de várias classes juntamente. Veremos, a seguir, como compor cada um desses elementos em uma pesquisa: Exemplo: o rol indica a quilometragem mensal que um vendedor fez com o veículo da empresa em um determinado período. Faça a distribuição de frequência utilizando dados agrupados por intervalos de classes, siga os passos: 16FUNDAMENTOS DE ESTATÍSTICA SUMÁRIO 550 580 615 630 650 700 780 805 830 850 865 900 925 940 950 955 970 980 1000 1100 1150 1150 1300 1350 1500 2000 2500 2800 2950 3000 Distância (Km) percorrida pelo vendedor 1. Estimar o número de classe. Utilizamos a fórmula de Sturges: Importante: explore a sua calculadora! Em algumas basta digitar a fórmula, em outras você precisa calcular o log primeiro, multiplicar por 3,3 e, por último, somar um. Vamos considerar que a nossa amostra tem 30 elementos, então n=30. Logo: k=1+3,3logn k=1+3,3log30 k=1+3,3.1,47 k=5,87 aproximadamente 6 classes 2. Estimar a amplitude de cada classe. h= (3000-550)/6 h=408,33 Importante: a amplitude de classe é o único caso que devemos arredondar “para cima”, sempre, pois caso contrário, o último valor da tabela pode não se encaixar na distribuição de frequência. Assim, h = 409. 3. Montar a tabela com a frequência absoluta. Para isso, partimos do primeiro valor do rol (ver tabela 5), ou seja 550. Este será o limite inferior da primeira classe. Para encon- trarmos o limite superior, somamos 550 com 409, que é a amplitude do intervalo, resultando em 959. A segunda classe começará com 959, que será somado com 409. O processo segue até alcançarmos 6 clas- ses, conforme a tabela a seguir. Para encontrar a frequência absoluta, voltamos para a tabela 5 e contamos quantos elementos pertencem à cada classe. Perceba que existem 16 eventos entre 550 e 959: k=1+3,3logn h= [maior valor]-[menor valor] número de classes desejadas 17FUNDAMENTOS DE ESTATÍSTICA SUMÁRIO 4. Frequência relativa. Basta dividir cada um dos valores da frequência absoluta pelo total, ou seja 30. 5. Frequência percentual. Basta multiplicar a frequência relativa por 100. 6. Frequência acumulada e frequência acumulada percentual. Distância Frequência absoluta (fi) 550 |–959 16 959 |– 1368 8 1368 |– 1777 1 1777 |– 2186 1 2186 |– 2595 1 2595 |–3004 3 TOTAL 30 Distribuição de frequência Distância fi fr 550 |–959 16 16/30 : 0,53 959 |– 1368 8 8/30: 0,27 1368 |– 1777 1 1/30: 0,033 1777 |– 2186 1 1/30: 0,033 2186 |– 2595 1 1/30: 0,033 2595 |–3004 3 3/30: 0,1 TOTAL 30 Aprox.1 Distribuição de frequência Distância fi fr fp 550 |–959 16 16/30 : 0,53 53% 959 |– 1368 8 8/30: 0,27 27% 1368 |– 1777 1 1/30: 0,033 3,3% 1777 |– 2186 1 1/30: 0,033 3,3% 2186 |– 2595 1 1/30: 0,033 3,3% 2595 |–3004 3 3/30: 0,1 10% TOTAL 30 Aprox.1 Aprox. 100% Distribuição de frequência Distância fi fr fp fa fap 550 |–959 16 16/30 : 0,53 53% 16 53% 959 |– 1368 8 8/30: 0,27 27% 16+8: 24 80% 1368 |– 1777 1 1/30: 0,033 3,3% 24+1: 25 83,3% 1777 |– 2186 1 1/30: 0,033 3,3% 25+1: 26 86,6% 2186 |– 2595 1 1/30: 0,033 3,3% 26+1: 27 89,9% 2595 |–3004 3 3/30: 0,1 10% 27+3: 30 99,9% TOTAL 30 Aprox.1 Aprox. 100% Distribuição de frequência 18FUNDAMENTOS DE ESTATÍSTICA SUMÁRIO 7. Estimar o ponto médio. Em muitas situações é necessário sabermos o ponto médio de cada classe. Logo, temos: Classe 1: (550 + 959) /2 = 754,5 Classe 2: (959+1368) /2 = 1163,5 Classe 3: (1368+1777) /2 = 1572,5 Classe 4: (1777+ 2186) /2 = 1981,5 Classe 5: (2186+2595) /2 = 2390,5 Classe 6: (2595+3004)/ 2 = 2799,5 Distância fi fr fp fa fap p.m. 550 |–959 16 16/30 : 0,53 53% 16 53% 754,5 959 |– 1368 8 8/30: 0,27 27% 16+8: 24 80% 1163,5 1368 |– 1777 1 1/30: 0,033 3,3% 24+1: 25 83,3% 1572,5 1777 |– 2186 1 1/30: 0,033 3,3% 25+1: 26 86,6% 1981,5 2186 |– 2595 1 1/30: 0,033 3,3% 26+1: 27 89,9% 2390,5 2595 |–3004 3 3/30: 0,1 10% 27+3: 30 99,9% 2799,5 TOTAL 30 Aprox.1 Aprox. 100% Distribuição de frequência 19FUNDAMENTOS DE ESTATÍSTICA EXERCÍCIOS SUMÁRIO 1. Uma franquia de lojas instalou algumas representações em diversas regiões do Rio Gran- de do Sul. Com o fim de conferir a satisfação dos clientes, resolveu entrevistar 7% des- ses de cada região. Então, vamos completar a tabela, indicando a amostra e o número da amostra. Obs. o número da amostra é a amostra, porém, arredondada. 2. O número de produtos que os clientes trocam em uma loja, foram registrados na tabela que segue: Vamos construir uma distribuição de frequência, sem agrupar dados: 3. Os funcionários da empresa “123 Testes Informática” estavam reclamando do tempo de reuniões. Para verificar se a reclamação procedia, foi realizado um estudo, no qual se controlou o tempo dasreuniões em minutos, que foram organizados na tabela que segue: Construa uma tabela de distribuição de frequência com dados agrupados por classes. Considere a frequência absoluta, frequência relativa, frequência percentual, frequência acu- mulada e frequência acumulada percentual. Região Clientes Amostra Número de amostra Metropolitana 690 Serra 380 Campanha 160 Litoral 280 Casacos Camisetas Camisas Meias Sapatos Cintos 8 5 0 5 7 4 7 4 1 4 8 3 6 3 4 2 6 2 Segunda Terça Quarta Quinta 45 52 70 58 50 51 46 63 42 44 59 54 41 40 64 60 20FUNDAMENTOS DE ESTATÍSTICA EXERCÍCIOS SUMÁRIO 4. Observe um estrato de uma tabela extraída do site do IBGE: Construa um gráfico de setores, preferencialmente, utilizando planilhas eletrônicas. 5. João Oliveira, o gerente da empresa onde você trabalha, recebeu um e-mail com o se- guinte conteúdo: Seu João. O Ricardo rodou 344 km e vendeu R$ 456,00, enquanto o Bruno rodou apenas 124 km e vendeu R$540,00. Só não entendi o Gilmar, que rodou 1389 km e vendeu apenas R$123,00. Por outro lado, a Marisa, que preferiu ficar na empresa e trabalhar por telefone, conseguiu vender R$560,00. Acho que está na hora de tomarmos algumas decisões. Att Vinicius Araújo Construa uma tabela de entrada dupla com os dados envolvidos no e-mail recebido pelo gerente da situação anterior. Segmento Número de empresas Fabricação de produtos alimentícios 6.839 Fabricação de bebidas 551 Fabricação de produtos do fumo 42 Fabricação de produtos têxteis 2.206 Confecção de artigos do vestuário e acessórios 8 939 Empresas que não apresentaram ações de inovações organizacionais e marketing no Brasil entre 2006 e 2008. 21 ESTATÍSTICA BÁSICA Neste capítulo, começaremos a analisar e interpretar os dados. Para isso, faremos uso de distintas técnicas de estatística que nos auxiliarão no processo de tomada de decisões. 22FUNDAMENTOS DE ESTATÍSTICA SUMÁRIO Em nossa atuação, seja profissional, ou pessoal, faz com que nos deparemos constantemente com fenômenos. Muitas vezes, atribuímos a sua existência à casualidade, em outros casos, procuramos compre- endê-los. Essa compreensão passa pelo entendimento de suas causas e de seus efeitos, que podem ser vinculados a números, que a partir daí podem ser interpretados à luz de procedimentos estatísticos. Tais técnicas podem ser usadas tanto na empresa, quanto em situações do cotidiano, para que possamos tomar decisões fundamentadas em pa- drões anteriormente observados. MEDIDAS ESTATÍSTICAS MEDIDAS DE TENDÊNCIA CENTRAL Como vimos no último capítulo, os dados obtidos em uma pes- quisa podem ser apresentados em gráficos ou tabelas. Entretanto, um fenômeno pode ser representado por meio de uma única quantia, de- nominada medida de tendência central. As principais são a média, a moda e a mediana. Média aritmética É um número que representa um fenômeno. Kazmier (1982, p. 29) define a mé- dia aritmética como “a soma dos valores do grupo de dados divididos pelo número de valores”. Usamos a média aritmética em diversas situações do nosso cotidiano, como quando queremos projetar uma situação intermediária. Por exemplo, se você faz duas provas valendo 10 pontos cada uma, e tira 6 na primeira e 8 na segunda, qual foi a sua média? Não foi 7? E como chegamos a esse resultado? Somamos 6 com 8 e dividimos por 2, não é verdade? Para dados não agrupados: A tabela indica o lucro da “KouroteK calçados”. Faça a média: Média: 120.000/6 = R$ 20.000,00 Existem vários recursos matemáticos que podem nos auxiliar a ler, interpretar e até mesmo prever o mundo. Observe que basta somar os valores e dividir pelo número de eventos. Meses Venda (R$) Janeiro 22.000 Fevereiro 18.000 Março 10.000 Abril 26.000 Maio 14.000 Junho 30.000 Total 120.000 Média aritmética 23FUNDAMENTOS DE ESTATÍSTICA SUMÁRIO Para dados agrupados por intervalo de classe: Quando nossos dados estão agrupados por intervalo de classe, devemos considerar seus pontos médios e as suas frequências absolutas. Exemplo: Segundo a tabela, o estoque de uma loja tem os seus valores organizados por intervalo de classes. Agora, encontre a média aritmética: Perceba que estimamos o ponto médio (xi) e multiplicamos pela frequência absoluta (fi). Os valores de cada classe devem ser somados e divididos pela soma da frequência absolu- ta. A fórmula que resume esse processo é: Média: 24.340/1.000 = R$ 24,34 MÉDIA PONDERADA A média ponderada é uma média aritmética que é utilizada quando cada elemento tem um peso distinto em relação ao total. Assim, este recurso será utilizado quando ocorrer repre- sentatividade distinta dentro do grupo (KAZMIER, 1982). Exemplo: na empresa em que você trabalha, existe o seguinte quadro funcional: A primeira coisa que devemos fazer é estimar o valor total do salário de cada um dos estratos: Assim: Preço unitário (R$) Quantidade (fi) Ponto médio (xi) Total da classe (xifi) 18,00 |– 20,00 120 19 19.120= 2280 20,00 |– 22,00 150 21 21.150= 3150 22,00 |– 24,00 180 23 23.180= 4140 24,00 |– 26,00 200 25 25.200= 5000 26,00 |– 28,00 190 27 27.190=5130 28,00 |– 30,00 160 29 29.160=4640 n=6 1000 24340 Média com dados agrupados Média: ∑xi.fi ∑fi Função Número Salário Gerente 2 R$ 10.000,00 Engenheiros 6 R$ 9.000,00 Operários 20 R$ 1.500,00 Estagiários 16 R$ 850,00 n=4 44 Média ponderada Gerentes: 2 x 10.000 = R$ 20.000,00 Engenheiros: 6 x 9.000 = R$ 54.000,00 Operários: 20 x 1.500 = R$ 30.000,00 Estagiários: 16 x R$ 850,00 = R$ 13.600,00 24FUNDAMENTOS DE ESTATÍSTICA SUMÁRIO Desse modo, podemos concluir que o total que a empresa investe em salários é R$ 117.600,00. Esse investimento deve ser repartido entre 44 funcionários, ou seja: Média: 117.600/44 = aprox.R$ 2.672,72 MEDIANA Podemos entender a mediana com o valor que está no centro ou no meio de um intervalo de dados. Para localizá-la, é importante que os dados estejam no formato de um rol, um seja, organizados de maneira crescente ou decrescente (KAZMIER, 1982). Para dados não agrupados: Basta construir o rol e localizar o valor do meio: Exemplos: Observe: a média aritmética é uma medida que sempre é atraída para os “outliers”, que são os valores atípicos que se afastam em demasia do padrão. Assim, olhar um fenômeno somente a partir da média aritmética, pode, de certa forma, “maquiá-lo”. Recomenda-se que ela seja utilizada conjuntamente com as outras medidas que veremos na sequência. I. Um vendedor fez a seguinte quilometragem durante a semana, utilizando o carro da empresa: 150, 110, 200, 80, 130. Iniciamos construindo um rol: 80, 110, 130, 150, 200 A mediana será 130, pois está exatamente no meio do rol. II. Uma loja vendeu o seguinte número de peças durante a semana: 45, 80, 45, 130, 175, 90. Rol: 45, 45, 80, 90, 130, 175. Perceba que não temos um termo que divida o rol ao meio. Então fazemos a média aritmética dos dois termos centrais: Para dados agrupados: A mediana para dados agrupados exige um pouco mais de trabalho manual, por isso precisamos estar atentos para não perdermos nenhum valor. Devemos seguir a fórmula: 25FUNDAMENTOS DE ESTATÍSTICA SUMÁRIO Vamos traduzir a fórmula, ou seja, compreender o que cada letra ou abreviatura significa, para que possamos identificar os elementos em nossos exercícios. li = limite inferior n/2= total da frequência absoluta dividido por 2 facant = frequência acumulada anterior fi = frequência absoluta da classe h = amplitude do intervalo de classe Exemplo: o estoque de uma loja tem os seus valores orga- nizados por intervalo de classes. De acordo com a tabela a seguir, encontre a mediana: Não se assuste! Se você “traduzir” a fórmula corretamente e montar uma tabela para a sua organização, não haverá problemas! 26FUNDAMENTOS DE ESTATÍSTICA SUMÁRIO Passo 1: determinar a classe em que está localizadoo valor da mediana. Isso é feito dividindo o número da amostra por 2, e identificando, a partir da frequência acumulada, em qual classe ele se encontra. Perceba que na classe destacada em vermelho, quando olhamos para a fre- quência acumulada, ela vai do 450 ao 650. Ou seja, o número 500 estará entre esses valores. Passo 2: identificar os demais elementos da fór- mula. li = 24. Perceba que na classe destacada em ver- melho o limite inferior é 24. fi = 200. Perceba na classe destacada em verme- lho que a frequência absoluta é 200. facant = 450. Perceba na classe destacada em vermelho que a frequência acumulada da classe ante- rior é 450. h=2. Perceba que a amplitude de todos intervalos de classe é 2. Passo 3: Aplicar a fórmula. Med: 24 + ((500-450)/200).2 Med: 24 +0, 25.2 Med: 24,5 Preço unitário (R$) Quantidade (fi) Fa 18,00 |– 20,00 120 120 20,00 |– 22,00 150 270 22,00 |– 24,00 180 450 24,00 |– 26,00 200 650 26,00 |– 28,00 190 840 28,00 |– 30,00 160 1000 N 1000 Mediana Observe: a mediana sempre depende da frequência acumulada. Caso você não lembre como ela é feita, volte nessa apostila ou consulte o seu professor. 27FUNDAMENTOS DE ESTATÍSTICA SUMÁRIO MODA Em nosso cotidiano, dizer que alguma coisa está na moda, normalmente se relaciona com aquilo que a maioria das pessoas estão usando, tem ou querem. Em estatística, o signifi- cado é similar. Podemos entender a moda como o fenômeno que ocorre com maior frequência. Para dados não agrupados: Basta observar o que mais se repete. Exemplo: Carlos é um representante comercial de uma certa marca de colchões, e obte- ve os seguintes resultados como vendas: Março: 5 unidades Abril: 6 unidades Maio: 8 unidades Junho: 2 unidades Julho: 8 unidades Agosto: 8 unidades Setembro: 9 unidades Outubro: 8 unidades Qual foi a moda? A moda foi 8, pois é o número com maior frequência, ou seja, o número que aparece mais vezes. Para dados agrupados sem intervalo de classe: Para fazer um plano preventivo de manutenção, foi realizada uma pesquisa em re- lação ao número de peças que quebram em uma empresa em determinado período. Qual é a moda? Basta olharmos para o valor, que temos a maior frequência absoluta, ou seja, Moda = 3. Com isso, concluímos que o mais comum de acontecer é a quebra de 3 peças no período considerado. Número de peças Número de vezes que aconteceu (fi) 0 0 1 18 2 25 3 32 4 23 5 13 Moda 28FUNDAMENTOS DE ESTATÍSTICA SUMÁRIO Para dados agrupados com intervalo de classe: Utilizamos a seguinte fórmula: Traduzindo a fórmula: li = fronteira inferior da classe que contem a moda (classe modal). d1= diferença entre a frequência da classe modal e a frequência da classe anterior. d2 = diferença entre a frequência da classe modal e a frequência da classe posterior. i = amplitude do intervalo de classe. Nada de pânico! Basta traduzir a fórmula e organizar os dados que não teremos problemas. Observe: a classe modal é aquela que apresenta a maior frequência absoluta. Exemplo: o estoque de uma loja tem os seus valores organizados por intervalo de clas- ses, conforme a tabela abaixo. Encontre a moda: Passo 1: identificar a classe modal. A Classe 24 I- 26 é a classe modal, pois apresenta maior frequência absoluta. Passo 2: encontrar o d1 e d2. d1 : 200 -180 = 20 d2: 200-190 = 10 Passo 3: aplicar a fórmula. Preço unitário (R$) Quantidade (fi) 18,00 |– 20,00 120 20,00 |– 22,00 150 22,00 |– 24,00 180 24,00 |– 26,00 200 26,00 |– 28,00 190 28,00 |– 30,00 160 N 1000 Moda 29FUNDAMENTOS DE ESTATÍSTICA SUMÁRIO Exemplo: na loja “123 Eletrodomésticos” trabalham dois vendedores, Adriano e Daia- ne, que tiveram os seguintes desempenhos de vendas: Adriano: Daiane: MEDIDAS DE VARIABILIDADE Medidas de variabilidade medem a oscilação de um fenômeno, ou seja, quanto se dis- persam quando comparadas à média. As principais medidas são a variância e o desvio padrão. VARIÂNCIA A variância representa a dispersão de uma variável em relação à sua média. Para dados não agrupados: Segunda Terça Quarta Quinta Sexta 10 2 8 3 7 Variância Segunda Terça Quarta Quinta Sexta 6 6 6 6 6 Variância 30FUNDAMENTOS DE ESTATÍSTICA SUMÁRIO Esses passos podem ser sintetizados com as fórmulas: • Para população: • À amostra: Exemplo: Adriano vendeu os seguintes eletrodomésti- cos durante a semana: 10, 2, 8, 3 e 7. Calcule a variância de suas vendas: Calculando a média = (10+2+8+3+7)/ 5 = 30/5 = 6 Lembre-se! A média pode maquiar o fenômeno. Média de Adriano: 30/5 = 6 eletrodomésticos. Média de Daiane: 30/5 = 6 eletrodomésticos. Mesmo que ambos os vendedores tenham obtido a mesma média, não po- demos dizer que são vendedores iguais, pois Adriano tende a ter oscilações nas suas vendas, enquanto Daiane é mais constante. Para medir essas variações po- demos utilizar a variância. Vamos aos passos!! Passo 1: determinar a média aritmética (µ) da sequência. Passo 2: determinar as diferenças entre a média e cada elemento da sequência. (fi-µ). Passo 3: elevar ao quadrado e somar os valores encontrados no passo 2. ∑(fi-µ)². Passo 4: dividir o resultado do passo 4 pelo número de eventos do conjunto. Observe: desenvolva todos os passos completando uma tabela. Quando ela estiver completa troque os valores para a fórmula. 31FUNDAMENTOS DE ESTATÍSTICA SUMÁRIO Organizando a tabela: Lembre-se que estamos trabalhando com todas as vendas de Adriano, então devemos considerar a fórmula da população: O numerador da fórmula foi gerado a partir da tabela, e o denominador n é 5, pois o ven- dedor fez 5 vendas. Com dados agrupados por intervalos de classe: A variância com dados agrupados pode ser um pouco trabalhosa. Você precisará organi- zar, muito bem, uma tabela com os dados e seguir os passos abaixo: fi (fi-µ) (fi-µ)² 10 10 - 6 = 4 4 x 4 = 16 2 2 – 6= - 4 (-4) x (-4) = 16 8 8 - 6 = 2 2 x 2 = 4 3 6 - 3 =- 3 (-3) x (-3) = 9 7 7 - 6 = 1 1x 1 = 1 ∑= 46 Variância Passo 1: determinar o ponto médio de cada intervalo de classe (xi). Passo 2: elevar cada ponto médio ao quadrado (xi²). Passo 3: multiplicar cada xi² pela frequência da classe fi correspondente. Passo 4: calcular a média aritmética considerando que os dados estão agrupados. Construímos uma tabela e aplicamos os dados em uma das fórmulas: • Para população: • Para a amostra: Exemplo: o número de produtos vendidos por uma loja está representado por uma dis- tribuição de frequência conforme a tabela que segue. Calcule a variância: 32FUNDAMENTOS DE ESTATÍSTICA SUMÁRIO A tabela precisa ser ajustada em acordo com os passos descritos anteriormente. Chegamos no seguinte resultado: Produtos fi 2 |− 14 13 14 |− 26 9 26 |− 38 8 38 |− 50 23 50 |− 62 15 62 |− 74 10 78 |− 86 2 Variância Classe xi fi xifi xi² xi²fi 2 |− 14 8 13 104 64 832 14 |− 26 20 9 180 400 3600 26 |− 38 32 8 256 1024 8192 38 |− 50 44 23 1012 1936 44528 50 |− 62 56 15 840 3136 47040 62 |− 74 68 10 680 4624 46240 74 |− 86 80 2 160 6400 12800 ∑ 80 3232 163232 Variância Vamos nos recordar que a média aritmética para dados agrupados é calculada por: Assim, a média será Média: 3232/80 = 40, 4. Também vamos considerar que esta- mos trabalhando com todas as vendas da loja em um dado período, então será utilizada a fórmula da população: DESVIO PADRÃO A resolução do último exemplo, leva-nos a perceber que a variância é uma medida que permanece elevada ao quadrado. Em situações práticas pode ser difícil imaginarmos essa situação. Por isso, normalmente se utiliza o desvio padrão. Segundo Youssef, Soares e Fernandes (2004, p.257) “o desvio padrão pode ser obtido diretamente da variância, extraindo-se a raiz quadrada do valor encontrado”. Ele informa a dispersão dos dados em relação à média, porém, parece nos dar suma dimensão mais exata. 33FUNDAMENTOS DE ESTATÍSTICA SUMÁRIOExemplo: pense nos dados do último exemplo. Considerando que a variância foi σ²= 408,24, o desvio padrão será DP: √408,24 ou seja DP: aprox. 20,20. Isso significa que o fenômeno está se afastando da média 20,20 unidades, seja para mais, seja para menos. COEFICIENTE DE VARIAÇÃO (V) Para Kazmier (1982, p.52) “o coeficiente de variação V, indica a magnitude relativa do desvio padrão quando comparado com a média da distribuição das medidas”. V: Coeficiente de variação σ: Desvio Padrão µ: Média Exemplo: o preço médio diário das ações de uma empresa A durante um certo período do mês foi de R$150,00, com um desvio padrão de R$5,00. A empresa B teve o preço médio R$ 50,00 no mesmo período, com desvio padrão de R$3,00. Kazmier (1982) esclarece que em termos de comparação absoluta, a empresa A teve uma maior variação, pois seu desvio padrão é maior. No entanto, quando pensamos em relação ao preço, podemos perceber que o preço das ações da empresa B é quase duas vezes mais variável quando comparado a empresa A. REGRESSÃO LINEAR SIMPLES A regressão linear tem o objetivo de verificar a existência de relações entre as variáveis. Barbetta (2002) considera que existe uma correlação direta entre duas variáveis, isso aconte- ce quando elas caminham no mesmo sentido. Por exemplo: peso e altura pode ser um exemplo de correlação direta entre variáveis, pois espera-se que um sujeito mais alto seja mais pesado. Já, a correlação inversa, ocorre quando elas caminham em sentido oposto. Por exemplo: no Brasil, a renda e o número de filhos por família apresentam uma correlação inversa, pois de um modo geral, quando menor a renda maior o número de filhos. Empresa A: V= σ/µ V= 5/150= 0,033 Empresa B: V= σ/µ v= 3/50= 0,060 34FUNDAMENTOS DE ESTATÍSTICA SUMÁRIO Chamamos o x de variável independente, pois é o próprio fenômeno e não de- pende de outros fatos. Já o y é chamado de variável dependente, pois depende do x. O processo consiste em obter uma equação que explique o comportamento de uma variável em relação a outra. EQUAÇÃO DA RETA Consiste em encontrar uma equação de uma reta que explique o comporta- mento das variáveis. DIAGRAMA DE DISPERSÃO Consiste em representar as variáveis em um plano cartesiano por pontos com coordenadas (x,y), em que x é a variável observada e y o correspondente (BARBET- TA, 2002). Quanto mais os pontos estiverem concentrados em torno de uma reta, mais correlação existe entre as variáveis. Exemplos: I. O gráfico a seguir indica as vendas (em cruzeiros) de uma empresa durante um período: Observe que o gráfico se aproxima de uma reta, o que indica uma forte correlação entre as vari- áveis. A reta crescente indica que a correlação é direta, ou seja, quanto mais aumentam os anos, mais aumentam as vendas da empresa. 35FUNDAMENTOS DE ESTATÍSTICA SUMÁRIO II. O gráfico demonstra o resultado de uma pesquisa em que foram consideradas a idade e a massa muscular de um grupo de pessoas: Perceba que mesmo que não forme uma reta perfeita, os dados se concentram em torno de uma linha imaginária, indicando que existe correlação. Como a linha é decrescente, a cor- relação é inversa, ou seja, quanto mais a idade aumenta, mais a massa muscular diminui. III. O gráfico demonstra o resultado de uma pesquisa em que foram considerados a idade e o tempo de leitura: Perceba que o fenômeno fica disperso, não se concentrando em torno de uma reta. Isto significa que não existe correlação entre as variáveis, ou seja, a idade não interfere no tempo de leitura. COEFICIENTE DE CORRELAÇÃO A correlação entre duas variáveis pode ser medida a partir de um número (coeficiente de Pearson), o qual indica em que nível a correlação ocorre. O coeficiente ocorre entre -1 e 1, sendo: 0: nula Entre 0,10 e 0,29 : pequena Entre 0,40 e 0,60 : moderada Entre 0,70 e 0,90: forte Maior que 0,90: muito forte R > 0 correlação direta R=0 correlação nula R< 0 correlação inversa 36FUNDAMENTOS DE ESTATÍSTICA SUMÁRIO Segundo passo: aplicar a fórmula. Existe uma relação muito forte entre as horas de exercício e o aumento do “colesterol bom”. r= 0,98 O coeficiente de Pearson indicou que existe uma correlação muito forte e direta entre as duas variáveis, ou seja, quanto mais exercícios a pessoa praticar, maior será o seu “colesterol bom”. Fórmula: Exemplo: em uma certa cidade, foi realizado um estudo, visando compreender a saúde das pessoas. Os entrevistados tinham entre 5 e 50 anos de idade. Fo- ram considerados o nível de HDL (colesterol bom) no sangue e as horas de exercícios semanais. Chegou-se aos seguintes resultados: Existe correlação entre as variáveis? Em que nível? Primeiro passo: ajustar a tabela montando as colunas x.y, x² e y². HDL Horas de Exercícios 40 0 50 2 55 3 60 4 65 6 x y x,y x² y² 40 0 0 1.600 0 50 2 100 2.500 4 55 3 165 3.025 9 60 4 240 3.600 16 65 6 390 4.225 36 Soma 270 15 895 14.950 65 37FUNDAMENTOS DE ESTATÍSTICA SUMÁRIO INTERVALO DE CONFIANÇA O intervalo de confiança é uma estimativa de parâmetro. Assim, podemos estimar um intervalo no qual existe a probabilidade de um fenômeno ocorrer. Exemplo: para estimar o tempo médio em uma consulta, foram amostrados 64 pacien- tes. Essa amostra indicou um tempo médio de 10 minutos, com desvio padrão de 3 minutos. Com base nisso, qual é o tempo médio de atendimento, com um nível de confiança de 90%? Temos: Vamos aplicar um teste T! Da seguinte forma, será usada a tabela t, que consta no final da apostila, siga os passos: Passo 1: pegue a sua tabela. Queremos um nível de confiança de 90%, temos uma mar- gem de erro de 10%, sendo 5% em cada cauda. Procuramos na tabela z, um valor que resulte em 0,05 (5%). O valor é -1,64. n = 64 Média: 10 S: 3 Passo 2: estimar a margem de erro. Passo 3: aplicar a fórmula. Passo 4: construir o intervalo. Limite superior: 10+ 0,615 = 10,615 Limite inferior: 9,385 [9,385; 10,615] Isso significa que se visitarmos esse médico, temos 90% de chance de ficarmos entre 9,38 minutos e 10,61 minutos na consulta. TESTE DE HIPÓTESES Uma hipótese é uma afirmação sobre uma determinada população. Os testes de hipóte- ses visam confirmar ou refutar tais afirmações. Média x ± z margem de erro ME: S / √n 38FUNDAMENTOS DE ESTATÍSTICA SUMÁRIO Ho (hipótese nula) H1 (hipótese alternativa) É importante que as hipóteses sejam contrárias. Vamos a mais um exemplo: Um fabricante de refrigerantes afirma que os frascos de dois litros dos seus produtos contêm, no mínimo, uma média de 1,99 litros do produto. Uma amostra de frascos de dois litros foi selecionada e o conteúdo avaliado com o fim de testar-se a afirmação do fabricante. Nesse caso, a construção das hipóteses parte da afirmação do fabricante, considerando ser ela verdadeira. Assim, teríamos as seguintes hipóteses: H0 : µ ≥ 1,99 H1: µ< 1,99 Caso os resultados da amostra indicarem que H0 não possam ser rejeitadas, a afirmação do fabricante não será contestada. Por outro lado, se H0 pode ser rejeitada, afirmamos que H1: µ< 1,99 é verdadeiro, o que evidencia que a informação do fabricante é incorreta. Em uma situação prática, os resultados do teste de hipóteses podem ser utilizados di- retamente no processo de tomada de decisão. No exemplo anterior, poderiam ser revistos os processos de envasamento do refrigerante. 39FUNDAMENTOS DE ESTATÍSTICA EXERCÍCIOS SUMÁRIO 1. O automóvel da empresa rodou as seguintes quilometragens. Encontre a mediana: 2. Na disciplina de estatística, o professor realizou 10 avaliações. Ana teve as seguintes notas: 2, 3, 3, 4, 5, 6, 7, 8, 9 e 10. Encontre a variância: 3. A tabela abaixo traz o tamanho dos bebês em uma determinada maternidade. Encontre a mediana: 4. Observe a relação entre o preço da venda de passagens e a demanda: Encontre o coeficiente de correlação de Pearson e interprete o resultado: 5. Uma pesquisa em 17 cinemas de São Paulo,indicou que o ingresso custava em média R$ 5,50 com desvio padrão de R$ 0,50. Determine o erro máximo com intervalo de confian- ça de 95%. A estimativa de preço médio com 95% de confiança:Seg Ter Qua Qui Sex Sáb Seg Ter Qua Qui 126 128 134 135 138 131 139 132 138 136 Tamanho Frequência absoluta 50 I- 54 4 54 I- 58 9 58 I- 62 11 62 I- 66 8 66 I- 70 5 70 I- 74 3 Preço 33 25 24 18 12 10 8 4 Demanda 300 400 500 600 700 800 900 1000 40FUNDAMENTOS DE ESTATÍSTICA GABARITO SUMÁRIO CAPÍTULO I 1. 2. 2 Região Clientes Amostra Número da amostra Metropolitana 690 48,3 48 Serra 380 26,6 27 Campanha 160 11,2 11 Litoral 280 19,6 20 Peças fi 0 1 1 1 2 2 3 2 4 4 5 2 6 2 7 2 8 2 3. k 4. ] j Classe Frequência absoluta (fi) Frequência relativa (fr) Frequência percentual (fp) Frequência acumulada (fa) Frequência acumulada percentual (fap) 40 I – 46 5 0,3124 31,24% 5 31,24% 46 I – 52 3 0,1875 18,75% 8 49,99% 52 I – 58 2 0,125 12,5% 10 62,49% 58 I – 64 4 0,25 25% 14 87,49% 64 I - I 70 2 0,125 12,5% 16 99,99% Total 16 0,9999 99,99% Obs: as cores, a disposição da legenda e o título podem alterar. Observar a relação entre a tabela e o gráfico. 41FUNDAMENTOS DE ESTATÍSTICA GABARITO SUMÁRIO 5. g CAPÍTULO II 1. 134,5 2. 6,81 3. 60,54 4. r. -0,98 existe uma relação muito forte e inversa entre as variáveis. 5. [5,25; 5,75] Vendedor Km R$ Ricardo 344 456 Bruno 124 540 Gilmar 1389 123 Marisa 0 560 Total 468 1556 42FUNDAMENTOS DE ESTATÍSTICA SUMÁRIO TABELAS Distribuição T de Student Tabela de distribuição normal reduzida 43FUNDAMENTOS DE ESTATÍSTICA SUMÁRIO 44FUNDAMENTOS DE ESTATÍSTICA REFERÊNCIAS SUMÁRIO BARBETTA, P. A. Estatística Aplicada às Ciências Sociais. 5.a ed. Flo- rianópolis: Editora da UFSC, 2002. CORREA, S.M.B.B Probabilidade e Estatística. 2.a ed. Belo Horizonte: PUC Minas Virtual, 2003. KAZMIER, Leonard J. Estatística aplicada à Economia e Administra- ção. São Paulo: Makron Books, 2004. MORETTIN, L.G. Estatística Básica. Probabilidade e inferência. Volu- me único. São Paulo: Pearson Prentice Hall, 2010. YOUSSEF, A. N., SOARES, E. e FERNANDEZ, V. P. Matemática de olho no mundo do trabalho. São Paulo: Scipione, 1ª ed. 2004