Baixe o app para aproveitar ainda mais
Prévia do material em texto
FUNDAMENTOS DE ESTATÍSTICA Jeronimo Flores 2FUNDAMENTOS DE ESTATÍSTICA SUMÁRIO CENTRO UNIVERSITÁRIO UNIFTEC Rua Gustavo Ramos Sehbe n.º 107. Caxias do Sul/ RS REITOR Claudino José Meneguzzi Júnior PRÓ-REITORA ACADÊMICA Débora Frizzo PRÓ-REITOR ADMINISTRATIVO Altair Ruzzarin DIRETORA DE EDUCAÇÃO A DISTÂNCIA (NEAD) Lígia Futterleib Desenvolvido pelo Núcleo de Educação a Distância (NEAD) Designer Instrucional Sabrina Maciel Diagramação, Ilustração e Alteração de Imagem Darlan Scheid, Igor Zattera Revisora Ana Clara Garcia INTRODUÇÃO À ESTATÍSTICA 3 NOÇÕES FUNDAMENTAIS 4 ESTATÍSTICA DESCRITIVA 5 AMOSTRAGEM 9 DISTRIBUIÇÃO DE FREQUÊNCIA 13 ATIVIDADE 17 ESTATÍSTICA BÁSICA 19 MEDIDAS ESTATÍSTICAS 20 REGRESSÃO LINEAR SIMPLES 30 INTERVALO DE CONFIANÇA 33 ATIVIDADE 35 GABARITOS 36 REFERÊNCIAS 38 3FUNDAMENTOS DE ESTATÍSTICA INTRODUÇÃO À ESTATÍSTICA A estatística é um ramo da Matemática que se propõe a coletar, organizar, sistematizar, descrever, analisar e interpretar dados para o auxílio no processo de tomada de decisão A estatística vem sendo utilizada há séculos. Na bíblia Sagrada existem relatos de história de contagem de pessoas com finalidades militares e de cobrança de impostos. Você se considera uma pessoa azarada? A fila em que você está no supermercado sempre anda mais devagar? Ou sempre chove quando você esquece o guarda-chuva? A maior parte dos fenômenos que as pessoas atribuem à “sorte” ou ao “azar” podem ser calculados, medidos e mesmo previstos por meio de procedimentos estatísticos. 4FUNDAMENTOS DE ESTATÍSTICA Podemos dividir a estatística em três grandes áreas: a estatística descriti- va, a estatística inferencial e a estatística probabilística. Na estatística descritiva, os procedimentos resumem-se a descrever os dados, o que exige organização, síntese e apresentação. Na estatística inferencial, procuramos generalizar um fenômeno a partir do estudo com uma fração ou pedaço dele. Já, na estatística probabilística mede as tendências de um fenômeno aconte- cer, partindo de observações preliminares (CORREA, 2003). NOÇÕES FUNDAMENTAIS Neste item iremos estudar alguns conceitos e ideias que serão de suma im- portância para o nosso sucesso na disci- plina. Como: • Variável: uma característica que pode assumir distintos valores, de acordo com os sujeitos e o contexto (CORREA, 2003). Por exemplo: o crescimento de uma planta, a distância que o vendedor percorre com o carro da empresa, o desgaste de uma peça, etc; • População: é o conjunto formado por elementos que tenham pelo menos uma variável comum (MORETTIN, 2010); • Amostra: após a população ser de- finida, um subconjunto ou “recorte” dessa será a amostra. Utiliza-se n para indicar o número que foi amostrado (MORET- TIN, 2010); • Amostragem: é o processo utili- zado para a composição da amostra (MO- RETTIN, 2010); • Dados brutos: são os dados na forma com que foram coletados, sem qual- quer tratamento matemático. (CORREA, 2003); • Frequência: é o número de vezes que um fenômeno se repete (CORREA, 2003); • Rol: É a organização dos dados brutos na forma crescente ou decrescente (CORREA, 2003); • Parâmetro: é uma medida utiliza- da para descrever as características de uma população de forma numérica. A média e a variância são exemplos de parâmetros (MORETTIN, 2010); • Censo: é uma pesquisa em que a população é igual à amostra (CORREA, 2003). O IBGE se propõe a fazer um censo da população brasileira, ou seja, entrevistar todos os habitantes do país. Vamos exemplificar: 5FUNDAMENTOS DE ESTATÍSTICA Refletindo Você trabalha no restaurante de uma empresa onde, diariamente, almoçam 300 funcionários. O seu interesse é mudar o cardápio, mas não tem certeza se irão aprovar. Você não tem tempo nem recursos para fazer um almoço para todos. Assim, sorteia 30 pessoas, faz um almoço teste e pede para que eles atribuam uma nota de zero a dez ao cardápio. Para estimar uma nota geral, faz-se uma média das notas. Assim, temos: População: 300 pessoas Amostra: 30 pessoas Amostragem: sorteio Parâmetro: média ESTATÍSTICA DESCRITIVA A estatística descritiva visa descrever os fenômenos. Assim, gráficos, tabelas e histogramas são valiosos para que isto seja possível. TABELAS Tabelas podem ser muito úteis no processo de organização, sistematização e apresentação dos dados. A maior parte das tabelas apresentam as variáveis e a sua frequência. Uma tabela pode ser de entrada simples, quando conter apenas uma variável ou de entrada dupla quanto conter mais de uma. Vale a pena lembrar que a estatística descritiva parte de um processo de conta- gem. Você conta algo, para posteriormen- te seguir com os demais processos. Por exemplo, verificou-se a distância que o vendedor da empresa em que você trabalha anda com o carro da empresa. Dia Distância (Km) Segunda-feira 80 Terça-feira 75 Quarta-feira 120 Quinta-feira 100 Sexta-feira 84 Sábado 67 Distância 6FUNDAMENTOS DE ESTATÍSTICA Considerando, unicamente, os nú- meros 80, 75, 120, 100, 84 e 67 pode- mos dizer que temos os dados brutos da distância percorrida. No momento em que eles forem organizados seguindo um padrão matemático: 67, 75, 80, 84, 100 e 120 temos um rol. Outro conceito importante é o de amplitude total (h). Assim, podemos dizer que a am- plitude total da distância percorrida pelo vendedor é dada por h= 120 -67 h= 53 km. Quando o nosso processo de conta- gem exigir a consideração de mais de uma variável significativa, podemos montar uma tabela de entrada dupla. Por exemplo, você foi responsabilizado para verificar se os funcionários da empresa desejam realizar horas extras. A sua experiência Amplitude, refere-se ao tamanho, ou seja, o maior valor menos o menor. anterior, indica que homens e mulheres tem opiniões diferentes a respeito desse as- sunto. Então, a tabela é organizada com as variáveis “homens” e “mulheres”. GRÁFICOS Gráficos, além de fornecerem a organização dos dados, são excelentes para apresentações e palestras, pois produzem um efeito visual interessante e revelam o comportamento do fenômeno. Entretanto, são necessários alguns cuidados na sua elaboração, dentre os quais destacamos: veracidade, clareza e simplicidade. Lembre- -se que os gráficos podem ser apresentados para pessoas que não conhecem a sua pesquisa, logo, eles precisam fornecer uma ideia do que aconteceu. Interesse em realizar horas extras Homens Mulheres Total Não 16 35 51 Sim 45 5 50 Total 61 40 101 Entrada dupla 7FUNDAMENTOS DE ESTATÍSTICA Gráfico em colunas Observe que o gráfico a seguir, apesar de representar o fenômeno, pode conter problemas para uma apresentação. Veja que alguns vendedores não tem a sua venda indicada, levando o leitor a precisar supor o valor exato da venda. Além dis- so, seria necessário especificar o período para termos uma noção de como as vendas aconteceram. Assemelha-se ao gráfico em colu- nas, porém, os retângulos são dispostos horizontalmente (CORREA, 2003, p.25). A escolha do modelo depende exclusi- vamente do interesse e da preferência de quem fez o gráfico, pois são representações muito similares. Entenda mais sobre os tipos de gráficos: Ainda sobre Gráfico em barras: O gráfico a seguir indica as vendas dos repre- sentantes comerciais da empresa “Sul Metais” Ltda. Vendas Vendas O gráfico a seguir indica as vendas dos repre- sentantes comerciais da empresa “Sul Metais” Ltda. 8FUNDAMENTOS DE ESTATÍSTICA Gráfico em setores É o famoso gráfico em “pizza”. Consiste em repartir um círculo em vários setores ou fatias. Utilizamos principalmen- te quando queremos comparar os valores encontrados com o total (CORRREA, 2005, p.25). Esse gráfico produz um bom aspecto visual, sendo muito utilizado em apresentações. Exemplo: O gráfico abaixo revela os gastos com papel em um escritório de uma de- terminada empresa.O gráfico, apesar de produzir um bom efeito visual, também apresenta al- gumas limitações. Por exemplo, observe a quantia de tons de azul e roxo utilizadas, o que pode confundir o leitor. Mesmo que tenhamos uma legenda, pois ela não indica exatamente em que local está o mês inicial, podendo causar uma certa confu- são. Dessa forma, é possível dizermos que ele falha no aspecto clareza. Sobretudo, para apresentações, devemos estar muito atentos ao modo pelo qual as pessoas irão entende-lo. Gráfico em linhas Constitui uma aplicação do processo de representação das funções num sistema de coordenadas cartesianas (CORREA, 2003, p.24). São bastante úteis quando almejamos visualizar a variação de um fenômeno, por exemplo, as vendas da em- presa, subiram, baixaram e mantiveram-se constantes. Comparações entre dois fenô- menos também são interessantes. Gastos de papel no Escritório 9FUNDAMENTOS DE ESTATÍSTICA Exemplo: O gráfico a seguir indica as vendas de João Carlos durante os primeiros meses do ano de 2016. Perceba que com esse tipo de gráfico é possível observar com clareza os períodos de queda e de crescimento nas vendas do representante. AMOSTRAGEM Podemos entender a população como a totalidade dos sujeitos envolvidos na pesquisa. A amostra é um “recorte” dessa população. A amostragem é a forma como efetuamos esse “recorte”. Veja as classificações de amostra- gem! Existem outros tipos de gráficos que devem ser usados, de acordo com a necessidade do pesquisador, mas, sobretudo, com o uso do bom senso. Amostragem é a forma ou técnica utilizada para compormos a amostra. 10FUNDAMENTOS DE ESTATÍSTICA AMOSTRAGENS PROBABILÍSTICAS São técnicas que envolvem elemen- tos estatísticos durante a composição da amostra. Aqui, procuramos eliminar o viés da aleatoriedade. Amostragem aleatória simples Nesse processo, precisamos identifi- car todos os elementos da população, sele- cionando a amostra a partir de um sorteio. É imprescindível que todos os elementos da população tenham a mesma chance de pertencerem à amostra (BARBETTA, 2002). Para isso, é muito importante a realização de um sorteio honesto. Uma boa ideia é a utilização de geração de números aleatórios. Na planilha eletrônica, você pode utilizar o comando ALEATÓRIO- ENTRE. Por exemplo, você deseja sortear um número aleatório entre 1 e 120. Basta digitar “=ALEATÓRIOENTRE(1;120)”. Amostragem sistemática É similar à amostragem aleatória simples, sendo utilizada quando almeja- mos compor a amostra a partir de ciclos. É necessário ordenar os elementos, for- necendo uma cobertura mais ampla do fenômeno (BARBETTA, 2002). 1) Numerar aleatoriamente os fun- cionários. 2) Construir um intervalo de seleção (K), dividindo-se o número da população (N) pelo da amostra (n): 3) Sortear um funcionário aleatoria- mente entre 1 e 6. Suponha que o número sorteado foi 5. O primeiro funcionário da amostra será “Alfredo”. Os demais serão obtidos a partir do intervalo de seleção, sendo adicionados 6. Assim, iremos en- trevistar: 5) Alfredo 11) Monique 17) Dener 23) Jaqueline 29) Sinara Exemplo: A construtora “JBF cons- truções” tem 30 funcionários e deseja en- trevistar 5 deles em relação às condições de segurança no trabalho. A amostragem será a sistemática. Vamos aos passos: 1) Beto 7) Cristiane 13) Alexandre 19) Andrei 25) Marcelo 2) Marilene 8) Daniel 14) Bruna 20) Débora 26) Tiago 3) Carlos 9) Márcio 15) Gláucia 21) Janice 27) Ana Paula 4) Ângela 10) Simone 16) Ivo 22) Marluce 28) Max 5) Alfredo 11) Monique 17) Dener 23) Jaqueline 29) Sinara 6) Vicente 12) Maicon 18) João 24) Patrícia 30) Marília K= N/n K= 30/5 K=6 Este número sempre deve ser arredondado. 11FUNDAMENTOS DE ESTATÍSTICA Amostragem estratificada Consiste em dividir a população em grupos, denominados estratos, que devem ser homogêneos em relação às característi- cas das variáveis de estudo (BARBETTA, 2002). Perceba que essa técnica de amos- tragem “varreu” todos os estratos consi- derados, já, com outra técnica, isso não seria possível. Amostragem por conglomerados Nesse tipo de amostragem, elege- mos conglomerados da população, que consistem em agrupamentos da população. Após selecionados os conglomerados, um deles é sorteado por amostragem aleató- ria simples e todos os elementos dele são analisados. 1) Indústrias 2) Comércio 3) Instituições de Ensino Superior 4) Empresas de Consultoria Realizamos um sorteio aleatório entre os números 1 e 4. Suponha que o número 2 foi sorteado. Assim, precisa- mos entrevistar todos os administradores que trabalham no comércio na cidade de Caxias do Sul. Amostragens não probabilísticas Em muitas situações não é possível conhecer a priori, a probabilidade de um elemento da população pertencer à amos- tra. Em outras, é muito difícil numerar-se toda a população (BARBETTA, 2002). Exemplo: Para eleger um represen- tante para o sindicato, do qual a sua em- presa é filiado, foi realizada uma pesquisa em relação ao estilo de liderança que os funcionários preferem. Você decidiu en- trevistar 20%, e percebeu que cada função pode ter uma opinião diferente. Assim, foi feita uma amostragem estratificada, considerando que na empresa tem 10 me- cânicos, 10 auxiliares de escritório e 30 operários. Componha a amostra: A composição dos estratos deve considerar a realidade do cenário pesquisado, bem como os valores da amostra devem ser arredondados. Função População Amostra Mecânico 10 2 Auxiliar de escritório 10 2 Operário 30 6 Total 50 10 Exemplo: Desejamos pesquisar a sa- tisfação de administradores de empresa na cidade de Caxias do Sul, e utilizamos a amostragem por conglomerados. Inicial- mente, devemos compor os conglomera- dos, que são os possíveis “lugares” em que estão os administradores. Vamos supor: 12FUNDAMENTOS DE ESTATÍSTICA Exemplo: Em uma pesquisa sobre a saúde dos peixes em um rio, não é possível determinarmos nem fazermos a numeração da população. Nesses casos, utilizamos as amostragens não probabilísticas. Amostragem a esmo Como o nome sugere, consiste em escolher a esmo, sem um critério matemá- tico previsto anteriormente. Nesse caso, contamos com o acaso para escolhermos os representantes da população. Amostragem intencional Pode ser utilizada quando o pes- quisador visa uma determinada caracte- rística dentro da população. É um tipo de pesquisa bastante utilizada no mercado consumir, pois visa um determinado tipo ou perfil de cliente. Amostragem por cotas Assemelha-se à amostragem estra- tificada, também trabalhando com sub- conjuntos, em que a população é dividida. Seleciona-se para participar da amostra uma cota de cada subgrupo, sendo pro- porcional ao seu tamanho. Entretanto a seleção não tem a necessidade de ser ale- atória (BARBETTA, 2002). Exemplo: Uma empresa deseja pro- mover um estudo sobre o “peso” dos seus funcionários. Levou-se em conta o sexo e a idade. Como não era possível obrigar todos os funcionários a realizar o exame, a instituição chegou aos seguintes números de entrevistados: Exemplo: Queremos testar a resis- tência de parafusos ao calor. Temos 5.000 parafusos e queremos analisar 250. Seria inviável numerar os parafusos e utilizar a amostragem aleatória simples, por exem- plo. Assim, sorteamos os 250 parafusos ao acaso ou a esmo, que justifica o nome da técnica. Exemplo: Você trabalha no setor de qualidade de uma empresa que manufatura tabaco, e almeja conferir a satisfação sobre uma nova marca de cigarro disponível no mercado. Assim, devem ser entrevistados, intencionalmente, fumantes. Uma amos- tragem composta de outra forma, além de poder formar uma amostra pequena, pode causar uma série de constrangimentos para o pesquisador. Sexo Mais de 40 anos Menos de 40 anos Masculino 48% 14% Feminino 26% 12% 13FUNDAMENTOS DE ESTATÍSTICA Perceba que um dos estratos (mas- culina com mais de 40 anos) foi de certaforma privilegiado, com um percentual maior de entrevistas, o que pode “conta- minar” a pesquisa. DISTRIBUIÇÃO DE FREQUÊNCIA Podemos entender a frequência como o número de vezes que um fenô- meno se repete. Uma distribuição de frequência é uma tabela na qual os possíveis valores de uma variável se encontram agrupados em classes, registrando-se o número de valores observados em cada classe (KAZMIER, 1982, p.8). Em pesquisas eleitorais são utilizadas amostragens por cotas. Consideram- se sexo, escolaridade e renda, por exemplo. DISTRIBUIÇÃO DE FREQUÊNCIA SEM AGRUPAR DADOS A distribuição de frequência sem agrupar dados é feita, a partir da obser- vação do número de acontecimentos em determinados intervalos de uma amostra. Podemos organizar estes dados considerando o número de funcioná- rios que faltou e o número de vezes que isto ocorreu (frequência absoluta). Exemplo: O departamento pessoal da empresa “PL Calçados” efetuou um levan- tamento dos funcionários que estiveram ausentes no decorrer de dois anos. Jan. Fev. Mar. Abr. Mai. Jun. Jul. Ago. Set. Out. Nov. Dez. Ano 1 6 7 1 6 9 2 7 9 1 8 10 9 Ano 2 8 8 5 1 7 4 10 9 4 10 6 10 Funcionários ausentes Número de funcionários que faltaram Número de meses (frequência) 1 3 2 1 4 2 5 1 6 3 7 3 8 3 9 4 10 4 Total: 52 Distribuição de frequência A tabela ao lado é denominada distribuição de frequência, sem agrupar dados. 14FUNDAMENTOS DE ESTATÍSTICA DISTRIBUIÇÃO DE FREQUÊNCIA COM DADOS AGRUPADOS Uma distribuição de frequência com dados agrupados consiste em realizar agru- pamentos, sendo muito utilizada quando temos muitas informações. No entanto, a construção desses grupos exige proce- dimentos matemáticos e o conhecimento de alguns conceitos: • Classes (k): são os grupos que serão formados; • Amplitude do intervalo de classe (h): é o tamanho da classe; • Intervalo de classe: são os limites da classe. Temos o limite inferior e o su- perior; • Ponto médio do intervalo de clas- se (xi): é o limite superior mais o limite inferior dividido por dois; • Frequência absoluta (fi): são os números de observações dos elementos de uma determinada classe; • Frequência relativa (fr): é a pro- porção que a frequência absoluta da classe ocupa em relação ao total. Ela é obtida a partir da divisão da frequência absoluta pelo total; • Frequência percentual (fp): indica o percentual que cada classe ocupa em relação ao todo. É obtida a partir da mul- tiplicação da frequência relativa por cem; • Frequência acumulada (fa): é a soma da frequência absoluta da classe com a da classe anterior. É comumente utilizada quando queremos ter uma ideia de várias classes conjuntamente; • Frequência acumulada percentual (fap): é a soma da frequência percentual da classe com a da classe anterior. É co- mumente utilizada quando queremos ter uma ideia de várias classes juntamente. Veremos, a seguir, como compor cada um desses elementos em uma pes- quisa: Exemplo: O rol a seguir indica a qui- lometragem mensal que um vendedor fez com o veículo da empresa em um deter- minado período. Faça a distribuição de frequência utilizando dados agrupados por intervalos de classes, siga os passos: 1) Estimar o número de classe. Utilizamos a fórmula de Sturges: Importante: Explore a sua calcula- dora! Em algumas basta digitar a fórmula, em outras você precisa calcular o log pri- meiro, multiplicar por 3,3 e, por último, somar um. Vamos considerar que a nossa amos- tra tem 30 elementos, então n=30. 550 580 615 630 650 700 780 805 830 850 865 900 925 940 950 955 970 980 1000 1100 1150 1150 1300 1350 1500 2000 2500 2800 2950 3000 Distância (Km) percorrida pelo vendedor k=1+3,3logn 15FUNDAMENTOS DE ESTATÍSTICA Logo: k=1+3,3logn k=1+3,3log30 k=1+3,3.1,47 k=5,87 aproximadamente 6 classes 2) Estimar a amplitude de cada classe. h= (3000-550)/6 h=408,33 Importante: a amplitude de classe é o único caso que devemos arredondar “para cima”, sempre, pois caso contrário, o último valor da tabela pode não se encai- xar na distribuição de frequência. Assim, h = 409. 3) Montar a tabela com a frequ- ência absoluta. Para isso, partimos do primeiro valor do rol (ver tabela 5), ou seja 550. Este será o limite inferior da primeira classe. Para encontrarmos o limite superior, somamos 550 com 409, que é a amplitude do inter- valo, resultando em 959. A segunda classe começará com 959, que será somado com 409. O processo segue até alcançarmos 6 classes, conforme a tabela a seguir. Para encontrar a frequência absoluta, voltamos para a tabela 5 e contamos quantos ele- mentos pertencem à cada classe. Perceba que existem 16 eventos entre 550 e 959: 4) Frequência relativa. Basta dividir cada um dos valores da frequência absoluta pelo total, ou seja 30. h= [maior valor]-[menor valor] número de classes desejadas Distância Frequência absoluta (fi) 550 |–959 16 959 |– 1368 8 1368 |– 1777 1 1777 |– 2186 1 2186 |– 2595 1 2595 |–3004 3 TOTAL 30 Distribuição de frequência Distância fi fr 550 |–959 16 16/30 : 0,53 959 |– 1368 8 8/30: 0,27 1368 |– 1777 1 1/30: 0,033 1777 |– 2186 1 1/30: 0,033 2186 |– 2595 1 1/30: 0,033 2595 |–3004 3 3/30: 0,1 TOTAL 30 Aprox.1 Distribuição de frequência 16FUNDAMENTOS DE ESTATÍSTICA 5) Frequência percentual. Basta multiplicar a frequência rela- tiva por 100. 6) Frequência acumulada e frequ- ência acumulada percentual. 7) Estimar o ponto médio. Em muitas situações é necessário sabermos o ponto médio de cada clas- se. Logo, temos: Distância fi fr fp 550 |–959 16 16/30 : 0,53 53% 959 |– 1368 8 8/30: 0,27 27% 1368 |– 1777 1 1/30: 0,033 3,3% 1777 |– 2186 1 1/30: 0,033 3,3% 2186 |– 2595 1 1/30: 0,033 3,3% 2595 |–3004 3 3/30: 0,1 10% TOTAL 30 Aprox.1 Aprox. 100% Distribuição de frequência Distância fi fr fp fa fap 550 |–959 16 16/30 : 0,53 53% 16 53% 959 |– 1368 8 8/30: 0,27 27% 16+8: 24 80% 1368 |– 1777 1 1/30: 0,033 3,3% 24+1: 25 83,3% 1777 |– 2186 1 1/30: 0,033 3,3% 25+1: 26 86,6% 2186 |– 2595 1 1/30: 0,033 3,3% 26+1: 27 89,9% 2595 |–3004 3 3/30: 0,1 10% 27+3: 30 99,9% TOTAL 30 Aprox.1 Aprox. 100% Distribuição de frequência Distância fi fr fp fa fap p.m. 550 |–959 16 16/30 : 0,53 53% 16 53% 754,5 959 |– 1368 8 8/30: 0,27 27% 16+8: 24 80% 1163,5 1368 |– 1777 1 1/30: 0,033 3,3% 24+1: 25 83,3% 1572,5 1777 |– 2186 1 1/30: 0,033 3,3% 25+1: 26 86,6% 1981,5 2186 |– 2595 1 1/30: 0,033 3,3% 26+1: 27 89,9% 2390,5 2595 |–3004 3 3/30: 0,1 10% 27+3: 30 99,9% 2799,5 TOTAL 30 Aprox.1 Aprox. 100% Distribuição de frequência Classe 1: (550 + 959) /2 = 754,5 Classe 2: (959+1368) /2 = 1163,5 Classe 3: (1368+1777) /2 = 1572,5 Classe 4: (1777+ 2186) /2 = 1981,5 Classe 5: (2186+2595) /2 = 2390,5 Classe 6: (2595+3004)/ 2 = 2799,5 17FUNDAMENTOS DE ESTATÍSTICA ATIVIDADE 1) Uma franquia de lojas insta- lou algumas representações em diversas regiões do Rio Grande do Sul. Com o fim de conferir a satisfação dos clientes, resolveu entrevistar 7% desses de cada região. Então, vamos completar a tabela a seguir, indicando a amostra e o número da amostra. Obs. O número da amostra é a amostra, porém arredondada. 2) O número de produtos que os clientes trocam em uma loja foram regis- trados na tabela que segue: Vamos construir uma distribuição de frequência, sem agrupar dados: 3) Os funcionários da empresa “123 Testes Informática” estavam re- clamando do tempo de reuniões. Para verificar se a reclamação procedia, foi re- alizado um estudo, no qual se controlou o tempo das reuniões em minutos, que foram organizados na tabela que segue: Construa uma tabela de distribui- ção de frequência com dados agrupados por classes. Considere a frequência ab- soluta, frequência relativa, frequência percentual, frequência acumulada efre- quência acumulada percentual. Região Clientes Amostra Número de amostra Metropolitana 690 Serra 380 Campanha 160 Litoral 280 Casacos Camisetas Camisas Meias Sapatos Cintos 8 5 0 5 7 4 7 4 1 4 8 3 6 3 4 2 6 2 Segunda Terça Quarta Quinta 45 52 70 58 50 51 46 63 42 44 59 54 41 40 64 60 18FUNDAMENTOS DE ESTATÍSTICA 4) Observe um estrato de uma tabela extraída do site do IBGE: Construa um gráfico de setores, preferencialmente, uti- lizando planilhas eletrônicas. 5) João Oliveira, o gerente da empresa onde você trabalha, recebeu um e-mail com o seguinte conteúdo: Seu João. O Ricardo rodou 344 km e vendeu R$ 456,00, en- quanto o Bruno rodou apenas 124 km e vendeu R$540,00. Só não entendi o Gilmar que rodou 1389 km e vendeu apenas R$123,00. Por outro lado, a Marisa, que preferiu ficar na empresa e trabalhar por telefone, conseguiu vender R$560,00. Acho que está na hora de tomarmos algumas decisões. Att Vinicius Araújo Construa uma tabela de entrada dupla com os dados en- volvidos no e-mail recebido pelo gerente da situação anterior. Segmento Número de empresas Fabricação de produtos alimentícios 6.839 Fabricação de bebidas 551 Fabricação de produtos do fumo 42 Fabricação de produtos têxteis 2.206 Confecção de artigos do vestuário e acessórios 8 939 Empresas que não apresentaram ações de inovações organizacionais e marketing no Brasil entre 2006 e 2008. 19FUNDAMENTOS DE ESTATÍSTICA ESTATÍSTICA BÁSICA Neste capítulo, iremos começar a analisar e interpretar os dados. Para isso, faremos uso de distintas técnicas de estatística que irão auxiliar-nos no processo de tomada de decisões. Em nossa atuação, seja pro- fissional, ou pessoal, faz com que nos deparemos constantemente com fenômenos. Muitas vezes, atribuímos a sua existência à ca- sualidade, em outros casos, procu- ramos compreendê-los. Essa com- preensão passa pelo entendimento de suas causas e de seus efeitos, que podem ser vinculados a números, Existem vários recursos matemáticos que podem nos auxiliar a ler, interpretar e até mesmo prever o mundo. 20FUNDAMENTOS DE ESTATÍSTICA que a partir daí podem ser interpretados à luz de procedimentos estatísticos. Tais téc- nicas podem ser usadas tanto na empresa, quanto em situações do cotidiano, para que possamos tomar decisões fundamentadas em padrões anteriormente observados. MEDIDAS ESTATÍSTICAS MEDIDAS DE TENDÊNCIA CENTRAL Como vimos no último capítulo, os dados obtidos em uma pesquisa podem ser apresentados em gráficos ou tabelas. Entretanto, um fenômeno pode ser repre- sentado por meio de uma única quantia, denominada medida de tendência central. As principais são a média, a moda e a mediana. Média Aritmética É um número que representa um fenômeno. Kazmier (1982, p. 29) define a média aritmética como “a soma dos valores do grupo de dados divididos pelo número de valores”. Usamos a média aritmética em diversas situações do nosso cotidiano, como quando queremos projetar uma situ- ação intermediária. Por exemplo, se você faz duas provas valendo 10 pontos cada uma, e tira 6 na primeira e 8 na segunda, qual foi a sua média? Não foi 7? E como chegamos a esse resultado? Somamos 6 com 8 e dividimos por 2, não é verdade? Para dados não agrupados: A tabela que segue indica o lucro da “KouroteK calçados”. Faça a média: Média: 120.000/6 = R$ 20.000,00 Meses Venda (R$) Janeiro 22.000 Fevereiro 18.000 Março 10.000 Abril 26.000 Maio 14.000 Junho 30.000 Total 120.000 Média aritmética Observe que basta somar os va- lores e dividir pelo número de eventos. 21FUNDAMENTOS DE ESTATÍSTICA Para dados agrupados por inter- valo de classe: Quando nossos dados estão agru- pados por intervalo de classe, devemos considerar seus pontos médios e as suas frequências absolutas. Exemplo: Segundo a tabela a seguir, o estoque de uma loja tem os seus valo- res organizados por intervalo de classes. Agora, encontre a média aritmética: Perceba que estimamos o ponto médio (xi) e multiplicamos esse pela fre- quência absoluta (fi). Os valores de cada classe devem ser somados e divididos pela soma da frequência absoluta. A fórmula que resume esse processo é: Média: 24.340 = R$ 24,34 1.000 Média ponderada A média ponderada é uma média aritmética que é utilizada quando cada elemento tem um peso distinto em relação ao total. Assim, este recurso será utilizado quando ocorrer representatividade distinta dentre o do grupo (KAZMIER, 1982). Exemplo: Na empresa em que você trabalha existe o seguinte quadro fun- cional: A primeira coisa que devemos fazer é estimar o valor total do salário de cada um dos estratos: Assim:Preço unitário (R$) Quantidade (fi) Ponto médio (xi) Total da classe (xifi) 18,00 |– 20,00 120 19 19.120= 2280 20,00 |– 22,00 150 21 21.150= 3150 22,00 |– 24,00 180 23 23.180= 4140 24,00 |– 26,00 200 25 25.200= 5000 26,00 |– 28,00 190 27 27.190=5130 28,00 |– 30,00 160 29 29.160=4640 n=6 1000 24340 Média: ∑xi.fi ∑fi Média com dados agrupados Função Número Salário Gerente 2 R$ 10.000,00 Engenheiros 6 R$ 9.000,00 Operários 20 R$ 1.500,00 Estagiários 16 R$ 850,00 n=4 44 Média ponderada Gerentes: 2 x 10.000 = R$ 20.000,00 Engenheiros: 6 x 9.000 = R$ 54.000,00 Operários: 20 x 1.500 = R$ 30.000,00 Estagiários: 16 x R$ 850,00 = R$ 13.600,00 22FUNDAMENTOS DE ESTATÍSTICA Desse modo, podemos concluir que o total que a empresa investe em salários é R$ 117.600,00. Esse investimento deve ser repartido entre 44 funcionários, ou seja: Média: 117.600 = aprox.R$ 2.672,72 ...................44 Mediana Podemos entender a mediana com o valor que está no centro ou no meio de um intervalo de dados. Para localizá-la é importante que os dados estejam no for- mato de um rol, um seja, organizados de maneira crescente ou decrescente (KAZ- MIER, 1982). Para dados não agrupados: Basta construir o rol e localizar o valor do meio: Exemplos: i) Um vendedor fez a seguinte quilo- metragem durante a semana, utilizando o carro da empresa: 150, 110, 200, 80, 130. Iniciamos construindo um rol: 80, 110, 130, 150, 200 A mediana será 130, pois está exa- tamente no meio do rol. ii) Uma loja vendeu o seguinte nú- mero de peças durante a semana: 45, 80, 45, 130, 175, 90. Rol: 45, 45, 80, 90, 130, 175. Perceba que não temos um termo que divida o rol ao meio. Então fazemos a média aritmética dos dois termos centrais: Para dados agrupados: A mediana para dados agrupados exige um pouco mais de trabalho manual, por isso precisamos estar atentos para não perdermos nenhum valor. Devemos seguir a fórmula: Observe: A média aritmética é uma medida que sempre é atraída para os “outliers”, que são os valores atípicos que se afastam em demasia do padrão. Assim, olhar um fenômeno somente a partir da média aritmética, pode, de certa forma, “maquiá-lo”. Recomenda-se que ela seja utilizada conjuntamente com as outras medidas que veremos na sequência. 23FUNDAMENTOS DE ESTATÍSTICA Não se assuste! Se você “traduzir” a fórmula corretamente e montar uma tabela para a sua organização, não haverá problemas! Vamos traduzir a fórmula, ou seja, compreender o que cada letra ou abreviatu- ra significa, para que possamos identificar os elementos em nossos exercícios. li = limite inferior n/2= total da frequência absoluta dividido por 2 facant = frequência acumulada an- terior fi = frequência absoluta da classe h = amplitude do intervalo de classe 24FUNDAMENTOS DE ESTATÍSTICA Exemplo: O estoque de uma loja tem os seus valores organizados por intervalo de classes. De acordo com a tabela a seguir, encontre a mediana: Passo 1: Determinar a classe em que está localizado o valor da mediana. Isso é feito dividindo o número da amostra por 2, e identificando, a partir da frequência acumulada, em qual classe ele se encontra. Percebaque na classe destacada em vermelho, quando olhamos para a frequ- ência acumulada, ela vai do 450 ao 650. Ou seja, o número 500 estará entre esses valores. Passo 2: identificar os demais ele- mentos da fórmula. li = 24. Perceba que na classe des- tacada em vermelho o limite inferior é 24. fi = 200. Perceba na classe destacada em vermelho que a frequência absoluta é 200. facant = 450. Perceba na classe des- tacada em vermelho que a frequência acu- mulada da classe anterior é 450. h=2. Perceba que a amplitude de todos intervalos de classe é 2. Passo 3: Aplicar a fórmula. Med: 24 + ((500-450)/200).2 Med: 24 +0, 25.2 Med: 24,5 Preço unitário (R$) Quantidade (fi) Fa 18,00 |– 20,00 120 120 20,00 |– 22,00 150 270 22,00 |– 24,00 180 450 24,00 |– 26,00 200 650 26,00 |– 28,00 190 840 28,00 |– 30,00 160 1000 N 1000 Mediana Observe: A mediana sempre depende da frequência acumulada. Caso você não lembre como ela é feita, volte nessa apostila ou consulte o seu professor. 25FUNDAMENTOS DE ESTATÍSTICA Moda Em nosso cotidiano, dizer que al- guma coisa está na moda, normalmente se relaciona com aquilo que a maioria das pessoas estão usando, tem ou querem. Em estatística, o significado é similar. Pode- mos entender a moda como o fenômeno que ocorre com maior frequência. Para dados não agrupados: Basta observar o que mais se repete. Exemplo: Carlos é um representante comercial de uma certa marca de colchões, e obteve os seguintes resultados como ven- das: Março: 5 unidades Abril: 6 unidades Maio: 8 unidades Junho: 2 unidades Julho: 8 unidades Agosto: 8 unidades Setembro: 9 unidades Outubro: 8 unidades Qual foi a moda? A moda foi 8, pois é o número com maior frequência, ou seja, o número que aparece mais vezes. Para dados agrupados sem inter- valo de classe: Para fazer um plano preventivo de manutenção, foi realizada uma pesquisa em relação ao número de peças que que- bram em uma empresa em determinado período. Qual é a moda? Basta olharmos para o valor, que temos a maior frequência absoluta, ou seja, Moda = 3. Com isso, concluímos que o mais comum de acontecer é a quebra de 3 peças no período considerado. Para dados agrupados com inter- valo de classe: Utilizamos a seguinte fórmula: Número de peças Número de vezes que aconteceu (fi) 0 0 1 18 2 25 3 32 4 23 5 13 Moda 26FUNDAMENTOS DE ESTATÍSTICA Traduzindo a fórmula: li = fronteira inferior da classe que contem a moda (classe modal). d1= diferença entre a frequência da classe modal e a frequência da classe anterior. d2 = diferença entre a frequência da classe modal e a frequência da classe posterior. i = amplitude do intervalo de classe. Exemplo: O estoque de uma loja tem os seus valores organizados por intervalo de classes, conforme a tabela abaixo. En- contre a moda: Passo 1: identificar a classe modal. A Classe 24 I- 26 é a classe modal, pois apresenta maior frequência absoluta. Passo 2: encontrar o d1 e d2. d1 : 200 -180 = 20 d2: 200-190 = 10 Passo 3: aplicar a fórmula. MEDIDAS DE VARIABILIDADE Medidas de variabilidade medem a oscilação de um fenômeno, ou seja, quanto se dispersam quando comparadas à média. As principais medidas são a variância e o desvio padrão. Variância A variância representa a dispersão de uma variável em relação à sua média. Nada de pânico! Basta traduzir a fórmula e organizar os dados que não teremos problemas. Observe: A classe modal é aquela que apresenta a maior frequência absoluta. Preço unitário (R$) Quantidade (fi) 18,00 |– 20,00 120 20,00 |– 22,00 150 22,00 |– 24,00 180 24,00 |– 26,00 200 26,00 |– 28,00 190 28,00 |– 30,00 160 N 1000 Moda 27FUNDAMENTOS DE ESTATÍSTICA Para dados não agrupados Exemplo: Na loja “123 Eletrodomés- ticos” trabalham dois vendedores, Adriano e Daiane, que tiverem os seguintes desem- penhos de vendas: Adriano: Daiane: Lembre-se que dissemos anterior- mente que a média pode maquiar o fe- nômeno. Média de Adriano: 30/5 = 6 ele- trodomésticos. Média de Daiane: 30/5 = 6 eletro- domésticos. Mesmo que ambos os vendedores tenham obtido a mesma média, não po- demos dizer que são vendedores iguais, pois Adriano tende a ter oscilações nas suas vendas, enquanto Daiane é mais cons- tante. Para medir essas variações podemos utilizar a variância. Vamos aos passos!! Passo 1: determinar a média arit- mética (µ) da sequência; Passo 2: determinar as diferenças entre a média e cada elemento da sequ- ência. (fi-µ); Passo 3: elevar ao quadrado e somar os valores encontrados no passo 2. ∑(fi-µ)²; Passo 4: dividir o resultado do passo 4 pelo número de eventos do conjunto. Esses passos podem ser sintetizados com as fórmulas: • Para população: • Para a amostra: Exemplo: Adriano vendeu os seguin- tes eletrodomésticos durante a semana: 10, 2, 8, 3 e 7. Calcule a variância de suas vendas: Calculando a média = (10+2+8+3+7)/ 5 = 30/5 = 6 Segunda Terça Quarta Quinta Sexta 10 2 8 3 7 Variância Segunda Terça Quarta Quinta Sexta 6 6 6 6 6 Variância Observe: Desenvolva todos os passos completando uma tabela. Quando ela estiver completa troque os valores para a fórmula. 28FUNDAMENTOS DE ESTATÍSTICA Organizando a tabela: Lembre-se que estamos trabalhando com todas as vendas de Adriano, então de- vemos considerar a fórmula da população: O numerador da fórmula foi gerado a partir da tabela, e o denominador n é 5, pois o vendedor fez 5 vendas. Com dados agrupados por inter- valos de classe: A variância com dados agrupados pode ser um pouco trabalhosa. Você vai precisar organizar, muito bem, uma tabela com os dados e seguir os passos abaixo: Passo 1: determinar o ponto médio de cada intervalo de classe (xi); Passo 2: elevar cada ponto médio ao quadrado (xi²); Passo 3: multiplicar cada xi² pela frequência da classe fi correspondente; Passo 4: calcular a média aritmética considerando que os dados estão agrupa- dos. Construímos uma tabela e aplica- mos os dados em uma das fórmulas: fi (fi-µ) (fi-µ)² 10 10 - 6 = 4 4 x 4 = 16 2 2 – 6= - 4 (-4) x (-4) = 16 8 8 - 6 = 2 2 x 2 = 4 3 6 - 3 =- 3 (-3) x (-3) = 9 7 7 - 6 = 1 1x 1 = 1 ∑= 46 Adriano Variância 29FUNDAMENTOS DE ESTATÍSTICA • Para população: • Para a amostra: Exemplo: O número de produtos ven- didos por uma loja está representado por uma distribuição de frequência conforme a tabela que segue. Calcule a variância: A tabela precisa ser ajustada em acordo com os passos descritos anterior- mente. Chegamos no seguinte resultado: Vamos nos recordar que a média aritmética para dados agrupados é cal- culada por: Assim, a média será Média: 3232/80 = 40, 4. Também vamos considerar que estamos trabalhando com todas as vendas da loja em um dado período, então será utilizada a fórmula da população: Desvio Padrão A resolução do último exemplo, le- va-nos a perceber que a variância é uma medida que permanece elevada ao quadra- do. Em situações práticas pode ser difícil imaginarmos essa situação. Por isso, nor- malmente se utiliza o desvio padrão. Se- gundo Youssef, Soares e Fernandes (2004, p.257) “o desvio padrão pode ser obtido diretamente da variância, extraindo-se a raiz quadrada do valor encontrado”. Ele informa a dispersão dos dados em relação Produtos fi 2 |− 14 13 14 |− 26 9 26 |− 38 8 38 |− 50 23 50 |− 62 15 62 |− 74 10 78 |− 86 2 Variância Classe xi fi xifi xi² xi²fi 2 |− 14 8 13 104 64 832 14 |− 26 20 9 180 400 3600 26 |− 38 32 8 256 1024 8192 38 |− 50 44 23 1012 1936 44528 50 |− 62 56 15 840 3136 47040 62 |− 74 68 10 680 4624 46240 74 |− 86 80 2 160 6400 12800 ∑ 80 3232 163232 Variância 30FUNDAMENTOS DE ESTATÍSTICA à média, porém parece nos dar suma di- mensão mais exata. Exemplo: Pense nos dados do último exemplo. Considerando que a variância foi σ²= 408,24, o desvio padrão será DP: √408,24 ou seja DP: aprox. 20,20. Issosignifica que o fenômeno está se afastando da média 20,20 unidades, seja para mais, seja para menos. COEFICIENTE DE VARIAÇÃO (V) Para Kazmier (1982, p.52) “o coefi- ciente de variação V, indica a magnitude relativa do desvio padrão quando com- parado com a média da distribuição das medidas”. V: Coeficiente de variação σ: Desvio Padrão µ: Média Exemplo: O preço médio diário das ações de uma empresa A durante um certo período do mês foi de R$150,00, com um desvio padrão de R$5,00. A empresa B teve o preço médio R$ 50,00 no mesmo período, com desvio padrão de R$3,00. Empresa A: V= σ/µ V= 5/150= 0,033 Empresa B: V= σ/µ v= 3/50= 0,060 Kazmier (1982) esclarece que em termos de comparação absoluta, a empresa A teve uma maior variação, pois seu des- vio padrão é maior. No entanto, quando pensamos em relação ao preço, podemos perceber que o preço das ações da empresa B é quase duas vezes mais variável quando comparado a empresa A. REGRESSÃO LINEAR SIMPLES A regressão linear tem o objetivo de verificar a existência de relações entre as variáveis. Barbetta (2002) considera que existe uma correlação direta entre duas variáveis, isso acontece quando elas caminham no mesmo sentido. Por exem- plo: peso e altura pode ser um exemplo de correlação direta entre variáveis, pois es- pera-se que um sujeito mais alto seja mais pesado. Já, a correlação inversa, ocorre quando elas caminham em sentido opos- to. Por exemplo: No Brasil, a renda e o número de filhos por família apresentam uma correlação inversa, pois de um modo geral, quando menor a renda maior o nú- mero de filhos. Chamamos o x de variável indepen- dente, pois é o próprio fenômeno e não 31FUNDAMENTOS DE ESTATÍSTICA depende de outros fatos. Já o y é chamado de variável dependente, pois depende do x. O processo consiste em obter uma equação que explique o comportamento de uma variável em relação a outra. EQUAÇÃO DA RETA Consiste em encontrar uma equação de uma reta que explique o comportamen- to das variáveis. Diagrama de dispersão Consiste em representar as variáveis em um plano cartesiano por pontos com coordenadas (x,y), em que x é a variável observada e y o correspondente (BAR- BETTA, 2002). Quanto mais os pontos estiverem concentrados em torno de uma reta, mais correlação existe entre as va- riáveis. Exemplos: i) O gráfico a seguir indica as vendas (em cruzeiros) de uma empresa durante um período: Observe que o gráfico se aproxima de uma reta, o que indica uma forte cor- relação entre as variáveis. A reta crescente indica que a correlação é direta, ou seja, quanto mais aumentam os anos, mais au- mentam as vendas da empresa. ii) O gráfico que segue, demonstra o resultado de uma pesquisa em que foram consideradas a idade e a massa muscular de um grupo de pessoas: Perceba que mesmo que não forme uma reta perfeita, os dados se concentram em torno de uma linha imaginária, indi- cando que existe correlação. Como a linha é decrescente, a correlação é inversa, ou seja, quanto mais a idade aumenta, mais a massa muscular diminui. 32FUNDAMENTOS DE ESTATÍSTICA iii) O gráfico abaixo demonstra o resultado de uma pesquisa em que foram considerados a idade e o tempo de leitura: Perceba que o fenômeno fica dis- perso, não se concentrando em torno de uma reta. Isto significa que não existe correlação entre as variáveis, ou seja, a idade não interfere no tempo de leitura. COEFICIENTE DE CORRELAÇÃO A correlação entre duas variáveis pode ser medida a partir de um número (coeficiente de Pearson), o qual indica em que nível a correlação ocorre. O coeficiente ocorre entre -1 e 1, sendo: 0: nula Entre 0,10 e 0,29 : pequena Entre 0,40 e 0,60 : moderada Entre 0,70 e 0,90: forte Maior que 0,90: muito forte R > 0 correlação direta R=0 correlação nula R< 0 correlação inversa Fórmula: Exemplo: Em uma certa cidade, foi realizado um estudo, visando compreen- der a saúde das pessoas. Os entrevistados tinham entre 5 e 50 anos de idade. Foram considerados o nível de HDL (colesterol bom) no sangue e as horas de exercícios semanais. Chegou-se aos seguintes re- sultados: Existe correlação entre as variáveis? Em que nível? Primeiro passo: ajustar a tabela montando as colunas x.y, x² e y² HDL Horas de Exercícios 40 0 50 2 55 3 60 4 65 6 x y x,y x² y² 40 0 0 1.600 0 50 2 100 2.500 4 55 3 165 3.025 9 60 4 240 3.600 16 65 6 390 4.225 36 Soma 270 15 895 14.950 65 33FUNDAMENTOS DE ESTATÍSTICA Segundo passo: aplicar a fórmula. Existe uma relação muito forte en- tre as horas de exercício e o aumento do “colesterol bom”. r= 0,98 O coeficiente de Pearson indicou que existe uma correlação muito forte e direta entre as duas variáveis, os seja, quan- to mais exercícios a pessoa praticar, maior será o seu “colesterol bom”. INTERVALO DE CONFIANÇA O intervalo de confiança é uma es- timativa de parâmetro. Assim, podemos estimar um intervalo no qual existe a pro- babilidade de um fenômeno ocorrer. Exemplo: Para estimar o tempo mé- dio em uma consulta, foram amostrados 64 pacientes. Essa amostra indicou um tempo médio de 10 minutos, com desvio padrão de 3 minutos. Com base nisso, qual é o tempo médio de atendimento, com um nível de confiança de 90%? Temos: Vamos aplicar um teste T! n= 64 Média: 10 S: 3 34FUNDAMENTOS DE ESTATÍSTICA Da seguinte forma, será usada a ta- bela t que consta no final da apostila, siga os passos: Passo 1: Pegue a sua tabela. Quere- mos um nível de confiança de 90%, temos uma margem de erro de 10%, sendo 5% em cada cauda. Procuramos na tabela z, um valor que resulte em 0,05 (5%). O valor é -1,64. Passo 2: Estimar a margem de erro. Passo 3: Aplicar a fórmula. Média x ± z margem de erro Passo 4: Construir o intervalo. Limite superior: 10+ 0,615 = 10,615 Limite inferior: 9,385 [9,385; 10,615] Isso significa que se formos a esse médico, temos 90% de chance de ficarmos entre 9,38 minutos e 10,61 minutos na consulta. TESTE DE HIPÓTESES Uma hipótese é uma afirmação so- bre uma determinada população. Os testes de hipóteses visam confirmar ou refutar tais afirmações. Ho (hipótese nula) H1 (hipótese alternativa) É importante que as hipóteses sejam contrárias. Vamos a mais um exemplo: Um fabricante de refrigerantes afir- ma que os frascos de dois litros dos seus produtos contem, no mínimo, uma média de 1,99 litros do produto. Uma amostra de frascos de dois litros foi selecionada e o conteúdo avaliado com o fim de testar-se a afirmação do fabricante. Nesse caso, a construção das hipóteses parte da afir- mação do fabricante, considerando ser ela verdadeira. Assim, teríamos as seguintes hipóteses: H0 : µ ≥ 1,99 H1: µ< 1,99 Caso os resultados da amostra indi- carem que H0 não possam ser regeitadas, a afirmação do fabricante não será con- testada. Por outro lado, se H0 pode ser rejeitada, afirmamos que H1: µ< 1,99 é verdadeiro, o que evidencia que a infor- mação do fabricante é incorreta. Em uma situação prática, os resulta- dos do teste de hipóteses podem ser utili- zados diretamente no processo de tomada de decisão. No exemplo anterior, poderiam ser revistos os processos de envasamento do refrigerante. ME: S / √n 35FUNDAMENTOS DE ESTATÍSTICA ATIVIDADE 1) O automóvel da empresa rodou as seguintes quilometragens. Encontre a mediana: 2) Na disciplina de estatística, o professor realizou 10 avaliações. Ana teve as seguintes notas: 2, 3, 3, 4, 5, 6, 7, 8, 9 e 10. Encontre a variância: 3) A tabela abaixo traz o tamanho dos bebês em uma determinada materni- dade. Encontre a mediana: 4) Observe a relação entre o preço da venda de passagens e a demanda: Encontre o coeficiente de correlação de Pearson e interprete o resultado: 5) Uma pesquisa em 17 cinemas de São Paulo, indicou que o ingresso custava em média R$ 5,50 com desvio padrão de R$ 0,50. Determine: o erro máximo com intervalo de confiança de 95%. A estimati- va de preço médiocom 95% de confiança: Seg Ter Qua Qui Sex Sáb Seg Ter Qua Qui 126 128 134 135 138 131 139 132 138 136 Tamanho Frequência absoluta 50 I- 54 4 54 I- 58 9 58 I- 62 11 62 I- 66 8 66 I- 70 5 70 I- 74 3 Preço 33 25 24 18 12 10 8 4 Demanda 300 400 500 600 700 800 900 1000 36FUNDAMENTOS DE ESTATÍSTICA GABARITOS CAP 1. 1) 2) 3) 4) 5) CAP 11. 1) 134,5 2) 6,81 Região Clientes Amostra Número da amostra Metropolitana 690 48,3 48 Serra 380 26,6 27 Campanha 160 11,2 11 Litoral 280 19,6 20 Peças fi 0 1 1 1 2 2 3 2 4 4 5 2 6 2 7 2 8 2 Classe Frequência absoluta (fi) Frequência relativa (fr) Frequência percentual (fp) Frequência acumulada (fa) Frequência acumulada percentual (fap) 40 I – 46 5 0,3124 31,24% 5 31,24% 46 I – 52 3 0,1875 18,75% 8 49,99% 52 I – 58 2 0,125 12,5% 10 62,49% 58 I – 64 4 0,25 25% 14 87,49% 64 I - I 70 2 0,125 12,5% 16 99,99% Total 16 0,9999 99,99% Vendedor Km R$ Ricardo 344 456 Bruno 124 540 Gilmar 1389 123 Marisa 0 560 Total 468 1556 Obs. As cores, a disposição da legenda e o título podem alterar. Observar a relação entre a tabela e o gráfico. 37FUNDAMENTOS DE ESTATÍSTICA TABELAS Distribuição T de Student Tabela de distribuição normal reduzida 38FUNDAMENTOS DE ESTATÍSTICA 39FUNDAMENTOS DE ESTATÍSTICA REFERÊNCIAS BARBETTA, P. A. Estatística Aplicada às Ciências Sociais. 5.a ed. Florianópolis: Editora da UFSC, 2002. CORREA, S.M.B.B Probabilidade e Estatística. 2.a ed. Belo Horizonte: PUC Minas Virtual, 2003. KAZMIER, Leonard J. Estatística aplicada à Economia e Adminis- tração. São Paulo: Makron Books, 2004. MORETTIN, L.G. Estatística Básica. Probabilidade e inferência. Volume único. São Paulo: Pearson Prentice Hall, 2010. YOUSSEF, A. N., SOARES, E. e FERNANDEZ, V. P. Matemática de olho no mundo do trabalho. São Paulo: Scipione, 1ª ed. 2004. Introdução à Estatística NOÇÕES FUNDAMENTAIS ESTATÍSTICA DESCRITIVA AMOSTRAGEM Distribuição de frequência ATIVIDADE Estatística Básica MEDIDAS ESTATÍSTICAS REGRESSÃO LINEAR SIMPLES ATIVIDADE GABARITOS REFERÊNCIAS
Compartilhar