Baixe o app para aproveitar ainda mais
Prévia do material em texto
Estatística Aplicada Simone Echeveste Estatística Aplicada O grande avanço tecnológico das últimas décadas gerou a necessida-de de formação de profissionais capazes de acompanhar esse de- senvolvimento com habilidades para gerar e analisar dados, produzindo informação útil a ser utilizada na resolução de problema. Neste contexto, as ferramentas estatísticas são imprescindíveis, e o conhecimento das mes- mas torna-se necessário para qualquer profissional. A Estatística hoje se configura como uma das ciências que mais vem crescendo em termos de utilização e importância na Administração: pes- quisas de marketing, comportamento do consumidor, estudos de qualida- de, confiabilidade, desenvolvimentos de novos produtos, avaliação de sa- tisfação dos clientes etc. Estes são alguns exemplos da ampla utilização das ferramentas estatísticas para resolução de problemas e tomada de decisões nessa área. A disciplina de Estatística Aplicada tem por objetivos: propiciar ao alu- no o estudo da estatística com vistas à análise de dados experimentais, cálculo e interpretação das medidas descritivas, utilização de testes estatís- ticos como ferramenta de análise de comparação e relação de dados no contexto das pesquisas realizadas na área de Administração. Os conteúdos serão apresentados em 10 capítulos, contendo a ex- plicação teórica dos mesmos, bem como a apresentação de exemplos e aplicações em problemas na área da Administração. Em cada capítulo será destacado o objetivo de cada ferramenta estatística, bem como a interpre- tação dos resultados obtidos. Introdução Sumário Introdução ................................................................................... iii 1 Conceitos Básicos de Estatística .............................................1 2 Apresentação de Dados ......................................................13 2.1 Tabelas de Frequência .....................................................014 2.2 Gráficos Estatísticos .........................................................018 3 Medidas de Tendência Central ............................................33 4 Medidas de Variabilidade ....................................................47 5 Distribuição de Probabilidade Normal .................................61 6 Amostragem .......................................................................85 7 Estimação .........................................................................101 8 Testes de Hipóteses ...........................................................117 9 Análise de Correlação ......................................................149 10 Análise de Regressão ........................................................169 Conceitos Básicos de Estatística ÂÂNeste capítulo, será apresentado o contexto da pesqui-sa em que a estatística está inserida, bem como serão destacados os principais conceitos básicos de estatística. O objetivo aqui é que o aluno compreenda o vocabulário pertinente à análise estatística e que compreenda os ele- mentos importantes no contexto dessa análise. Ao final deste capítulo, espera-se que o aluno, dada uma situação problema, identifique corretamente a popu- lação e a amostra de estudo bem como as variáveis en- volvidas classificando-as de acordo com a sua natureza. Capítulo 1 Simone Echeveste 2 Estatística Aplicada O papel da estatística na ciência A necessidade de analisar um conjunto de dados estatistica- mente está sempre inserida no contexto de uma pesquisa, ou seja, temos inicialmente uma situação problema a ser resol- vida, ou ainda uma hipótese a ser testada e, para isso, uma pesquisa deve ser realizada. Com isso, em uma pesquisa, destaca-se a importância da utilização da estatística de acordo com os seguintes fatores: a) Em uma pesquisa, muitas vezes são realizados estudos experimentais ou observacionais que culminam em uma coleção de dados numéricos que devem ser organizados e resumidos. b) O padrão de variação nos dados faz com que a resposta não seja óbvia, ou seja, somente tratando os dados ade- quadamente é que poderemos verificar o comportamento das variáveis de estudo. c) Uma análise estatística é composta por métodos para co- leta e descrição dos dados, viabilizando a verificação da força da evidência nos dados pró ou contra as hipóteses de pesquisa. A presença de uma variação não previsível nos dados faz disso, muitas vezes, uma tarefa pouco trivial. Em toda a pesquisa realizada, almeja-se a resposta a um problema ou ainda uma situação-problema que está vinculada a uma tomada de decisão a ser realizada. Podemos considerar que nossa decisão pode ser tomada por meio de dois tipos de soluções: a primeira, que pode ser considerada uma solução empírica que se fundamenta na observação e na experiência, Capítulo 1 Conceitos Básicos de Estatística 3 livre de um método científico, é uma forma de solução muitas vezes subjetiva que pode levar a tomada de decisão errada. Figura 1 O papel da Estatística na pesquisa. O outro tipo de solução seria por meio de método cientí- fico, à luz de dados provenientes de uma pesquisa que segue uma metodologia predeterminada para garantir a imparcia- lidade das informações obtidas. Nesse caso, as ferramentas estatísticas são indispensáveis para a viabilização de uma to- mada de decisão com menores riscos e incertezas. Definições importantes na estatística Sempre que falamos em Estatística estamos inseridos no con- texto de uma pesquisa. As pesquisas podem ser classificadas 4 Estatística Aplicada em duas grandes abordagens conforme demonstra a figura a seguir: Figura 2 Tipos de Pesquisa. Uma pesquisa quantitativa é composta por quatro etapas distintas. Dessas etapas, nas três últimas (planejamento, exe- cução e comunicação dos resultados), a estatística surge como uma importante ferramenta de suporte para o pesquisador (Fi- gura 3). Na etapa Planejamento da pesquisa, a estatística tem im- portante participação na determinação do tamanho da amos- tra a ser estudada, na escolha do procedimento/processo de amostragem que deve ser utilizado para a coleta de dados, bem como na elaboração do instrumento de coleta e no esta- belecimento do tipo de variáveis a serem pesquisadas. Capítulo 1 Conceitos Básicos de Estatística 5 Figura 3 Contribuição da Estatística para a pesquisa. No momento da Execução da pesquisa, a estatística é im- prescindível, pois fornece as ferramentas necessárias para a análise dos dados e para a obtenção de conclusões sobre o objeto de estudo. Na Comunicação dos resultados, a estatística auxilia a construção de tabelas e gráficos, facilitando a apresentação dos principais resultados obtidos. A realização de todas essas etapas é importante, e elas fazem parte da elaboração de uma pesquisa científica que procure ser o mais fidedigna possível. O conhecimento dessas etapas também é importante para o julgamento da adequa- cidade de pesquisas realizadas por terceiros, ou seja, quando nos é apresentado oralmente ou por meio de artigos resultan- tes de uma pesquisa, precisamos ter um conhecimento mínimo do processo científico para que sejamos capazes de criticar e entender os resultados obtidos. 6 Estatística Aplicada Na literatura, encontramos vários conceitos e definições para a Estatística, alguns autores a definem como um ramo da matemática, já outros defendem a ideia de que a Estatística representa por si só uma área única da ciência, desconside- rando ser esta uma subdivisão da matemática. Rao (1999) define estatística como: “A estatística é uma ciência que estuda e pesquisa sobre: o levantamento de dados com a máxima quantidade de informação possível para um dado custo; o processamento de dados para a quantificação da quantidade de incerteza existentena resposta para um determinado problema; a to- mada de decisões sob condições de incerteza, sob o menor risco possível. Finalmente, a estatística tem sido utilizada na pesquisa científica, para a otimização de recursos econô- micos, para o aumento da qualidade e produtividade, na otimização em análise de decisões.” Esse conceito apresenta de forma clara e concisa todos os aspectos que envolvem as diversas formas de utilização da Estatística: levantamento de dados, processamento, análise e auxílio na tomada de decisões. Ao iniciar uma análise estatística, deve-se também considerar alguns elementos relacionados à metodologia do estudo reali- zado, como as definições de População e Amostra da pesquisa: Uma população (N) é conjunto de elementos de interesse em um determinado estudo, que podem ser pessoas ou resultados experimentais, com uma ou mais características comuns, que se pretende estudar. Capítulo 1 Conceitos Básicos de Estatística 7 Uma amostra (n) é um subconjunto da população usado para obter informação acerca do todo. Obtemos uma amostra para fazer inferências de uma população. Nossas inferências são vá- lidas somente se a amostra é representativa da população. Para ilustrar esses conceitos por meio de um exemplo, con- sidere a seguinte situação de pesquisa: Situação de pesquisa “Uma empresa operadora de TV a cabo deseja realizar uma pesquisa com seus clientes da cidade de Porto Alegre referente ao grau de satisfação dos mesmos com o serviço prestado. Ao todo, essa operadora possui, nessa cidade, 217.193 assinan- tes dos quais foram selecionados 620 para participar dessa pesquisa.” População: 217.193 assinantes da operadora de TV a cabo de Porto Alegre. Amostra: 620 assinantes da operadora de TV a cabo de Porto Alegre que participaram da pesquisa. Outro conceito muito importante é o da Variável, que vem a ser a matéria prima de qualquer pesquisa, ou seja, quando se termina uma coleta de dados, em um primeiro momento, dispomos de um conjunto de valores ou ainda respostas perti- nentes às nossas variáveis de pesquisa. 8 Estatística Aplicada Uma variável (x) é uma característica dos elementos investiga- dos que difere de um elemento para outro e do qual temos inte- resse em estudar. Cada unidade (elemento) da população que é escolhido como parte de uma amostra fornece uma medida de uma ou mais variáveis, também chamadas observações. As variáveis podem ser classificadas em:  Variáveis Quantitativas: são as características que podem ser medidas em uma escala quantitativa, ou seja, apresentam valores numéricos/quantidades. Podem ser contínuas ou discretas. Discretas: características mensuráveis que podem as- sumir apenas um número finito ou infinito contável de valores e, assim, somente fazem sentido valores intei- ros. Exemplos: números de carros vendidos, número de filhos, número de reclamações recebidas por dia etc. Contínuas: características mensuráveis que assumem valores em uma escala para as quais valores fracionais fazem sentido. Exemplos: renda mensal, tempo de en- trega da mercadoria, tamanho do imóvel em m2 etc.  Variáveis Qualitativas: são as características que não possuem valores quantitativos, mas, ao contrário, são definidas por várias categorias, ou seja, represen- tam uma classificação dos elementos. Podem ser nomi- nais ou ordinais. Nominais: não existe ordenação dentre as catego- rias. Exemplos: marca do carro, tipo de fornecedor, profissão etc. Capítulo 1 Conceitos Básicos de Estatística 9 Ordinais: existe uma ordenação entre as catego- rias. Exemplos: escolaridade (Fundamental, Médio ou Superior), grau de importância (nenhuma, pouca, razoável, muito) etc. Figura 4 Classificação das variáveis. A Estatística pode ser dividida em duas áreas: Descritiva e Inferencial. A área descritiva é mais simples, contem- plando ferramentas de organização de dados e síntese de informação. A área Inferencial, por sua vez, permite ao pesquisador projetar resultados amostrais para populações, bem como testar hipóteses concernentes a parâmetros popu- lacionais. Inferência estatística é o processo pelo qual estatísticos tiram conclusões acerca da população usando informação de uma amostra. A Estatística Inferencial está baseada em dois pilares fundamentais: a Amostragem e a Probabilidade. 10 Estatística Aplicada Recapitulando As ferramentas estatísticas são indispensáveis no trata- mento de dados provenientes de uma pesquisa. É pela análise e tratamento de dados que o pesquisador obtém todas as in- formações pertinentes ao objeto de estudo, propiciando uma tomada de decisão com menores riscos e incertezas. Algumas definições importantes:  População (N): é o conjunto de elementos de interes- se em um determinado estudo.  Amostra (n): parte da população selecionada é a quantidade de elementos investigada.  Variável (x): é a característica da amostra a ser inves- tigada, ou seja, o que desejamos saber com a pergunta realizada. A Estatística pode ser dividida em duas áreas: Descritiva, que se refere à organização e síntese da informação, e Infe- rencial, destinada à projeção de resultados amostrais para toda a população. Atividades: Conceitos básicos de estatística Considere a seguinte situação de pesquisa: “Uma pesquisa foi realizada com um grupo aleatoriamente se- lecionado de 400 clientes de um restaurante japonês. O objeti- vo dessa pesquisa era identificar o perfil do cliente em relação às características Bairro em que reside, Tempo que frequenta o restaurante, Gasto médio na refeição realizada e grau de Capítulo 1 Conceitos Básicos de Estatística 11 satisfação com o serviço oferecido pelo restaurante (muito sa- tisfeito, satisfeito etc.).” Questão 1. A população dessa pesquisa pode ser considerada como: a) 400 clientes desse restaurante japonês. b) Todos os clientes desse restaurante japonês. c) Perfil do cliente. d) Características do cliente, como bairro, tempo que fre- quenta, gasto e grau de satisfação. e) Todos os restaurantes japoneses. Questão 2. A amostra dessa pesquisa pode ser considerada como: a) Perfil do cliente. b) Características do cliente, como bairro, tempo que fre- quenta, gasto e grau de satisfação. c) 400 clientes desse restaurante japonês. d) Todos os clientes desse restaurante japonês. e) Os restaurantes japoneses. Questão 3. As variáveis dessa pesquisa são: a) Identificação do Perfil do cliente. b) Os 400 clientes desse restaurante japonês. c) Todos os clientes desse restaurante japonês. d) Bairro em que reside, tempo que frequenta o restaurante, gasto médio e grau de satisfação com o serviço. e) Os diferentes restaurantes japoneses existentes. Questão 4. As variáveis quantitativas dessa pesquisa são: a) Bairro em que reside e grau de satisfação com o serviço. b) Bairro em que reside, gasto médio e grau de satisfação com o serviço. 12 Estatística Aplicada c) Tempo que frequenta o restaurante, gasto médio e grau de satisfação com o serviço. d) Tempo que frequenta o restaurante e gasto médio. e) Todas as variáveis são quantitativas. Questão 5. Marque V para verdadeiro e F para falso nas seguintes afirmativas: a) ( ) Em uma pesquisa, o padrão de variação nos dados faz com que os resultados não sejam óbvios, por esse mo- tivo, os resultados obtidos devem receber um tratamento estatístico que permitirá a verificação do comportamento das variáveis de estudo. b) ( ) As variáveis quantitativas são características que não pos- suem valores, mas, ao contrário, são definidas por catego- rias, ou seja, representam uma classificação dos elementos. c) ( ) A necessidade da utilização da Estatística na análise de dados ocorre em pesquisas do tipo Quantitativas. d) ( ) A Estatística dividi-seem duas partes: Estatística Des- critiva e Estatística Qualitativa. Gabarito das atividades propostas Questão 1. b) Todos os clientes desse restaurante japonês. Questão 2. c) 400 clientes desse restaurante japonês. Questão 3. d) Bairro em que reside, tempo que frequenta o restau- rante, gasto médio e grau de satisfação com o serviço. Questão 4. d) Tempo que frequenta o restaurante e gasto médio. Questão 5. a) V, b) F, c) V, d) F Apresentação de Dados Simone Echeveste Capítulo 2 14 Estatística Aplicada Tabelas de frequência O primeiro contato do pesquisador com os seus dados é feito por meio da construção das tabelas de frequência. Podemos dizer que, neste momento, os dados recebem o seu primeiro tratamento. Nessa etapa de análise, o pesquisador identificará as possíveis respostas a uma determinada variável e o compor- tamento das mesmas no que se refere a sua frequência. A tabela de frequência tem por objetivo apresentar os resul- tados de cada variável de uma forma organizada e resumida. Nessa tabela, encontramos o número de repetições de cada categoria de resposta de uma variável, bem como o seu per- centual no grupo investigado. De acordo com as normas da ABNT (Associação Brasileira de Normas Técnicas) e do IBGE (Instituto Brasileiro de Geo- grafia e Estatística), as tabelas de frequência devem considerar os seguintes elementos: a) Título: deve conter as informações necessárias para que se compreenda “o que” está sendo apresentado na tabela, “onde” os dados foram obtidos e “quando” esses dados foram coletados. b) Cabeçalho: indica a natureza do conteúdo de cada co- luna da tabela. c) Corpo da Tabela: é a parte composta por linhas e colu- nas com as informações observadas. d) Rodapé: espaço logo abaixo da tabela que pode ser uti- lizado para a apresentação de notas ou observações de natureza informativa. Capítulo 2 Apresentação de Dados 15 e) Fonte: refere-se à entidade que organizou ou forneceu os dados apresentados na tabela. Exemplo de construção de uma tabela de frequência: Considere uma pesquisa realizada com uma amostra de 20 clientes que compraram em um site de compras na Internet com o objetivo de investigar o tempo de atraso na entrega (em dias) das mercadorias adquiridas nesse site. Os dados obser- vados foram: 0 1 0 2 3 3 2 1 0 4 3 1 0 0 4 2 1 0 1 0 Para esses dados, podemos destacar as seguintes informações: a) Variável de pesquisa: tempo de atraso na entrega das mercadorias. b) Amostra investigada: 20 clientes. Para a construção da tabela, precisamos das seguintes infor- mações: c) Valores da variável que surgiram: correspondem aos tempos de atraso observados. Neste caso, encontra- mos 0, 1, 2, 3 e 4 dias. d) Frequência (f) de cada valor da variável: corres- ponde ao número de vezes que cada valor se repetiu. 16 Estatística Aplicada Para o exemplo, podemos observar que 0 dias de atraso se repetiu em 7 clientes: 0 1 0 2 3 3 2 1 0 4 3 1 0 0 4 2 1 0 1 0 Na sequência, 1 dia de atraso se repetiu em 5 clientes: 0 1 0 2 3 3 2 1 0 4 3 1 0 0 4 2 1 0 1 0 Já 2 dias de atraso se repetiu em 3 clientes: 0 1 0 2 3 3 2 1 0 4 3 1 0 0 4 2 1 0 1 0 Para 3 dias de atraso, observamos uma ocorrência em 3 clien- tes: 0 1 0 2 3 3 2 1 0 4 3 1 0 0 4 2 1 0 1 0 Por fim, para 4 dias de atraso, observamos uma ocorrência em 2 clientes: 0 1 0 2 3 3 2 1 0 4 3 1 0 0 4 2 1 0 1 0 Agora, organizamos essa informação por meio da estrutu- ra de uma tabela de frequência, considerando todos os seus elementos: Capítulo 2 Apresentação de Dados 17 Tempo de atraso na entrega das mercadorias Tempo de atraso Frequência % 0 7 35 1 5 25 2 3 15 3 3 15 4 2 10 Total 20 100 Fonte: Pesquisa Interna Como calculamos a porcentagem da tabela de fre- quência? Cálculo da Porcentagem: 18 Estatística Aplicada IMPORTANTE!!! De acordo com as normas, as tabelas de frequência não podem ser fechadas dos lados, nem ter linhas dividindo as categorias da variável. As únicas linhas permitidas são as que delimitam o cabeçalho e as que delimitam o total; no centro da tabela, é opcional colocar ou não o traço divisório das colunas. Gráficos estatísticos A utilização de gráficos como forma de apresentação de da- dos pode ser justificada por um ditado popular de que “uma imagem vale mais que 1000 palavras” Técnicas gráficas são geralmente utilizadas, em vez de ta- belas, para descrever um conjunto de dados por meio de um “desenho”. Um gráfico estatístico é uma forma de apresen- tação dos dados estatísticos, cujo objetivo é o de reproduzir, no investigador ou no público em geral, uma impressão mais rápida e viva do fenômeno em estudo. (Crespo, 1996) A representação gráfica deve ser utilizada levando-se em conta algumas qualidades essenciais básicas para a constru- ção destes conforme nos mostra a figura 2. De acordo com Levin (1987), enquanto algumas pessoas parecem “desligar-se” ao serem expostas a informações esta- tísticas em forma de tabelas, elas podem prestar bastante aten- ção às mesmas informações apresentadas em forma gráfica. Esse fato justifica a grande utilização por parte dos pesquisa- dores e da mídia escrita e impressa dos gráficos em substitui- ção das tabelas. Capítulo 2 Apresentação de Dados 19 Figura 5 Qualidade de um bom gráfico. Gráfico de setores O gráfico de setores, também conhecido como gráfico pizza, torta, queijo ou bolacha, é um dos mais simples recursos gráfi- cos, sua construção é baseada no fato de que o círculo possui 360º, sendo que esse círculo é dividido em fatias de acordo com o percentual em cada categoria. É um gráfico útil para representar variáveis nominais ou apresentadas em categorias de respostas. 20 Estatística Aplicada Figura 6 Exemplo de gráfico de setores. Gráfico de colunas O gráfico de colunas é um dos gráficos mais utilizados para representar um conjunto de dados, sendo a representação de uma série de dados por meio de retângulos dispostos verti- calmente. A altura desses retângulos é proporcional a suas respectivas frequências (ou porcentagens). Esse gráfico pode Capítulo 2 Apresentação de Dados 21 ser utilizado para representar qualquer tipo de variável em qualquer nível de mensuração; por esse fato, é um recurso extremamente utilizado em pesquisas. Figura 7 Exemplo de gráfico de colunas. Gráfico de barras O gráfico de barras é uma representação de uma série de dados por meio de retângulos dispostos horizontalmente. Os 22 Estatística Aplicada comprimentos desses retângulos são proporcionais a suas res- pectivas frequências. Esse gráfico é semelhante ao gráfico de colunas, contudo, a posição da escala e da frequência é troca- da, ou seja, na linha horizontal temos a frequência (ou percen- tual) de casos observados e na linha vertical temos os valores (ou as categorias) da variável de estudo. Figura 8 Exemplo de gráfico de barras. Capítulo 2 Apresentação de Dados 23 Gráfico de linhas Esse gráfico se utiliza de uma linha para representar uma série estatística. Seu principal objetivo é evidenciar a tendência ou a forma como o fenômeno está crescendo ou decrescendo em um período de tempo. Seu traçado deve ser realizado conside- rando o eixo “x” (horizontal), a escala de tempo, e o eixo “y” (vertical), frequência observada dos valores. Figura 9 Exemplo de gráfico de linhas. 24 Estatística Aplicada Como fazer gráficos no excel Fazer gráficos no Excel é muito fácil e simples! Para isso, precisamos inicialmente fazer as tabelas de frequências e calcular as porcentagens. Na confecção dos gráficos, devemos considerar que a informação percentual é sempre mais interessante de ser apresentada (essa regra só não se aplica no caso do gráficode linhas, pois, nesse caso, muitas vezes desejamos acompanhar a evolução de uma determinada variável que não necessariamente é analisada em percentual). Vamos considerar um exemplo de construção de um gráfi- co de barras apresentando os resultados para a variável Profis- são. Na planilha do Excel, precisamos colocar apenas duas informações: as categorias da variável que apareceram (no caso do exemplo apresentado abaixo, as profissões) e as suas respectivas porcentagens. Capítulo 2 Apresentação de Dados 25 Marque com o mouse essas duas colunas na planilha e escolha a opção na barra de ferramentas Inserir Gráfico Barras. Escolha o gráfico de barras dentre as opções fornecidas pelo Excel. Uma dica importante é que a primeira opção apre- sentada é sempre mais interessante e mais simples. 26 Estatística Aplicada Capítulo 2 Apresentação de Dados 27 Após o gráfico pronto, você poderá formatar as cores, es- tilos, acrescentar título etc. utilizando a barras de ferramentas de Gráfico. No item Design, você pode modificar as cores do gráfico. No item Layout, você pode modificar os eixos do gráfico, acrescentar títulos, legendas e valores. No item Formatar, você pode modificar os preenchimentos (cores) e os contornos do gráfico. 28 Estatística Aplicada Recapitulando  Variável (x): é a característica da amostra a ser inves- tigada, ou seja, o que desejamos saber com a pergunta realizada.  Categorias: representam as possíveis respostas para a variável investigada.  Frequência (f): é o número de vezes que cada cate- goria da variável se repetiu, ou ainda, quantos elemen- tos investigados optaram por determinada resposta da questão. As tabelas de frequência correspondem a uma forma de apresentação de dados, seus elementos são: Título, Ca- beçalho, Corpo, Rodapé e Fonte. Sua estrutura é composta por linhas e colunas. As colunas são determinadas de forma que a variável a ser apresentada e suas respectivas catego- rias localizam-se na primeira coluna; já na segunda coluna, é apresentada a frequência (número de repetições) de cada ca- tegoria; e, por fim, a terceira coluna representa a porcentagem de cada categoria de resposta. Os gráficos estatísticos são formas de apresentação dos dados cujo objetivo é o de reproduzir, no investigador ou no público em geral, uma impressão mais rápida e viva do fenômeno em estudo, levando-se em conta a simplicidade, clareza e veracidade das informações apresentadas. Capítulo 2 Apresentação de Dados 29 Atividades: Apresentação de dados Os dados a seguir referem-se ao tempo de espera na fila de uma casa lotérica, em minutos, considerando um grupo de 15 clientes. Os resultados obtidos foram: 6 5 6 7 8 8 8 8 5 7 8 7 6 8 6 Questão 1. A variável de pesquisa para esse exemplo é: a) 15 clientes de uma casa lotérica. b) Clientes da casa lotérica. c) Tempo de espera na fila (em minutos). d) Contas pagas na fila da casa lotérica. e) Nenhuma das respostas anteriores. Questão 2. A amostra de pesquisa para esse exemplo é: a) 15 clientes de uma casa lotérica. b) Clientes da casa lotérica. c) Tempo de espera na fila (em minutos). d) Contas pagas na fila da casa lotérica. e) Nenhuma das respostas anteriores. Questão 3. Construa uma tabela de frequência para repre- sentar esses dados. 30 Estatística Aplicada Questão 4. Construa uma tabela para representar os dados abaixo que se referem ao número de viagens realizadas por 20 famílias nos últimos 5 anos: 0 1 2 5 2 3 4 2 2 4 4 0 0 2 3 2 1 5 2 1 Questão 5. “O desempenho do setor de Cartões de Crédito tem sido bastante satisfatório e tem crescido na medida em que a compensação de cheques vem diminuindo. Existe o incentivo por parte dos bancos para que seja impulsionado o uso de car- tões, tudo porque a transação com cheque custa 455% a mais que a eletrônica. Por parte dos estabelecimentos comerciais, o incentivo acontece por ser mais seguro e por reduzir as des- pesas financeiras. Atualmente, o potencial de crescimento de demanda é para o dobro de cartões que estão em circulação, hoje, pouco mais de 40 milhões. Nos últimos 8 anos, o uso do cartão de crédito aumentou 327%, enquanto que a utilização do cartão de débito, 562,5%.” Fonte: www.investnews.com.br Os dados abaixo correspondem aos resultados de uma pesquisa realizada com 20 lojas de um shopping com o ob- jetivo de verificar o valor mensal de suas vendas (mil reais) pagas com cartão de débito: 12 15 10 5 10 10 5 12 2 2 10 15 10 15 10 5 10 10 10 10 Construa uma tabela de frequência para representar esses dados. Capítulo 2 Apresentação de Dados 31 Gabarito das atividades propostas Questão 1. c) Tempo de espera na fila (em minutos). Questão 2. a) 15 clientes de uma casa lotérica. Questão 3. Tempo de espera na fila (em minutos) Tempo Frequência % 5 2 13,3 6 4 26,7 7 3 20,0 8 6 40,0 Total 15 100 Fonte: Pesquisa Questão 4. Número de viagens realizadas nos últimos 5 anos Nº viagens Frequência % 0 3 15,0 1 3 15,0 2 7 35,0 3 2 10,0 4 3 15,0 5 2 10,0 Total 20 100 Fonte: Pesquisa 32 Estatística Aplicada Questão 5. Valor mensal de suas vendas (mil reais) pagas com cartão de débito: Valor (mil reais) Frequência % 2 2 10,0 5 3 15,0 10 10 50,0 12 2 10,0 15 3 15,0 Total 20 100 Fonte: Pesquisa Medidas de Tendência Central ÂÂNeste capítulo, iremos abordar as Medidas de Tendên-cia Central, que são medidas que têm por objetivo representar todos os valores de uma variável por meio de um único valor. As medidas de tendência central são: Média, Mediana e Moda. Simone Echeveste Capítulo 3 34 Estatística Aplicada Nosso objetivo aqui é a apresentação de cada uma dessas medidas no que se refere à aplicabilidade, ao cálculo e à in- terpretação dos resultados obtidos. O aluno, ao final deste capítulo, deverá ser capaz de calcular e interpretar as medidas estatísticas apresentadas. Podemos ainda aprofundar um pouco mais a nossa análise estatística para o caso em que as variáveis analisadas sejam QUANTITATIVAS por meio das medidas estatísticas de ten- dência central. Essas medidas têm por objetivo encontrar a “tendência central” de um conjunto de dados, ou seja, encontrar o valor do meio ou ainda os valores típicos de uma distribuição. São medidas úteis para caracterizar e representar um conjunto de dados por meio de um único valor utilizando critérios distintos para isso. As medidas de tendência central são: média, me- diana e moda. Figura 10 Medidas de Tendência Central. Capítulo 3 Medidas de Tendência Central 35 Média A média é a medida de tendência central mais conhecida e mais utilizada de todas. Existem vários tipos de médias, a que utilizamos em pesquisas é a Média aritmética, obtida pela soma de todos os valores da variável investigada (valores de x) dividida pelo número total de valores no conjunto de dados (total da amostra – n). É representada pelos símbolos na amostra e por µ na população. Notação: µ – média populacional – média amostral Fórmula: Onde: S = somatório x – variável (valores obtidos para a variável investigada) n – tamanho da amostra Exemplo Os dados abaixo representam o tempo de relacionamento (em anos) de uma amostra de 7 clientes com a sua operadora de telefonia celular. 15 18 18 20 17 18 16 36 Estatística Aplicada Elementos importantes: Amostra (n): 7 clientes. Variável (x): tempo de relacionamento com a operadora de telefonia celular. Média: = 17,4 anos Interpretação: “Em média, o tempo de relacionamento dos clientes com sua operadora de telefonia celular é de 17,4 anos.” Média para dados agrupados em tabelas de frequência Quando os dados estão organizadosna forma de uma tabe- la de frequências, devemos multiplicar os diferentes valores “x” pelas respectivas frequências “f”. A fórmula utilizada deve- rá ser nesse caso: Capítulo 3 Medidas de Tendência Central 37 Onde: S = somatório x – variável f – frequência de cada valor da variável n – tamanho da amostra Exemplo Considere a seguinte tabela referente ao Número de faltas no período de um ano em uma amostra de 62 funcionários de uma empresa: Número de faltas em um ano Nº de faltas (x) Frequência (f) % x.f 0 5 8,0 0 x 5 = 0 2 25 40,3 2 x 25= 50 4 30 48,4 4 x 30= 120 6 2 3,2 6 x 2= 12 Total 62 (n) 100 182 = 2,9 faltas 38 Estatística Aplicada Interpretação: “Em média, os funcionários tiveram 2,9 faltas em um ano.” Mediana Ordenados os elementos da amostra em ordem crescente, a mediana é o valor considerado o ponto do meio, que a divide ao meio, isto é, metade dos elementos da amostra é menor ou igual à mediana, e a outra metade é maior ou igual à mediana. Notação: Md ou Me Como obter a Mediana: 1º) todos os valores do conjunto de dados devem ser colocados em ordem crescente, se houver algum valor que se repita mais de uma vez, deve ser repetido na ordenação também. 2º) devemos encontrar a posição da mediana considerando a seguinte regra: se o tamanho da amostra (n) é ímpar, a mediana é o valor central; se o tamanho da amostra (n) for par, a mediana será a média dos dois valores centrais. EXEMPLO 1: Quando o tamanho da amostra “n” for ímpar. Uma pesquisa foi realizada com o objetivo de verificar a renda, em salários mínimos, de uma amostra de 5 clientes de uma loja. 8,0 9,1 8,5 9,7 9,2 Capítulo 3 Medidas de Tendência Central 39 Amostra (n): 5 clientes de uma loja. Variável (x): renda em salários mínimos. Mediana (Md) 1º) Colocar os valores em ordem crescente. 8,0 8,5 9,1 9,2 9,7 2º) Encontrar o valor central no conjunto de dados. 8,0 8,5 9,1 9,2 9,7 Mediana Interpretação: “Metade dos clientes dessa loja possuem renda de 9,1 salários mínimos ou menos, e metade dos clientes possui renda de 9,1 salários mínimos ou mais.” EXEMPLO 2: Quando o tamanho da amostra “n” for par. Uma pesquisa foi realizada com o objetivo de verificar a renda, em salários mínimos, de uma amostra de 6 clientes de uma loja. 8,0 8,8 8,5 9,7 9,5 9,2 Amostra (n): 6 clientes de uma loja. Variável (x): renda em salários mínimos. 40 Estatística Aplicada 1º) Colocar os valores em ordem crescente. 8,0 8,5 8,8 9,2 9,5 9,7 2º) Encontrar os dois valores centrais no conjunto de dados. 8,0 8,5 8,8 9,2 9,5 9,7 Mediana 3º) Calcular o ponto médio entre esses dois valores centrais (somando os dois valores e dividindo por dois). Md = 9,0 salários mínimos Interpretação: “Metade dos clientes dessa loja possuem renda de 9 salários mínimos ou menos, e metade dos clientes possui renda de 9 salários mínimos ou mais.” Moda A moda de um conjunto de dados é simplesmente o valor do conjunto de dados que ocorreu com maior frequência, ou seja, que mais se repetiu. Notação: Mo Capítulo 3 Medidas de Tendência Central 41 Exemplo Os dados apresentados a seguir referem-se aos valores da diária (em reais) para um casal em uma amostra de 8 Hotéis na cidade de Porto Alegre: 200 210 200 210 210 250 230 210 Amostra (n): 8 Hotéis em Porto Alegre. Variável (x): valor da diária para um casal (em reais). Mo = 210 reais (este valor se repete quatro vezes na amos- tra, foi o valor de diária que mais se repetiu). 200 210 220 210 210 250 230 210 Interpretação: “O valor da diária para um casal que ocorreu com maior frequência foi de 210 reais.” ATENÇÃO!!! - Um conjunto de dados pode não ter moda, ou seja, nenhum valor se repetir. Exemplo: Idade de 5 clientes: 34, 56, 23, 42, 38 Nenhum valor se repete – não tem moda! - Um conjunto de dados pode ter mais que uma moda, ou seja, poderemos ter mais que um valor da variável se repetindo com frequências iguais. Exemplo: Idade de 8 clientes: 35, 23, 35, 40, 51, 40, 32, 55 Duas modas: 35 e 40 peças! 42 Estatística Aplicada Recapitulando As Medidas de Tendência Central têm por objetivo representar todos os valores de uma variável por meio de um único va- lor. As medidas de tendência central são: Média, Mediana e Moda. A Média representa a soma de todos os valores de uma variável dividida pela quantidade de valores existente; já a me- diana representa o valor central de um conjunto de dados de forma que metade dos valores observados é igual ou menor a ela, e metade igual ou superior a ela. A moda corresponde ao valor da variável que ocorreu com maior frequência, ou ainda, o que mais se repetiu. Atividades: Medidas de tendência central Questão 1. Uma pesquisa foi realizada com 12 empresas do ramo alimentício, com o objetivo de verificar o número de fun- cionários que estas possuem, os dados obtidos estão abaixo: 32 35 45 50 30 22 15 25 10 15 30 21 Calcule e interprete: a) Média. b) Mediana. c) Moda. Capítulo 3 Medidas de Tendência Central 43 Questão 2. A tabela abaixo representa os salários pagos a 100 operários da empresa GLT & Cia: Salários GLT & Cia Nº de salários mínimos Nº de operários % 0 40 40,0 2 30 30,0 4 10 10,0 6 15 15,0 8 5 5,0 Total 100 100,0 Fonte: Pesquisa a) Quem é a variável de estudo? b) Qual foi a amostra pesquisada? c) Qual a média de salário dos operários da empresa GLT & Cia? Questão 3. Uma pesquisa levantou os dados sobre o mer- cado imobiliário de determinado centro urbano, do ano 2005 a 2012, e os valores obtidos sobre o número de lançamentos (em mil unidades) e o total em vendas (em milhões de Reais) estão dispostos abaixo: Ano 2005 2006 2007 2008 2009 2010 2011 2012 Vendas 5,1 4,0 4,5 10,1 12,6 9,7 10,2 11,7 Fonte: Pesquisa 44 Estatística Aplicada a) Quem é a variável desse estudo? b) Quem é a amostra estudada? c) Calcule e interprete a média. d) Calcule e interprete a mediana. e) Calcule e interprete a moda. Questão 4. A tabela abaixo apresenta os valores das diárias pagas por 40 turistas nos hotéis do balneário Beach Star: Diárias pagas em Beach Star Diária (em R$) Nº de turistas % 80 18 45,0 96 10 25,0 145 5 12,5 210 7 17,5 Total 40 100 Fonte: Rede hoteleira a) Calcule e interprete a média para esses dados. Questão 5. Segundo dados divulgados pelo DIEESE (Depar- tamento Intersindical de Estatísticas e Estudos Socioeconômi- cos), os valores da cesta básica em Dezembro de 2009, em 10 capitais brasileiras pesquisadas, estão na tabela abaixo: Capítulo 3 Medidas de Tendência Central 45 Valor da Cesta Básica em 10 capitais brasileiras em Dezembro de 2009 Capital Valor da cesta básica (R$) Brasília 222,22 RJ 213,36 SP 228,19 Curitiba 211,85 Porto Alegre 237,58 Belém 204,32 Fortaleza 176,96 Manaus 215,94 Recife 171,31 Salvador 183,15 Fonte: DIEESE Com base nos dados apresentados na tabela acima: a) Calcule e interprete o preço médio da Cesta Básica para as capitais pesquisadas. b) Calcule e interprete o preço mediano da Cesta Básica para as capitais pesquisadas. Gabarito das atividades propostas Questão 1. a) Em média, essas empresas possuem 27,5 funcionários. 46 Estatística Aplicada b) Metade das empresas possui menos que 27,5 funcioná- rios, e metade mais que 27,5 funcionários. c) Os números de funcionários que ocorrem com maior fre- quência são 15 e 30 funcionários. Questão 2. a) Variável: salários GLT&Cia. b) Amostra: 100 operários. c) 2,3 salários mínimos. Questão 3. a) Variável: total de vendas. b) Amostra: 8 anos. c) Em média, foram vendidos 8,5 milhões em reais nesse períodopor ano. d) Metade do período foi vendida por menos que 9,9 mi- lhões de reais, e metade por mais que 9,9 milhões de reais. e) Não há moda, pois nenhum valor se repete. Questão 4. O valor médio das diárias é de 114,9 reais. Questão 5. a) O preço médio da cesta básica nessas capitais é de 206,5 reais. b) Em metade das capitais, o preço da cesta básica é inferior a 212,6 reais, e em metade é superior a 212,6 reais. Medidas de Variabilidade ÂÂNeste capítulo, iremos abordar as Medidas de Variabi-lidade, que são medidas que têm por objetivo mensu- rar variação de um conjunto de dados em torno da média. Simone Echeveste Capítulo 4 48 Estatística Aplicada Nosso objetivo aqui é a apresentação de cada uma dessas medidas no que se refere à aplicabilidade, ao cálculo e à inter- pretação dos resultados obtidos. O aluno, ao final deste capítu- lo, deverá ser capaz de calcular e interpretar as medidas de va- riabilidade: variância, desvio-padrão e coeficiente de variação. A média é extremamente útil como uma medida que obje- tiva representar/resumir um conjunto de dados, mas também é imprescindível ao pesquisador ter conhecimento da variação que ocorre em torno dessa média. Para isso, o cálculo das medidas de variabilidade contribui para uma melhor interpre- tação do comportamento de uma variável quantitativa (sua média e sua variação). Tão importante quanto representarmos todos os valores de um conjunto de dados por meio das medidas de tendência central é ter o conhecimento da variação que ocorre em torno dessa medida. As medidas de variabilidade são extremamente úteis no tratamento de dados, pois estas indicam a variação existente em torno da média. As medidas de variabilidade que veremos em nossa disciplina são: Variância, Desvio-padrão e Coeficiente de variação. Figura 11 Medidas de Variabilidade. Capítulo 4 Medidas de Variabilidade 49 Variância A variância de uma amostra corresponde à média dos qua- drados dos desvios dos valores em relação à média, Quanto maior for a variação dos valores do conjunto de dados, maior será a variância. Notação: σ2 – variância populacional s2 – variância amostral Fórmula: Onde: x – valores da variável investigada – média da amostra n – tamanho da amostra S – somatório Propriedades da Variância 1. Somando-se (ou subtraindo-se) a cada elemento de um con- junto de valores uma constante, a variância não se altera; 2. Multiplicando-se (ou dividindo-se) cada elemento de um con- junto de valores por um valor constante, a variância fica mul- tiplicada (ou dividida) pelo quadrado da constante. 50 Estatística Aplicada Exemplo Os dados apresentados abaixo correspondem ao número de reclamações (em mil reclamações) diárias recebidas pelo PROCON referentes às operadoras de TV a cabo no período de 5 dias: 17 18 16 20 22 Elementos importantes: Variável (x): número de reclamações (em mil reclamações) diárias recebidas pelo PROCON referentes às operadoras de TV a cabo. Amostra (n): 7 dias. Média: Variância: Capítulo 4 Medidas de Variabilidade 51 s2 = 5,8 reclamações/dia2 No cálculo da variância, pode-se observar que a unidade da variável estudada é elevada ao quadrado, dificultando, as- sim, a interpretação de seu resultado final. A solução para esse problema é extrair a raiz quadrada da variância, permitindo, dessa forma, que se volte à unidade original da variável. Essa nova medida (a raiz quadrada da variância) é chamada de desvio-padrão. Desvio-padrão O desvio-padrão corresponde à raiz quadrada da variância. Essa medida expressa a variação média do conjunto de dados em torno da média, para mais ou para menos na mesma uni- dade de medida da média. Notação: σ – desvio-padrão populacional s – desvio-padrão amostral Fórmula: 52 Estatística Aplicada Propriedades do Desvio-padrão 1. Somando-se (ou subtraindo-se) a cada elemento de um conjun- to de valores uma constante, o desvio-padrão não se altera; 2. Multiplicando-se (ou dividindo-se) cada elemento de um con- junto de valores por um valor constante, o desvio-padrão fica multiplicado (ou dividido) pela constante. O desvio-padrão de uma amostra pode ser calculado con- siderando as seguintes etapas: Figura 12 Etapas para o cálculo do Desvio-padrão. Para o exemplo apresentado teremos: Capítulo 4 Medidas de Variabilidade 53 Variância: s2 = 5,8 reclamações/dia2 Desvio-padrão: s = 2,4 reclamações/dia Interpretação: “Em média, o PROCON recebe diariamente 18,6 reclamações com uma variação em torno dessa média de 2,4 reclamações.” Coeficiente de variação Neste momento, poderemos questionar: quando um desvio- -padrão é grande e quando ele é pequeno? Na verdade, um desvio padrão pode ser considerado grande ou pequeno de- pendendo da ordem de grandeza da variável. Por esse motivo, quando desejamos comparar a variabili- dade entre métodos, ou ainda entre grupos de valores, é indi- cada a utilização do Coeficiente de Variação que representa o desvio-padrão expresso como uma porcentagem da média. Notação: C.V. – Coeficiente de variação. 54 Estatística Aplicada Fórmula: Onde: – média da amostra s – desvio-padrão Para o exemplo... Interpretação: “Existe uma variação em torno da média de 12,9%.” Figura 13 Interpretação Coeficiente de Variação. Capítulo 4 Medidas de Variabilidade 55 Medidas de variabilidade para dados agrupados em tabelas de frequência Os dados abaixo se referem ao tempo de espera na fila de um caixa de supermercado (em minutos): Tempo de espera na fila (minutos) Tempo de espera (x) Frequência (f) % x.f 0 5 8,0 0 x 5 = 0 2 25 40,3 2 x 25= 50 4 30 48,4 4 x 30= 120 6 2 3,2 6 x 2= 12 Total 62 (n) 100 182 Média: Agora, vamos calcular a variância e o desvio-padrão. Nes- se caso, devemos considerar a frequência de cada valor da variável. 56 Estatística Aplicada Variância: Tempo de espera na fila (minutos) Tempo de espera (x) Frequência (f) % (x– )2. f 0 5 8,0 (0 – 2,9)2. 5 = 42,05 2 25 40,3 (2 – 2,9)2. 25 = 20,25 4 30 48,4 (4 – 2,9)2. 30 = 36,3 6 2 3,2 (6 – 2,9)2. 2 = 19,22 Total 62 (n) 100 117,82 s2 = minutos2 Desvio-padrão: s = 1,4 minutos Capítulo 4 Medidas de Variabilidade 57 Interpretação: “Em média, o tempo de espera na fila desse supermercado é de 2,9 minutos com uma variação em torno dessa média de 1,4 minutos.” Recapitulando As Medidas de Variabilidade (Variância, Desvio-padrão e Coefi- ciente de Variação) são extremamente úteis no tratamento de da- dos, pois estas indicam a variação existente em torno da média. Quando realizamos o tratamento estatístico de dados pro- venientes de variáveis quantitativas, o cálculo e interpretação dessas medidas fornece informação detalhada e de extrema importância na tomada de decisão do pesquisador. Atividades: Medidas de variabilidade Questão 1. Os dados abaixo são referentes às taxas de de- semprego (em %) em alguns países selecionados da América do Sul e da América do Norte: Brasil Uruguai Chile Argentina Canadá EUA Venezuela 11.4 12.1 5.6 7.3 4.8 5.3 7.3 Calcule e interprete a Média e o desvio-padrão para esses dados. 58 Estatística Aplicada Questão 2. A capacidade em litros dos porta-malas dos car- ros populares produzidos no Brasil foi investigada obtendo-se os seguintes dados: Corsa: 240 litros Uno: 224 litros Hobby: 325 litros Gol: 146 litros Calcule e interprete a média e o desvio-padrão para esses dados. Questão 3. Um fabricante de molas está interessado em im- plementar um sistema de controle de qualidade para monitorar seu processo de produção. Para isto, foi registrado o número de molas fora da conformidade em cada lote deprodução. Os dados apresentados na tabela de frequência abaixo se referem a 20 lotes selecionados, observando-se o número de molas fora de conformidade. Número de molas fora de conformidade Número de molas f % 6 3 15,0 7 6 30,0 8 4 20,0 9 3 15,0 12 4 20,0 Total 20 100,0 a) Calcule e interprete as medidas descritivas: média e des- vio-padrão para esses dados. Capítulo 4 Medidas de Variabilidade 59 Questão 4. Considere a seguinte tabela: Número de faltas no mês de uma amostra de 153 funcionários na empresa WK Nº de faltas Nº funcionários % 0 85 55,5 1 20 13,1 2 40 26,1 3 8 5,3 Total 153 100,0 Calcule e interprete a média e o desvio-padrão para esses dados. Questão 5. Duas turmas de Estatística apresentam as seguin- tes estatísticas para as notas na prova G1: Turma A: média = 7,8 pontos e desvio-padrão = 1,4 pontos. Turma B: média = 8,2 pontos e desvio-padrão = 2,5 pontos. Qual das duas turmas teve um desempenho mais homogê- neo na prova G1? Justifique. Gabarito das atividades propostas Questão 1. A taxa média de desemprego é 7,7% com uma variação em torno dessa média de 2,9%. 60 Estatística Aplicada Questão 2. Em média, a capacidade do porta-malas desses carros é de 233,8 litros com uma variação em torno dessa média de 73,4 litros. Questão 3. Em média, são produzidas por lote 8,4 molas fora de confor- midade com uma variação de 2,2 molas. Questão 4. Em média, os funcionários da empresa WK possuem 0,8 fal- tas, com uma variação em torno dessa média de 1 falta. Questão 5. CVA = 17,9% CVB = 30,5% CVA < CVB A turma A teve um desempenho mais homogêneo na prova G1, comparada com a turma B, pois tem um coeficiente de variação menor. Distribuição de Probabilidade Normal  A distribuição Normal ou Gaussiana é, sem dú-vida, o modelo probabilístico mais conhecido. Várias técnicas estatísticas necessitam da suposição de que os dados se distribuam normalmente para serem utilizadas. Na natureza, uma grande quantidade de variáveis apre- senta tal distribuição. O objetivo desse capítulo é a apresentação dessa dis- tribuição por meio de exemplos de aplicações na área da administração; espera-se que o aluno compreenda as situações problema em que ela possa ser aplicada e as interpretações dos resultados fornecidos. Simone Echeveste Capítulo 5 62 Estatística Aplicada A distribuição Normal é o modelo probabilístico mais utilizado no tratamento estatístico de dados, pois diversas ferramentas estatísticas necessitam da suposição de que os dados se distri- buam normalmente para serem utilizadas. A sua função densidade de probabilidade da distribuição normal f(x) é dada por: ; para -∞ < x < ∞ , -∞ < µ < ∞ e σ2 > 0 Os parâmetros da Normal são a média ( µ ) e o desvio- -padrão ( σ ), que permitem infinitas curvas normais com dife- rentes formatos (mas sempre simétricas). O gráfico da função densidade de probabilidade é apresentado a seguir: Figura 14 Gráfico da Curva Normal. Capítulo 5 Distribuição de Probabilidade Normal 63 Figura 15 Características da Distribuição Normal. A distribuição Normal, independentemente dos valores dos parâmetros, apresenta sempre a seguinte relação (Fi- gura 11): 64 Estatística Aplicada Figura 16 Áreas importantes da Curva Normal. Distribuição normal-padrão ou normal reduzida - Z A função densidade de probabilidade f(x) da distribuição nor- mal depende dos valores de µ e σ; por essa razão, teremos várias equações para vários diferentes valores de µ e σ. Todas as curvas normais representativas de distribuições de frequên- cias podem ser transformadas em uma curva normal padrão, usando-se a média µ e o desvio padrão σ da variável em estudo. Capítulo 5 Distribuição de Probabilidade Normal 65 Para evitar cálculos com a integração, uma tabela única foi desenvolvida para uma variável aleatória agora chamada de “Z” com µ=0 e σ=1, e sua distribuição de probabilidades é definida como normal padronizada, ou ainda normal padrão. Seja X uma variável aleatória normalmente distribuída com quaisquer parâmetros média µ e desvio-padrão σ. Para reali- zar o processo de padronização, devemos realizar a seguinte transformação: Onde: x = valor de interesse da variável µ = média da variável σ = desvio-padrão da variável Após a padronização, poderemos obter as probabilidades associadas a cada área por meio da Tabela Normal padrão apresentada a seguir: Tabela da Distribuição Normal Padrão P(Z < z) – VALORES POSITIVOS z 0,0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359 0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753 0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141 0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517 0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879 0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224 66 Estatística Aplicada 0,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549 0,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,7852 0,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133 0,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8389 1,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621 1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830 1,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,9015 1,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9177 1,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,9319 1,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,9441 1,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,9545 1,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,9633 1,8 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,9706 1,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,9767 2,0 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,9817 2,1 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,9857 2,2 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,9890 2,3 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,9916 2,4 0,9918 0,9920 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9934 0,9936 2,5 0,9938 0,9940 0,9941 0,9943 0,9945 0,9946 0,9948 0,9949 0,9951 0,9952 2,6 0,9953 0,9955 0,9956 0,9957 0,9959 0,9960 0,9961 0,9962 0,9963 0,9964 2,7 0,9965 0,9966 0,9967 0,9968 0,9969 0,9970 0,9971 0,9972 0,9973 0,9974 2,8 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0,9979 0,9980 0,9981 2,9 0,9981 0,9982 0,9982 0,9983 0,9984 0,9984 0,9985 0,9985 0,9986 0,9986 3,0 0,9987 0,9987 0,9987 0,9988 0,9988 0,9989 0,9989 0,9989 0,9990 0,9990 3,1 0,9990 0,9991 0,9991 0,9991 0,9992 0,9992 0,9992 0,9992 0,9993 0,9993 3,2 0,9993 0,9993 0,9994 0,9994 0,9994 0,9994 0,9994 0,9995 0,9995 0,9995 3,3 0,9995 0,9995 0,9995 0,9996 0,9996 0,9996 0,9996 0,9996 0,9996 0,9997 3,4 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9998 3,5 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 3,6 0,9998 0,9998 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 3,7 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 3,8 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 3,9 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 Capítulo 5 Distribuição de Probabilidade Normal 67 Tabela da Distribuição Normal Padrão P(Z < z) – VALORES NEGATIVOS z 0,0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,0 0,5000 0,4960 0,4920 0,4880 0,4840 0,4801 0,4761 0,4721 0,4681 0,4641 -0,1 0,46020,4562 0,4522 0,4483 0,4443 0,4404 0,4364 0,4325 0,4286 0,4247 -0,2 0,4207 0,4168 0,4129 0,4090 0,4052 0,4013 0,3974 0,3936 0,3897 0,3859 -0,3 0,3821 0,3783 0,3745 0,3707 0,3669 0,3632 0,3594 0,3557 0,3520 0,3483 -0,4 0,3446 0,3409 0,3372 0,3336 0,3300 0,3264 0,3228 0,3192 0,3156 0,3121 -0,5 0,3085 0,3050 0,3015 0,2981 0,2946 0,2912 0,2877 0,2843 0,2810 0,2776 -0,6 0,2743 0,2709 0,2676 0,2643 0,2611 0,2578 0,2546 0,2514 0,2483 0,2451 -0,7 0,2420 0,2389 0,2358 0,2327 0,2296 0,2266 0,2236 0,2206 0,2177 0,2148 -0,8 0,2119 0,2090 0,2061 0,2033 0,2005 0,1977 0,1949 0,1922 0,1894 0,1867 -0,9 0,1841 0,1814 0,1788 0,1762 0,1736 0,1711 0,1685 0,1660 0,1635 0,1611 -1,0 0,1587 0,1562 0,1539 0,1515 0,1492 0,1469 0,1446 0,1423 0,1401 0,1379 -1,1 0,1357 0,1335 0,1314 0,1292 0,1271 0,1251 0,1230 0,1210 0,1190 0,1170 -1,2 0,1151 0,1131 0,1112 0,1093 0,1075 0,1056 0,1038 0,1020 0,1003 0,0985 -1,3 0,0968 0,0951 0,0934 0,0918 0,0901 0,0885 0,0869 0,0853 0,0838 0,0823 -1,4 0,0808 0,0793 0,0778 0,0764 0,0749 0,0735 0,0721 0,0708 0,0694 0,0681 -1,5 0,0668 0,0655 0,0643 0,0630 0,0618 0,0606 0,0594 0,0582 0,0571 0,0559 -1,6 0,0548 0,0537 0,0526 0,0516 0,0505 0,0495 0,0485 0,0475 0,0465 0,0455 -1,7 0,0446 0,0436 0,0427 0,0418 0,0409 0,0401 0,0392 0,0384 0,0375 0,0367 -1,8 0,0359 0,0351 0,0344 0,0336 0,0329 0,0322 0,0314 0,0307 0,0301 0,0294 -1,9 0,0287 0,0281 0,0274 0,0268 0,0262 0,0256 0,0250 0,0244 0,0239 0,0233 -2,0 0,0228 0,0222 0,0217 0,0212 0,0207 0,0202 0,0197 0,0192 0,0188 0,0183 -2,1 0,0179 0,0174 0,0170 0,0166 0,0162 0,0158 0,0154 0,0150 0,0146 0,0143 -2,2 0,0139 0,0136 0,0132 0,0129 0,0125 0,0122 0,0119 0,0116 0,0113 0,0110 -2,3 0,0107 0,0104 0,0102 0,0099 0,0096 0,0094 0,0091 0,0089 0,0087 0,0084 -2,4 0,0082 0,0080 0,0078 0,0075 0,0073 0,0071 0,0069 0,0068 0,0066 0,0064 -2,5 0,0062 0,0060 0,0059 0,0057 0,0055 0,0054 0,0052 0,0051 0,0049 0,0048 -2,6 0,0047 0,0045 0,0044 0,0043 0,0041 0,0040 0,0039 0,0038 0,0037 0,0036 -2,7 0,0035 0,0034 0,0033 0,0032 0,0031 0,0030 0,0029 0,0028 0,0027 0,0026 -2,8 0,0026 0,0025 0,0024 0,0023 0,0023 0,0022 0,0021 0,0021 0,0020 0,0019 -2,9 0,0019 0,0018 0,0018 0,0017 0,0016 0,0016 0,0015 0,0015 0,0014 0,0014 -3,0 0,0013 0,0013 0,0013 0,0012 0,0012 0,0011 0,0011 0,0011 0,0010 0,0010 -3,1 0,0010 0,0009 0,0009 0,0009 0,0008 0,0008 0,0008 0,0008 0,0007 0,0007 68 Estatística Aplicada -3,2 0,0007 0,0007 0,0006 0,0006 0,0006 0,0006 0,0006 0,0005 0,0005 0,0005 -3,3 0,0005 0,0005 0,0005 0,0004 0,0004 0,0004 0,0004 0,0004 0,0004 0,0003 -3,4 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0002 -3,5 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 -3,6 0,0002 0,0002 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 -3,7 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 -3,8 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 -3,9 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 Como utilizar a tabela normal padrão Na tabela, desejamos saber a área correspondente a um de- terminado valor de “z”, devemos considerar duas informações importantes obtidas a partir do valor de “z” que são: a linha e a coluna em que devemos procurar o valor. Por exemplo, para P(z < 1,35), lê-se “probabilidade de z ser inferior a 1,35”: Devemos dividir esse número em duas partes: a primei- ra composta pela parte inteira do número e a primeira casa após a vírgula que representa os décimos; a segunda parte é composta pela segunda casa após a vírgula que representa o centésimo. Capítulo 5 Distribuição de Probabilidade Normal 69 Para o nosso exemplo P(z < 1,35), deveremos buscar na ta- bela dos valores de “z” positivos a linha 1,3 e a coluna 0,05: Tabela da Distribuição Normal Padrão P(Z < z) – VALORES POSITIVOS z 0,0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359 0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753 0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141 0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517 0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879 0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224 0,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549 0,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,7852 0,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133 0,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8389 1,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8557 0,8599 0,8621 1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830 1,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,9015 1,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9177 1,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,9319 1,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,9441 Então P(z < 1,35) = 0,9115 ou ainda 91,15%. Outro exemplo: P(z < -0,27) 70 Estatística Aplicada Deveremos buscar na tabela dos valores de “z” negativos a linha -0,2 e a coluna 0,07: Tabela da Distribuição Normal Padrão P(Z < z) – VALORES POSITIVOS z 0,0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,0 0,5000 0,4960 0,4920 0,4880 0,4840 0,4801 0,4761 0,4721 0,4681 0,4641 -0,1 0,4602 0,4562 0,4522 0,4483 0,4443 0,4404 0,4364 0,4325 0,4286 0,4247 -0,2 0,4207 0,4168 0,4129 0,4090 0,4052 0,4013 0,3974 0,3936 0,3897 0,3859 -0,3 0,3821 0,3783 0,3745 0,3707 0,3669 0,3632 0,3594 0,3557 0,3520 0,3483 -0,4 0,3446 0,3409 0,3372 0,3336 0,3300 0,3264 0,3228 0,3192 0,3156 0,3121 -0,5 0,3085 0,3050 0,3015 0,2981 0,2946 0,2912 0,2877 0,2843 0,2810 0,2776 -0,6 0,2743 0,2709 0,2676 0,2643 0,2611 0,2578 0,2546 0,2514 0,2483 0,2451 -0,7 0,2420 0,2389 0,2358 0,2327 0,2296 0,2266 0,2236 0,2206 0,2177 0,2148 -08 0,2119 0,2090 0,2061 0,2033 0,2005 0,1977 0,1949 0,1922 0,1894 0,1867 Então P(z < -0,27) = 0,3936 ou ainda 39,36%. Exemplo 1 O valor gasto em uma refeição em um restaurante tem dis- tribuição normal com média de 20 reais e desvio-padrão de 0,50 reais. Qual a probabilidade que um cliente aleatoria- mente selecionado gaste menos de 21 reais? Passo 1: Dados do Problema x = valor gasto em uma refeição µ = 20 reais σ = 0,50 reais Capítulo 5 Distribuição de Probabilidade Normal 71 Pede-se: P(x < 21 reais) Passo 2: Padronizar para obter o cálculo da área pela tabela Normal Padrão Passo 3: Buscar o valor da probabilidade P(z < 2,00) na tabela normal 72 Estatística Aplicada Deveremos buscar na tabela dos valores de “z” positivos a linha 2,0 e a coluna 0,00: Tabela da Distribuição Normal Padrão P(Z < z) – VALORES POSITIVOS z 0,0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359 0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753 0,2 0,5793 0,5832 0,5871 0,5910 ,05948 0,5987 0,6026 0,6064 0,6103 0,6141 0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517 0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879 0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224 0,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549 0,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,7852 0,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133 0,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8389 1,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621 1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830 1,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,9015 1,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,91470,9162 0,9177 1,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,9319 1,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,9441 1,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,9545 1,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,9633 1,8 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,9706 1,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,9767 2,0 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,9817 2,1 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,9857 2,2 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,9890 Então a P(x < 21 reais) = 0,9772 ou 97,72%. Capítulo 5 Distribuição de Probabilidade Normal 73 Exemplo 2 O número de unidades vendidas em uma loja de materiais es- portivos no período de um mês é normalmente distribuído com média de 7000 unidades e desvio-padrão de 600 unidades. Qual é a probabilidade de que em um determinado mês essa loja venda menos de 6400 unidades? Passo 1: Dados do Problema x = número de unidades vendidas em uma loja de materiais esportivos no período de um mês µ = 7000 unidades σ = 600 unidades Pede-se: P(x < 6400 unidades) 74 Estatística Aplicada Passo 2: Padronizar para obter o cálculo da área pela tabela Normal Padrão Passo 3: Buscar o valor da probabilidade P(z < -1,00) na tabela normal Capítulo 5 Distribuição de Probabilidade Normal 75 Deveremos buscar na tabela dos valores de “z” negativos a linha -1,0 e a coluna 0,00: Tabela da Distribuição Normal Padrão P(Z < z) – VALORES POSITIVOS z 0,0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,0 0,5000 0,4960 0,4920 0,4880 0,4840 0,4801 0,4761 0,4721 0,4681 0,4641 -0,1 0,4602 0,4562 0,4522 0,4483 0,4443 0,4404 0,4364 0,4325 0,4286 0,4247 -0,2 0,4207 0,4168 0,4129 0,4090 0,4052 0,4013 0,3974 0,3936 0,3897 0,3859 -0,3 0,3821 0,3783 0,3745 0,3707 0,3669 0,3632 0,3594 0,3557 0,3520 0,3483 -0,4 0,3446 0,3409 0,3372 0,3336 0,3300 0,3264 0,3228 0,3192 0,3156 0,3121 -0,5 0,3085 0,3050 0,3015 0,2981 0,2946 0,2912 0,2877 0,2843 0,2810 0,2776 -0,6 0,2743 0,2709 0,2676 0,2643 0,2611 0,2578 0,2546 0,2514 0,2483 0,2451 -0,7 0,2420 0,2389 0,2358 0,2327 0,2296 0,2266 0,2236 0,2206 0,2177 0,2148 -0,8 0,2119 0,2090 0,2061 0,2033 0,2005 0,1977 0,1949 0,1922 0,1894 0,1867 -0,9 0,1841 0,1814 0,1788 0,1762 0,1736 0,1711 0,1685 0,1660 0,1635 0,1611 -1,0 0,1587 0,1562 0,1539 0,1515 0,1492 0,1469 0,1446 0,1423 0,1401 0,1379 -1,1 0,1357 0,1335 0,1314 0,1292 0,1271 0,1251 0,1230 0,1210 0,1190 0,1170 -1,2 0,1151 0,1131 0,1112 0,1093 0,1075 0,1056 0,1038 0,1020 0,1003 0,0985 Então a P(x < 6400 unidades) = 0,1587 ou 15,87%. Nos exemplos anteriores, observe que as áreas/probabi- lidades solicitadas foram sempre áreas INFERIORES a um 76 Estatística Aplicada valor “x” de interesse; observe que, na tabela normal padrão utilizada, as probabilidades que ali se encontram referem-se sempre a áreas inferiores: Tabela da Distribuição Normal Padrão P(Z < z) – VALORES POSITIVOS z 0,0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,0 0,5000 0,4960 0,4920 0,4880 0,4840 0,4801 0,4761 0,4721 0,4681 0,4641 -0,1 0,4602 0,4562 0,4522 0,4483 0,4443 0,4404 0,4364 0,4325 0,4286 0,4247 Quando a probabilidade desejada for uma área SUPE- RIOR a algum valor de “x” ou ainda ENTRE dois valores de “x”, devemos utilizar a mesma tabela, porém observando as seguintes regras: No mesmo exemplo anteriormente citado, vamos consi- derar agora que desejamos saber a probabilidade dessa loja vender mais de 7500 unidades: Pede-se: P(x > 7500 unidades) Capítulo 5 Distribuição de Probabilidade Normal 77 Observe que aqui desejamos a área localizada à DIREITA no gráfico (área escura), ou seja, uma área SUPERIOR, po- rém a tabela apresenta apenas o cálculo das áreas INFERIO- RES, ou ainda à ESQUERDA do gráfico (área clara). Nesse caso utilizaremos a informação que a curva ao todo possui 100% de área, então calcularemos a área INFERIOR e do re- sultado obtido na tabela subtrairemos 100%. Então poderemos estabelecer a seguinte regra: P( x ≥ a ) = 100% - P( x ≤ a ) Voltando ao exemplo: b) Probabilidade de vender mais de 7500 unidades. Pede-se: P(x > 7500 unidades) 78 Estatística Aplicada Vamos então aplicar a regra: P(x > 7500 unidades) = 100% - P(x < 7500 unidades) Padronizando para obter o cálculo da área pela tabela Normal Padrão. Buscando o valor da probabilidade P(z < 0,83) na tabela normal. Deveremos buscar na tabela dos valores de “z” positivos a linha 0,8 e a coluna 0,03: Capítulo 5 Distribuição de Probabilidade Normal 79 Tabela da Distribuição Normal Padrão P(Z < z) – VALORES POSITIVOS z 0,0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359 0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753 0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141 0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517 0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879 0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224 0,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549 0,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,7852 0,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133 0,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8389 1,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621 1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830 Então a P(x < 7500 unidades) = 0,7967 ou 79,67%. ATENÇÃO!!! Não esqueça que a probabilidade desejada é SUPERIOR a 7500 horas, então: P(x > 7500 horas) = 100% - P(x < 7500 horas) P(x > 7500 horas) = 100% - 79,67% P(x > 7500 horas) = 20,33% 80 Estatística Aplicada Agora, vejamos o terceiro e último tipo de área/probabili- dade a ser calculada: ENTRE dois valores. Qual é a probabilidade dessa loja vender entre 6300 uni- dades e 7400 unidades? Pede-se: P( 6300 ≤ x ≤ 7400 ) Nesse caso, teremos dois valores de “x” que deverão ser padronizados resultando em dois valores de probabilidade, uma referente à área inferior a 7400 e outra inferior a 6300. Capítulo 5 Distribuição de Probabilidade Normal 81 Para obter a área de interesse, devemos subtrair uma área da outra. Assim, poderemos estabelecer a seguinte regra: P( a ≤ x ≤ b ) = P( x ≤ b ) – P( x ≤ a ) Voltando ao exemplo: Pede-se: P( 6300 ≤ x ≤ 7400 ) 82 Estatística Aplicada Vamos então aplicar a regra: P( 6300 ≤ x ≤ 7400 ) = P(x ≤ 7400) – P(x ≤ 6300) Padronizando para obter o cálculo da área pela tabela Normal Padrão. Na tabela: linha 0,6 e coluna 0,07 0,7486 ou 74,86% Na tabela: linha -1,1 e coluna 0,07 0,1210 ou 12,10% Então: P( 6300 ≤ x ≤ 7400 ) = 74,86% – 12,10% P( 6300 ≤ x ≤ 7400 ) = 62,76% Capítulo 5 Distribuição de Probabilidade Normal 83 Recapitulando A distribuição de probabilidades para uma variável aleatória “X” é expressa por meio de um modelo matemático que repre- senta as probabilidades associadas aos possíveis valores que essa variável pode assumir. A Distribuição Normal é o modelo probabilístico mais co- nhecido, no qual várias técnicas estatísticas necessitam da suposição de que os dados se distribuam normalmente para serem utilizadas. Seus parâmetros são a média e o desvio- -padrão. Atividades: Distribuição de probabilidade normal Questão 1. Determinado atacadista efetua suas vendas por telefone. Após alguns meses, verificou-se que os pedidos se distribuem normalmente com média de 3.000 pedidos e des- vio-padrão de 180 pedidos. Qual a probabilidadede que em um mês selecionado ao acaso essa empresa venda menos de 2700 pedidos. Questão 2. O conteúdo líquido das garrafas de 300 ml de um refrigerante é normalmente distribuído com média de 300 ml e desvio-padrão de 2 ml. Determine a probabilidade de uma garrafa selecionada ao acaso apresentar conteúdo líquido: a) Inferior a 306 ml. b) Superior a 305 ml. 84 Estatística Aplicada c) Entre 302 e 304 ml. Questão 3. O lucro mensal obtido com ações de determi- nada empresa tem distribuição normal com média de 12 mil reais e desvio-padrão de 5 mil reais. Qual a probabilidade de que em determinado mês o lucro dessa empresa seja: a) Superior a 18 mil reais. b) Inferior a 8 mil reais. c) Entre 10 e 15 mil reais. Questão 4. Suponha que a renda média anual de uma grande comunidade tenha distribuição normal com média de 15 mil re- ais e com um desvio-padrão de 3 mil reais. Qual a probabilida- de de que um indivíduo aleatoriamente selecionado desse grupo apresente uma média salarial anual superior a 18 mil reais? Questão 5. O escore de um estudante no vestibular é uma variável com distribuição normal com média de 550 pontos e desvio-padrão de 30 pontos. Se a admissão em certa faculda- de exige um escore mínimo de 575 pontos, qual é a probabi- lidade de um aluno ser admitido nessa faculdade? Gabarito das atividades propostas Questão 1. P(x < 2700 pedidos) = 4,75% Questão 2. a) 99,87% b) 0,62% c) 13,59% Questão 3. a) 11,51% b) 21,19% c) 38,12% Questão 4. P(x > 18 mil reais) = 15,87% Questão 5. P(x > 575 pontos) = 20,33% Amostragem  Quando uma pesquisa/estudo analisa os dados de todo o Universo/grupo que ele tenta compreender, dizemos que está trabalhando com a população. Entre- tanto, muitas vezes, o pesquisador trabalha com tempo, energia e recursos econômicos limitados, tornando possí- vel a análise de apenas parte do grupo de dados retirados da população. Esse grupo denomina-se amostra. Neste capítulo, serão apresentados os elementos im- portantes relacionados ao processo de seleção da amos- tra que fará parte da pesquisa. Com o estudo da teoria da amostragem, espera-se que o aluno conheça as diferentes metodologias de seleção da amostra, bem como compre- enda os procedimentos do cálculo do tamanho mínimo de uma amostra em uma pesquisa. Simone Echeveste Capítulo 6 86 Estatística Aplicada “Frederick Mosteller, estatístico e professor em Harvard, dis- se, certa vez, que é possível mentir usando estatísticas, mas que se mente mais, e melhor, sem estatísticas. É preciso en- tender que as amostras podem levar a conclusões erradas. Contudo, as opiniões pessoais, sem base em dados, levam, em geral, a conclusões muito mais erradas.” Amostragem é o conjunto de procedimentos e técnicas para extração de elementos da população para compor a amostra. O objetivo da amostragem é obter amostras representativas das populações em estudo. As técnicas de amostragem se dividem em: probabilísti- cas e não probabilísticas. As técnicas probabilísticas são aquelas em que todos os elementos da população têm uma probabilidade não nula de seleção. Nas técnicas não proba- bilísticas, não podemos garantir que todos os elementos têm probabilidade de serem selecionados para a amostra. Técnicas de amostragem probabilísticas  Amostra Aleatória Simples Uma amostra aleatória simples é selecionada tal que todos os elementos da população tenham a mesma chance de serem selecionados, por exemplo, por um sorteio.  Amostra Sistemática Uma amostra sistemática poderá ser tratada como uma amostra aleatória simples se os elementos da população estiverem ordenados aleatoriamente, e a seleção será re- Capítulo 6 Amostragem 87 alizada por meio da escolha sistemática, por exemplo, de uma a cada cinco elementos.  Amostra Estratificada Esta técnica consiste em dividir a população em subgrupos, que são denominados estratos. Esses estratos devem ser internamente mais homogêneos do que a população toda, com respeito às variáveis em estudo.  Amostra por conglomerados Chamamos de conglomerado um agrupamento de elemen- tos da população. Por exemplo, numa população de alunos de uma escola, as turmas formam conglomerados de alunos. Técnicas de amostragem não probabilísticas  Amostra por cotas Nesta técnica, a população é vista de forma segregada, dividida em diversos subgrupos. Numa pesquisa socioeco- nômica, por exemplo, a população pode ser dividida por faixas de renda, faixas de idade, nível de instrução etc.  Amostra por julgamento Os elementos escolhidos são aqueles julgados como típi- cos da população que se deseja estudar.  Amostra por fluxo Os elementos são selecionados a partir do fluxo destes em determinado local. Por exemplo, considere uma pesquisa 88 Estatística Aplicada referente à opinião das pessoas sobre a administração da cidade. A amostra pode ser selecionada considerando o fluxo das pessoas no centro de Porto Alegre. As perguntas mais frequentes em relação ao tamanho mí- nimo da amostra podem ser resumidas em três questões apre- sentadas na figura 17. Figura 17 Questões mais frequentes sobre o tamanho da amostra. Nesse contexto, definir o tamanho mínimo da amostra é indispensável para garantir a capacidade de o estudo respon- der aos objetivos propostos considerando o rigor científico in- dispensável em qualquer pesquisa. É importante observar que não existe um tamanho de amostra predeterminado, ou seja, cada pesquisa deve ser realizada considerando sua população e seus objetivos. A determinação do tamanho amostral é realizada mediante fórmulas estatísticas, conhecidas como fórmulas para cálculo de tamanho de amostra que consideram alguns elementos im- portantes apresentados na figura 18. Capítulo 6 Amostragem 89 Figura 18 Elementos que devem ser considerados no cálculo do tamanho mínimo da amostra. Determinação do tamanho mínimo da amostra Quando desejamos coletar uma amostra aleatória de dados que será utilizada para estimar uma média populacional µ, quantos valores amostrais devem ser obtidos? De acordo com TRIOLA (2008), a determinação do tamanho de uma amostra é muito importante, pois amostras desnecessariamente gran- 90 Estatística Aplicada des gastam tempo e dinheiro, e amostras muito pequenas po- dem levar a resultados pobres. Não podemos evitar a ocorrência do ERRO AMOSTRAL, porém podemos limitar seu valor a partir da escolha de uma amostra de tamanho adequado. Obviamente, o ERRO AMOS- TRAL e o TAMANHO DA AMOSTRA seguem sentidos contrários (conforme apresentação da Figura 19, abaixo). Quanto maior o tamanho da amostra, menor o erro cometido e vice-versa. Figura 19 Relação entre o erro amostral e o tamanho da amostra. Cálculo do tamanho mínimo da amostra A) PARA ESTIMAR UMA MÉDIA QUANDO A POPULA- ÇÃO É CONHECIDA Para estimarmos uma média, o cálculo para o tamanho mínimo de amostra necessita das seguintes informações: - Determinação do erro de estimação (e). Capítulo 6 Amostragem 91 - Nível de confiança desejado nos resultados (normalmente, esse valor é estipulado em 95%). Valores de z para níveis de confiança estabelecidos e o tamanho da amostra. Nível de confiança Valor tabela Z 90% 1,645 95% 1,960 99% 2,575 - Tamanho da população de interesse do estudo (N). A fórmula utilizada é: Onde: σ2 – desvio-padrão populacional elevado ao quadrado (vari- ância) Z2 – valor da tabela normal padrão elevado ao quadrado e2 – erro máximo de estimação estabelecido pelo pesquisador N – tamanho da população 92 Estatística Aplicada Exemplo Deseja-se determinar o tamanho mínimo de uma amostra para estimar a média de gastos mensais em supermercado de clientes que possuem o cartão fidelidade, considerando um erro máximo
Compartilhar