Buscar

Resumo Estatistica aplicada

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 26 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 26 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 26 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

ESTATISTICA APLICADA 
Unidade I
Amostragem: fundamentos 
Entendem-se os procedimentos destinados a estudar as relações entre populações e suas amostras. 
--- Através dessas relações, podemos estimar o comportamento de uma população através de amostras retiradas, ou ainda comparar diferentes amostras verificando se as diferenças que elas apresentam são causais ou não casuais. 
· Estimativa por pontos é preterida em favor daquelas realizadas por intervalos, que indicam a precisão ou exatidão. 
· As estimativas por intervalos são dadas por dois números obtidos pela introdução do conceito de erro estatístico. 
REVISÃO DOS CONCEITOS BÁSICOS DE PROBABILIDADES E DISTRIBUIÇÕES DE PROBABILIDADES
Probabilidade: frequência relativa, ou seja, a divisão do número de ocorrências de um evento pelo número total de vezes que essa circunstância foi repetida. 
· Exemplo: se jogarmos uma moeda (que não sabemos a priori se é honesta ou viciada) 1.000 vezes e obtivermos 575 caras, podemos assumir que para ela em particular a probabilidade de se obter cara em uma jogada é de 57,5%, isso porque:
Recordando a simbologia: 
p = probabilidade de ocorrência; (DE OCORRER) 
Fri = frequência relativa, relação entre as frequências simples e total 
fi = frequência simples; (QUANTAS OCORRERAM)
ft = frequência total; no nosso caso, quantas vezes a moeda foi jogada 
 
A diferença entre as tabelas de frequências e as de probabilidades é o tempo em que os eventos ocorrem. 
--- Tabelas de frequência referem-se ao passado ou ao presente. 
--- Distribuições de probabilidades ao futuro. 
O comportamento das amostras e populações não só são bastante proporcionais como, principalmente, os comportamentos probabilísticos dos experimentos estatísticos são previsíveis e equacionáveis, seja qual for o ramo do conhecimento humano trabalhado. 
Distribuição binomial, características: 
• envolvem variáveis discretas; 
• existem apenas dois eventos possíveis, complementares; 
• tratam-se de eventos cujas probabilidades são independentes.
Recordando, a formulação matemática é dada por:
Onde: 
• P(X = x) é a probabilidade que o número de sucessos obtidos seja exatamente igual a x. 
• n é o número de tentativas realizadas.
• x é o número de sucessos que desejamos obter. 
• p é a probabilidade de sucesso em uma única tentativa. 
As informações poderiam ser apresentadas na forma gráfica, mais visual e de melhor entendimento:
São exemplos dessas distribuições a de Poison; a hipergeométrica; a exponencial; a t de student, entre outras, e principalmente a distribuição normal ou distribuição de Gauss, a mais importante de todas. 
O raciocínio é chamado de aproximação da distribuição binomial pela normal. Suponha que no caso da moeda viciada com 57,5% de chances de sair cara sejam efetuadas cem jogadas e não mais apenas nove. Os raciocínios e cálculos são idênticos, apenas mais trabalhosos e cansativos. Usando recursos computacionais e transformando as informações obtidas para a forma gráfica teríamos o seguinte comportamento estatístico:
Caracteristicamente, a distribuição normal é uma curva em formato de sino que atinge um valor máximo coincidente com a média da distribuição. 
--- No caso que estamos focando, o número médio de caras esperado seria de 57,5, como mostra o gráfico e como também estabelece a forma de cálculo da média da distribuição binomial, dado por: µ = Np, no nosso caso, µ = 100 * 0,575 = 57,5 caras. 
Evidentemente, não é possível obtermos 57,5 caras, ou serão sorteadas 57 ou 58, cujas probabilidades de ocorrência, por esse motivo, são calculadas pela fórmula binomial, ou seja:
A largura é dada pelo desvio padrão da distribuição. 
--- No nosso exemplo, como estamos ajustando uma distribuição binomial pela distribuição normal, o desvio padrão seria dado por:
Portanto, existe um desvio padrão de 5 caras para mais ou para menos, o que significa que o mais provável é obtermos em 100 jogadas dessa moeda viciada entre 53 e 63 caras. 
--- Sabemos que essa probabilidade é de aproximadamente 70%. Segue o gráfico explicando:
Conceitualmente, a distribuição normal é usada quando trabalhamos com variáveis contínuas, apesar de ser possível o uso para variáveis discretas, como já visto.
--- A distribuição normal é, portanto, caracterizada por duas informações: a média provável ou também chamada de valor esperado e o desvio padrão dessa média.
· Exemplo: Uma nova máquina, mais automatizada, está nos sendo oferecida pelo fabricante com o argumento de venda de que é mais produtiva. 
--- Em princípio, uma nova máquina nos interessaria se apresentasse uma produtividade acima de 86 toneladas por hora. 
--- Realizou-se um acompanhamento da máquina em produção durante 168 horas, chegando-se na tabela:
--- Em 28 horas trabalhadas a produtividade da máquina esteve entre 80 e 82 toneladas por hora.
Sabemos calcular para essa amostra a média e o desvio padrão, e a tabela a seguir irá nos ajudar nesse cálculo!
O cálculo da média é dado por:
Já o cálculo do desvio padrão obtém-se através de: 
É possível e esperada uma variação. 
--- Essa variação é caracterizada pelo desvio padrão. 
--- É possível que ao longo do tempo a máquina apresente produtividade maior ou menor.
A questão é: qual a probabilidade que isso ocorra? 
Utilize os conceitos de distribuição normal. 
A resposta a essa questão é obtida através do cálculo da área percentual mostrada na figura. Esse cálculo, descrito em estatística, é feito com o auxílio da tabela das áreas sob a curva normal reduzida.
--- Com esse valor de z, entramos na tabela e encontramos uma área tabelada correspondente, no caso, Atab = 0,6628. 
--- Como a área tabelada é a que está à esquerda do valor considerado e a área que queremos está à direita, devemos subtrair a área tabelada de 1, obtendo então a área pedida: A p = 1 – Atab = 1-0,6628 = 0,3372 ou 33,72%. 
Isso quer dizer que a máquina tem 33,72% de probabilidade de operar com produtividade média acima de 86 toneladas por hora. 
Exemplo para calcular qual a condição que atenda a uma determinada circunstância: Imagine que para a máquina mencionada não queiramos correr um risco de mais de 20% de não atingir a determinada produtividade. 
Qual seria essa produtividade?
Entrando na tabela da curva normal reduzida com o valor 0,2000 (ou seja, 20%) encontramos que o valor de z correspondente é de -0,84 (valor mais próximo). Usando a fórmula de equivalência, teríamos:
X= 84,9 - 0,84 x 2,6 --- x= 82,7 toneladas por hora.
--- O risco de a máquina ter uma produtividade menor ou igual a 82,7 toneladas por hora é igual ou menor que 20%
Amostragem: processos e conceitos
População é o conjunto de todos os elementos possíveis que apresentam entre si uma característica comum sendo estudada. 
--- O processo de amostragem, se inicia com a definição de amostra, um “pedaço coerente” da população. 
--- Caso um conjunto de elementos seja realmente uma amostra da população, é correto se afirmar que o comportamento de ambas, população e amostra, serão semelhantes, não idênticos. 
Estimativa: a população e amostra provavelmente terão o mesmo valor para uma determinada medida de tendência central (média, mediana, moda etc.), mas não com exatidão. 
--- ela está sujeita a uma margem de erro, faixa na qual o verdadeiro valor estimado pode se localizar. 
A margem de erro depende basicamente de três fatores que se justapõem: 
• Homogeneidade da população: populações mais homogêneas permitem estimativas mais exatas, com menor margem de erro. Calcular por desvio padrão. 
• Tamanho da amostra: quanto maior for a amostra, maiores serão as previsões a partir delas. 
--- Ocorre, no entanto, que aumentar o tamanho da amostra implica em subir o custo do estudo estatístico. 
• O nível de confiança com que desejamos trabalhar: caso queiramos trabalhar com confiança total (100%), teremos que pagar por isso, e o custo é alto. 
O cálculo em um processo de amostragem é dado: 
• planejar a amostra através da determinação e reprodução percentual das características intervenientes (aquelas queinfluem no que está sendo estudado) da população.
• aplicar os conceitos de estatística descritiva na amostra, determinando as medidas estatísticas que nos interessam (o mais frequente é trabalharmos com a média e o desvio padrão).
 • estimar o comportamento da população através do cálculo da margem de erro.
Podemos dividir os conceitos de amostragem em:
• Teoria Elementar da Amostragem: conhecemos o comportamento estatístico da população e queremos prever como devem se comportar amostras que forem efetivamente retiradas dela. 
• Teoria da Estimação Estatística: aqui desejamos estimar o comportamento estatístico da população a partir de amostras coletadas. 
• Teoria da Decisão Estatística: quando comparamos duas ou mais amostras ou duas ou mais populações entre si, certamente encontraremos diferenças. Essas distinções, no entanto, podem advir de fatores que ocorrem ao acaso (diferenças casuais) ou de elementos devidos às características intrínsecas de cada conjunto (diferenças causais). 
Teoria Elementar da Amostragem
Ao retirarmos amostras aleatórias de uma população, teremos comportamentos diferentes. 
--- Esses valores obtidos irão compor um conjunto ao qual nos referimos como distribuição amostral da referida medida estatística, por exemplo, distribuição amostral das médias.
Entre elas, temos as distribuições amostrais das proporções, distribuições amostrais da soma ou diferença de duas médias, distribuições amostrais da soma ou diferença de duas proporções, etc. 
DISTRIBUIÇÃO AMOSTRAL DAS MÉDIAS
Imagine uma população de grande quantidade de valores, da qual são retiradas todas as amostras possíveis de tamanho N. 
--- Para cada uma dessas amostras, podemos calcular uma determinada grandeza estatística , a qual irá variar em toda amostra. 
--- Todos os valores calculados juntos formarão uma distribuição amostral.
--- Para essa distribuição, podem ser calculados a média e o desvio padrão. 
· Exemplo: Temos uma população composta pelos seguintes valores {2;4;6;8;10}. 
--- Como são poucos números, podemos calcular diretamente a média e o desvio padrão.
Para o cálculo do desvio padrão, seguimos o critério estabelecido por Kazmier (1982), ou seja:
Ao sorteemos ao acaso amostras de tamanho dois dessa população, ou seja, aleatoriamente dois dentre os cinco elementos. 
· Poderíamos obter 25 amostras diferentes:
· Cada uma das amostras retiradas terá evidentemente uma média. 
Utilizaremos uma delas como exemplo: (4;8). Seu valor médio seria 6:
· Assim, todas as outras amostras teriam suas respectivas médias, como mostrado a seguir:
· Imagine que calculemos a média dos números agora apresentados. 
-- Para tanto, bastaria somar as 25 médias e dividir por 25, ou seja, 150 dividido por 25, o que resulta em 6. 
· Podemos observar que as médias das várias amostras obtidas apresentam, cada uma, desvio em relação à média obtida (6). 
· Esses desvios podem ser, cada um deles, elevados ao quadrado:
· A soma de todos esses desvios ao quadrado daria 100. Assim sendo, o desvio padrão seria:
FÓRMULAS USADAS:
Admita que uma determinada população tenha média µ e desvio padrão σ e que retiremos dessa população todas as amostras possíveis de tamanho n.
---- Para cada amostra, calculamos a média, e toda irão compor a distribuição amostral das médias, cuja média é chamada de média da distribuição das médias e simbolizada por µx ; já o desvio padrão da distribuição das médias é simbolizado por σx , sendo o valor de ambos dados, respectivamente, por:
· Exemplo 1: sabemos que a altura média de 5.000 estudantes universitários do sexo masculino é de 1,728 m com desvio padrão de 0,067 m. 
---- Desse grupo, retiramos 100 amostras de 30 estudantes cada uma. Qual é a média da distribuição amostral das médias e qual é o desvio padrão da distribuição amostral das médias? Resolução: 
Observe que nos foram informados os seguintes dados: 
• Média populacional: µ = 1,728. 
• Desvio padrão populacional: σ = 0,067. 
• Tamanho das amostras: n = 30. 
Assim, podemos calcular a média e o desvio padrão da distribuição amostral: x x µ =µ⇒µ =1,728
Sobre esses cálculos, é importante ressaltar: 
• Não estamos considerando todas as amostras possíveis e imagináveis, somente 100 delas estão sendo levadas em conta. Isso faz com que essa não seja a verdadeira distribuição amostral das médias, mas uma amostragem experimental. 
• Esses cálculos foram considerados para uma população muito grande, tão grande que a consideramos infinita. Caso a população não fosse tão grande e a amostragem não fosse feita com reposição, deveríamos fazer uma correção no cálculo do desvio. Essa correção é feita pela multiplicação do valor do desvio padrão pela expressão:
Onde N é o tamanho da população e n o tamanho da amostra. 
---- Assim, o cálculo do desvio padrão ficaria sendo:
Perceba que, na prática, não ocorrem diferenças, em virtude do tamanho muito grande da população.
---- Para Kazmier (1982), a correção seria insignificante e poderia ser omitida sempre que n < 0,05 N. É o que ocorre nesse caso: 0,05 x 3000 = 150. Não precisaríamos usar a correção, porque 30 < 150. 
• Para grandes valores de N (N≥30), a distribuição amostral é quase normal, independentemente do comportamento da população. 
· Exemplo 2: quantas das 100 amostras colhidas apresentarão valores médios acima de 1,735 m?
Resolução: Esse cálculo é feito de modo idêntico ao que realizamos em distribuição normal, ou seja:
R: A probabilidade de que uma das amostras tiradas tenha valor médio superior a 1,735 m é de 28,10%. 
· Exemplo 3: uma máquina produz peças cujo diâmetro médio tem que ser de 25,4 mm, mas com uma tolerância aceitável expressa pelo desvio padrão de 0,8 mm. 
---- Uma vez por turno de trabalho é colhida na produção uma amostra aleatória de 64 peças, que após serem medidas fornecem o cálculo do diâmetro médio da amostra. 
Qual é a probabilidade de uma determinada amostra apresentar diâmetro médio inferior a 25,2 mm?
Resolução: 
• Média populacional: µ = 25,4 mm. 
• Desvio padrão populacional: σ = 0,8 mm. 
• Tamanho das amostras: n = 64. 
Portanto, espera-se que a média amostral seja: X µ =µ= 25,4 E que o erro padrão seja:
Consequentemente, a probabilidade de uma amostra apresentar diâmetro médio abaixo de 25,2 mm será dada pelo cálculo:
R: Existe, uma probabilidade de apenas 2,28% de que o diâmetro médio de uma amostra desse tipo seja inferior a 25,2 mm. 
· Exemplo 4: nas condições descritas do exemplo anterior foi encontrada uma amostra na qual o diâmetro médio calculado foi de 25,8 mm.
---- Qual era a probabilidade de isso ter acontecido e, caso tenha ocorrido, qual o problema apresentado? 
Resolução: Perceba que o cálculo é semelhante ao exemplo prévio, ou seja,
Como desejamos a probabilidade de ocorrência em algo acima da média, devemos fazer o raciocínio de determinação da área pedida, ou seja: 
Ap= 1- Atab = 1-1= 0 ou 0%
Não existe, portanto, probabilidade se uma amostra apresentar diâmetro médio de 25,4 mm.
---- Caso isso tenha acontecido, significa que ela não pode ter saído da população considerada. 
Exemplo 5: nas condições do exemplo 3 foram realizadas amostragens em 30 turnos de trabalhos sucessivos. 
---- Nesse processo foram encontradas 8 amostras cujos diâmetros médios calculados situaram-se abaixo de 25,3 mm, mas acima de 25,0 mm. Isso é possível ou algo está errado nesse método de controle. 
Resolução: Observe que 25,0 mm é o menor diâmetro médio que uma amostra pode apresentar. Aceita-se que uma curva normal tenha existência no intervalo que ocorre do valor na média menos quatro vezes o desvio padrão até a média mais quatro vezes o desvio padrão. Fora desse intervalo, as probabilidades de ocorrência são desprezíveis. Veja figura a seguir:
---- Portanto, é possível termos amostras com diâmetros médios superiores a 25,0 mm (mas inferiores a 25,8 mm, obviamente). A probabilidade de possuirmos diâmetros média inferiores a 25,3 mm (mas superiores a 25,0 mm) é obtida pela repetição dos cálculos dos exemplos anteriores:
A probabilidade de que o diâmetromédio de uma amostra retirada nesse controle esteja entre 25,0 mm e 25,3 mm é, portanto, de 15,87%. Como foram feitas 30 amostragens, é esperado que 4,76 amostras apresentem o intervalo citado (15,87% de 30). 
---- Temos consequentemente um problema. Em termos objetivos, a máquina sofreu uma deterioração gradativa e a produção deve ser paralisada para regulagem do processo. 
· Exemplo 6: um auditor fiscal toma uma amostra de 49 contas a receber de um conjunto de 700 contas existentes em determinada empresa. 
---- Ele sabe que o valor médio da população de contas a receber é de R$ 680,00, mas não conhece o desvio padrão populacional. Verificou, no entanto, que o desvio padrão da amostra é de R$ 86,00.
Qual é a probabilidade que a média da amostra considerada seja igual ou inferior a R$ 640,00? 
Resolução: 
• Média populacional: µ = R$ 680,00. 
• Desvio padrão da amostra: S = R$ 106,00. 
• Tamanho da amostra: n = 49. 
• Tamanho da população: N = 700. 
Note também que a população não é tão grande assim, o que nos obriga a pensar se essa amostragem é com ou sem reposição. 
Vamos nos lembrar da recomendação de Kazmier (1982). Estamos dispensados de usar correção se n < 0,05N. Nesse caso, 49 > 0,05 x 700; fazendo a multiplicação, 49 > 35, portanto, não estamos dispensados do uso do fator de correção. 
Em primeiro lugar, devemos calcular o valor da média da distribuição amostral e do erro padrão:
---- E que o erro padrão seja:
Na prática, sempre que n ≥ 30, podemos usar o desvio padrão da amostra no lugar do desvio padrão da população.
DISTRIBUIÇÃO AMOSTRAL DAS PROPORÇÕES
Uma população seja infinita, que a probabilidade de ocorrência de determinado evento seja p (probabilidade de sucesso) e que retiremos dessa nação todas as amostras possíveis de tamanho n. 
---- Para cada amostra, calculamos a probabilidade de sucesso média, e todas as probabilidades médias calculadas irão compor a distribuição amostral das proporções, cuja média é chamada de média da distribuição das proporções e simbolizada por µp e o desvio padrão da distribuição das proporções (erro padrão) é simbolizado por σ p , sendo o valor de ambos dados, respectivamente, por:
Uma distribuição amostral das proporções se comporta de modo análogo à distribuição das médias, tendo em mente os seguintes fatores: 
• Uma proporção se comporta de acordo com uma distribuição binomial. Por conta disso, utiliza-se a distribuição da binomial aproximada pela normal, desde que o valor de n seja maior ou igual a 30. Kazmier (1982) acrescenta a essa exigência mais duas: que np ≥ 5 e n(1-p) ≥ 5. 
• Ao utilizar a normal como aproximação da binomial, nós precisamos ter em mente que a proporção é uma variável discreta e, será necessário fazer uma correção. 
• Assim como na amostragem das médias, a amostragem das proporções pode ser feita com reposição (ou populações infinitas) ou sem reposição (e populações finitas). A amostragem sem reposição obriga a mesma correção vista anteriormente, ou seja, o uso da correção.
--- onde N é o tamanho da população e n o tamanho da amostra. 
· Exemplo 1: em determinado processo produtivo, 2,4% das peças produzidas são defeituosas. Em dado momento, retira-se dessa produção 500 peças, aleatoriamente. 
Qual é a média da distribuição amostral dessa proporção e seu erro padrão correspondente? 
Resolução: 
• Probabilidade de sucesso: p = 2,4% ou 0,024. 
• Tamanho das amostras: n = 500.
A média e o erro padrão da distribuição amostral:
---- Como a nossa amostra é de 500 itens, teríamos: 
Cada vez que tirarmos uma amostra de 500 peças da produção, o mais provável é que 12 delas (ou 2,4%) sejam defeituosas. 
---- Essa informação está sujeita à tolerância expressa pelo erro padrão de 3,4 peças (ou 0,68%). 
· Exemplo 2: em um processo produtivo, 2,4% das peças produzidas são defeituosas. Em dado momento retira-se dessa produção 500 peças, aleatoriamente. 
Qual é a probabilidade de que dessas 500 peças inspecionadas 3% ou mais sejam defeituosas?
Resolução: Precisamos introduzir o fator de correção para variáveis discretas. Isso é permitido porque o n é suficientemente grande (n ≥ 30), mas é necessário fazer uma correção.
---- A melhor maneira de se entender essa correção é fazer o cálculo utilizando quantidades e não porcentagens. Desejamos calcular a probabilidade de termos 3% ou mais peças defeituosas, ou seja, 15 ou mais peças defeituosas (3% de 500 são 15). Graficamente, teríamos a seguinte situação:
O problema é que esse cálculo está errado. 
O erro está na descontinuidade. 
Observe que a variável que estamos trabalhando é discreta. É possível ter 15 ou 16 peças defeituosas, mas não 15,8. 
--- Por outro lado, a ferramenta usada, a distribuição normal, serve às variáveis contínuas. 
Precisamos corrigir esse fato.
--- Fazemos isso distribuindo a descontinuidade (no caso, o intervalo entre dois números inteiros, 14 e 15, por exemplo) entre os valores permitidos. 
Assim sendo, a partir de agora o valor 15 peças defeituosas é um número entre 14,5 e 15,5. 
O esquema a seguir mostra o efeito da descontinuidade em torno de um determinado valor nominal (no caso do exemplo o valor nominal é 15). 
---- De acordo com a situação especificada (mais ou menos que o valor nominal e se ele é incluído ou não), determina-se a utilização do fator de descontinuidade
Como no cálculo queremos 15 ou mais peças defeituosas, usaremos na fórmula o valor 14,5, representando 15 peças. 
--- Caso o pedido fosse mais de 15 peças, usaríamos o valor 15,5. 
Observe bem, 15 passou a ser um número intervalar, e, portanto, incluí-lo ou não incluí-lo altera o limite considerado. A probabilidade desejada ficaria assim: 
Esse seria então o valor correto pedido. 
Existe uma probabilidade de 22,60% de que em uma amostragem de 500 peças do processo produtivo, 15 ou mais sejam defeituosas. 
---- Note que é consideravelmente diferente dos 18,94% calculados quando não levamos em conta a descontinuidade. 
Entretanto, e se desejássemos fazer o cálculo usando porcentagens e não quantidades? 
O processo seria basicamente o mesmo, mas utilizando-se um fator de descontinuidade percentual:
Sendo, claro, n o tamanho da amostra. 
Nesse exemplo o fator de correção é:
E consequentemente o cálculo das probabilidades, usando as ferramentas da distribuição normal, seria:
R: Confirmou-se o calculado anteriormente, ou seja, existe uma probabilidade de 22,60% de que em uma amostragem de 500 peças do processo produtivo, 3% ou mais delas sejam defeituosas. 
· Exemplo 3: um candidato obteve 48% dos votos em determinada eleição. Em uma seção eleitoral composta de 250 eleitores, quantos provavelmente votaram no referido candidato e qual o erro padrão da previsão? 
Resolução: O valor mais provável de ter ocorrido na seção eleitoral citada é calculado por: 
R: Isso significa que nessa seção eleitoral o candidato citado deverá ter 48% dos votos, mas sujeito a um erro padrão, ou seja, uma variação de 3,16%, e como n é maior que 30 podemos utilizar a distribuição normal para calcularmos as diversas probabilidades envolvidas, como veremos na sequência. 
· Exemplo 4: qual é a probabilidade que o candidato utilizado no exemplo anterior tenha maioria absoluta na seção eleitoral considerada?
Resolução:
A média amostral das proporções é de 48% e o erro padrão, de (16%, podemos utilizar a distribuição normal, desde que consideremos o efeito da descontinuidade).
O fator de descontinuidade será:
Por outro lado, devemos entender que a maioria absoluta significa ter 50 % dos votos mais um voto, ou seja, ter mais do que 50%. Assim, devemos somar a descontinuidade ao valor nominal. 
Efetuando os cálculos, teremos:
R: Portanto, o candidato considerado tem 24,2% de probabilidade de obter maioria dos votos. 
· Exemplo 5: em uma cidade, 53% das crianças nascidas são do sexo feminino. Foi tomada, em dado momento, uma amostra de 500 crianças. 
Qual a probabilidade de que: 
A) Menos de 45% sejam meninos? 
B) Entre 50% e 55% sejam meninas? 
C) Mais de 60% sejam meninas?
Resolução: primeiramentedevemos determinar o valor da média amostral das proporções e seu erro padrão. 
Para meninas:
E para os meninos:
Para o cálculo das probabilidades, podemos utilizar a distribuição normal, visto que n>30, mas considerando o efeito da descontinuidade: 
· Exemplo 6: Uma empresa de material eletrônico forneceu 2.000 lotes de 100 unidades, cada um de determinado componente eletrônico.
A probabilidade de um desses apresentar defeitos é de 4,5%. Em quantos lotes fornecidos:
A) Existem mais de 95 componentes perfeitos?
B) Existem 98 ou mais componentes perfeitos?
Resolução:
Novamente, temos que considerar a descontinuidade caracterizada pelo coeficiente:
ITEM A: Em quantos dos lotes fornecidos existem mais de 95 componentes perfeitos? Somar a descontinuidade.
Queremos 95 componentes perfeitos em lotes de 100 unidades, portanto, nosso objetivo é de 95% de componentes perfeitos. 
R: ---- A probabilidade de um lote apresentar mais de 95 componentes perfeitos é de 50%, portanto, em 2000 lotes 1000 apresentarão mais de 95 componentes perfeitos.
ITEM B: Em quantos dos lotes fornecidos existem 98 ou mais componentes perfeitos? Subtrair a descontinuidade.
R: ---- A probabilidade de um lote apresentar 98 componentes ou mais perfeitos é de 16,60%, portanto, em 2.000 lotes, 332 apresentarão 98 componentes ou mais perfeitos (16,60% de 2.000, ou seja, 0,1660 x 2.000 = 332).
· Exemplo 7: uma empresa de material eletroeletrônico forneceu 2.000 lotes de 100 unidades cada de determinado componente eletrônico. 
A probabilidade de um desses componentes apresentar defeitos é de 4,5%, e 50 desses lotes não foram aceitos por apresentarem excesso de defeitos. Quantos componentes perfeitos esses lotes demonstraram no máximo? 
Resolução: Como vimos no exemplo anterior, os parâmetros dessa distribuição amostral das médias são dados por: µp= 95,5% e σp 2,07% e o coeficiente de descontinuidade é Fc = 0,005. 
Graficamente:
Observe que a área destacada é percentualmente igual à porcentagem de lotes rejeitados por excesso de defeitos. Como foram rejeitados 50 lotes em 2.000, a porcentagem de rejeitos e consequentemente a área percentual é de 2,5%.
Como visto anteriormente, conhecendo uma área da curva normal, determinar os limites desta tal área:
R: os lotes rejeitados tinham 91,44% de peças perfeitas ou menos. Isso significa que em um lote de 100, no máximo 91,44 peças eram perfeitas. 
--- Como não existem 91,44 peças, consideraremos os conceitos de descontinuidade, ou seja, aceitaremos a resposta 91 peças.
DISTRIBUIÇÃO AMOSTRAL DAS SOMAS E DIFERENÇAS
Dadas duas populações das quais são retiradas amostras de nA da população A e nB elementos da população B, a distribuição amostral das somas e diferenças (das médias, das proporções ou de qualquer outra medida estatística) é caracterizada pela soma ou diferença dos valores centrais e pela raiz quadrada da soma dos quadrados dos desvios padrões, divididos pelo tamanho da amostra.
---- O valor amostral esperado é obtido pela soma ou pelas diferenças dos valores aguardados para cada amostra.
---- O erro padrão é sempre obtido pela soma dos erros padrões de cada amostra, conforme mostram as fórmulas a seguir, para as principais medidas.
Para médias
· Somas: 
· Diferenças:
Para proporções
· Somas: 
· Diferenças:
O desvio padrão é a medida estatística que representa, a variação dos elementos de uma amostra (S) ou de uma população (σ) em torno da medida de tendência central (média, mediana, proporção etc.). 
--- As variações de uma amostra ou população não compensam, as variações de outra amostra ou outra população, elas se somam, acrescentam-se as variações de uma à outra.
Como o desvio padrão é tomado ao quadrado, para obter o seu resultante devemos extrair a raiz quadrada
--- Podemos então considerar que o desvio padrão de um processo qualquer é a medida dos problemas, imperfeições, defeitos e volatilidade. 
· Exemplo 1: os amortecedores do fabricante A rodam em média 65.000 km, com desvio padrão de 4.500 km, normalmente distribuídos. 
--- Já os amortecedores do fabricante B duram em média 60.000 km, com desvio padrão de 3.500 km. Suponha que foram testados 36 amortecedores da marca A e 49 da marca B. 
Quais são a média e o desvio padrão da distribuição amostral da diferença entre as vidas úteis?
Resolução:
R: Uma amostra de amortecedores da marca A irá durar, provavelmente, 5.000 km do que a da marca B. No entanto, essa afirmativa é sujeita a um erro padrão de 901 km. 
· Exemplo 2: os amortecedores do fabricante A rodam em média 65.000 km, com desvio padrão de 4.500 km, normalmente distribuídos. Já os amortecedores do fabricante B duram em média 60.000 km, com desvio padrão de 3.500 km. 
Suponha que tenham sido testados 36 amortecedores da marca A e 49 amortecedores da marca B. 
Qual é a probabilidade de que a amostra dos amortecedores da marca A dure 3.000 km a menos do que os da marca B? 
Resolução: Assim como populações e amostras envolvendo esse exemplo são distribuições normais, as distribuições amostrais delas também o serão, portanto, podemos utilizar os conceitos sobejamente conhecidos, para o cálculo das probabilidades.
Existe 1,32% de probabilidade de que a amostra dos amortecedores da marca A durem em média menos do que os 3.000 km dos amortecedores da marca B. 
· Exemplo 3: os resultados de uma eleição mostraram que um candidato obteve 60% dos votos. 
Qual é a probabilidade de que duas amostras aleatórias, cada uma com 200 eleitores, apresentem diferença superior a 10% uma em relação à outra? 
Resolução: Inicialmente devemos calcular a média amostral da diferença entre as proporções e o erro padrão correspondente. Depois, determinar as probabilidades com o uso das ferramentas conhecidas.
A princípio, não deveria haver diferença entre as duas amostras, mas é possível que a amostra A seja maior que a amostra B ou vice-versa, por casualidades. 
--- A probabilidade de que a amostra A tenha 10% a mais de eleitores que a amostra B é calculada da forma costumeira, lembrando que a medida estatística considerada é discreta (não existe meio eleitor), mas como n ≥ 30, podemos aproximar pela distribuição normal, desde que façamos a correção pela descontinuidade.
Como queremos uma diferença superior a 10%, devemos somar a descontinuidade. Teremos:
Devemos lembrar, que o oposto também pode ocorrer, ou seja, existe 1,83% de probabilidade de que a amostra B tenha mais de 10% de eleitores.
R: a probabilidade que uma tenha mais que 10% de eleitores do que a outra é a soma das duas probabilidades: 0,0183 + 0,0183 = 0,0366 ou 3,66%.
· Exemplo 4: um sistema de iluminação é composto de quatro lâmpadas do mesmo tipo ligadas de modo que uma permaneça acesa até queimar, quando então a segunda irá ligar permanecendo acesa até queimar, momento em que a terceira irá se acender, repetindo a ocorrência até a queima da quarta lâmpada. 
Considerando que as quatro lâmpadas tenham vida útil normalmente distribuída com média de 2.000 horas e desvio padrão de 120 horas, durante quantas horas estima-se que o sistema permanecerá funcionando, proporcionando iluminação? 
Resolução: A vida útil do sistema seria, em um mundo perfeito, a soma da vida útil das quatro lâmpadas, ou seja, 8.000 horas. 
---- Mas o mundo não é perfeito, e as lâmpadas podem eventualmente durar mais ou menos dependendo de fatores aleatórios expressos pelo desvio padrão de 120 horas. Dessa forma, estatisticamente poderíamos dizer que o sistema estará em funcionamento durante
Mas sujeito a um erro padrão de:
R: Estima-se, portanto, que o sistema permanecerá funcionando por 8.000 horas, mas com um erro padrão de 240 horas. 
· Exemplo 5: o sistema de iluminação descrito no exemplo anterior poderia permanecer funcionando menos do que 7.800 horas? Qual a probabilidade de que isso ocorra? 
Resolução: O sistema de iluminação segue em sua vida útil uma distribuição normal, portanto, as probabilidades envolvidas podem ser calculadas usando a tabela de distribuição normal reduzida.
R: Consequentemente, devemosafirmar que é possível o sistema permanecer iluminando menos do que 7.800 horas e a probabilidade que isso ocorra é de 20,83%.
Exemplo 6: qual o número de horas máximo e mínimo que o sistema de iluminação descrito no exemplo 4 poderá permanecer funcionando? 
Resolução: A situação descrita segue a distribuição normal, portanto, as probabilidades de ocorrência se situam entre os limites de -4 ≤ z ≤ 4, onde z é a variável normal reduzida; consequentemente, a vida útil máxima do sistema é dada por:
E a vida útil mínima por: 
Unidade II 
· Amostragem: estimação e decisão estatística 
--- Objetivos do módulo: a partir do estudo de uma amostra, estimar-se o comportamento de uma população. 
TEORIA DA ESTIMAÇÃO ESTATÍSTICA 
A princípio, o valor central da amostra é igual ao valor central correspondente da população. 
Por exemplo, tomamos uma amostra de um determinado processo produtivo e ela revelou uma produtividade média de 150 toneladas por hora ( X = 150 t/h). 
--- É lícito pensar que se fosse possível avaliar toda a população (as infinitas vezes em que o processo foi e será repetido), a produtividade média dela seria 150 toneladas por hora também (µ = 150 t/h). 
--- Esse raciocínio é conhecido por estimativa por pontos. Acasos ocasionarão variações que têm que ser de algum modo consideradas.
Estimativa por intervalos: nos conduz ao conceito de fidedignidade da estimativa, que consiste em declarar um intervalo de variação. 
Observação
---- utilizamos a média da amostra ( X ) no lugar da média da população (µ).
---- e o desvio padrão da amostra (S) em vez do desvio padrão da população (σ), visto não conhecermos os parâmetros populacionais (é o que desejamos saber). ----- Espera-se que as médias da amostra, da população e a amostral sejam iguais, por definição de amostragem. 
---- Já a igualdade dos desvios padrões é menos intuitiva, mas pode ser assumida se n ≥ 30 ou se a distribuição for normal. 
---- Quando isso não acontecer, recairemos na Teoria das Pequenas Amostras.
No caso do processo produtivo, estimaríamos que a produtividade estivesse, por exemplo, entre 145 e 155 t/h, portanto, uma estimativa por intervalos. 
Calcular esses intervalos é o nosso problema desta etapa. 
Exemplo numérico. 
Suponha que a população de alunos da UNIP que cursaram Estatística no passado apresente uma nota média igual a 6,2, com desvio padrão igual a 0,4, distribuída normalmente. 
--- Para estudo, retiramos uma amostra de 16 alunos. Qual a nota média amostral decorrente, ou seja, entre que valores essa amostra pode ocorrer? Os parâmetros amostrais seriam:
R: temos 100% de certeza que qualquer amostra de 16 alunos retirada da população de alunos de Estatística da UNIP terá sua média entre 5,8 e 6,6. 
É estatisticamente impossível um valor médio superior a 6,6 ou inferior a 5,8 ocorrer. 
Podemos fazer o raciocínio inverso. 
Caso tomemos uma amostra com X e desvio padrão S, poderemos afirmar com 100% de certeza que o valor real da população estará entre X − S até X + S.
---- Vamos imaginar que temos uma amostra com 25 alunos de Matemática Financeira da UNIP e calculamos sua média e desvio padrão chegando aos valores X = 5,6 e S = 2,5. Podemos estimar que a nota média desses estudantes (todos) estará entre 3,6 e 7,6, com 100% de certeza. Veja os cálculos:
Essa estimativa não é satisfatória, afinal, prever que as notas médias estarão entre 3,6 e 7,6 é pouco melhor do que prever que elas estejam entre 0 e 10 e para isso não precisaríamos de estatística. 
Temos duas maneiras de aperfeiçoá-la. 
· A primeira é aumentar o número de elementos da amostra. 
--- Imagine que pegamos uma amostra de 100 alunos e que ela também apresenta os mesmos valores de média e desvio padrão. Refazendo os cálculos, notaríamos uma melhoria significativa:
Estima-se, portanto, que a média de todos os alunos de Matemática Financeira da UNIP esteja entre 4,6 e 6,6, com 100% de certeza. Reduziu-se pela metade a margem de erro da estimativa, mas o custo foi multiplicado por quatro. 
· A segunda maneira é trabalhar com níveis de confiabilidade, ou confiança, menores, assumindo algum risco de estarmos em desacordo. O gráfico a seguir demonstra esse raciocínio.
Podemos determinar uma confiança a partir do valor crítico ou, ao contrário, estabelecer o valor crítico a partir da confiança desejada, utilizando a tabela da curva normal reduzida. 
Por exemplo, caso queiramos trabalhar com uma confiabilidade de 90%, o valor crítico será de 1,645. Chega-se a esse valor através do raciocínio estabelecido no gráfico a seguir:
Utilizando a tabela da distribuição reduzida, teríamos:
Perceba que a área de 0,0500 é exatamente o ponto médio entre os valores 0,0495 (Z= - 1,65) e 0,0505 (Z= -1,64), daí o valor intermediário igual a -1,645. O sinal negativo será ignorado, por causa da simetria da curva. 
---- Existe um Zc positivo e outro negativo, simétricos.
Vamos voltar ao exemplo dos alunos de matemática financeira. Devemos considerar a amostra original de 25 alunos, e refazer os cálculos para uma confiabilidade de 90%. Como vimos anteriormente, o valor de z, para uma confiabilidade de 90% seria igual a 1,64. Ficaria:
R: Estima-se, que a média de todos os alunos esteja entre 4,8 e 6,4, com 90% de certeza. Isso quer dizer que se tomarmos 100 amostras de 25 alunos cada, em 90 delas estaríamos corretos, mas em 10 delas errados.
Forma geral das estimativas por intervalos: 
Valor estimado = Valor mais provável coeficiente de confiança x erro padrão 
Intervalo de confiança para a média:
Intervalo de confiança para as diferenças de média:
· Exemplo 1: um auditor contábil separou aleatoriamente uma amostra de 45 contas pagas por uma empresa e encontrou um valor médio para elas de R$ 14.900,00 com desvio padrão de R$ 3.600,00. 
Qual foi o valor estimado para a média populacional, com 95% de confiabilidade?
Resolução: A estimativa para a média é dada por:
Para se fazer essa estimativa, precisamos das seguintes informações:
Tamanho da amostra: 45
R: Baseado nesse cálculo e nessa amostra, nós podemos dizer que se estima que as contas dessa empresa tenham um valor médio entre R$ 13.848,00 e R$ 15.952,00 com 95% de certeza.
· Exemplo 2: uma pesquisa eleitoral feita com 2.500 eleitores revelou que o candidato A tinha 45% de intenções de voto para determinado cargo eletivo. 
Qual a estimativa da votação que esse candidato teria se a eleição fosse hoje, com 99% de confiabilidade? 
Resolução: A estimativa para a proporção é dada por:
R: Podemos afirmar que, se a eleição fosse hoje, o candidato A teria 45% dos votos, com uma margem de erro, para mais ou para menos, de 2,6%, com 99% de confiabilidade, ou então dizer que temos 99% de certeza de que ele teria entre 42,4% e 47,6% dos votos.
· Exemplo 3: uma amostra de 300 lâmpadas da marca A apresentou uma durabilidade média de 2.300 horas, com desvio padrão de 200 horas. 
Outra amostra de 150 lâmpadas da marca B apresentou vida útil de 2.000 horas, com desvio padrão de 90 horas. Estime com 90% de confiabilidade a diferença entre as vidas úteis de ambas as marcas de lâmpadas.
Resolução:
R: As lâmpadas da marca A devem durar mais do que as lâmpadas da marca B entre 277,4 horas e 322,4 horas, com 90% de confiança.
· Exemplo 4: uma amostra aleatória, com 250 homens e 320 mulheres, revelou que 150 dos homens e 240 das mulheres apreciaram o design de um novo modelo de automóvel. 
Estime com 98% de confiabilidade a diferença entre a proporção de todos os homens e mulheres em relação a esse novo automóvel.
Resolução:
R: Estima-se que 15% a mais de mulheres do que homens gostem do design desse automóvel, com uma margem de erro de 9,2% e uma confiabilidade de 98% –, ou em outras palavras, a diferença entre mulheres e homens nesse aspecto está entre 5,8% e 24,2%, com 98% de certeza. 
· Exemplo 5: um analista de treinamento deseja estimar o tempo de treinamento em horas para determinado cargo com uma confiabilidade de 95% e erro esperado de 2 horas. 
Baseado em estudos anteriores, ele estima o desvio padrãodas horas gastas em treinamento em 18 horas. Qual é o tamanho de amostra com que deve trabalhar?
Resolução:
R: concluímos que o analista deve trabalhar com uma amostra de 312 elementos.
· Exemplo 6: uma pesquisa com amostra de 100 consumidores detectou que 40% deles preferiam o sabão em pó Lava fácil, em vez de qualquer outra marca. 
Ao se estimar o comportamento de toda a população, com uma confiabilidade de 95%, chegou-se a uma margem de erro inconveniente. O cliente da pesquisa deseja que a estimativa seja feita com um erro de no máximo 5%, mantida a confiabilidade. 
Dessa forma, mais quantos consumidores devem ser pesquisados para atender o estabelecido, supondo que a proporção de consumidores de Lava fácil permanecesse constante?
Resolução:
Observe que o erro esperado, ou margem de erro é:
Para se fazer essa estimativa, precisamos das seguintes informações:
· Erro esperado estabelecido, ou margem de erro: 5% ou 0,05.
R: Como já foram entrevistados 100 consumidores, precisaríamos entrevistar mais 269 consumidores (369 - 100 = 269).
· Exemplo 7: um engenheiro deseja avaliar a diferença entre duas marcas distintas de cabos de aço e para tanto ensaiou uma amostra de 64 cabos de cada marca, chegando aos valores a seguir:
Ao fazer uma estimativa das diferenças de resistência média de todos os cabos de cada uma das duas marcas, chegou a 99% de confiabilidade e percebeu que a margem de erro que não o agradava. Ele deseja reduzir essa margem de erro em 20 kgf. 
Quantos cabos a mais ele deverá ensaiar?
Resolução:
Sendo:
R: Como já foram ensaiados 64 cabos, o engenheiro precisaria ensaiar mais 115 cabos (179 - 64 = 115).
· Exemplo 8: uma amostra de 20 baterias elétricas para uso em tablets revelou uma vida útil média de 30.000 horas com desvio padrão de 2.600 horas. 
Baseado nesses dados, um técnico estimou que as baterias desse tipo tivessem uma vida útil de 30.000±744 horas. 
Qual a confiabilidade dessa estimativa?
Resolução:
Sabemos que o erro da estimativa é igual a 744 horas, que o desvio padrão foi de 2600 horas e que o tamanho da amostra é de 20 baterias. Com esses dados conseguimos determinar o valor de Zc.
Invertendo o raciocínio que utilizamos anteriormente para determinar o valor crítico (zc ), obteremos o valor da confiabilidade da amostra, como mostra a figura a seguir.
R: Podemos então afirmar que o técnico tem 80% de confiança na estimativa que fez.
· Exemplo 9: às vésperas de uma eleição, um importante órgão da mídia informou que, se a eleição fosse naquele momento, o candidato João Honesto venceria com 42% dos votos. 
Afirmou também que a pesquisa havia sido feita com 2.000 eleitores e que a margem de erro era de 1% para mais ou para menos. 
Qual a confiabilidade que essa informação tem? 
Resolução:
A margem de erro foi de 1%, que o candidato teve 42% dos votos na amostra e que seu tamanho era de 2000 eleitores, logo:
· Exemplo 10: Uma pesquisa de mercado pegou a amostra do salário de funcionários de duas empresas concorrentes
Resolução:
R: A estimativa apresenta uma confiabilidade de 86,64%
· Exemplo 11: às vésperas de uma importante eleição foi feita uma pesquisa com 4.866 eleitores que revelou uma polarização entre dois candidatos. 
O candidato A teria 48,7% das intenções de votos, enquanto o candidato B ficaria com 46,1% dos votos. Um importante jornal decide “cacifar” o resultado e coloca na manchete do dia da eleição que o Candidato A será eleito. 
Considerando que não ocorram variações nas intenções de votos, qual é a confiabilidade que o jornal tem dessa informação? 
Resolução: Caso consideremos a estimativa por pontos, o candidato A evidentemente ganharia, pois teria 2,6% de votos a mais, mas vimos que isso não seria preciso. 
---- Ambas as votações têm variações, portanto, precisamos considerá-las. Irá ganhar a eleição o candidato que tiver um voto a mais do que o outro, ou seja, a diferença entre eles deverá ser superior a 0%.
A estimativa da diferença das proporções é dada por:
Perceba que o candidato A deverá ter 2,6% mais ou menos uma variação. 
--- Ele ganhará a eleição se tiver mais 0% dos votos, ou seja, se a margem de erro for abaixo de 2,6%, ele vence. 
Em outras palavras, o valor estimado para a diferença das votações deve ser acima de 0%, e como temos:
Perceba que a confiabilidade calculada de 99% exclui duas áreas na cauda da curva normal.
--- A área da esquerda realmente tem que ser excluída, visto ser a área na qual o candidato B vence e, portanto, a estimativa do jornal estaria errada. 
--- Mas a área à direita não tem motivo para ser excluída, visto que ela se refere à vitória ainda mais expressiva do candidato A, portanto, a favor da previsão do jornal. 
A confiabilidade é calculada em um conceito conhecido como bicaudal, ou seja, caudas de exceção de ambos os lados da curva. 
O nosso problema é de um tipo diferente, o unicaudal. ----- Só faz sentido de um dos lados da curva, no exemplo, à esquerda. 
R: O jornal estaria correto em todos os casos, com exceção das ocorrências da cauda esquerda, portanto, 99,49% (0,9898+0,0051).
TEORIA DA DECISÃO ESTATÍSTICA 
Ao jogarmos certo número de vezes uma moeda honesta (não viciada), o esperado é que em metade das vezes saia cara e na outra metade, coroa. 
Portanto, se jogarmos uma moeda honesta 50 vezes, imaginamos que em 25 delas saia cara. E se saírem 26 caras? Provavelmente a moeda é honesta e por casualidade saiu uma cara a mais. Mas e se saírem 30 caras? 
Causal: ocasionada pela aleatoriedade do experimento. 
Teoria da Decisão Estatística: quando precisamos nos decidir sobre populações a partir de amostras delas retiradas. 
A única maneira de se chegar a uma conclusão é testar a referida moeda e, a partir dos resultados, decidir se ela é viciada ou não. 
-- A hipótese de que ela seja honesta é o que se chama de hipótese nula e é simbolizada por H0 . 
-- Qualquer hipótese que não seja a zero é chamada de hipótese alternativa e simbolizada por H1 . 
Assim sendo, no caso de ela ser honesta, tanto a probabilidade de sair cara como de sair coroa é igual a 0,5, é a hipótese nula (p=0,5). Qualquer ocorrência diferente (p≠0,5) é considerada hipótese alternativa.
Utilizando a distribuição normal, podemos afirmar que é impossível lançar 100 vezes uma moeda honesta e ter menos de 30 caras ou de 30 coroas – e, consequentemente, mais de 70 coroas ou de 70 caras. 
Portanto, se ao coletarmos uma amostra de 100 jogadas dessa moeda saírem mais do que 70 caras (e, consequentemente, menos do que 30 coroas) ou mais do que 70 coroas (e, consequentemente, menos do que 30 caras), a moeda será viciada, nos casos contrários ela será honesta. 
--- Perceba que essa afirmação tem 100% de confiabilidade, já que abrange toda a curva normal. Mas já vimos que esse nível não é muito utilizado na prática. Normalmente, se usam níveis menores de confiabilidade, por exemplo, 95%. 
---- Note que aceitar como honesta uma moeda com toda essa variação (entre 30 e 70 caras ou coroas) na prática é pouco interessante. Iremos trabalhar com menores confiabilidades, por exemplo, 95%. Graficamente teremos:
Com 95% de confiança, afirmamos que a moeda será honesta caso em uma amostra de 100 jogadas não se obtenha mais de 60 caras ou coras ou menos do que 40 caras ou coroas.
Resumindo, caso ao jogarmos 100 vezes a moeda obtenhamos entre 40 e 60 caras ou coroas, assumimos que ela é honesta, caso contrário, entendemos que a moeda é viciada. 
---- Perceba que os valores que correspondem à moeda ser viciada estão nas áreas sombreadas do gráfico, chamadas de região crítica. 
---- Resultados nessas áreas expressam que existem diferenças observadas significativas, o que nos leva a rejeitar a hipótese nula (H0 ).
Essa regra que estabelecemos (aceitarmos a hipótese zero se o número de caras ou coroas estiver entre 40 e 60 e rejeitarmos nos casos contrários) é nomeada como teste de hipóteses ou regra de decisão ou ainda teste de significância. 
---- Nesse assunto estamos sujeitos a dois tipos de erros. 
· Podemos aceitar como falsa umahipótese verdadeira, ou seja, rejeitarmos uma situação que deveria ser aceita. Esse é o chamado erro do tipo I. 
· Podemos aceitar como verdadeira uma hipótese falsa, ou seja, aceitarmos um evento que deveria ser rejeitado. Esse é o chamado erro do tipo II. 
Um teste de hipóteses deve ser planejado para apresentar os menores erros possíveis, seja do tipo I ou do tipo II. Mantido o tamanho da amostra, se nós diminuirmos o erro de um tipo, nós aumentamos o erro do outro.
---- Da nossa decisão sairá o foco da redução do tipo de erro. Via de regra os erros do tipo I são mais importantes e normalmente objeto de tentativa de redução. 
---- Nesse caso, nosso nível de confiabilidade foi de 95%, portanto, temos um risco de 5% de ocorrerem erros do tipo I. Em outras palavras, se fizermos com essa moeda 100 testes e em cada um jogarmos a moeda 100 vezes, em 5 desses testes o resultado cairá na zona sombreada, causando um erro do tipo I.
A esse risco máximo damos o nome de nível de significância do teste (simbolizado normalmente por α). 
---- Na prática, utilizamos níveis de significância de 0,05 (5%) ou 0,01 (1%), mas qualquer outro nível pode ser utilizado. 
Observação 
Perceba que o nível de significância e o nível de confiabilidade são complementares. A soma dos dois sempre será sempre igual a 1 ou 100%. Agora, imagine que tenhamos obtido uma amostra com 42 caras e, portanto, com 58 coroas. 
---- Pela regra de decisão que estabelecemos (moeda é honesta caso saiam entre 40 e 60 caras ou coroas), aceitamos que a moeda é honesta, mas podemos estar incorrendo em um erro do tipo II. 
---- Para evitá-lo, em vez de aceitá-la, simplesmente não a rejeitamos, o que significa que não estaríamos tomando qualquer decisão a respeito. 
Na prática, no entanto, muitas vezes é necessário definir se uma hipótese deverá ser aceita ou não. Isso requer um estudo mais completo dos erros tipo II.
Existem, 04 resultados possíveis em um teste de hipóteses:
· Um exemplo deixa mais claro todo o processo. 
No processo de negociação de uma nova máquina automática o fornecedor informa à empresa compradora que a produtividade dela é de 260 toneladas por hora com um desvio padrão de 43 toneladas por hora. 
---- O comprador decide verificar a veracidade, e consequentemente adquirir ou não a máquina, e para tanto efetua uma amostragem com 36 observações. Para essa amostra, a produtividade média observada foi de 240 toneladas por hora. 
Estabeleça para esses dados: 
• Quais as hipóteses possíveis? 
• Qual o nível de significância que o estudo irá utilizar?
• Qual a regra de decisão? 
• Qual a decisão a ser tomada? 
• Quais os riscos desta tomada de decisão?
A regra de decisão será a seguinte: 
• Aceita-se que o fornecedor informou corretamente a produtividade da máquina se a amostra estiver com valores entre 245,95 e 274,05 t/h. 
• Rejeita-se a informação do fornecedor se a amostra estiver fora dos limites mencionados.
Essa decisão apresenta risco de erros. 
O quadro a seguir resume as possibilidades:
Observe, no entanto, uma peculiaridade nesse exemplo. 
-- O fabricante da máquina afirma que a produtividade dela é de 260 t/h, e como nossa amostra apresentou produtividade de 240 t/h, rejeitamos a produtividade anunciada. Mas e se nossa amostra tivesse registrado uma produtividade média de 280 t/h? 
Teríamos rejeitado também, porque está fora do intervalo estabelecido (245,95 e 274,05 t/h). 
---- No entanto, essa rejeição não teria sentido prático, porque a produtividade seria maior que a alegada pelo fabricante e, portanto, iria nos favorecer mais ainda, na compra da máquina. 
---- Ao resolvermos o exercício adotamos um raciocínio bilateral, rejeitando ambos os extremos da curva normal, e o correto seria usar o raciocínio unilateral, preterindo apenas o lado da curva que nos interessa.
Dessa forma, a resolução do exercício ficaria muito mais adequada com o aspecto prático se: 
• aceita-se que o fornecedor informou corretamente a produtividade da máquina se a amostra estiver com valores superiores à região crítica do teste unilateral; 
• rejeita-se a informação do fornecedor se a amostra estiver na zona crítica do teste unilateral. 
Mantendo o nível de significância em 0,05, o valor de zc seria igual a 1,64, os valores críticos seriam dados por:
· Exemplo 1: um empreendedor pretende assumir uma franquia em determinada região da cidade na qual se alega que a renda média familiar é de R$ 15.000,00. 
---- Não confinado nessa informação, ele faz sua própria pesquisa com 15 famílias e obtém para elas uma renda média de R$ 14.000,00. De estudos anteriores ele sabe que o desvio padrão aceitável para as rendas dessa zona é de R$ 2.000,00. 
Ele deve aceitar a alegação feita com um nível de significância de 5%?
Resolução:
Assim, aceitamos a hipótese se a amostra estiver entre R$ 13.987,86 e R$ 16.012,14, que é efetivamente o caso visto que o empreendedor obteve uma amostra de média de R$ 14.000,00. 
· Exemplo 2: considere que o empreendedor do exemplo anterior não esteja interessado na possibilidade de a renda familiar da região ser maior que R$ 15.000,00 e sim de ser menor. 
Qual seria então a regra de decisão a ser aplicada?
Resolução:
A regra de decisão fica então: aceita-se a hipótese zero se o valor amostral for maior ou igual a R$ 14.153,11 e rejeita-se nos casos contrários (a amostra foi rejeitada)
· Exemplo 3: um fabricante informa que 95% dos pequenos motores elétricos que fornece estão rigorosamente de acordo com as especificações. Um comprador testou 200 desses motores e encontrou 18 defeituosos. 
A afirmação do fabricante pode ser aceita com nível de significância de 1%? 
Resolução: Note que é um teste unilateral, só interessa testar a quantidade de motores fora da especificação; portanto, as hipóteses seriam:
Aceita-se a hipótese zero se a porcentagem de defeitos for menor ou igual a 8,6% e rejeita-se no caso contrário. 
--- A amostra apresentou 18 defeitos em 200, ou seja, 9%; portanto, rejeitamos a afirmação do fabricante com uma significância de 1%. O gráfico da figura a seguir resume a situação calculada.
· Exemplo 4: duas classes em princípio semelhantes foram submetidas a uma avaliação da disciplina de estatística e obtiveram os resultados mostrados a seguir:
Podemos afirmar com um nível de significância de 5% que as classes apresentam diferenças significativas nos seus aproveitamentos? 
Resolução: Vamos supor que as duas classes vêm de populações cujas médias são respectivamente µA e µB
Nesse caso, as hipóteses seriam:
Considerando um teste bilateral, visto que nos interessa saber se há diferenças de uma em relação a outra, teríamos:
· Exemplo 5: como ficaria o teste de hipóteses do exemplo anterior para o nível de significância de 1%?
Resolução: Vamos supor que as duas classes venham de populações cujas médias são respectivamente µA e µB . 
Considerando um teste bilateral, visto que nos interessa saber se há diferenças de uma em relação a outra teríamos: 
O valor crítico de z(Zc) é calculado por:
Dessa forma, podemos supor que no caso de as diferenças entre as notas das classes estarem entre 4,14 e +4,14, verifica-se a hipótese zero, ou seja, são causais; nas situações contrarias, as variações são significativas. 
---- A diferença ente os setores dói de 74 – 78= -4, portanto, não existem diferenças significativas entre os aproveitamentos das classes, no nível de 1% de significância. 
Murray Spiegel (1993) afirma que alguns estatísticos fazem a seguinte distinção terminológica: 
Usando esse conceito terminológico nos exemplos 4 e 5 poderíamos afirmar que os resultados são provavelmente significativos, visto que estão no nível de 5%, mas não significativos no nível de 1%. 
· Exemplo 6: uma pesquisa médica trabalhou com dois grupos de pacientes portadores da mesma doença, cada um deles com 100 elementos. 
--- Ao grupo A ministrou uma nova medicação em desenvolvimento, enquanto ao grupo B administrou apenas placebo (substância com aparência medicamentosa, mas sem princípios ativos), para que elese comportasse como grupo de controle. Todas as demais condições foram mantidas idênticas.
--- Terminado o teste, constatou-se que 75 pessoas do grupo A tinham sido curadas, contra 65 indivíduos do grupo B. 
Teste a hipótese de o medicamento ministrado auxiliar na cura com um nível de significância de 5%.
Resolução:
As proporções de cura para os dois grupos seriam:
Portanto, a amostragem apresentou uma diferença de 0,1 ou 10% a favor da medicação. Esse resultado é significativo?
Observe que se trata de um teste unilateral, portanto:
Portanto, as diferenças serão significativas se o número de pessoas curadas com medicação for superior a 10,6 daquelas curadas sem medicação.
---- A diferença, no entanto, é de 10 indivíduos (75 - 65), ou seja, a medicação não apresenta variações significativas no nível de 5% de significância.
Portanto, a discrepância de resultados é devida ao acaso nesse nível de significância. 
· Exemplo 7: como ficaria o exemplo anterior no caso de um nível de significância de 10%?
Resolução:
As propostas de cura para os dois grupos seriam:
Portanto, a amostragem apresentou uma diferença de 0,10 ou 10% a favor da utilização da medicação. Esse resultado é significativo?
O teste de hipóteses seria montado da seguinte forma:
Observa que se trata de um teste unilateral, portanto:
Como a diferença foi de 10 pessoas (75 - 65), a medicação apresenta diferenças significativas no nível de 10% de significância. Portanto, ela é significativa. 
Unidade III
· Regressão e correlação: objetivos do módulo
-- Correlação: é um parâmetro que indica o grau de correspondência entre duas variáveis, ou seja, a correlação mostra a intensidade com a qual dois conjuntos de dados estão relacionados mutuamente. 
Eventualmente, uma variável está correlacionada a outra, de maneira mais ou menos intensa, provocando questões do seguinte tipo: 
• A quantidade de livros que uma pessoa já leu está relacionada com sua escolaridade? 
• Em que grau o peso de uma pessoa está relacionado com sua altura? 
CORRELAÇÃO LINEAR
Exemplo: um trabalhador deve ganhar mais se tiver maior escolaridade; uma pessoa mais alta deve pesar mais.
---- Como determinar a veracidade de uma relação de causa e efeito? 
As questões mencionadas podem ser resumidas a duas variáveis, nomeadas rotineiramente por variável independente (xi ) e variável dependente (yi ). 
---- Qual é o nível dessa dependência?
É lógico supor que a produtividade de um processo químico (variável dependente) depende em boa parte da qualidade da matéria-prima utilizada (variável independente).
Para determinar a verdade ou a falsidade de uma relação de causa e efeito, e o nível dessa eventual relação, é calcular o coeficiente de correlação que existe entre as variáveis. 
---- O mais usado entre essas medidas é o linear, chamado de coeficiente de correlação linear de Pearson, dado pela expressão:
Onde Xi é a chamada variável independente
E Yi:é a variável dependente, ou seja, que está correlacionada (ou não) à variável dependente. 
n: O número de pares ordenados (x;y).
E os valores são todos decorrentes de somatórios.
---- Essa correlação pode existir ou não e ser mais ou menos intensa, confirme o valor do coeficiente de Pearson.
Correlação linear positiva significa que, se uma variável aumenta, a outra variável também sobe, ou então se uma variável diminui, a outra também cai. 
Exemplo: considerando-se que os ganhos de uma pessoa estejam relacionados à sua escolaridade, teremos uma correlação positiva. 
--- Aumentando a escolaridade (variável independente), subirão os ganhos (variável dependente). 
--- Dizemos que causa e efeito são diretamente proporcionais.
Correlação linear negativa significa que, se uma variável aumenta, a outra variável diminui, ou então, se uma variável diminui, a outra aumenta. 
Exemplo: à medida que o automóvel envelhece (aumenta a variável independente, anos de uso), cai o seu valor de mercado (variável dependente). 
--- O cálculo do coeficiente de correlação não apresenta grandes dificuldades conceituais, sendo mais um trabalho braçal. 
· Exemplo 1: suponha que uma empresa de confecções queira avaliar se suas despesas com publicidade estão repercutindo favoravelmente em suas vendas. 
--- Para tanto levantou, os gastos de publicidade e as vendas em cinco meses diferentes, os quais estão relacionados na tabela a seguir. 
Calcule a resposta para a empresa.
A resposta a essa questão é o cálculo do coeficiente de correlação linear. 
--- Em tese, as vendas da empresa estão relacionadas com os gastos de publicidade. 
Nesse cenário, o coeficiente será positivo e poderemos afirmar que os gastos com publicidade realmente repercutem de modo favorável nas vendas; caso contrário, a resposta será negativa. 
--- Caso o coeficiente seja positivo, quanto mais próximo de 1, maior será a repercussão da publicidade nas vendas. 
Da tabela, tiramos as informações necessárias para o cálculo do coeficiente:
R: Existe, portanto, entre as duas variáveis uma correlação positiva forte, ou seja, do ponto de vista prático, interessante, para essa empresa, investir.
· Exemplo 2: o gerente de produção de uma empresa têxtil argumenta, visando aumentar suas verbas para treinamento, que o índice de 2ª qualidade dos produtos está fortemente relacionado com o tempo de treinamento dado aos funcionários. 
--- Para justificar sua tese, ele fez um levantamento com 8 funcionários relacionando as semanas de treinamento aplicadas a cada um com o índice de defeitos que eles faziam. 
O gerente tem razão na sua exposição? 
O gerente, espera que o coeficiente de correlação obtido seja um número negativo e próximo de 1.
---- Isso provaria a argumentação dele, já que aumentando o número de semanas de treinamento diminuiria o índice de defeitos. Ele deseja uma correlação linear negativa.
Observe que as porcentagens devem ser transformadas em valores decimais.
Da tabela, tiramos as informações necessárias para o cálculo do coeficiente:
R: Existe, portanto, entre as duas variáveis uma correlação negativa forte, ou seja, o ponto de vista do gerente de produção é respaldado pela avaliação estatística.
REGRESSÃO LINEAR
No exemplo 1 foi determinado que para a empresa em pauta os gastos com publicidade tinham correlação direta e forte com as vendas obtidas. 
Mas e se quiséssemos ir além e estimar quanto seria vendido caso os gastos com publicidade fossem de R$ 180.000,00? 
É necessário estabelecer um relacionamento matemático entre as duas variáveis. 
--- Trata-se do processo de traduzir o comportamento conjunto de duas variáveis na forma de uma lei matemática denominada equação de regressão. 
A regressão é linear quando essa lei matemática mencionada é uma reta – portanto, uma equação de 1º grau. 
--- O critério normalmente utilizado para a definição desta reta é o chamado método dos mínimos quadrados. 
Equação de uma reta é dada pela fórmula: y= ax + b.
--- Onde a e b são os chamados coeficientes da reta, que caracterizam e particularizam cada situação prática considerada. 
--- O coeficiente angular a (aquele que define o ângulo da reta e se ela é crescente ou decrescente) é dado por:
Onde:
--- O coeficiente b (chamado de termo independente e que caracteriza a ´´altura´´ da reta no plano ortagonal é dado por:
Onde:
--- Dessa forma, a equação da reta interpoladora é dada por: 
Onde, evidentemente, y é a variável dependente e x a variável independente. 
EXEMPLO PASSO A PASSO:
· Exemplo 1: a tabela a seguir mostra a evolução de duas variáveis possivelmente correlacionadas.
Determine a equação de regressão linear decorrente.
Resolução:
1° PASSO: Cálculo do coeficiente da correlação linear:
2° PASSO: Cálculo da média e do desvio padrão da variável x:
3° PASSO: Cálculo da média e do desvio padrão da variável y:
4° PASSO: Cálculo do coeficiente Ky:
5° PASSO: Definição da equação da reta procurada:
--- A partir da determinação da função linear podemos prever valores de y para um dado valor de x, com os devidos cuidados que previsões estatísticas devemconsiderar. 
---- Exemplo: saber qual o valor da variável dependente (y) quando a variável independente (x) assume o valor 18.
· Exemplo 2: uma fábrica de cervejas acredita que o volume de vendas dos seus produtos está diretamente relacionado com a temperatura média do período considerado. 
Para comprovar ou refutar essa crença, um analista levantou os dados necessários resumidos a seguir. 
A partir destes dados, pergunta-se: 
A) Existe realmente correlação entre volume de vendas e temperatura média do período? 
B) Qual a expressão matemática que relaciona essas duas variáveis? 
C) Caso haja correlação entre as variáveis, qual seria o volume de vendas caso a temperatura média do período fosse de 35 ºC? 
D) Qual a temperatura média que produziria um volume de vendas de 90 mil unidades, se houver correlação entre as variáveis mencionadas? 
Resolução: 
------- Item A: 
Devemos calcular o coeficiente de correlação de Pearson, utilizando a tabela: 
Da tabela tiramos as informações necessárias para o cálculo do coeficiente:
R: Existe, portanto, uma correlação forte entre vendas e temperaturas médias dos períodos considerados. 
------- Item B: 
A expressão que relaciona as duas variáveis é a função de regressão linear. Para defini-la precisamos das médias e dos desvios padrões de ambas as variáveis, conforme a tabela anterior e a que se segue.
Cálculo da média e do desvio padrão da variável x:
Cálculo da média e do desvio padrão da variável y:
Cálculo do coeficiente Ky:
------- Item C: 
Para 35°, o volume de vendas estimado seria de:
------- Item D: 
Para um volume de vendas de 90 mil unidades, a temperatura estimada seria de:
· Exemplo 3: uma emissora de televisão deseja saber se existe correlação entre a idade dos seus telespectadores e a quantidade de minutos que permanecem assistindo aos seus programas. 
---- Para tanto, acompanhou oito telespectadores de diferentes idades, chegando aos dados a seguir. 
Ela pode afirmar que essa correlação existe? Resolução: devemos calcular o coeficiente de correlação de Pearson para responder a essa questão
Dados para o cálculo do coeficiente:
R: O número é praticamente igual a zero, o que indica não existir correlação entre essas duas variáveis.
· Exemplo 4: uma empresa deseja ter expressão matemática que exprima a relação entre preço de seu produto e unidades vendidas, para estimar as vendas em função do preço do produto. 
--- Para tanto, levantou cinco ocorrências reais.
Quais seriam a expressão procurada e os valores de vendas estimadas para preços do produto iguais a R$ 200,00 e a R$ 150,00? 
Resolução:
---- Cálculo do coeficiente de correlação:
Dados para o cálculo do coeficiente:
Cálculo da função linear de regressão:
Cálculo da média e do desvio padrão da variável x:
Cálculo da média e do desvio padrão da variável y:
Definição da equação da reta procurada: 
Assim sendo, para os preços fixados teríamos:
Graficamente:

Continue navegando