Buscar

AULAS 6 A 10 ESTATÍSTICA APLICADA

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 23 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 23 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 23 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

AULAS DE ESTATÍSTICA APLICADA PARTE 2 – AULAS 6 AO 10
AULA 06: GRÁFICO
ELABORANDO UM GRÁFICO
Para a elaboração de um gráfico devem ser considerado os seguintes itens:
a) Um título geral indicando a situação estudada, época e local;
b) escalas e as respectivas unidades de medida; (EIXO TEM QUE COMEÇAR EM 0)
c) convenções adotadas;
d) fonte de informação assinalando de onde foram retirados os valores.
Os gráficos podem ser classificados de várias maneiras:
QUANTO À FORMA
a) Diagramas: gráficos geométricos dispostos em duas dimensões.
b) Cartogramas: ilustrações relativas a cartas geométricas.
c) Estereogramas: gráficos volumétricos com três dimensões.
QUANTO AO USO
a) Gráficos de Informação: destinados ao público em geral, sendo apresentados de forma completa e clara.
b) Gráficos de Análise: tabelas de informação técnica e qualitativa.
· VARIÁVEIS QUALITATIVAS nominais ou ordinais.
Ex.: grau de escolaridade (qualitativa ordinal, segue uma ordem)
· Gráfico de barra na vertical ou horizontal.
A frequência pode ser feita pela absoluta ou relativa (%).
· Gráfico de setores ou pizza
· Diagrama de Pareto: o gráfico sempre será em “escadinha”, ou seja, a barra mais alta à esquerda e vai diminuindo, pois este é o objetivo do gráfico, explorar os principais problemas. 
· VARIÁVEIS QUANTITATIVAS – dicretas (nº inteiro) ou contínuas (assume valores decimais).
· Gráfico de barras na vertical (a frequência é absoluta ou relativa em %)
· Algumas vezes temos que construir tabelas com intervalos de classe, e o melhor gráfico para isso é o histograma. (o limite de classe coincide com o do seguinte, por isso não há espaçamento).
· Blogspot: verifica (assim como o histograma) se há simetria ou não de uma distribuição. Para haver simetria, precisaria estar em “forma de sino”.
· Gráfico de linha: analisa o comportamento da variável numa série histórica. 
· Gráfico de dispersão: 2 variáveis no ponto cartesiano, verificando se há alguma relação pela disposição destes.
TIPOS DE GRÁFICOS
Histograma
É formado por um conjunto de retângulos justapostos, de tal forma que a área de cada retângulo seja proporcional à frequência da classe que ele representa. Os retângulos terão como base o eixo das abscissas, cuja largura será igual a amplitude do intervalo de classe.
Diagrama 
Apresenta as frequências sob a forma de colunas verticais ou de barras. São empregados para representar frequência de dados categóricos ou nominais.
Gráfico de Pareto
Representa as frequências simples ou relativas das classes ou dos valores analisados, de forma ordenada, geralmente da classe de maior frequência para a de menor frequência. É considerado uma ferramenta para a Qualidade Total, no campo da gestão de empresas.
Gráfico de Ogiva
Representa as frequências geralmente mostradas no histograma.
Gráfico Boxplot
Representa a dispersão dos dados, revelando a mediana e os quartis (que são medidas de posição).  
Assim, é possível verificar a posição central do conjunto ordenado dos dados, denominado mediana, e as subdivisões das séries ordenadas, denominadas quartis.
Gráfico de Setores
Representa as frequências relativas ou simples sobre a forma de setores de círculo.  Também é denominado “Gráfico de Pizza”.
Gráfico de Dispersão
Mostra a relação gráfica existente entre duas variáveis numéricas, como custos e vendas.
Pictograma
Construído a partir de figuras ou conjuntos de figuras representativas da intensidade ou das modalidades do fenômeno.
Falhas na elaboração de gráficos
Vejamos:
• Gráfico sucata
• Ausência de Base Relativa
• Eixo Vertical Comprimido
• Ausência do Ponto Zero
AULA 6 TELETRANSMITIDA
ESTATÍSTICA APLICADA
GRÁFICOS
O objetivo da utilização de gráficos em análise de dados é o de facilitar a compreensão do fenômeno estatístico por meio do efeito visual imediato que os gráficos proporcionam.
TIPOS DE GRÁFICOS
•Gráfico em linhas
•Diagramas de área (colunas, barras e setores)
•Gráfico para representar distribuições de frequências agrupadas em classes: histograma e polígono de frequências.
Segundo VIEIRA (2013, p. 17), cada tipo de gráfico tem indicação específica, mas, de acordo com as normas brasileiras:
•Todo gráfico deve apresentar título e escala;
•O título deve ser colocado abaixo da ilustração;
•As escalas devem crescer da esquerda para a direita e de baixo para cima;
•As legendas explicativas devem ser colocadas, de preferência, à direita da figura;
•Os gráficos devem ser numerados na ordem em que são citados no texto.
GRÁFICO EM LINHAS : É um tipo de gráfico apropriado quando as observações do conjunto de dados são feitas ao longo do tempo. Tais conjuntos de dados constituem as chamadas séries históricas, ou séries temporais.
Estas séries mostram o comportamento de um fenômeno em certo intervalo de tempo. 
DIAGRAMAS DE ÁREA : Os gráficos em colunas, barras e setores são bastante utilizados quando estamos trabalhando com variáveis qualitativas.
As colunas (ou barras) comparam rapidamente o tamanho das categorias por meio das frequências ou frequências relativas (%).
Lembrando: Frequência relativa em porcentagem: frequência x100
 Nº total de elementos
Ex.: 3.609.979 x100 = 69,94
 5.161.379
DIAGRAMA DE PARETO: Quando construímos o gráfico de barras para variáveis qualitativas e as barras são arranjadas em ordem descendente de altura, a partir da esquerda para a direita, com o atributo que ocorre com maior frequência aparecendo em primeiro lugar, denominamos este gráfico de barras de Diagrama de Pareto.
Podemos representar as informações contidas na Tabela 2 através do Diagrama de Pareto.
GRÁFICOS PARA DADOS AGRUPADOS EM CLASSES
Os gráficos apresentados a seguir são bastante utilizados quando queremos representar um conjunto de dados cujos mesmos foram agrupados em classes.
Um histograma é semelhante ao diagrama em barras, porém não há espaços entre as barras. Os intervalos de classes são colocados no eixo horizontal enquanto as frequências são colocadas no eixo vertical. 
 As frequências podem ser absolutas ou relativas.
O polígono de frequências é um gráfico de linha de uma distribuição de frequências. No eixo horizontal são colocados os pontos médios* de cada intervalo de classe e no eixo vertical são colocadas as frequências absolutas ou relativas (como no histograma)
O histograma e o polígono de frequências são gráficos alternativos e contêm a mesma informação. Fica a critério de quem está conduzindo o estudo a escolha de qual deles utilizar.
*soma os limites e divide por 2; Ex.: (750+ 1062)/2 =906
Há 6 pontos médio na Figura 1.6, e na 1.7 tem 8, porque para trabalhar com o polígono, precisa fazer com uma imagem fechada, não pode ter pontos ”voando” na imagem.
Falhas na elaboração de gráficos
Entre os principais erros na elaboração de gráficos, podemos mencionar:
•Gráfico sucata.
•Ausência de base relativa.
•Eixo vertical comprimido.
•Ausência do ponto zero.
Gráfico sucata
Neste tipo de gráfico há figura demais, ocultando a informação que se deseja transmitir.
Eixo vertical comprimido
	
Ausência do ponto zero
A ausência do ponto zero em uma figura pode disfarçar a análise, aumentando ou diminuindo demasiadamente eventuais variações. 
Devemos analisar a informação numérica fornecida no gráfico, de modo a não nos enganarmos por sua forma geral
Figura 1.10: PIB municipal em 2008.
AULA 07 
ESTATÍSTICA APLICADA
DISTRIBUIÇÕES DE AMOSTRAGENS
Vídeo: 
População: conjunto formado por todos os elementos que se deseja estudar (uma ou mais características)
Amostra: subconjunto da população.
Parâmetro: medida numérica desconhecida da população
Estimador: função utilizada em cima dos dados amostrais para conseguir conhecer os parâmetros que são desconhecidos. Assim, terá uma Estimativa.
Sempre que se trabalha com amostras e não com o senso, se está sujeito a erros.
Problemas dos métodos de amostragem
Zentgraf (2007) aponta que os métodos de amostragem podem apresentar alguns problemas em suaaplicação quando:
• A população for muito pequena;
• Os dados da população apresentarem volatilidade alta;
• Houver casos de necessidade de previsão absoluta;
• Os dados da população já estiverem disponíveis.
Esse erro amostral existe independente da forma ou critérios de como uma determinada pesquisa foi elaborada.
Exemplo : Considere que, ao analisar 10.000 notas de Estatística do nosso EAD, verificamos uma nota média de 6, com desvio padrão de 1,2. Porém, ao retirar uma amostra de 50 alunos, verificamos uma nota média e desvio padrão diferentes do que o mensurado pela população.
Video: Mi = “u com perninha”= média populacional 
sigma= “o com perninha” = desvio padrão populacional 
O sigma ao quadrado é a variância populacional
P = proporção populacional.
Conforme N aumenta, a distribuição das estatísticas se apresentam em forma de sino.
Conforme se aumenta o valor da amostra, a variância vai diminuindo.
Proporção populacional: 
Erro padrão
Na pratica, uma pesquisa dificilmente é realizada com mais de uma ou duas amostras. Seria difícil, dessa forma, chegar à chamada média das medias.
O erro padrão da média é calculada pela divisão do desvio padrão da população pela raiz quadrada do tamanho da amostra. Vejamos:
δx = δ / √n
erro padrão é a raiz quadrada da variância desse estimador 
Entretanto, em casos de uma nova amostragem ser feita em uma população finita sem reposição, os resultados novamente se distorceriam. A média e desvio padrão da população sem a amostra retirada se alteraria.
Para isso, é necessário que possamos ter um fator de correção para populações.
√(N - n) / (N - 1)
Onde:
n = tamanho da Amostra
N = tamanho da população
Vamos a mais um cálculo...
Considere que a média de uma população seja de 50 e o desvio padrão 12. Considere também um tamanho da amostra de 36 escolhida de uma população de 100.
Calcule:
• Erro padrão da distribuição.
• Fator de correção.
Calculando o erro padrão da distribuição temos:
δx = δ / √n = 12 / √36 = 12 / 6 = 2
√ (N - n) / (N - 1) = √ (100 - 36) / (100 - 1) = 0,80
Logo, multiplicamos o fator de correção pelo erro padrão da distribuição: 2 x 0,8 = 1,60
Atividade proposta
O valor médio em dólar das vendas de um determinado produto no último ano é conhecida como seguindo a distribuição normal com media de R$ 3.400,00 por revendedor a varejo, com desvio padrão de R$ 200,00. Se um grande número de revendedores comercializar o produto, determine o erro padrão da média para uma amostra de tamanho n=25.
δx = δ / √n =
200 / √25 =
200 / 5 =
40
Entretanto, em casos de uma nova amostragem ser feita em uma população finita sem reposição, os resultados novamente se distorceriam. A média e desvio padrão da população sem a amostra retirada se alteraria.
Para isso, é necessário que possamos ter um fator de correção para populações.
√(N - n) / (N - 1)
Onde:
n = tamanho da Amostra
N = tamanho da população
AULA TELETRANSMITIDA
ESTATÍSTICA APLICADA
A Inferência Estatística é um conjunto de técnicas muito utilizadas em problemas práticos do dia-a-dia. Com estas técnicas podemos tirar conclusões acerca de uma população de interesse utilizando informações de uma amostra aleatória.
As técnicas mais importantes e utilizadas da Inferência Estatística são: Estimação e Teste de hipóteses.
Conceitos Básicos
Parâmetro é uma quantidade numérica, em geral desconhecida, que descreve uma característica da população. Normalmente é representado por letras gregas como , entre outras.
Estimador é uma função dos valores da amostra que utilizamos para estimar um parâmetro populacional. Os estimadores, em geral, são representados por letras gregas com acento circunflexo: etc.
Estimativa/Estatística é o valor numérico obtido através do estimador.
Erro amostral é a diferença entre o resultado amostral e o verdadeiro resultado da população; tais erros resultam de flutuações amostrais devidas ao acaso.
Erro não amostral ocorre quando os dados amostrais são coletados, registrados ou analisados incorretamente. Por exemplo: os dados são selecionados através de uma amostra tendenciosa, uso de um instrumento de medida defeituoso ou o registro incorreto dos dados.
Estimação
A estimação de parâmetros pode ser feita através de uma estimativa pontual ou através de uma estimativa intervalar.
Estimativa pontual: um único valor é usado para estimar um parâmetro populacional.
Intervalo de confiança (ou estimativa intervalar): é uma faixa (ou intervalo) de valores usada para estimar o verdadeiro valor de um parâmetro populacional.
· Estimativa pontual: A média amostral é a melhor estimativa pontual da média populacional
Exemplo 1:
A sua empresa vende roupas e equipamentos esportivos pela internet. Para planejar as roupas, você coleta dados sobre as características físicas dos seus diferentes tipos de fregueses. Os pesos (em kg) de uma amostra de 24 corredores homens estão apresentados a seguir. Suponha que estes corredores possam ser vistos como uma amostra aleatória de todos os seus potenciais clientes do sexo masculino. 
Encontre a estimativa pontual para a média da população da qual a amostra foi extraída.
67,8 61,9 63,0 53,1 62,3 59,7 55,4 58,9 60,9 69,2 
63,7 68,3 64,7 65,6 56,0 57,8 66,0 62,9 53,6 65,0 
55,8 60,4 69,3 61,7 
 Estimativa pontual: 
· Estimativa intervalar
•Um estimador pontual produz um único número como estimativa do parâmetro. Esse procedimento não permite julgar qual a possível magnitude do erro que estamos cometendo. 
•Um intervalo de confiança nos informa a precisão da estimativa pontual obtida.
•Intervalos de confiança são obtidos através da distribuição amostral de seus estimadores.
A distribuição amostral de um estimador é a distribuição de todos os valores do estimador quando todas as amostras possíveis de mesmo tamanho n são extraídas da mesma população.
	
	
ESTATÍSTICA APLICADA
AULA 08 
INTERVALOS DE CONFIANÇA
Distribuição da Curva Normal
Para compreendermos a aplicação do Intervalo de Confiança, precisamos ter noções sobre a Distribuição da Curva Normal.
Características da distribuição normal:
· A variável pode assumir qualquer valor real;
· O gráfico da distribuição normal é uma curva em forma de sino, simétrica em torno da média;
· A área total sob a curva vale 1, porque corresponde à probabilidade de a variável aleatória assumir qualquer valor real;
· Como a curva é simétrica em torno da média, os valores maiores e os menores do que a média ocorrem com igual probabilidade;
· A configuração da curva é dada por dois parâmetros: a média e a variância. Mudando a média, muda a posição da distribuição; mudando a variância, muda a dispersão da distribuição.
Agora que você já conhece as características da distribuição normal, confira a figura dos gráficos de cada uma das situações abaixo:
Distribuição Normal
Duas Distribuições Normais de mesma variância e com médias diferentes
Duas Distribuições Normais de mesma média e com variâncias diferentes
Os intervalos de confiança mais utilizados são os de 90%, 95% e 99%, seguindo a tabela a seguir.
Os modelos de aplicação do Intervalo de Confiança são baseados na premissa de que a distribuição normal pode ser usada com os seguintes dados: sempre a amostra deve ser igual/superior a 30; quando for menor do que 30, o desvio padrão é conhecido.
VÍDEO: Na inferência estatística existem duas técnicas: estimação e de hipótese. Na área de estimação, temos estimativas pontuais (somente 1 resultado) e intervalares.
Para se ter uma estimativa intervalar, precisa-se do estimador pontual e de algumas características da variabilidade do estimador.
Cálculo de um intervalo de confiança
Para calcular um intervalo de confiança, utiliza-se a seguinte fórmula:
Xm +- Z δ x
	Xm é a média
	Z é o número de Unidades de Desvio Padrão a partir da Média
	δ x é o erro amostral
AULA 08 
TELETRANSMITIDA
DISTRIBUIÇÃO NORMAL 
Nesta aulainiciaremos o estudo da distribuição contínua de probabilidade mais importante em Estatística: a distribuição normal. 
A distribuição normal pode ser usada para modelar uma variedade de fenômenos físicos naturais, estudos de comportamento humano, processos industriais, etc., e desempenham papel importante nos métodos de inferência estatística.
Propriedades de uma distribuição normal
O gráfico da distribuição normal é chamado de curva normal. A distribuição normal tem as seguintes propriedades:
· A média, a mediana e a moda são iguais.
· A curva normal tem formato de sino e é simétrica em torno da média.
· A área total sob a curva normal é igual a 1.
· A curva normal aproxima-se mais do eixo x à medida que se afasta da média em ambos os lados, mas nunca toca o eixo.
Função densidade de probabilidade
INTERVALO DE CONFIANÇA
As escolhas mais comuns para o nível de confiança e, consequentemente, os respectivos valores críticos obtidos da distribuição normal são:
A escolha de 95% é a mais comum porque resulta em um bom equilíbrio entre precisão (que é refletido na largura do intervalo de confiança) e confiabilidade (conforme expresso pelo nível de confiança).
INTERVALO DE CONFIANÇA PARA A MÉDIA POPULACIONAL
	
	
AULA 09 
ESTATÍSTICA APLICADA
DISTRIBUIÇÃO NORMAL
Denomina-se distribuição normal reduzida a distribuição normal de média zero e variância.
As probabilidades associadas à distribuição normal reduzida são facilmente obtidas em tabelas (Área sob a curva normal padronizada compreendida entre os valores 0 e Z).
Daí o interesse em estudar esse tipo particular de distribuição.
Exemplos:
A área total sob a curva normal vale 1. Isto significa que a probabilidade de ocorrer qualquer valor real é 1. A curva é simétrica em torno da média zero. Então a probabilidade de ocorrer valor maior do que zero é 0,5. Mas qual seria a probabilidade de ocorrer valor entre zero e z = 1,25, por exemplo? 
Essa probabilidade é encontrada na tabela de distribuição normal. (Área sob a curva normal padronizada compreendida entre os valores 0 e Z). Na primeira coluna da tabela, está o valor 1,2. Na primeira linha da tabela, está o valor 5. O número 1,2 compõe, com o algarismo 5, o número z = 1,25. No cruzamento da linha 1,2 com a coluna 5, está o número 0,3944. Esta é probabilidade de ocorrer valor entre zero e z = 1,25. 
Qual é a probabilidade de ocorrer valor maior do que z = 1,25?
Como a probabilidade de ocorrer valor maior do que zero é 0,5 e a probabilidade de ocorrer valor entre zero e z = 1,25 é 0,3944, a probabilidade pedida é: 
0,5 – 0,3944 = 0,1056 ou 10,56%
Qual é a probabilidade de ocorrer valor menor do que z = -0,5?
Se construirmos a figura de uma distribuição normal para responder a essa pergunta, podemos verificar que a área entre zero e z = -0,5 é igual a área entre zero e z = 0,5. 
Mas quanto vale essa área?
Se procurarmos na primeira coluna da tabela de distribuição normal reduzida o valor 0,5 e, na primeira linha, o valor zero, para compor o número z = 0,50. 
No cruzamento entre a linha e a coluna está o valor 0,1915, que é a probabilidade de ocorrer valor entre zero e z = 0,50. 
A probabilidade de ocorrer valor menor do que z = -0,50 é igual à probabilidade de ocorrer valor maior do que z = 0,50. Como a probabilidade de ocorrer valor maior do que a média zero é 0,5, a probabilidade pedida é dada por: 0,5 - 0,1915 = 0,3085 ou 30,85%
Probabilidades na Distribuição Normal
Suponhamos que uma nota média de estudantes em uma prova foi de 6 com desvio-padrão de 1,5.
Para calcular probabilidades associadas à distribuição normal, usa-se um artifício. Sabe-se que, se X tem distribuição normal com média, e desvio padrão, a variável z.
Esta variável corresponde a: Z = ( Xi Xm ) / DP Ou seja, o valor da variável menos a média, dividido pelo desvio-padrão.
Para pensar e calcular
Em homens, a quantidade de hemoglobina por 100ml de sangue é uma variável aleatória com distribuição normal de media 16g e desvio padrão de 1g.
Com base nestes dados, calcule:
A) A probabilidade de um homem apresentar de 16g a 18g de hemoglobina por 100ml de sangue.
B) A probabilidade de um homem apresentar mais de 18g de hemoglobina por 100ml de sangue.
Em um exame final de Matemática, a média foi 6,5 e o desvio padrão foi de 1,0.
Com base nestes dados, determine a % de estudantes que obtiveram as seguintes notas:
a) x>7,5
b) x>7,0
c) x>8,0 d) x>5,0
AULA 09
TELETRANSMITIDA
DISTRIBUIÇÃO NORMAL
CONCEITOS:
· Uma variável aleatória é uma variável que tem um único valor numérico, determinado pelo acaso, para cada resultado de algum experimento.
· Uma distribuição de probabilidade descreve a probabilidade de cada valor da variável aleatória.
· Uma variável aleatória discreta tem uma quantidade enumerável de valores, isto é, o número de possíveis valores que a v.a. pode assumir e 0, 1, 2 e assim por diante.
· Uma variável aleatória contínua tem infinitos valores, e esses valores são frequentemente associados a medidas em uma escala contínua.
DISTRIBUIÇÃO NORMAL
Nesta aula estudaremos a distribuição contínua de probabilidade mais importante em Estatística: a distribuição normal. A distribuição normal pode ser usada para modelar uma variedade de fenômenos físicos naturais, estudos de comportamento humano, processos industriais, etc., e desempenham papel importante nos métodos de inferência estatística.
O gráfico da distribuição normal é chamado de curva normal. A distribuição normal tem as seguintes propriedades:
· A média, a mediana e a moda são iguais.
· A curva normal tem formato de sino e é simétrica em torno da média.
· A área total sob a curva normal é igual a 1.
· A curva normal aproxima-se mais do eixo x à medida que se afasta da média em ambos os lados, mas nunca toca o eixo.
Uma vez que cada distribuição normal pode ser transformada em uma distribuição normal padrão, pode-se usar escores z e a curva normal padrão para obter áreas (e portanto probabilidades) sob qualquer curva normal.
Quando ocorre a transformação para o escore z, a área que está no intervalo sob a curva normal não padronizada é igual àquela que está sob a curva normal padrão com as correspondentes fronteiras z.
	
Exemplo: Um processo industrial produz peças com diâmetro médio de 2 polegadas e desvio padrão de 0,01 polegada. As peças com diâmetro que se afaste da média por mais de 0,03 polegadas são consideradas defeituosas. Admitindo que o processo segue uma distribuição normal, encontre a porcentagem de peças defeituosas.
(OBS.: A variância é o desvio elevado ao quadrado)
DISTRIBUIÇÃO NORMAL REDUZIDA
	AULA 10
ESTATÍSTICA APLICADA
Você já ouviu falar em Teste de Hipóteses?
Teste de Hipóteses é um método utilizado para observarmos se determinados dados são compatíveis ou não com alguma hipótese levantada.
Este procedimento estatístico tem como base a observação de uma amostra, sendo a teoria de probabilidades utilizada para verificar o comportamento de parâmetros desconhecidos numa população.
O Teste de Hipóteses pode ser feito através de duas formas:
	Testes paramétricos
	Testes não paramétricos
O uso tanto dos testes paramétricos como dos não paramétricos está condicionado à dimensão da amostra e à respectiva distribuição da variável em estudo. Testes paramétricos são baseados em parâmetros da amostra, por exemplo, média e desvio padrão.
Os testes de hipóteses são sempre constituídos por duas hipóteses, a hipótese nula H0 e a hipótese alternativa H1.
 Hipótese existente, ou hipótese a ser testada – H0, que sempre alega a igualdade de um determinado parâmetro.
 Hipótese alternativa – H1, que sempre alega a desigualdade de um determinado parâmetro.
Para a realização dos testes de hipóteses, temos que obedecer às seguintes etapas:
· Formulação do Teste de Hipótese: Hipótese Nula (H0) e Alternativa (H1).
· Escolha de Distribuição Normal Adequada
· Selecionar o nível de significância e região crítica do teste
· Estabelecer Regra de Decisão.
· Selecionar a amostra, calculara Estatística de teste e interpretar seus resultados
Vídeo: p^ é a estimativa obtida através dos dados amostrais da proporção de interesse no estudo.
p= parâmetro, que é a proporção
Quando o interesse for em “mi”(média): 
Isso quando o desvio padrão populacional é conhecido.
Quando o “sigma” (desvio padrão populacional) for desconhecido, precisa estimá-lo através dos dados amostrais, mudando de distribuição “z” para “t”: 
Os testes de hipóteses podem ser Bilaterais ou Unilaterais à esquerda ou à direita.
Quando o teste for bilateral, o valor de “alfa” será dividido, mas quando o teste for unilateral (direita ou esquerda), usará o valor integral do alfa.
Quem indica se estamos trabalhando com teste à esquerda ou direita é o H1 (hipótese alternativa): os sinais estão especificados ao lado.
Se a estatística de teste cair dentro da área hachurada, a gente rejeita a hipótese H0. Caso não caia na área hachurada, não rejeita a hipótese H0.
Vídeo: 
Valor crítico é z= 1,645
Qualquer estatística de teste menor que esse número de z, não se rejeita a hipótese H0.
Qualquer estatística de teste maior que esse número de z, cai dentro da área de rejeição do teste.
O valor de z= 5,83 ; é maior que 1,645 logo está dentro da área de rejeição da hipótese H0. = a maioria obtém emprego através de rede de amigos.
Testes não paramétricos
Os testes não paramétricos envolvem casos em que não podemos supor características da população de onde a amostra foi extraída, como por exemplo, comportamento de distribuição normal.
Conheça os principais testes não paramétricos.
• Teste do Qui-Quadrado: Utilizado na análise de frequências, no caso de análise de uma característica da amostra.
• Teste do Qui-Quadrado para Independência ou Associação: Utilizado na análise de frequências, no caso de análise de duas características da amostra.
• Teste dos Sinais: Utilizado em casos emparelhados, ou seja, submetido a duas medidas.
• Teste de Wilcoxon: Analisa os dados emparelhados considerando também as magnitudes encontradas.
• Teste de Mann Whitney: Analisa se dois grupos originam-se de populações com médias diferentes.
• Teste da Mediana: Análise de grupos que originam-se de populações com medianas diferentes.
• Teste de Kruskal-Wallis: Análise de grupos que originam-se de populações com médias diferentes.
Para pensar e calcular
Considere que um determinado professor anunciou que a média de nota de alunos em estatística foi de no mínimo 6,0 na AV1.
Considerando um teste de hipótese com amostras de 50 elementos e um nível de significância de 5%, calcule:
a) Se após os dados relativos a 50 elementos encontrarmos a média de 6,2 e desvio-padrão de 0,8.
b) Se após os dados relativos a outra amostra com 50 elementos, encontrarmos a média de 5,7 e desvio-padrão de 1,2.
GABARITO
Etapa 1: H0 = 6,0 e H1<6,0
Etapa 2: Nível de Significância 5%
Etapa 3: De acordo com a Distribuição Normal Reduzida, o Z para nível de significância de 5% é de – 1,65
Etapa 4: Utilização da fórmula
Z = (6,2 -6) / (0,8/ √   50) = 0,2 / 0,1131 = 1,7678
Como 1,7678> - 1,65, a hipótese nula será aceita.
b) Etapa 1: H0 = 6,0 e H1<6,0
Etapa 2: Nível de Significância 5%
Etapa 3: De acordo com a Distribuição Normal Reduzida, o Z para nível de significância de 5% é de – 1,65
Etapa 4: Utilização da fórmula
Z = (5,7 -6) / (1,2/  √ 50) = -0,3 / 0,1131 = -2,6525
Como -2,6525 < -1,65, a hipótese nula será rejeitada.
Ou seja, a informação da amostra não nos permite confirmar uma média 6,0 na prova com nível de significância de 5%.

Continue navegando