Baixe o app para aproveitar ainda mais
Prévia do material em texto
31/10/2015 1 Profa. Lidia Rodella UFPE-CAA � O que é estatística? ◦ É conjunto de técnicas que permite, de forma sistemática, coletar, organizar, descrever, analisar e interpretar dados oriundos de estudos ou experimentos, realizados em qualquer área do conhecimento. � Dois tipos de estatística: ◦ Estatística Descritiva; ◦ Inferência Estatística. 2 31/10/2015 2 � População ◦ É o conjunto de objetos, indivíduos ou resultados experimentais acerca do qual se pretende estudar alguma característica comum. � Amostra ◦ É uma parte da população que é observada com o objetivo de obter informação para estudar a característica pretendida. 3 � Em uma pesquisa recente, foi perguntado a 1708 adultos americanos se eles consideram o aquecimento global um problema que exige uma ação imediata do governo. 939 deles responderam que sim. ◦ Qual é a população? ◦ Qual é a amostra? ◦ Descreva o conjunto de dados: � 939 sim; � 769 não. Resposta de todos os adultos nos EUA (população) Respostas dos adultos na pesquisa (amostra) 4 31/10/2015 3 � Parâmetro ◦ É a descrição numérica de uma característica da população. � Estatística ◦ É a descrição numérica de uma característica da amostra. 5 � Distinguindo entre parâmetro e estatística: ◦ 1. Uma pesquisa recente de uma amostra de MBAs reportou que o salário médio para um MBA é mais do que $ 82.000 por ano. ◦ 2. Os salários iniciais para 667 MBAs graduados na Escola de Negócios da Universidade de Chicago aumentaram 8,5% em comparação ao ano anterior. ◦ 3. Em 2006, a liga dos times de beisebol gastou um total de $ 2,3 bilhões nos salários dos jogadores. 6 31/10/2015 4 � Estatística Descritiva ◦ Métodos que organizam, resumem e apresentam os dados de uma maneira que permite entende-los facilmente. � Inferência Estatística ◦ Métodos usados para tirar conclusões ou fazer inferências sobre as características da população baseado nos dados de uma amostra. Uma ferramenta básica no estudo da inferência estatística é a probabilidade. 7 � Estatística descritiva e inferência estatística ◦ 1. Uma grande amostra de homens, com 48 anos, foi estudada durante 18 anos. Para os que são solteiros, 70% ainda estavam vivos aos 65 anos. Para os casados, 90% estavam vivos aos 65 anos. ◦ 2. Uma pesquisa conduzida entre 1.017 homens e mulheres descobriu que 76% das mulheres e 60% dos homens haviam passado por exames físicos no ano anterior. 8 31/10/2015 5 � 1. Verdadeiro ou Falso ◦ a. Um dado estatístico é uma medida que descreve as características de uma população. ◦ b. Uma amostra é um subgrupo de uma população. ◦ c. A inferência estatística envolve o uso de uma população para chegar a conclusões sobre a amostra correspondente. � 2. População ou amostra ◦ a. A idade de cada aluno da UFPE. ◦ b. Uma pesquisa com 500 espectadores de um estádio com 42.000. ◦ c. Os níveis de colesterol de 20 pacientes em um hospital com 100 pacientes. ◦ d. O número de televisões em cada residência no Brasil. amostra amostra população população amostra amostra população 9 � Variáveis ◦ São as características dos elementos da população ou da amostra. � Dados ◦ São os valores observados das variáveis. Variáveis Qualitativas Quantitativas Nominal Ordinal Discreta Contínua 10 31/10/2015 6 Defina quais são os tipos das variáveis abaixo: Estado civil Grau de instrução Número de Filhos Salário Idade Região de procedência Temperatura Número de itens comprados Qualitativa nominal Qualitativa ordinal Quantitativa discreta Quantitativa contínua Quantitativa contínua Qualitativa nominal Quantitativa contínua Quantitativa discreta 11 � Censo ◦ É uma contagem ou medição de uma população inteira. � Amostragem ◦ É uma contagem ou medição de parte de uma população e é mais comumente usada nos estudos estatísticos. 12 31/10/2015 7 � Amostra aleatória ◦ É aquela na qual todos os membros de uma população têm chances iguais de serem selecionados ◦ Uma amostraamostraamostraamostra aleatóriaaleatóriaaleatóriaaleatória simplessimplessimplessimples é aquela em que toda amostra possível de mesmo tamanho tem a mesma chance de ser selecionada. Ou seja, todos os itens na população de NNNN itens têm a mesma chance de serem escolhidos na amostra de nnnn itens. ◦ Amostragem semsemsemsem reposiçãoreposiçãoreposiçãoreposição e amostragem comcomcomcom reposiçãoreposiçãoreposiçãoreposição. 13 � Amostra estratificada ◦ Quando é importante que uma amostra tenha membros de cada segmento da população. Esse método é aplicável quando a população pode ser dividida em subgrupos homogêneos de tamanhos conhecidos (denominados estratos). Dentro de cada estrato, pode-se tomar uma amostra aleatória simples do tamanho desejado. � Ex. Estimar taxas de vacinação contra a varíola entre funcionários públicos, sabendo que a população alvo é composta de 55% homens e 45% mulheres. n = 200. 110 homens e 90 mulheres. 14 31/10/2015 8 � Amostra por agrupamento (ou conglomerados) ◦ Quando a população está em subgrupos que ocorrem naturalmente, cada um tendo características similares. Para selecionar uma amostra por agrupamento, divida a população em grupos, chamados clusters, e selecione todos os membros em um ou mais (mas não em todos) clusters. ◦ São, essencialmente, estratos consistindo em regiões geográficas. ◦ Cada cluster deve consistir de membros com todas as características (ex: todas as faixas etárias). Bairro 1 Bairro 2 Bairro 3 Bairro 4 15 � Amostra sistemática ◦ É um outro método de amostragem aleatória em que os itens são escolhidos de k em k, iniciando-se de um ponto escolhido aleatoriamente entre os primeiros k itens da lista. ◦ Uma amostra sistemática de n itens de uma população de N itens requer que a periodicidade k seja aproximadamente N/n. ◦ Ex: Pesquisa Forbes sobre salários dos CEO das 500 maiores empresas americanas. Para escolher 25 empresas de uma lista de 500, k = 500/25=20. 16 31/10/2015 9 Informações de 36 empregados da seção de Orçamento da Companhia LC Distribuições Distribuições Distribuições Distribuições Distribuições Distribuições Distribuições Distribuições de frequênciade frequênciade frequênciade frequênciade frequênciade frequênciade frequênciade frequência 17 � Distribuição de frequência ◦ É uma tabela que mostra classesclassesclassesclasses ou intervalosintervalosintervalosintervalos das entradas de dados com uma contagem do número de entradas (observações) em cada classe. A frequênciafrequênciafrequênciafrequência ffff de uma classe é o número de entrada de dados em uma classe. 18 31/10/2015 10 � PassoPassoPassoPasso 1111:::: Organizar os dados em ordem crescente � PassoPassoPassoPasso 2222:::: Escolher o número de classes (blocos) k Regra de Sturges: k = 1 + 3,3 log (n) � PassoPassoPassoPasso 3333:::: Estabelecer os limites das classes (blocos) Comprimento do bloco ≃ xmax – xmin k � PassoPassoPassoPasso 4444:::: Alocar os valores dos dados nos blocos apropriados � PassoPassoPassoPasso 5555:::: Criar a tabela 19 � Frequência ◦ Definimos frequência de um valor de uma variável como sendo o número de vezes que aquele valor se repete no conjunto de dados observados. ◦ Ex: Tabela 1 – grau de instrução dos 36 funcionários da seção de orçamento da companhia LC Grau de instrução (Y) Freqüência Fundamental Médio Superior Total 12 18 6 36 20 31/10/2015 11 � Frequência relativa (proporção) � Ex: n f f ir i = = freqüência absoluta de cada categoria da variável.if n = o número total de observações. Tabela 2 – grau de instrução dos 36 funcionáriosda seção de orçamento da companhia LC Grau de instrução (Y) Frequência Frequência acumulada Frequência relativa Porcentagem Fundamental 12 12 Médio 18 30 Superior 6 36 Total 36 36 0,3333 0,5000 0,1667 1,0000 33,33 50,00 16,67 100,00 21 � Para a construção de tabelas de freqüência para variáveis contínuas a solução empregada é agruparagruparagruparagrupar os dados por faixa de valores. Tabela 3 – Freqüências e porcentagens dos 36 funcionários por faixa de salário Classe de salários Freqüência Porcentagem 4,00 8,00 8,00 12,00 12,00 16,00 16,00 20,00 20,00 24,00 Total Classe de salários Freqüência Porcentagem 4,00 8,00 8,00 12,00 12,00 16,00 16,00 20,00 20,00 24,00 Total 10 12 8 5 1 36 27,78 33,33 22,22 13,89 2,78 100,00 Perda de informação. 22 31/10/2015 12 � Existem vários gráficos para representar as variáveis qualitativas, entre eles: ◦ Gráficos em barras; ◦ Gráficos de composição em setores (“pizza”). � Ex: Grau de instrução (Y) Freqüência Porcentagem Fundamental 12 33,33 Médio 18 50,00 Superior 6 16,67 Total 36 100,00 Tabela 2 – Distribuição de freqüência do grau de instrução. 23 � Gráfico em barras: Gráfico em barras para a variável grau de instrução 0 5 10 15 20 Fundamental Médio Superior F re q u ê n c ia 24 31/10/2015 13 � Gráficos de composição em setores (“pizza”) Fundamental 33% Médio 50% Superior 17% Fundamental Médio Superior 25 � Variedade maior de representações gráficas: ◦ Gráficos de dispersão unidimensional; ◦ Histograma. � Ex:Tabela 4 – Distribuição de freqüência da variável número de filhos para os funcionários casados. Nº de filhos (Z) Freqüência Porcentagem 0 4 20 1 5 25 2 7 35 3 3 15 4 - 0 5 1 5 Total 20 100 26 31/10/2015 14 � Gráfico de dispersão: Gráfico de dispersão unidimensional para a variável nº de filhos 0 1 2 3 4 5 6 7 8 0 1 2 3 4 5 6 Nº de filhos F re q ü ê n c ia 27 Tabela 3 – Distribuição de freqüência dos 36 funcionários por faixa de salário. Classe de salários Freqüência Porcentagem 4,00 |- 8,00 10 27,78 8,00 |- 12,00 12 33,33 12,00 |- 16,00 8 22,22 16,00 |- 20,00 5 13,89 20,00 |- 24,00 1 2,78 Total 36 100,00 28 Como representar graficamente variáveis quantitativas contínuas? 31/10/2015 15 � Ponto médio – (limite inferior + limite superior) 2 � Ex: Tabela 5 – Distribuição de freqüência dos 36 funcionários por faixa de salário. Classe de salários Ponto Médio Freqüência Porcentagem 4,00 |- 8,00 6,00 10 27,78 8,00 |- 12,00 10,00 12 33,33 12,00 |- 16,00 14,00 8 22,22 16,00 |- 20,00 18,00 5 13,89 20,00 |- 24,00 22,00 1 2,78 Total - 36 100,00 29 � Gráfico em barras: Gráfico em barras para a variável salário 0 2 4 6 8 10 12 14 6 10 14 18 22 Salário F re q u ê n c ia 30 Supondo que todos os salários da classe são iguais ao ponto médio. 31/10/2015 16 � Polígono de frequências: 0 2 4 6 8 10 12 14 4 6 10 14 18 22 24 Salário F re q ü ê n c ia Gráfico em barras Polígono de freqüencias 31 � HistogramaHistogramaHistogramaHistograma ◦ É um gráfico de barras contíguas, com as bases proporcionais aos intervalos das classes e a área de cada retângulo proporcional à respectiva frequência. ◦ Quando os intervalos de classe (amplitude) são iguais, podemos utilizar no eixo das ordenadas os valores das frequências absolutas, das frequências relativas ou da proporção ou das densidades de frequência. ◦ Se não forem iguais teremos que utilizar as densidades de frequência ou proporção. 32 31/10/2015 17 � Histograma Histograma da variável salário 0 2 4 6 8 10 12 14 4 |- 8 8 |- 12 12 | -16 16 |- 20 20 |- 24 Salário F re q u ê n c ia 33 � Densidade de frequência da i-ésima classe: ou ◦ ∆ = amplitude da classe ◦ ∆i ◦ Área total do histograma será igual a 1 ◦ Histogramas – eixo Y: forma x áreas 34 ∆ if ∆ ir f 31/10/2015 18 � Ex: 35 Classe de salários Porcentagem Amplitude Densidade da proporção 1,00 |-2,00 40 2,00 |- 5,00 30 5,00 |- 10,00 30 Total 100 - - 0,4 0,1 0,06 1 3 5 ir f100 ∆ ir f ∆ � Histograma: 36 1 2 5 10 Salário 0,4 0,3 0,2 0,1 D e n s id a d e d e fr e q ü ê n c ia r e la ti v a 0 40% 30% 30% 1 2 5 10 0,4 0,3 0,2 0,1 0 31/10/2015 19 � Ex: 37 Classe de salários Freqüência Proporção Densidade de freqüência Densidade da proporção 4,00 |- 8,00 10 0,2778 8,00 |- 12,00 12 0,3333 12,00 |- 16,00 8 0,2222 16,00 |- 20,00 5 0,1389 20,00 |- 24,00 1 0,0278 Total 36 1,0000 - - if irf ∆ if ∆ ir f 2,5 3,0 2,0 1,25 0,25 0,06944 0,08333 0,05555 0,34722 0,00694 Tabela 5 – Distribuição de frequência dos 36 funcionários por faixa de salário. 38 Histograma da variável salário 28% 33% 22% 14% 3% 0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 4 |- 8 8 |- 12 12 | -16 16 |- 20 20 |- 24 Salário D e n s id a d e d e p ro p o rç ã o 31/10/2015 20 � Histograma ◦ Importância: sugerem a forma da distribuição da população que estamos amostrando. ◦ Não é apenas uma técnica gráfica para resumir os dados, mas é também usado para ajudar a explicar um importante aspecto de probabilidade. ◦ Dá uma ideia da localização do centro dos dados e da variabilidade do conjunto de dados. 39 � Formas do Histograma ◦ Histograma simétrico: � Quando uma linha vertical pode ser desenhada no meio do gráfico e as metades resultantes são aproximadamente imagens espelhadas. 40 31/10/2015 21 � Formas do Histograma ◦ Histograma assimétrico: � Quando a “cauda” do gráfico se alonga mais em um dos lados. Assimetria à direita (positiva): Assimetria à esquerda (negativa): 41 � 1. Usando os dados da tabela, construa a distribuição de frequências da variável “região de procedência” e faça sua representação através de um gráfico de “pizza”. � 2. Usando os dados da tabela 1, construa a distribuição de frequências da variável “idade” e faça um histograma. 42
Compartilhar