Baixe o app para aproveitar ainda mais
Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original
ESTATÍSTICA A Estatística estuda métodos para a obtenção, organização e análise de dados. É uma matéria fundamental para a realização de pesquisas com coleta de dados Os procedimentos estudados na Estatística serão utilizados na realização de trabalhos científicos, monografia ou TCC Estatística Descritiva: consistem em resumir as principais características de um conjunto de dados através de tabelas, gráficos e medidas descritivas. Inferência Estatística: consiste em generalizar os resultados de uma amostra para todos os elementos da população. HISTÓRICO ESTATÍSTICA Estatística: palavra associada à palavra latina STATUS (Estado). Censo: palavra associada à palavra latina CENSERE (Taxar). Há indícios de que 3.000 anos A.C. já se faziam censos na Babilônia, China e Egito O 4o. livro do Velho Testamento faz referência à uma instrução dada a Moisés, para que fizesse um levantamento dos homens de Israel que estivessem aptos para guerrear. Foi publicado um decreto do imperador e César Augusto, convocando toda a população do império para recensear-se. José e Maria saíram de Nazareth, na Galiléia, para Belém, na Judéia, onde deviam alistar-se no recenseamento ordenado por César Augusto (Lc 2) Em 1085, Guilherme, O Conquistador, solicitou um levantamento estatístico da Inglaterra, que deveria conter informações sobre terras, proprietários, uso da terra, empregados e animais que serviram de base para o cálculo de impostos John Graunt (1620-1674) e William Petty (1623-1687) se preocuparam com o estudo numérico dos fenômenos sociais e políticos, através de exaustivas análises de nascimentos e mortes, realizadas através das Tábuas de Mortalidade, que deram origem às atuais Tábuas de Mortalidade usadas pelas companhias de seguros Karl Pearson (1857-1936) dedicou-se ao estudo da evolução de Darwin, aplicando os métodos estatísticos aos problemas biológicos. Realizou contribuições extremamente importantes para o desenvolvimento da teoria da Análise de Regressão e do Coeficiente de Correlação, bem como do teste qui-quadrado William Sealey Gosset (1876-1937) foi contratado, em 1899 pela Cervejaria Guinness em Dublin como Químico. Devido à necessidade de manipular dados provenientes de pequenas amostras, extraídas para melhorar a qualidade da cerveja, Gosset derivou o teste t de Student baseado na distribuição de probabilidades. Ronald Aylmer Fisher (1890-1962) apresentou os princípios de planejamento de experimentos, introduzindo os conceitos de aleatorização, da Análise da Variância, além do conceito da verossimilhança NO BRASIL: No ano de 1872, houve o primeiro censo nacional do Brasil com o nome Recenseamento da População do Império do Brasil. A partir deste ano foi realizado censo em: 1890, 1900, 1920, 1940, 1950, 1960, 1970, 1980, 1991, 2000 e 2010 NO BRASIL: Criação do Instituto Brasileiro de Geografia e Estatística IBGE em 1936 Criação em1953 da Escola Nacional de Ciências Estatística (RJ) e Escola de Estatística da Bahia (BA). Inclusão da Estatística no Ensino Fundamental e Médio a partir da determinação dos Parâmetros Curriculares Nacionais (PCN’s) em 1997 CONCEITOS BÁSICOS População: Conjunto de TODAS as unidades que se deseja estudar Amostra: Subconjunto da população, são as unidades que iremos observar CONCEITOS BÁSICOS INDIVÍDUO: cada elemento afetado por uma medida ou enumerado por um índice. VARIÁVEL: determinada característica que, por algum motivo, nos interessa estudar. É O QUE MEDIREMOS!! FASES DE UM TRABALHO ESTATÍSTICO 1ª DEFINIÇÃO DO PROBLEMA. 2ª PLANEJAMENTO 3ª COLETA DE DADOS 4ª APURAÇÃO DOS DADOS 5ª APRESENTAÇÃO DOS DADOS 6ª ANÁLISE E INTERPRETAÇÃO DOS DADOS PLANEJAMENTO O QUE MEDIR quais variáveis utilizar COMO MEDIR como medir estas variáveis DE QUEM MEDIR qual será a amostra VARIÁVEIS QUALITATIVAS (CATEGÓRICAS) NOMINAIS (NÃO TEM ORDEM) ORDINAIS (TEM ORDEM) QUANTITATIVAS DISCRETAS (CONTAGEM) CONTÍNUAS (MENSURAÇÃO) Porcentagem Quando os indivíduos são classificados em k classes mutuamente exclusivas (cada indivíduo pertence as uma única classe), a porcentagem de indivíduos na classe i, é dada por: N – 100% Ni – x% Razão A razão de um número A em relação a outro B é o valor de A dividido por B. Esta medida é útil na comparação entre os valores, e seu resultado indica quantas vezes um número é maior que outro. R = A/B OBS: Quando se trabalha com dados ao longo do tempo, a razão sempre deve ser feita dividindo-se o valor do período final pelo valor do período inicial Variação Percentual A variação percentual indica quantos % um valor é maior ou menor que outro. Esta medida pode ser calculada para dados em períodos de tempo distintos para indicar o % de aumento ou redução destes valores. Δ% = (R – 1) x 100 EXERCÍCIOS 1) Para a tabela abaixo calcule a porcentagem de cada período, a razão do período 1 para o 2 indicando a variação percentual de cada item e também a razão e variação percentual de cada produto para o produto A no primeiro período AVALIAÇÃO FORMATIVA: https://goo.gl/forms/Np628eL1s07tLdXj2 EXERCÍCIO 2) Os dados abaixo indicam as quantidades vendidas de 3 produtos em 2 meses, calcule a variação percentual de cada produto de março para abril e a variação total interpretando o seu valor AMOSTRAGEM Amostra é parte desta população, é a parte que será realmente estudada, portanto pode-se compreender que ela deva apresentar o melhor possível, a população da qual veio. REPRESENTATIVA PLANOS AMOSTRAIS - Aleatória simples: Sortear indivíduos do total da população (LISTA) - Aleatória sistemática: Selecionar sistematicamente indivíduos (de “k em k”) quando não é possível sortear - Estratificada proporcional: Dividir a população em estratos (grupos) e selecionar a amostra proporcionalmente dentro de cada estrato Amostra estratificada Exemplo: Uma população é dividida em 3 grupos da seguinte forma - Estrato A (jovens) 120 pessoas - Estrato B (adultos) 72 pessoas - Estrato C (3ª idade) 48 pessoas Indique como proceder para retirar uma amostra de 50 indivíduos dessa população: AMOSTRA POR CONVENIÊNCIA Quando não é possível utilizar nenhum dos planos amostrais anteriores e a única possibilidade é utilizar alguns indivíduos que temos a disposição Obs: Caracterizar bem a amostra para deixar claro qual população ela representa (descrição das características dos indivíduos como: sexo, escolaridade classe social, etc.) EXERCÍCIOS: 1) Uma população divide-se, nas seguintes quantidades, em 3 estratos: Estrato A = 60 indivíduos, Estrato B = 40 indivíduos, Estrato C = 80 indivíduos. Indique como proceder para retirar uma amostra de 10 indivíduos dessa população. AVALIAÇÃO FORMATIVA: https://goo.gl/forms/ONVHNOZiVg5qb0823 2) Um Pet Shop deseja realizar um levantamento com seus clientes, onde o tipo de animal (cão ou peixe) é importante no estudo, Sendo que este Pet Shop tem 83 clientes que possuem peixes e 294 clientes que possuem cão, indique o plano amostral mais conveniente e também como retirar uma amostra de 40 indivíduos desta população. 3) Será realizada uma pesquisa em uma cidade que é dividida em 4 regiões. A região Norte tem 8.300 habitantes, a região Sul 3.700, a região Leste 4.100 e a região Oeste 6.000 habitantes. Indique como retirar uma amostra de 300 pessoas dessa população levando-se em conta a região onde elas habitam. TABELAS GRÁFICOS Barras ou Colunas: Comparar as quantidades Escala Iniciar do ZERO!! GRÁFICOS Pizza ou Setores: Comparar as partes de um todo Apenas Categorias NOMINAIS No Máximo 5 ou 6 Categorias GRÁFICOS Linhas: Verificar comportamento AO LONGO DO TEMPO GRÁFICOS Dispersão: Verificar Correlação entre 2 variáveis quantitativas CORRELAÇÃO Verificar como 2 variáveis quantitativas se relacionam Diagrama de Dispersão Coeficiente de Correlação de Pearson (r) DISTRIBUIÇÃO DE FREQUÊNCIA Tabela para variáveis quantitativas COMPONENTES DE UMA DISTRIBUIÇÃO DE FREQUÊNCIAS - Classes : Intervalo de variação dos dados (LI = limite inferior da classe e LS = limite superior da classe) - Frequência absoluta ( f ) : Refere-se ao número de elementos em cada classe, - Frequência Acumulada (F ): É a soma das frequências absolutas até cada uma das classes, - Frequência Relativa ( fr ): É a porcentagem dos dados que em uma determinada classe, - Frequência Relativa Acumulada (Fr ): É a porcentagens de dados até cada uma das classes. Exemplo: Calcule todas as frequências da tabela abaixo: Peso de cobaias em gramas HISTOGRAMA: Formado por uma série de retângulos justapostos cuja base representa o intervalo e a altura representa a frequência de cada classe. Apresenta graficamente a distribuição dos dados CONSTRUÇÃO DE UMA DISTRIBUIÇÃO DE FREQUÊNCIAS SEM INTERVALOS DE CLASSES Quando o conjunto de dados que se está estudando apresenta poucos valores distintos, que se repetem várias vezes, não é indicado calcular um intervalo para representar estes dados, apenas deve-se utilizar os próprios valores como classes e verificar suas frequências. Exercício: Monte a distribuição de frequências para os dados abaixo que indicam o número de animais de estimação de 30 pessoas: 0 0 1 1 0 0 0 2 2 3 0 0 1 1 2 2 0 0 0 1 3 3 0 2 1 1 0 0 1 3 CONSTRUÇÃO DE UMA DISTRIBUIÇÃO DE FREQUÊNCIAS COM INTERVALOS DE CLASSES Quando o conjunto de dados que se está estudando apresenta muitos valores distintos, que pouco ou nada se se repetem é indicado calcular um intervalo para representar estes dados. Para a determinação destes intervalos será utilizado o critério de Sturges Exemplos de intervalos pré definidos: CRITÉRIO DE STURGES K = 1 + 3,3.log(n) h = M – m k Onde h é o tamanho das classes EXERCÍCIOS: 1) Os dados abaixo representam o peso de 20 cães. Monte a distribuição de frequências para esses dados. 75,0 - 60,1 - 74,6 - 68,1 - 64,3 - 67,2 - 75,3 - 79,3 - 66,4 - 86,6 - 80,0 - 85,0 - 72,5 - 73,2 - 68,9 - 71,0 - 81,3 - 64,2 - 73,0 - 81,2 AVALIAÇÃO FORMATIVA: https://goo.gl/forms/cS1rifdNimkwHPCs2 2) Construa a distribuição de frequências para as idades apresentadas abaixo 52 27 46 15 22 20 68 73 19 30 33 58 24 35 32 27 42 30 45 40 70 21 27 50 51 31 17 20 60 63 3)Construa uma tabela de distribuição de frequências para o peso de 20 crianças: 15,0 / 38,4 / 27,6 / 28,0 / 24,7 / 30,8 / 31,3 26,4 / 29,0 / 24,2 / 41,9 / 25,1 / 27,7 / 20,7 23,0 / 34,3 / 33,8 / 37,2 / 19,0 / 35,0 MEDIDAS DE TENDÊNCIA CENTRAL Média. É o valor em torno do qual os dados se concentram. Ex) Amostra de 5 valores de colesterol: 200 - 250 - 280 - 310 - 320 MÉDIA ARITMÉTICA PONDERADA: É uma medida semelhante à média aritmética, entretanto, nesse caso, os valores do conjunto de dados apresentam pesos (importâncias) diferentes. A expressão para o cálculo da média aritmética ponderada é dada por: Exercícios 1) Um professor aplicou 3 avaliações com pesos diferentes. Calcule a nota média do seguinte aluno: Nota Peso 9,0 2 7,5 3 5,5 5 Exercícios 2) Os dados abaixo se referem a renda per capita e a população de 4 países. Com base nesses dados calcule a população média e a renda per capita média dos países. Moda. É o valor que ocorre com maior freqüência dentro do conjunto de observação. Ex 1) Peso de pessoas (Kg): 56 - 83 - 72 - 83 - 60 - 71 - 74 Mo = 83 Kg Interpretação: o peso que mais aparece é 83Kg 1 moda = unimodal + de 1 moda = multimodal não possui moda = amodal Ex 2) Idade de pessoas (anos) 18 – 19 – 18 – 20 – 19 – 20 Mo = Não existe AMODAL Ex 3) Idade de pessoas (anos) 18 – 19 – 18 – 20 – 19 – 20 – 22 Mo = 18, 19 e 20 MULTIMODAL Mediana. É o valor que divide um conjunto de observações ao meio Ex 1) Amostra de 5 valores de colesterol: 200 - 250 - 280 - 310 - 320 (n.º de observações ímpares) Md = 280 (mg/dl) Interpretação : 50% dos indivíduos tem colesterol menor que 280 e os outros 50% tem colesterol maior que 280. Ex 2) Amostra de salários de 6 profissionais: 2.000 – 2.200 – 2.500 – 2.800 – 3.100 –3.200 (n.º de observações par) Md= 2500 + 2800 2 Md= 2.650,00 reais Interpretação : 50%dos profissionais ganham menos que 2.650,00 reais e os outros 50% ganham mais que 2.650,00 reais. Separatrizes. São valores que dividem um conjunto de observações em partes iguais: Mediana -- Divide em 2 partes iguais (Md) Quartil----- Divide em 4 partes iguais (Q) Decil -------Divide em 10 partes iguais (D) Percentil ------Divide em 100 partes iguais (P) EXERCÍCIO: Foi medida a glicemia em jejum de um grupo de 800 pessoas, com base nesses dados foram calculadas as medidas abaixo. Interprete os valores: Md = 98 Q3 = 102,1 D3 = 88,3 P15 = 80,5 P85 = 106 EXERCÍCIOS: 1) Os dados abaixo indicam o peso de 7 pessoas. Com base nesses dados calcule a média, a moda e a mediana e comente o significado dos resultados: 70 58 82 88 73 69 72 kg 2) Os dados abaixo indicam a idade de 6 alunos. Com base nesses dados calcule a média, a moda e a mediana e comente o significado dos resultados: 20 26 24 18 23 20 anos AVALIAÇÃO FORMATIVA: https://goo.gl/forms/6hPezVxtO7iCGpAI2 BOX- PLOT Boxplot, ou diagrama de caixa, é um gráfico que capta importantes aspectos de um conjunto de dados através do seu resumo dos cinco números BOX- PLOT Visualização da distribuição dos dados Assimetria positiva Simetria Assimetria negativa Exercício: Com base nas informações abaixo monto o box-plot e indique a forma de assimetria desses dados: Mínimo = 20 Q1 = 35 Md = 45 Q3 = 50 Máximo = 53 BOX- PLOT Detecção de outliers LI = Q1 – 1,5(Q3 – Q1) LS = Q3 + 1,5(Q3 – Q1) Exercício: Foi realizada uma pesquisa onde foi medido o peso de 200 crianças. Com base nas informações abaixo faça um esboço do box-plot, indique se esses dados tem assimetria positiva ou negativa, calcule os limites para detecção de outliers e e indique se existem outliers Mínimo = 3 Q1 = 3,5 Q2 = 4,2 Q3 = 5,3 Máximo = 6,6 MEDIDAS DE VARIABILIDADE VARIÂNCIA: S2 É a “média” entre os quadrados das diferenças entre cada elemento do conjunto de dados e sua média. Cálculo da Variância: 1º: Calcular a média 2º: Fazer cada valor menos a média 3º: Elevar esses valores ao quadrado 4º: Somar os resultados 5º: Dividir a soma pela quantidade de valores menos 1 DESVIO PADRÃO: S É a raiz quadrada da variância. Ele mede a dispersão de um conjunto de dados em relação à média. COEFICIENTE DE VARIAÇÃO: CV Medida de dispersão relativa que estabelece uma relação entre o desvio padrão e a média. Utilizada para medir e comparar a variabilidade relativa ou grau de homogeneidade CV ≤ 30%: Grupo Homogêneo CV > 30%: Grupo Heterogêneo % Exemplo: Indique qual grupo é mais homogêneo em relação ao salário: Grupo A : Média R$1.800 desvio padrão R$150 Grupo B : Média R$3.000 desvio padrão R$210 CV A = 150/1800 = 8,33% CV B = 210/3000 = 7% Grupo B mais homogêneo (CV menor) EXERCÍCIOS: 1) Os dados abaixo se referem a uma amostra com 8 suínos, onde foi medido o peso desses animais. Calcule a média, mediana, desvio padrão e coeficiente de variação destes dados. 152 198 200 108 136 140 166 180 AVALIAÇÃO FORMATIVA: https://goo.gl/forms/uZlTRH0ad28CNQMn2 2) Foi medido o consumo de 30 famílias de dois grupos diferentes. Com base nos resultados apresentados verifique qual dos dois grupos é mais homogêneo, e comente sua resposta: GRUPO I: média = 886 reais variância = 5625 GRUPO II: média = 236 reais variância = 4900 3) Os dados abaixo indicam os pesos de meninos e meninas, calcule as medidas de posição e dispersão estudadas para cada grupo e indique qual sexo é mais homogêneo em relação aos pesos: Meninos 72 70 84 80 79 Meninas 56 55 62 51
Compartilhar