Baixe o app para aproveitar ainda mais
Prévia do material em texto
ESTATÍSTICA E PROBABILIDADE Antonio Alexandre Lima, profº Me profaalima@gmail.com CONTEÚDO DESTA AULA ESTATÍSTICA E PROBABILIDADE Conhecendo a Estatística Conceitos Fundamentais Coleta de Dados Medidas de Posição, de Tendência Central e Separatrizes Gráficos ESTATÍSTICA E PROBABILIDADE (1) Conhecendo a Estatística A Estatística é uma ciência que se dedica à coleta, análise e interpretação de dados. Atenta-se com os métodos de recolha, organização, resumo, apresentação e interpretação dos dados, assim como obtenção de conclusões sobre as características das fontes donde estes foram retirados, para melhor compreender as situações. Práticas Estatísticas incluem o planejamento, a sumarização e a interpretação de observações para a produção da melhor informação possível a partir dos dados disponíveis. ESTATÍSTICA E PROBABILIDADE (1) Conhecendo a Estatística AMOSTRATécnicas de Amostragem Planejamento de Experimento Informações contidas nos dados A n álise D ESC R ITIV A Conclusões sobre as características do universo / população Inferência Estatística ESTATÍSTICA E PROBABILIDADE (1) Conhecendo a Estatística A origem da palavra Estatística está associada à palavra latina STATUS (Estado). Há indícios de que 3000 anos A.C. já se faziam censos na Babilônia, China e Egito e até mesmo o 4º livro do Velho Testamento faz referência à uma instrução dada a Moisés, para que fizesse um levantamento dos homens de Israel que estivessem aptos para guerrear. As primeiras aplicações do pensamento estatístico estavam voltadas para as necessidades de Estado, na formulação de políticas públicas, fornecendo dados demográficos e econômicos. A abrangência da Estatística aumentou no começo do século XIX para incluir a acumulação e análise de dados de maneira geral. Hoje, a Estatística é largamente aplicada nas ciências naturais, e sociais, inclusive na administração pública e privada. ESTATÍSTICA E PROBABILIDADE POPULAÇÃO é um conjunto de elementos sobre o qual se faz alguns estudos ou Inferência Estatística. À Estatística não interessa concluir a respeito de unidades individuais de observação, mas sim, de grupos, conjuntos ou agregados. PARÂMETRO / VARIÁVEL é a medida usada para descrever uma característica populacional. (2) Conceitos Fundamentais O UNIVERSO é o objetivo do seu estudo ESTATÍSTICA E PROBABILIDADE (2) Conceitos Fundamentais ESTATÍSTICA E PROBABILIDADE (2) Conceitos Fundamentais ESTATÍSTICA E PROBABILIDADE AMOSTRA: fixada uma população, a amostra é qualquer subconjunto formado exclusivamente por seus elementos. (2) Conceitos Fundamentais AMOSTRAGEM: é o processo de seleção dos elementos de uma amostra, que possibilita o estudo das características da população. ESTATÍSTICA E PROBABILIDADE Definida a população/universo, é preciso estabelecer a técnica de amostragem, isto é, o procedimento que será adotado para escolher os elementos que irão compor a amostra, conforme a técnica utilizada tem-se um tipo de amostra. (3) Coleta de Dados A AMOSTRA CASUAL SIMPLES é composta por elementos retirados, ao acaso, de toda população. Então, todo elemento da população tem igual probabilidade de ser escolhido para a amostra. (Por exemplo: efetuar um sorteio simples como num bingo) ESTATÍSTICA E PROBABILIDADE A AMOSTRA ALEATÓRIA ESTRATIFICADA é composta por elementos de todos os estratos da população. Devem ser obtidas amostras estratificadas sempre que a população for constituída por diferentes estratos. Por exemplo, se as pessoas que moram nos vários bairros de uma cidade são diferentes, cada bairro é um estrato. Para obter uma amostra de pessoas dessa cidade, seria razoável obter uma amostra de cada bairro e depois reunir as informações numa amostra estratificada. (3) Coleta de Dados ESTATÍSTICA E PROBABILIDADE Na AMOSTRA ALEATÓRIA SISTEMÁTICA faz-se uma seleção aleatória do primeiro elemento e logo se selecionam os itens subsequentes utilizando intervalos fixos ou sistemáticos até chegar ao tamanho da amostra desejada. Por exemplo: numa inspeção de qualidade numa linha de produção ou qualidade de atendimento telefônico. (3) Coleta de Dados ESTATÍSTICA E PROBABILIDADE A Amostra de CONVENIÊNCIA é formada por elementos que o pesquisador reuniu simplesmente porque dispunha deles. Os estatísticos têm muitas restrições ao uso desse tipo de amostra, comuns, por exemplo, na área de saúde, onde se fazem pesquisas com pacientes de uma só clínica ou de um só hospital. As amostras de conveniência constituem, muitas vezes, a única maneira de estudar determinado problema e poder servir de início (3) Coleta de Dados ESTATÍSTICA E PROBABILIDADE Apresentação Tabular ESTATÍSTICA E PROBABILIDADE Séries Estatísticas Séries Estatísticas: São as tabelas que apresentam a distribuição de um conjunto de dados e que podem estar dispostas em função da época/tempo/cronologia/história, do local/geografia ou da fenômeno/espécie. Temporal Geográfica Específica ESTATÍSTICA E PROBABILIDADE Séries Estatísticas Séries Estatísticas: São as tabelas que apresentam a distribuição de um conjunto de dados e que podem estar dispostas em função da época / tempo / cronologia / história, do local / geografia, da fenômeno / espécie ou mista / combinada... Geográfica Temporal Específica ESTATÍSTICA E PROBABILIDADE Séries Estatísticas – Distribuição de Frequências Idade dos alunos das turmas de Estatística da Estácio Campus PresVargas em 2018-1 do profº Antº Alexandre 18 18 19 19 20 20 20 20 21 21 21 21 21 21 21 21 21 21 21 22 22 22 22 22 22 23 23 23 23 23 24 24 24 24 24 24 25 25 26 26 26 26 26 26 27 27 27 27 27 28 28 28 28 28 29 29 29 29 30 30 30 30 30 30 30 32 32 32 32 32 34 34 34 34 35 35 36 36 38 50 50 58 DADOS BRUTOS são os dados originais que, geralmente, são coletados sem ordem (ou organização). ROL é a lista ordenada dos dados de uma série estatística. Essa ordenação pode ser crescente ou decrescente. ESTATÍSTICA E PROBABILIDADE Séries Estatísticas – Distribuição de Frequências 18 18 19 19 20 20 20 20 21 21 21 21 21 21 21 21 21 21 21 22 22 22 22 22 22 23 23 23 23 23 24 24 24 24 24 24 25 25 26 26 26 26 26 26 27 27 27 27 27 28 28 28 28 28 29 29 29 29 30 30 30 30 30 30 30 32 32 32 32 32 34 34 34 34 35 35 36 36 38 50 50 58 Limites de classe são os valores extremos. O limite mínimo de uma classe é denominado limite Inferior e o limite máximo de Limite Superior. Intervalo de classe (h) é a diferença entre o limite superior e o limite inferior da classe. Idade dos alunos das turmas de Estatística da Estácio Campus PresVargas em 2018-1 do profº Antº Alexandre ESTATÍSTICA E PROBABILIDADE Séries Estatísticas – Distribuição de Frequências 18 18 19 19 20 20 20 20 21 21 21 21 21 21 21 21 21 21 21 22 22 22 22 22 22 23 23 23 23 23 24 24 24 24 24 24 25 25 26 26 26 26 26 26 27 27 27 27 27 28 28 28 28 28 29 29 29 29 30 30 30 30 30 30 30 32 32 32 32 32 34 34 34 34 35 35 36 36 38 50 50 58 Ponto Médio de classe é o valor representativo da classe. Para se obter o ponto médio de uma classe, basta somar os limites superior e inferior da classe e dividir por 2. Idade dos alunos das turmas de Estatística da Estácio Campus PresVargas em 2018-1 do profº Antº Alexandre ESTATÍSTICA E PROBABILIDADE Séries Estatísticas – Distribuição de Frequências 18 18 19 19 20 20 20 20 21 21 21 21 21 21 21 21 21 21 21 22 22 22 22 22 22 23 23 23 23 23 24 24 24 24 24 24 25 25 26 26 26 26 26 26 27 27 27 27 27 28 28 28 28 28 29 29 29 29 30 3030 30 30 30 30 32 32 32 32 32 34 34 34 34 35 35 36 36 38 50 50 58 Frequência absoluta (ƒi) é a quantidade de observações correspondente a cada classe. A frequência absoluta é, geralmente, chamada apenas de frequência. Idade dos alunos das turmas de Estatística da Estácio Campus PresVargas em 2018-1 do profº Antº Alexandre ESTATÍSTICA E PROBABILIDADE Séries Estatísticas – Distribuição de Frequências 18 18 19 19 20 20 20 20 21 21 21 21 21 21 21 21 21 21 21 22 22 22 22 22 22 23 23 23 23 23 24 24 24 24 24 24 25 25 26 26 26 26 26 26 27 27 27 27 27 28 28 28 28 28 29 29 29 29 30 30 30 30 30 30 30 32 32 32 32 32 34 34 34 34 35 35 36 36 38 50 50 58 Frequência Acumulada é a soma da quantidade de observações até o limite da classe superior. Idade dos alunos das turmas de Estatística da Estácio Campus PresVargas em 2018-1 do profº Antº Alexandre ESTATÍSTICA E PROBABILIDADE Séries Estatísticas – Distribuição de Frequências 18 18 19 19 20 20 20 20 21 21 21 21 21 21 21 21 21 21 21 22 22 22 22 22 22 23 23 23 23 23 24 24 24 24 24 24 25 25 26 26 26 26 26 26 27 27 27 27 27 28 28 28 28 28 29 29 29 29 30 30 30 30 30 30 30 32 32 32 32 32 34 34 34 34 35 35 36 36 38 50 50 58 F re q u ê n c ia s R e la tiv a s (S im p le s e A c u m u la d a ) Idade dos alunos das turmas de Estatística da Estácio Campus PresVargas em 2018-1 do profº Antº Alexandre ESTATÍSTICA E PROBABILIDADE (4) Medidas de Posição 18 18 19 19 20 20 20 20 21 21 21 21 21 21 21 21 21 21 21 22 22 22 22 22 22 23 23 23 23 23 24 24 24 24 24 24 25 25 26 26 26 26 26 26 27 27 27 27 27 28 28 28 28 28 29 29 29 29 30 30 30 30 30 30 30 32 32 32 32 32 34 34 34 34 35 35 36 36 38 50 50 58 Média Aritmética é o ponto de equilíbrio da variável observada. Nos dados isolados (rol ou brutos) a aritmética da Média é: Soma-se todas as observações (idade) e divide-se ela quantidade delas, neste nosso exemplo temos... 2217 82 = 27,036585 ≈ 𝟐𝟕 𝐚𝐧𝐨𝐬 𝐝𝐞 𝐢𝐝𝐚𝐝𝐞 Idade dos alunos das turmas de Estatística da Estácio Campus PresVargas em 2018-1 do profº Antº Alexandre ESTATÍSTICA E PROBABILIDADE (4) Medidas de Posição Média Aritmética é o ponto de equilíbrio da variável observada. Nos dados repetidos por frequência, calculamos a Média pela seguinte expressão: Soma-se a multiplicação da variável observada (idade) pela sua frequência e divide-se pela quantidade de observações, neste nosso exemplo... 2217 82 = 27,036585 ≈ 𝟐𝟕 𝐚𝐧𝐨𝐬 𝐝𝐞 𝐢𝐝𝐚𝐝𝐞 xi fi xi.fi 18 2 36 19 2 38 20 4 80 21 11 231 22 6 132 23 5 115 24 6 144 25 2 50 26 6 156 27 5 135 28 5 140 29 4 116 ... ... ... 82 2217 Estamos tratando da Média PONDERADA, aqui, pela frequência observada Idade dos alunos das turmas de Estatística da Estácio Campus PresVargas em 2018-1 do profº Antº Alexandre ESTATÍSTICA E PROBABILIDADE (4) Medidas de Posição Média Aritmética é o ponto de equilíbrio da variável observada. Na Distribuição de Frequências calculamos a Média Aritmética com a seguinte expressão: Soma-se todas as variáveis observadas e divide- se pela quantidade, neste nosso exemplo... 2262,5 82 = 27,591463 ≈ 𝟐𝟕, 𝟔 𝐚𝐧𝐨𝐬 𝐝𝐞 𝐢𝐝𝐚𝐝𝐞 Idade dos alunos das turmas de Estatística da Estácio Campus PresVargas em 2018-1 do profº Antº Alexandre xi fi 18 2 19 2 20 4 21 11 22 6 23 5 24 6 25 2 26 6 27 5 28 5 29 4 ... ... 82ESTATÍSTICA E PROBABILIDADE (4) Medidas de Posição 18 18 19 19 20 20 20 20 21 21 21 21 21 21 21 21 21 21 21 22 22 22 22 22 22 23 23 23 23 23 24 24 24 24 24 24 25 25 26 26 26 26 26 26 27 27 27 27 27 28 28 28 28 28 29 29 29 29 30 30 30 30 30 30 30 32 32 32 32 32 34 34 34 34 35 35 36 36 38 50 50 58 Idade dos alunos das turmas de Estatística da Estácio em 2018-1 do profº Antº Alexandre. Moda é o valor mais frequente, simples assim! Nos dados isolados, é melhor ordenar para melhor identificação da Moda. Moda = 21 anos de idade ESTATÍSTICA E PROBABILIDADE (4) Medidas de Posição Moda é o valor mais frequente e, na distribuição de frequência, usamos a seguinte expressão: 𝑀𝑜 = 21 + 22 − 8 2 . 22 − 8 + 14 . 3 Mo = 21+1,9091 => 22,9 anos de idade = 24 – 21 = 3 (4) Medidas de Posição Mediana é o valor observado que ocupa o lugar central DO ROL, ou seja, sempre que for calcular a Mediana, é necessário colocar os dados em ordem (rol). Nos exemplos, observa-se que estão ordenados e o cálculo é diferente se a quantidade de observações é par ou impar. ESTATÍSTICA E PROBABILIDADE (4) Medidas de Posição 18 18 19 19 20 20 20 20 21 21 21 21 21 21 21 21 21 21 21 22 22 22 22 22 22 23 23 23 23 23 24 24 24 24 24 24 25 25 26 26 26 26 26 26 27 27 27 27 27 28 28 28 28 28 29 29 29 29 30 30 30 30 30 30 30 32 32 32 32 32 34 34 34 34 35 35 36 36 38 50 50 58 Idade dos alunos das turmas de Estatística da Estácio em 2018- 1 do profº Antº Alexandre. xi fi fai 18 2 2 19 2 4 20 4 8 21 11 19 22 6 25 23 5 30 24 6 36 25 2 38 26 6 44 27 5 49 28 5 54 29 4 58 ... ... 82 Mediana é o valor observado que ocupa o lugar central DO ROL, ou seja, sempre que for calcular a Mediana, é necessário colocar os dados em ordem (rol). Por ser par a quantidade de observações, a Mediana será a média dos dois valores centrais, então, as idades dos elementos nas posições 41 (82/2) e 42 => (26+26) / 2 = 26 anos de idade. ESTATÍSTICA E PROBABILIDADE (4) Medidas de Posição 𝑀𝑑 = 24 + 82 2 − 30 14 . 3 Md = Mediana = 24+2,357142 => 26,36 anos de idade Mediana é o valor observado que ocupa o lugar central... na distribuição de frequência usaremos a seguinte expressão: (1º) Posição Md = 82 / 2 = 41 Separatrizes são as medidas que dividem nas partes que se deseja: Quartil divide em 4 ( n / 4 ) Decil divide em 10 ( n / 10 ) e Percentil divide em 100 ( n / 100 ) (5) de Tendência Central e Separatrizes Comparando-as: Md Q D P ESTATÍSTICA E PROBABILIDADE 𝑆𝑒𝑝 = 𝐿𝑖𝑆𝑒𝑝 + 𝑃𝑆𝑒𝑝 − 𝐹𝐴𝑐𝐴𝑛𝑡 𝑓𝑆𝑒𝑝 . ℎ Separatrizes são as medidas que dividem nas partes que se deseja: Quartil divide em 4 ( n / 4 ) Decil divide em 10 ( n / 10 ) e Percentil divide em 100 ( n / 100 ). (1º) PosSep= 3 / 4 . 82 = 61,5 (5) de Tendência Central e Separatrizes 𝑄3 = 30 + 61,5 − 58 12 . 3 𝑓𝑆𝑒𝑝 𝐹𝐴𝑐𝐴𝑛𝑡 Q3 = 30 + 0,875 = 30,88 anos de idade. ESTATÍSTICA E PROBABILIDADE 𝑆𝑒𝑝 = 𝐿𝑖𝑆𝑒𝑝 + 𝑃𝑆𝑒𝑝 − 𝐹𝐴𝑐𝐴𝑛𝑡 𝑓𝑆𝑒𝑝 . ℎ (1º) PosSep= 1 / 4 . 82 = 20,5 (5) de Tendência Central e Separatrizes 𝑄1 = 21 + 20,5 − 8 22 . 3 𝑓𝑆𝑒𝑝 𝐹𝐴𝑐𝐴𝑛𝑡 Q1 = 21 + 1,704545 = 22,7 anos de idade. Separatrizes são as medidas que dividem nas partes que se deseja: Quartil divide em 4 ( n / 4 ) Decil divide em 10 ( n / 10 ) e Percentil divide em 100 ( n / 100 ). ESTATÍSTICA E PROBABILIDADE 𝑆𝑒𝑝 = 𝐿𝑖𝑆𝑒𝑝 + 𝑃𝑆𝑒𝑝 − 𝐹𝐴𝑐𝐴𝑛𝑡 𝑓𝑆𝑒𝑝 . ℎ (1º) PosSep= 10 / 100 . 82 = 8,2 (5) de Tendência Central e Separatrizes 𝑃10 = 21 + 8,2 − 8 22 . 3 𝑓𝑆𝑒𝑝 𝐹𝐴𝑐𝐴𝑛𝑡 P10 = 21 + 0,027273 = 21,03 anos de idade Separatrizes são as medidas que dividem nas partes que se deseja: Quartil divide em 4 ( n / 4 ) Decil divide em 10 ( n / 10 ) e Percentil divide em 100 ( n / 100 ). ESTATÍSTICA E PROBABILIDADE 𝑆𝑒𝑝 = 𝐿𝑖𝑆𝑒𝑝 + 𝑃𝑆𝑒𝑝 − 𝐹𝐴𝑐𝐴𝑛𝑡 𝑓𝑆𝑒𝑝. ℎ (1º) PosSep= 90 / 100 . 82 = 73,8 (5) de Tendência Central e Separatrizes 𝑃90 = 33 + 73,8 − 70 6 . 3 𝑓𝑆𝑒𝑝 𝐹𝐴𝑐𝐴𝑛𝑡 P90 = 33 + 1,9 = 34,9 anos de idade. Separatrizes são as medidas que dividem nas partes que se deseja: Quartil divide em 4 ( n / 4 ) Decil divide em 10 ( n / 10 ) e Percentil divide em 100 ( n / 100 ). ESTATÍSTICA E PROBABILIDADE Então, temos: P10 = 21,0 anos de idade Q1 = 22,7 anos de idade Md = 26,4 anos de idade Q3 = 30,9 anos de idade P90 = 34,9 anos de idade (5) de Tendência Central e Separatrizes Idade dos alunos das turmas de Estatística da Estácio Campus PresVargas em 2018-1 do profº Antº Alexandre Q 22,7 26,4 30,9 25% 25% 25% 25% Anos de idade 27,6 Média 22,9 Moda 21 34,9 ESTATÍSTICA E PROBABILIDADE (5) de Tendência Central e Separatrizes Idade dos alunos das turmas de Estatística da Estácio Campus PresVargas em 2018-1 do profº Antº Alexandre 𝑪𝒖𝒓𝒕𝒐𝒔𝒆 = 𝑲 = 𝑄3 − 𝑄1 2 𝑃90 − 𝑃10 = 30,9 − 22,7 2 34,9 − 21 = 0,29496 Q 22,7 26,4 30,9 25% 25% 25% 25% Anos de idade 27,6 Média 22,9 Moda 21 34,9 K < 0,263 Leptocúrtica K = 0,263 Mesocúrtica K > 0,263 Platicúrtica ESTATÍSTICA E PROBABILIDADE (5) de Tendência Central e Separatrizes Idade dos alunos das turmas de Estatística da Estácio Campus PresVargas em 2018-1 do profº Antº Alexandre 𝑨𝒔𝒔𝒊𝒎𝒆𝒕𝒓𝒊𝒂 = 𝑄1 + 𝑄3 − 2.𝑀𝑑 𝑄3 − 𝑄1 = 22,7 + 30,9 − 2 . 26,4 30,9 − 22,7 = 0,09756 Simétrica Q 22,7 26,4 30,9 25% 25% 25% 25% Anos de idade 27,6 Média 22,9 Moda 21 34,9 Observe como é o formato do histograma da nossa distrib. de frequência. ESTATÍSTICA E PROBABILIDADE Gráficos - 8 22 14 14 12 6 3 0 - 5 10 15 20 25 19,5 22,5 25,5 28,5 31,5 34,5 37,5 52,7 Histograma Idade dos alunos das turmas de Estatística da Estácio Campus PresVargas em 2018-1 do profº Antº Alexandre ESTATÍSTICA E PROBABILIDADE Gráficos ESTATÍSTICA E PROBABILIDADE Gráficos ESTATÍSTICA E PROBABILIDADE Gráficos ESTATÍSTICA E PROBABILIDADE Gráficos ESTATÍSTICA E PROBABILIDADE Gráficos 4/24/2018 44 ESTATÍSTICA E PROBABILIDADE Gráficos 4/24/2018 45
Compartilhar