Baixe o app para aproveitar ainda mais
Prévia do material em texto
Prof. Me. José Lorandi UNIDADE I Estatística Iniciamos apresentando alguns conceitos básicos, como as definições de estatística, amostra, população, processos e dados estatísticos. Definimos, ainda, o que é estatística descritiva, dados brutos e rol. Estatística é um ramo da matemática que visa coletar, analisar e interpretar dados, usando como ferramentas tabelas e gráficos para analisar fenômenos. Uma das maneiras de classificarmos a estatística é “dividi-la” em dois segmentos: Estatística Descritiva. Estatística Indutiva. Conceito Básico da Estatística A Estatística Descritiva trabalha com conjuntos de dados oriundos de algo “certo”, que já aconteceu, que “pertence ao passado”. Exemplo: Se soubermos a idade de três pessoas e quisermos calcular a idade média desse grupo, não há incerteza associada a tal cálculo. Estatística Descritiva A Estatística Indutiva trabalha com uma amostra a fim de que, com o uso de técnicas e métodos adequados, seja possível obter informações a respeito da população que tal amostra representa. Nesse caso, para dado intervalo de confiança, temos um erro associado. Exemplo: Se uma pesquisa eleitoral diz que certo candidato tem 60% dos votos, com margem de erro de 3% e confiança de 95%. Isso significa que ele tem 95% de chance de ter entre 57% e 63% dos votos na data da pesquisa. Vale destacar que nem sempre a máxima “amostra boa é amostra grande” é verdadeira, pois amostra boa é amostra que fornece todas as características presentes na população e na proporção em que ocorrem na população. Estatística Indutiva População e amostra Podemos definir população (ou universo) como um conjunto completo de elementos com um parâmetro comum. A população finita tem um número determinado de elementos, enquanto a população infinita não tem. Exemplo: A população brasileira é formada pelo conjunto de pessoas nascidas no Brasil ou com nacionalidade brasileira, então a população pode ser classificada em finita ou infinita. A amostra é um subconjunto da população. Exemplo: O grupo formado por jovens brasileiros de 12 a 14 anos é uma amostra da população brasileira. Conceitos fundamentais para o estudo da Estatística Processos Estatísticos de Abordagem No estudo de um fenômeno coletivo usando Estatística, podemos escolher entre duas diferentes abordagens: Censo. Amostragem. No Censo é feita a avaliação direta de um parâmetro utilizando-se de toda a população. A necessidade de acessar toda a população para obter a informação faz com que o processo seja lento, mas aumenta sua confiabilidade. Na Amostragem, a avaliação de um parâmetro é indireta e usa-se como estimador o cálculo de probabilidades. Nela, não é necessário acessar toda a população, de forma que o processo se torna mais rápido e com menos custos, permitindo, ainda, que os dados sejam constantemente atualizados. Conceitos fundamentais para o estudo da Estatística Dados Estatísticos Os Dados Estatísticos são os elementos fundamentais a partir dos quais a estatística é feita. Define-se como variável a característica de interesse de cada dado da amostra ou da população. As variáveis podem ser de dois tipos: Variáveis Quantitativas. Variáveis Qualitativas. Conceitos fundamentais para o estudo da Estatística Variáveis Quantitativas As Variáveis Quantitativas assumem valores numéricos e, a partir deles, podemos realizar cálculos estatísticos. Tais variáveis são classificadas como discretas ou contínuas. Discretas: assumem apenas certos valores (inteiros). Contínuas: podem assumir um intervalo de valores. Conceitos fundamentais para o estudo da Estatística Variáveis Qualitativas Contêm informações não numéricas relativas a categorias, como gênero, cargo e endereço, ao tratarmos de pessoas, ou cor, volume e peso, ao tratarmos de produtos. Ordinais: contêm informações que localizam o dado dentro de uma categoria, por exemplo, escolaridade. Nominais: contêm informações que não localizam o dado em uma categoria, como cor dos olhos ou endereço. Conceitos fundamentais para o estudo da Estatística Analise o quadro a seguir e indique as Variáveis Qualitativas. a) São Variáveis Qualitativas o número do apartamento, o nome do morador responsável e a placa do carro. b) É Variável Qualitativa o número do apartamento. c) É Variável Qualitativa o nome do morador. d) É Variável Qualitativa a placa do carro. e) É Variável Qualitativa o número de moradores. Interatividade Apartamento Morador responsável Placa do carro Número de moradores 10 Paula Silva – 2 11 Felipe Rodrigues DEF2132 5 20 Marcos Junior F23R222 4 21 Diana Souza AED1202 1 30 Rafaela Moraes – 2 Tabela 1 – Dados dos moradores do condomínio Analise o quadro a seguir e indique as Variáveis Qualitativas. a) São Variáveis Qualitativas o número do apartamento, o nome do morador responsável e a placa do carro. b) É Variável Qualitativa o número do apartamento. c) É Variável Qualitativa o nome do morador. d) É Variável Qualitativa a placa do carro. e) É Variável Qualitativa o número de moradores. Resposta Apartamento Morador responsável Placa do carro Número de moradores 10 Paula Silva – 2 11 Felipe Rodrigues DEF2132 5 20 Marcos Junior F23R222 4 21 Diana Souza AED1202 1 30 Rafaela Moraes – 2 Tabela 1 – Dados dos moradores do condomínio Como já foi comentado, a estatística divide-se em: Estatística Descritiva. Estatística Indutiva. A Estatística Descritiva tem como objetivo organizar e analisar um conjunto de dados utilizando: Média. Moda. Mediana. Estatística Descritiva A Estatística Indutiva tem como objetivo inferir, induzir ou estimar o comportamento da população a partir da qual a amostra foi obtida. A Estatística Indutiva faz uma generalização a partir de resultados particulares. Estatística Indutiva A Estatística Descritiva e o estudo estatístico completo de uma população deve se basear no método estatístico, que é composto por uma série de etapas listadas a seguir: 1) Definição do problema. 2) Delimitação do problema. 3) Planejamento para a obtenção dos dados. 4) Coleta dos dados. 5) Apuração dos dados. 6) Apresentação dos dados. 7) Análise dos dados. 8) Interpretação dos dados. Estatística Descritiva Chamamos de Dados Brutos os dados exatamente da forma como são obtidos, sem tratamento nem organização. Por exemplo: em uma pesquisa de cargos e salários, o conjunto de dados com cargo do funcionário e o seu salário são Dados Brutos se não passaram por nenhuma forma de organização. Não é incomum que Dados Brutos, isto é, dados sem nenhum tipo de tratamento –, apresentem incompatibilidades que precisam ser resolvidas. Um exemplo clássico está nos dados envolvendo datas, que podem ser escritas em diversos formatos; esses formatos precisam ser uniformizados para que a análise dos dados seja feita de forma correta. Outro exemplo de incompatibilidade é a frequência de nomes de cidades com diversas grafias possíveis, como São Paulo, S.Paulo ou, ainda, SP, que se referem à mesma cidade e devem ter a grafia uniformizada. Dados Brutos Se partirmos de Dados Brutos e aplicarmos alguma forma de organização, teremos o que chamamos de Rol. No Rol, os dados podem ser organizados da seguinte forma: Crescente. Decrescente. Ordem alfabética. Rol Sem nenhuma organização: 9 4 6 7 8,5 3 8 10 10. Decrescente: 10 10 9 8,5 8 7 6 4 3. Se aplicarmos qualquer processo de organização nesses dados, passaremos a ter um Rol. Rol Aluno Nota Maria 9 Pedro 4 Otávio 6 Mariana 7 Sheila 8,5 Oswaldo 3 Matheus A. 8 Matheus R. 10 Leonardo 10 Tabela 2 – Desempenhos dos alunos na prova Dessa forma, é possível analisar a distribuição de notas dos alunos com mais facilidade, mas a informação ainda não está apresentada da melhor maneira, o quepode ser feito a partir de um estudo de frequências (que veremos mais adiante). Nem todos os dados, porém, são de natureza numérica. A tabela 2 também apresenta informações sob a forma de nomes, que são classificados como dados alfanuméricos. Poderíamos obter um Rol organizando o nome dos alunos em ordem alfabética, por exemplo. Rol Um estudo estatístico completo de uma população deve basear-se no método estatístico, que é composto por uma Série de Etapas. Qual alternativa a seguir pode ser classificada como uma das etapas? a) Entrevista. b) Reunião. c) Gráfico. d) Coleta dos dados. e) Exclusão de dados. Interatividade Um estudo estatístico completo de uma população deve basear-se no método estatístico, que é composto por uma Série de Etapas. Qual alternativa a seguir pode ser classificada como uma das etapas? a) Entrevista. b) Reunião. c) Gráfico. d) Coleta dos dados. e) Exclusão de dados. Resposta Série de Etapas 1) Definição do problema. 2) Delimitação do problema. 3) Planejamento para a obtenção dos dados. 4) Coleta dos dados. 5) Apuração dos dados. 6) Apresentação dos dados. 7) Análise dos dados. 8) Interpretação dos dados. Definimos como Séries Estatísticas as tabelas que apresentam os dados organizados em função do tempo, da localidade ou da espécie do dado. As Séries Estatísticas são classificadas em: Séries Históricas – classificadas em função do tempo. Séries Geográficas – classificadas em função da localidade. Séries Específicas – classificadas em função de categorias características dos dados. Séries Conjugadas – é uma combinação das geográficas ou específicas. Séries Estatísticas As Séries Históricas são classificadas em função do tempo; as Séries Geográficas são classificadas em função da localidade; as Séries Específicas são classificadas em função de categorias características dos dados; e as Séries Conjugadas, também conhecidas como Séries Mistas, são uma combinação das Séries Temporais, Geográficas ou Específicas. Séries Estatísticas Fonte: IBGE (c2022b). Ano População 1991 146.815.815 2000 169.872.856 2010 190.755.799 Tabela 3 – População residente no Brasil, por ano Na tabela 4 a seguir é apresentado um exemplo de Séries Geográficas, onde os dados são organizados por localidade: Séries Geográficas Fonte: IBGE (c2022b). Grande região População Norte 15.864.454 Nordeste 53.081.950 Sudeste 80.364.410 Sul 27.386.891 Centro-Oeste 14.058.094 Tabela 4 – População residente no Brasil em 2010, por grande região Na tabela 5 a seguir, temos um exemplo de Séries Específicas, onde os dados são organizados por sexo. Séries Especificas Fonte: IBGE (c2022b). Sexo População Homens 93.406.990 Mulheres 97.348.809 Tabela 5 – População residente no Brasil em 2010, por sexo Na tabela 6 a seguir, temos um exemplo de Séries Conjugadas ou Mistas: Séries Conjugadas Fonte: IBGE (c2022b). Tabela 6 – População residente no Brasil em 2010, por grande região e por ano Grande Região Ano 1991 2000 2010 Norte 10.027.373 12.911.170 15.864.454 Nordeste 42.494.112 47.782.487 53.081.950 Sudeste 62.740.146 72.430.193 80.364.410 Sul 22.129.131 25.119.348 27.386.891 Centro-Oeste 9.425.053 11.638.658 14.058.094 A maneira fundamental de apresentação e organização de Dados Estatísticos é por tabelas. São partes fundamentais de uma tabela: título; cabeçalho; coluna indicadora; corpo da tabela: linhas; células. Apresentação de Dados Estatísticos O título localiza-se na parte superior da tabela (ABNT, 2011) e especifica o assunto dos dados da tabela e, se for o caso, o período ao qual os dados se referem. Todas as tabelas devem ter título. O cabeçalho é a parte superior da tabela, normalmente destacado do corpo da tabela. O cabeçalho deve indicar os conteúdos de cada coluna. A coluna indicadora é, normalmente, a primeira coluna à esquerda da tabela e especifica o conteúdo das linhas. Na tabela 5, a coluna indicadora é o sexo. Abaixo do cabeçalho e à direita da coluna indicadora, temos o corpo da tabela. No corpo da tabela temos as linhas, que disponibilizam a informação no sentido horizontal. Cada elemento do corpo da tabela, obtido pelo cruzamento de uma linha com uma coluna, é chamado de célula. Apresentação de Dados Estatísticos Aqui será discutido como apresentar dados usando uma Distribuição de Frequência (f). A primeira etapa trata-se de Variáveis Discretas. Distribuição de Frequência – Variável Discreta Imagine que esse dado tenha sido lançado 14 vezes e que tenham sido obtidos os seguintes resultados: 4 2 5 1 3 5 2 6 1 6 2 2 3 1. Note que, se somarmos as Frequências, devemos recuperar o número total de lançamentos (14). Figura 1 – Dados mostrando cada uma das 6 faces Disponível em: https://cutt.ly/bMxBZzD Face do dado Frequência 1 3 2 4 3 2 4 1 5 2 6 2 Tabela 7 – Frequência de resultados obtidos pelo lançamento de um dado Na Frequência Relativa dividimos a frequência de cada valor pelo número total de dados na amostra ou população. Na tabela 8 a seguir são expostas as Frequências Relativas para o resultado do lançamento do dado estudado no exemplo anterior. Distribuição de Frequência Relativa Note que a soma das Frequências Relativas deve ser igual a 1, ou próxima de 1, no caso de arredondamento dos valores. Face do dado Frequência Frequência relativa 1 3 3/14 = 0,21 2 4 4/14 = 0,29 3 2 2/14 = 0,14 4 1 1/14 = 0,08 5 2 2/14 = 0,14 6 2 2/14 = 0,14 Tabela 8 – Frequência relativa de resultados obtidos por 14 lançamentos de um dado Nesse caso, é fundamental que os dados sejam agrupados em classes ou intervalos, como foi feito com as Variáveis Discretas. Todas as observações sobre a distribuição de Frequência para as Variáveis Discretas aplicam-se também à distribuição de Frequências das Variáveis Contínuas. Distribuição de Frequência – Variável Contínua Frequentemente, a visualização de dados em uma tabela não apresenta, de forma imediata, as características dos dados, ainda mais para o público leigo. Salário (em salários mínimos) Número de funcionários 0├ 1 0 1├ 2 5 2├ 3 23 3├ 4 53 4├ 5 12 Tabela 12 – Distribuição de salários em uma empresa Durante sua fase inicial, um aplicativo recebeu as seguintes avaliações dos seus primeiros 200 usuários: a) Esse aplicativo tem boa aceitação, pois a frequência relativa das 5 estrelas é igual a 50%. b) Esse aplicativo tem boa aceitação, pois a frequência relativa das 5 estrelas é maior que 50%. c) Esse aplicativo não tem boa aceitação, pois a frequência relativa das 5 estrelas é menor que 50%. d) Esse aplicativo não tem boa aceitação, pois a frequência relativa das 5 estrelas é igual a 50%. e) Esse aplicativo não tem boa aceitação, pois a frequência relativa das 5 estrelas é igual a 500%. Interatividade Estrelas Frequência absoluta 1 estrela 20 2 estrelas 8 3 estrelas 10 4 estrelas 7 5 estrelas 55 Não avaliam 100 A alternativa correta é a B. Primeiramente, calcularemos a frequência relativa das 5 estrelas. Porém, note que havia 200 usuários, sendo que 100 deles não avaliaram, e queremos a frequência relativa somente daqueles que avaliaram, ou seja, 200 – 100 = 100 usuários Desses 100 usuários, 55 avaliaram com 5 estrelas, então temos: 55 : 100 = 0,55 = 55% Logo, podemos afirmar que o aplicativo tem boa aceitação, pois a frequência relativa de 5 estrelas é maior que 50%. Resposta A melhor forma de apresentarmos os dados ou resultados de uma pesquisa costuma ser por meio de Gráficos. Os Gráficos, independentemente do tipo, precisam ser de fácil visualização e de rápida interpretação. Assim como as tabelas, os Gráficos devem sempre ser identificados por um título na parte superior, e, se for o caso, a fonte dos dados deve ser identificada na parte inferior. Representação Gráfica de Séries EstatísticasFigura 4 – Gráficos em um relatório Disponível em: https://cutt.ly/UMx156S Existem diversos tipos de Gráficos, como os listados a seguir: Gráfico de Dispersão. Gráfico de Barras. Gráfico de Colunas. Gráfico de Setores. Histograma. Polígono de Frequências. De acordo com os dados que são representados no Gráfico, um tipo pode ser mais adequado do que o outro. Representação Gráfica de Séries Estatísticas O Gráfico de Dispersão é um dos tipos mais usado nas ciências exatas. Podemos utilizar Gráficos de Dispersão quando queremos mostrar a relação entre duas (ou três) grandezas. Esse gráfico em duas dimensões tem dois eixos, um na vertical e outro na horizontal. Nos eixos deve-se indicar sempre as grandezas representadas neles e, se for o caso, suas unidades. Representação Gráfica – Dispersão Relação entre expectativa de vida e PIB per capita, por país Expectativa de vida (anos) 80 60 40 0 20K 40K 60K 80K 100K 120K 140K PIB per capita (US$) Figura 5 – Gráfico tipo dispersão Quando desejamos mostrar a evolução de dada grandeza, ou ainda comparar essa grandeza em locais e situações diferentes, trabalhamos com Gráficos de Barras. Os Gráficos de Barras também têm dois eixos: no eixo vertical, costuma-se colocar a variável categórica (ou qualitativa), já no eixo horizontal, costuma-se colocar a variável quantitativa. Representação Gráfica – Barras Nordeste Sudeste Norte Sul Centro-Oeste 0 2.000.000 4.000.000 6.000.000 8.000.000 Número de pessoas Grande região Número de pessoas analfabetas, por região Figura 6 – Exemplo de gráfico de barras representando o número de pessoas analfabetas, por região Outra forma de representação similar ao Gráfico de Barras é o Gráfico de Colunas. A diferença entre eles é que, no Gráfico de Colunas, a variável categórica é representada no eixo horizontal, e a variável quantitativa é representada no eixo vertical. Representação Gráfica – Colunas Número de pessoas 8.000.000 6.000.000 4.000.000 2.000.000 0 Grande região Pessoas analfabetas, por grande região Figura 8 – Exemplo de gráfico de colunas representando o número de pessoas analfabetas, por grande região O Gráfico de Setores, ou “Gráfico de Pizza”, é um gráfico polêmico e muitos não gostam de usá-lo. O Gráfico de Setores é apresentado de forma circular e é utilizado para representar a divisão de dada grandeza em diferentes categorias, em que cada categoria usa uma fatia do círculo. Nesse tipo de gráfico é interessante representar a grandeza quantitativa sob a forma de porcentagem. Representação Gráfica – Setores Porcentagem de alfabetização no Brasil, 2010 Alfabetizados Não alfabetizados 10,53% 89,47% Figura 9 – Exemplo de gráfico de setores, mostrando a porcentagem de alfabetização no Brasil no ano de 2010 Representação Gráfica – Setores Distribuição da população por idade no Brasil, 2010 0 a 5 anos 20 a 24 anos 60 a 69 anos 6 a 5 anos 25 a 29 anos 70 anos ou mais 7 a 9 anos 30 a 39 anos 10 a 14 anos 40 a 49 anos 15 a 19 anos 50 a 59 anos 5,22% 6,72% 10,41% 14,04% 16,75% 9,67% 9,74% 9,6% 9,7% 5,17% 3,29% 8,46% Figura 10 – Exemplo de gráfico em que a representação por setores não é adequada. Temos nesse gráfico a distribuição da população brasileira por idade, onde os setores ocupam áreas muito parecidas e a variação dos dados não se torna evidente O Histograma é uma variação do Gráfico de Colunas, em que: no eixo horizontal, os dados são divididos em intervalos (ou classes); no eixo vertical é apresentada a frequência dos dados. Representação – Histograma Distribuição de frequência para lançamento de um dado numérico de 6 faces Frequência 4 3 2 1 1 2 3 4 5 6 Face Figura 12 – Exemplo de histograma construído a partir dos dados da tabela 7, com dados de frequência absoluta dos resultados de 14 lançamentos de um dado de 6 faces Quando trabalhamos com Histogramas é possível incluir no gráfico o que chamamos de Polígono de Frequências, obtido pela ligação dos pontos médios do topo de cada barra do Histograma (figura 14). Representação – Histograma Distribuição de frequência para lançamento de um dado numérico de 6 faces Frequência relativa 0,30 0,20 0,10 1 2 3 4 5 6 Face Figura 14 – Histograma de frequências relativas com Polígono de Frequências para os resultados de 14 lançamentos de um dado de 6 faces Um estudo estatístico completo de uma população deve se basear no método estatístico, que é composto por uma série de fases: Definição do problema. Delimitação do problema. Planejamento para a obtenção dos dados. Coleta dos dados. Apuração dos dados. Apresentação dos dados. Análise dos dados. Interpretação dos dados. Concluindo Para efeito de análise dos dados, consideramos que todos os dados, quando agrupados em intervalos ou classes, estão associados ao Ponto Médio (Pm) da classe à qual pertencem. O Ponto Médio de uma classe é calculado por: Na equação: Ls é o limite superior do intervalo ou da classe. Li é o limite inferior do intervalo ou da classe. Concluindo Interatividade Um entrevistador perguntou a um grupo de pessoas a respeito do sabor preferido de sorvete. Com os dados obtidos, o entrevistador elaborou o gráfico a seguir. Figura 16 Chocolate Morango Creme Flocos Napolitano Sabor preferido de sorvete 7 6 5 4 3 2 1 0 Q u a n ti d a d e d e p e s s o a s Com base no exposto e em seus conhecimentos, avalie as afirmativas a seguir. I. O gráfico elaborado pelo entrevistador é chamado de Gráfico de Dispersão. II. Foram entrevistadas 20 pessoas. III. O percentual de pessoas que prefere sorvete de flocos é igual a 30%. É correto o que se afirma em: a) I, apenas. b) II, apenas. c) III, apenas. d) II e III, apenas. e) I, II e III. Interatividade Resposta correta: alternativa D – II e III, apenas. Análise das afirmativas: I. Afirmativa incorreta. Justificativa: o gráfico elaborado pelo entrevistador é chamado de Gráfico de Colunas (ou barras verticais). II. Afirmativa correta. Justificativa: temos a quantidade de pessoas que preferem determinado sabor de sorvete e a quantidade total de pessoas entrevistadas (20). III. Afirmativa correta. Justificativa: como 6 das 20 pessoas preferem sorvete de flocos, o percentual de pessoas que prefere sorvete de flocos é igual a 30%. Resposta ATÉ A PRÓXIMA!
Compartilhar