Baixe o app para aproveitar ainda mais
Prévia do material em texto
Unidade I ESTATÍSTICA APLICADA Profa. Ana Carolina Bueno Estatística Interpretar processos em que há variabilidade. “Estatísticas” indica qualquer coleção de dados quantitativos, ou ainda, ramo da matemática que trata da coleta, da análise, da interpretação e da apresentação de massa de dados numéricos. “Estatística” é um conjunto de métodos e processos quantitativos que serve para estudar e medir os fenômenos coletivos. Áreas da estatística Estatística descritiva: descreve e analisa determinada população, utilizando métodos numéricos e gráficos, para se determinarem padrões, em um conjunto de dados e, assim, apresentar a informaçãoinformação. Estatística inferencial: conjunto de métodos para a tomada de decisões, nas situações em que há incerteza, variações ou outras generalizações acerca de um conjunto maior de dadosconjunto maior de dados. Classificação dos dados Qualitativos Dados Quantitativos Discretos Contínuos Classificação dos dados Elementos da estatística População Amostra Amostragem Amostragem simples Elementos da estatística Amostragem sistemática Amostragem estratificada Formas iniciais de tratamento de dado A tabela mostra uma pesquisa sobre o número de filhos por funcionário de uma certa empresa: 0 2 1 2 3 5 2 0 2 1 Dados Brutos 2 0 0 1 1 2 3 3 1 2 0 0 0 0 1 1 1 1 1 2 Rol 2 2 2 2 2 2 3 3 3 5 Séries estatísticas Uma série estatística se define como qualquer tabela na qual haja distribuição de um conjunto de dados estatísticos destinados a uma mesma ordem de classificação: quantitativa. Séries estatísticas Séries homógradas: em que há variação discreta ou descontínua na variável descrita. Série temporal Série geográfica Série específica Série específica Séries heterógradas: são aquelas nas quais o fenômeno/fato apresenta gradações ou subdivisões. Distribuição de frequências Distribuição de frequências Organiza os dados de acordo com as ocorrências dos diferentes resultados observados. Apresentada em tabela ou gráfico. Tabela: apresenta de forma resumida um conjunto de dados. Tabelas de Frequência Tabelas de Frequência Relativas Tabelas de Frequência AcumuladasTabelas de Frequência Acumuladas Tabelas Interatividade São dados os seguintes experimentos: I. Lançar uma moeda cinco vezes e observar o número de caras. II. Numa linha de produção, observar dez itens, tomados ao acaso, e verificar quantos estão defeituosos. III. Verificar o tempo que internautas ficam em site de p q reportagem. IV. Em uma realização de projeto, verificar a porcentagem do término do projeto após 6 meses. Quais dos itens acima terão eventos classificados como variáveis aleatórias discretas? a) I, II.a) , b) I, IV. c) II, IV. d) III. e) I, II, III, IV. Distribuição de frequências Gráficos: são usados para visualizar facilmente a natureza da distribuição dos dados. Um gráfico é uma figura constituída a partir de uma tabela, pois é quase sempre possível locar um dado tabulado num gráfico. C l Colunas Barras Linhas Setores DispersãoDispersão Histograma Polígono de frequência Etc. Gráfico em colunas Gráfico em barras Gráfico em linhas Gráfico em setores Total __________360º Parte___________ xº Diagrama de dispersão Histograma 8 10 12 un os Estatura de 40 alunos 0 2 4 6 8 N úm er o d e a lu 0 148. 152. 156. 160. 164. 168. 172. 176. estatura Polígono de frequência 8 10 12 al un os Estatura de 40 alunos 0 2 4 6 148. 152. 156. 160. 164. 168. 172. 176. N úm er o d e a Estatura Medidas de tendência central Como podemos Como podemos descrever estes dados? Como podemos resumir estes dados? Média Estatura Xi Fi 150 154 152 4 154 158 156 9 158 162 160 11 162 166 164 8 Mediana Moda 12s Estatura de 40 alunos 166 170 168 5 170 174 172 3 Total 40 0 2 4 6 8 10 148. 152. 156. 160. 164. 168. 172. 176. N úm er o d e a lu no s Estatura Média É a soma dos valores de todas as observações dividida pelo número de observações envolvidas. Vantagem: leva em conta todos os valores no seu cálculo. Número de filhos – média 0 0 0 0 1 1 1 1 1 2 2 2 2 2 2 2 3 3 3 5 Nº de filhos fi 0 4 1 5 2 7 3 3 4 0 5 1 Total 20 Média ponderada Um aluno fez um teste (peso 1) e duas provas (peso 2), tirando 8 no teste, 5 na primeira prova e 6 na segunda prova. A sua média (ponderada) será Se o teste e a prova tivessem o mesmo peso (e não importa qual o valor do peso, importa apenas a relação entre os pesos), a média seria, aproximadamente, 6,33. Interatividade Em um levantamento realizado em maio, com os 134 funcionários da empresa XK, em relação a variável expressa em unidades monetárias (u.m.), obteve-se a tabela abaixo. Determine a média. Salário Nº de funcionários 3 32 a) 3 salários. 3 32 5 34 7 40 9 28 b) 4 salários. c) 5 salários. d) 6 salários. e) 7 salários. Mediana (Md) Divide uma série ordenada de dados em duas partes iguais. Ocupa a posição central. Não é afetada por valores extremos. A amostra pode ter número ímpar de elementos ou número par de elementos. Calcular a posição da mediana com a formula a seguir: Posição mediana = (n + 1)/2. Mediana – nº ímpar de elementos Um conjunto de dados indica o salário de funcionários de uma empresa xi = {6, 9, 3, 5, 2, 9, 5, 5, 8, 7, 1, 7, 2}, em que n = 13. Rol - {1, 2, 2, 3, 5, 5, 5, 6, 7, 7, 8, 9, 9} Posição mediana = (n+1)/2 Posição mediana = (13+1)/2 = 7 (indica a posição) Então Md = 5 Mediana – nº par de elementos Exemplo: número de filhos Posição mediana = (20 + 1) / 2 = 10,5 0 0 0 0 1 1 1 1 1 2 2 2 2 2 2 2 3 3 3 5 Então: Md = (2 + 2)/2 = 2 filhos Moda (Mo) Um conjunto de dados ao dado que ocorre com maior frequência. A moda não é afetada por valores extremos. É utilizada para fins descritivos apenas, uma vez que é, dentre as medidas de tendência a mais variável de amostratendência, a mais variável de amostra para amostra. Uma moda: unimodal Duas modas: bimodal Mais de duas modas: multimodalMais de duas modas: multimodal Nenhuma moda: amodal Número de filhos – moda Mo = 2 filhos (unimodal) 0 0 0 0 1 1 1 1 1 2 2 2 2 2 2 2 3 3 3 5 Nº de filhos fi 0 4 1 5 2 7 3 3 4 0 5 1 Total 20 Medidas de dispersão Medidas que mostram a dispersão dos dados em torno da tendência central. A variação se refere a quanto os valores podem diferir entre si e pode ser medida por números específicos. Os números relativamente próximos uns Os números relativamente próximos uns dos outros têm baixas medidas de variação, enquanto os valores mais dispersos têm maior medida de variação. 10 12 os Estatura de 40 alunos 0 2 4 6 8 10 148. 152. 156. 160. 164. 168. 172. 176. N úm er o d e a lu n Estatura Medidas de dispersão Amplitude Amplitude Total = Valor máximo – Valor mínimo Variância Desvio padrão Coeficiente de variação 100 x sCV Amplitude – número de filhos Amplitude Total = Valor máximo – Valor mínimo Amplitude Total = 5 – 0 = 5 Nº de filhos fi 0 4 1 5 2 7 3 3 4 0 5 1 Total 20 Variância – número de filhos 0 0 0 0 1 1 1 1 1 2 2 2 2 2 2 2 3 3 3 5 � � Número de filhosVariância (s²) Nº de filhos fi 0 4 (-1,65)² = 2,72 2,724 = 10,88 1 5 (-0,65)² = 0,42 0,425 = 2,10 2 7 0,35² = 0,12 0,12 7 = 0,84 3 3 1,35² = 1,82 1,82 3 = 5,46 4 0 2,35² = 5,52 5,52 0 = 0 5 1 3,35² = 11,22 11,22 1 = 11,22 Total 20 = 30,50 � � Número de filhos – desvio padrão (s) � �� � Interatividade Dada a tabela do número de erros de impressãoDada a tabela do número de erros de impressão da primeira página de um jornal durante 50 dias, assinale a alternativa correta. Erros fi xi . fi (xi – x)² * fi 7 11 7 x 11 = 77 (7 – 12,7)² x 11 = 357,4 11 14 11 x 14 154 (11 12 7)² x 14 40 5 a) O tamanho da amostra é igual a 52. 11 14 11 x 14 = 154 (11 – 12,7)² x 14 = 40,5 15 14 15 x 14 = 210 (15 – 12,7)² x 14 = 74,1 19 9 19 x 9 =171 (19 – 12.7)² x 9 = 357,2 48 = 612 = 829,2 b) A média é igual a 10,5 erros. c) O desvio padrão é igual a 17,3 erros. d) O desvio padrão é igual a 4,2 erros. e) A variância é igual a 4 erros². Coeficiente de variação (CV) O coeficiente de variação é a razão entre o desvio padrão e a média. O resultado é multiplicado por 100, para que o coeficiente de variação seja dado em porcentagem. O coeficiente de variação mede a dispersão em relação à média comparando dois 100 x sCV em relação à média, comparando dois conjuntos de dados diferentes. Coeficiente de variação Idade 100 x sCV Estatura 100 65,1 23,1 CV %55,74CV 100 161 57,5 CV %46,3CV Exemplo Considere uma população de 40 profissionais liberais que foram questionados sobre o número de revistas e/ou jornais que eles são assinantes. Obteve-se os seguintes dados: 2 0 4 3 1 2 3 0 2 1 3 1 2 4 4 0 3 2 1 3 2 1 3 0 2 3 2 1 2 3 4 1 2 2 1 3 3 0 2 0 Exemplo Rol 0 0 0 0 0 0 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3 4 4 4 4 Nº de publicações Nº de profissionais 0 6 1 8 3 3 3 3 3 3 4 4 4 4 2 12 3 10 4 4 Exemplo – gráfico 10 12 14 on ai s Nº de assinantes 0 2 4 6 8 10 1 2 3 4 5 N º d e p ro fis si o 0 1 2 3 41 2 3 4 5 Nº de publicações 0 1 2 3 4 Exemplo – média e moda Nº de publicações Nº de profissionais xi.fi 0 6 0x6 = 0 1 8 1x8 = 8 2 12 2x12 = 24 Média = 1,95 publicação 3 10 3x10 = 30 4 4 4x4 = 16 Total 40 (xifi) = 78 Moda Mo = 2 publicações 95,1 40 78 40 16302480 x Exemplo – mediana 0 0 0 0 0 0 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3 4 4 4 4 Mediana Posição: (40 + 1)/2 = 20,5 Então, Md (2 2)/2 2 bli õ 3 3 3 3 3 3 4 4 4 4 Md = (2 + 2)/2 = 2 publicações Exemplo – amplitude Nº de publicações Nº de profissionais 0 6 1 8 2 12 A lit d V l V l 2 12 3 10 4 4 Amplitude Total = Valor máximo – Valor mínimo Amplitude Total = 4 – 0 = 4 Exemplo – variância Nº de publicações Nº de profissionais (xi – x)².fi 0 6 (0 – 1,95)² 6 = 22,82 1 8 (1 – 1,95)² 8 = 7,22 Sabendo que a média é 1,95 publicações 2 12 (2 – 1,95)² 12 = 0,03 3 10 (3 – 1,95)² 10 = 11,03 4 4 (4 – 1,95)² 4 = 16,81 Total 40 = 57,91 ²45,1 40 91,57² 2 publicação n xxs Exemplo – desvio padrão Nº de publicações Nº de profissionais (xi – x)².fi 0 6 (0 – 1,95)² 6 = 22,82 1 8 (1 – 1,95)² 8 = 7,22 Sabendo que a média é 1,95 publicações 2 12 (2 – 1,95)² 12 = 0,03 3 10 (3 – 1,95)² 10 = 11,03 4 4 (4 – 1,95)² 4 = 16,81 Total 40 = 57,91 publicaçãos 20,145,1 Exemplo – coeficiente de variação Um CV igual a 61,54% indica que a dispersão dos dados em relação à média %54,61100 95,1 2,1 CV dispersão dos dados em relação à média é muito grande, ou seja, a dispersão relativa é alta. Interatividade É dada uma tabela de uma amostra das notas dos alunos da disciplina de estatística. I. A amostra tem 5 alunos. II A édi d t é i l 3 Nota Alunos 6,3 2 8,4 3 5,3 2 9 5 3II. A média da nota é igual a 3. III. A moda da nota é igual a 6,5. IV. A variância não pode ser usada como parâmetro para medir a variabilidade dos dados. Assinale a alternativa com as afirmações incorretas. ) I 9,5 3 6,5 5 a) I. b) II. c) III e IV. d) I, II e IV. e) I, II, III e IV. ATÉ A PRÓXIMA!
Compartilhar