Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 Tópicos de Estatística Descritiva Professor Paulo Roberto paulnscmnt@globo.com INTRODUÇÃO: ‘ Iniciamos este estudo com algumas definições de Estatísticas de forma a esclarecer que as definições estão baseadas na forma que cada um dos autores citados desenvolve suas pesquisas nessa área. Aqui, levaremos em conta que base dos estudos estatísticos está intimamente ligada aos fenômenos de populações que apresentam uma mesma característica “ESTATÍSTICA é um conjunto de métodos e processos quantitativos que serve para estudar e medir os fenômenos coletivos” Ermes Medeiros da Silva “A ESTATÍSTICA dedica-se ao desenvolvimento e ao uso de métodos para coleta e a análise de dados, i. e., a interpretação substantiva e a construção de inferências neles baseados” Alfredo Alves de Farias “ESTATÍSTICA é uma coleção de métodos para planejar experimentos, obter dados e organizá-los, resumi-los, analisá-los, interpretá-los e deles extrair conclusões” Mário Triola , Nesse contexto: Estatística prevê princípios racionais e técnicas, que nos indicam quando e como podemos decidir sobre informações parciais e incompletas. Em nosso estudo dividiremos a Estatística em dois grupos: (a) Estatística Descritiva (b) Estatística Analítica (Inferência Estatística ou Estatística Inferencial) A primeira destina-se à coleta e à demonstração dos dados através de tabulações, tabelas, gráficos, enquanto a segunda fica destinada à interpretação, conclusões e a tomada de decisão. Na inferência estatística usamos o cálculo de probabilidades para estimar possíveis erros. Considerações Entende-se, por POPULAÇÃO, qualquer conjunto de fenômenos estudados ou a serem estudados tais como objetos, pessoas ou acontecimentos. Esta população pode ser dividida em dois grupos: População finita ou população infinita. Pode parecer estranho falar em população infinita, mas quando estamos trabalhando com uma população finita, onde cada elemento pode ser selecionado mais de uma vez, teoricamente temos uma população infinita. Este fato é utilizado quando trabalhamos com amostragem com repetição. Quando nos referirmos a uma parte de população usaremos o termo AMOSTRA. O processo de obtenção de amostras é denominado AMOSTRAGEM. (Tipos de Amostragem: Casual ou Aleatória, Sistemática, por Conglomerado, Tendenciosa etc). Na manipulação de dados estatísticos utilizamos dois tipos de variáveis ou dados: Quantitativas consistem em números que representam contagens ou medidas As variáveis quantitativas, também se classificam em discretas (expressas por números inteiros) e contínuas (não enumeráveis intervalares). As Qualitativas quando podem ser separados em diferentes categorias que se distinguem por uma categoria não numérica. MÉTODO ESTATÍSTICO Se considerarmos Estatística como um método, podemos dizer que: Os estudos estatísticos descritos como um método científico, que tem como objetivo operar dados numéricos. Este método pode definido em fases, sendo estas um processo utilizado para coletar, apresentar, descrever, interpretar e até mesmo prever os aspectos quantitativos dos fenômenos analisados, desde que eles possam conseguir a forma de contagem ou medida. 2 As fases do método estatístico são: PLANEJAMENTO ESTATÍSTICO, COLETA DE DADOS, APURAÇÃO DE DADOS, APRESENTAÇÃO DE DADOS, ANÁLISE, INTERPRETAÇÃO E CONCLUSÃO DE DADOS. COLETA DE DADOS A coleta de dados pode ser classificada de duas formas: Coleta de dados primária (Direta), quando o pesquisador coleta os dados na fonte originária, e Coleta de dados secundários (Indireta) APURAÇÃO DE DADOS Após a coleta de dados, torna-se necessária sua apuração, ou contagem, esse processo também é denominado tabulação. Um dos objetivos da apuração é a ordenação dos dados segundo critérios de ordenação. Essas classificações podem ser feitas de forma manual, mecânica ou eletrônica. Apuração eletrônica: Via Telefone - Roletas nos transportes coletivos Mecânica: Roletas nos transportes coletivos APRESENTAÇÃO DE DADOS Depois dos dados coletados e apurados eles podem ser apresentados sob a forma de tabelas, quadros ou gráficos. Uma delas é a Distribuição de freqüências, que é uma maneira de ordenar os dados estatísticos em linhas ou colunas, tornando possível sua leitura, tanto no sentido horizontal quanto no vertical. A distribuição de freqüências é uma série estatística. E as séries estatísticas também são classificadas em TEMPORAIS ou HISTÓRICAS, GEOGRÁFICAS e ESPECÍFICAS, porém nos deteremos nas distribuições de freqüências. Exemplo de uma Série Específica Título: Vendedor Total de Vendas Colunas1 Antonio 100 Carlos 200 Davi 600 Enio 350 Fernando 700 Gabriel 450 Fonte: Análise e Conclusão dos Dados De todas as fases do Método estatístico, esta é a que apresenta maiores dificuldades. Isto porque todo o trabalho efetuado até o momento deixará de ter o valor devido, se a conclusão não estiver coerente. Não existe um critério a ser utilizado nesta fase TIPOS DE GRÁFICOS: Podemos também nessa fase apresentar os dados sob a forma de gráficos. Os mais conhecidos são. O gráfico de Barras ou colunas, O gráfico de linhas, O gráfico de setores e os histogramas etc. 3 Exemplos: Uma mesma situação é descrita por dois gráficos diferentes – No primeiro Caso por um gráfico de Coluna e no segundo por um Gráfico de Setores. Titulo: Fonte Titulo Fonte: Tabela de freqüência Os dados coletados quando ordenados segundo uma ordem de grandeza formam o que chamamos de ROL. 4 Ao número de vezes que um elemento figura no rol denominamos freqüência absoluta de elemento. As tabelas de freqüências podem ser classificadas em: 1) Tabelas de freqüências para Dados não Agrupados. 2) Tabelas de freqüências para Dados Agrupados em Classes. Tipos de freqüências 1. Freqüência Simples Absoluta (Fi) É definida como o número de vezes que um determinado valor se repete no rol, ou informações verificadas em cada classe. A soma de todas as freqüências absolutas é denominada freqüência total denotada por Fi. 2. Freqüência Simples Relativa Fr A freqüência Relativa de um elemento ou classe é o quociente entre a Freqüência absoluta desse elemento ou classe e a Freqüência total. Fri = F F i i . Nota : Quando multiplicamos a freqüência relativa por 100 obtemos a freqüência percentual , que denotamos por Fri % = 100.Fri . 3. Freqüência Simples Acumulada. A freqüência acumulada de um elemento ou de uma classe é obtida através da adição sucessiva das freqüências absolutas de cada elemento ou classe anterior a ele/ela e a freqüência absoluta desse elemento ou classe. Tabelas de freqüências para dados agrupados em classes Não existe uma regra fixa para se determinar o número de classes STURGES sugere uma regra para determinação do número de classes, desde que se conheça o número de informações que é k = 1 3 3 , .logN , onde k é o número de classes desejado e N número de dados a distribuir. Após conhecido o número de classes, determinamos a AMPLITUDE TOTAL DO ROL (A T) pela diferença entre o maior e o menor valor observado. A amplitude ou comprimento de cada intervalo é obtida por h = A K T . onde K é o número de classes . ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQÜÊNCIAS a) A classe pode ser definida como sendo os subintervalos da Amplitude total. b) Os limites de classes, são os valores de cada classe, sendo o da esquerda o limite inferior e o da direita limite superior. c) A média aritmética simples entre o limite superior e o inferior de uma mesma classe é denominada Ponto Médio da classe. REPRESENTAÇÃO GRÁFICADE UMA DISTRIBUIÇÃO DE FREQÜÊNCIAS Em nosso estudo destacaremos dois tipos distintos de gráficos, assim classificados: HISTOGRAMA Construído em um sistema de eixos ortogonais é, uma representação gráfica em forma de colunas justapostas. 5 Para sua construção, deve ser observado o seguinte: a) A área total do histograma deve ser proporcional à freqüência total, e as áreas parciais, proporcionais as freqüências das classes. b) As bases dos retângulos são proporcionais ã amplitude do intervalo de classe. c) Caso as amplitudes dos intervalos de classes sejam unitárias, a altura de cada retângulo terá como correspondente sua respectiva freqüência. Polígono de Freqüências. Formado por uma linha poligonal, cujos vértices são obtidos pela interseção de cada Ponto Médio da classe e sua respectiva freqüência absoluta de cada classe de valor. MEDIDAS Podemos reduzir um conjunto de números a uma ou algumas medidas numéricas que resumem todo o conjunto. Tais medidas são úteis para compreensão e manejo mais fácil dos dados originais. Além disso, são essenciais para técnicas computacionais. Duas características mais importantes dos dados que as medidas numéricas podem evidenciar são o valor central ou mais típico do conjunto e a dispersão dos números. MEDIDAS DE TENDÊNCIA CENTRAL (Medidas de posição) As medidas de tendência central são usadas para indicar um valor que tende a tipificar, ou a representar melhor um conjunto de números. As três medidas mais usadas são a média, a mediana e a moda. A mediana de um conjunto ordenado de números tem como objetivo, dividi-lo em duas partes iguais, a metade terá valores inferiores a mediana e a outra parte terá valores superiores a mediana. A moda é o valor que ocorre com maior freqüência. A média aritmética é a idéia que ocorre à maioria das pessoas quando se fala em média. E como ela possui certas propriedades matemáticas convenientes é considerada a mais importante das três. CÁLCULO DA MÉDIA ARITMÉTICA. Seja X uma distribuição de freqüência. Sejam x1, x2, x3,... , xn valores de X e F1, F2,... , Fn, suas freqüências absolutas. A média aritmética de X e dada por: n nn FFF FxFxFx x ... ....... 21 2211 i ii F Fx x Observação: Considerando uma distribuição de freqüências em intervalos de Classes, substituímos os xi pelos pontos médios das classes, e a média resultante é uma aproximação. A utilização dos pontos médios das classes trata os pontos médios como médias de classes, o que nem sempre é o caso. Todavia, se não dispomos dos dados originais, não há outra alternativa razoável. Medidas de Dispersão As medidas de dispersão são utilizadas, quando desejamos medir a variabilidade ou dispersão de um conjunto de dados. As medidas de dispersão indicam se os valores estão relativamente próximos, uns dos outros, ou estão afastados. As medidas de dispersão mais utilizadas são: o desvio médio, a variância e o desvio - padrão. Todas elas têm como referência a média. Em cada caso o valor zero indica a ausência de dispersão: a dispersão aumenta à proporção que aumenta o valor da medida. Em razão de suas propriedades matemáticas, quase sempre se calcula a média de um conjunto de dados. Por isso, existem várias medidas de dispersão que têm a média como ponto 6 de referência. Todas requerem o cálculo do desvio, ou diferença, entre cada valor e a média x xi . Desvio Médio Absoluto O desvio médio absoluto de um conjunto de números é a média dos desvios dos valores a contar da média, ignorando o sinal de diferença. Cálculo do Desvio Médio Dm = x x F F i i i Variância A variância de uma população é a média dos quadrados dos desvios dos valores a contar da média O desvio padrão de um conjunto de números é a raiz quadrada da variância. Cálculo da Variância i ii F Fxx 2 2 )( EXERCÍCIOS 1 O número de automóvel modelo HC vendidos semanalmente em uma concessionária de veículos é apresentada na tabela de distribuição discreta X : X 10 12 14 18 20 Fi 20 25 35 15 5 a) Determinar a média aritmética da distribuição. b) Determinar a mediana e a moda da distribuição. c) Determinar o desvio padrão e o coeficiente de variação. 2 . O quadro abaixo apresenta o rol do número de pontos obtidos pelos 80 candidatos aprovados na primeira fase de um exame de seleção para estagiários. 175 175 175 175 175 200 200 200 200 200 220 220 220 220 225 225 225 225 225 225 260 260 260 260 260 260 180 280 280 280 280 280 280 280 280 280 290 290 290 290 320 320 320 320 320 320 320 320 320 320 320 330 335 336 337 338 339 339 350 350 350 350 350 350 350 350 350 350 350 375 375 375 400 400 400 400 400 400 400 400 Pede-se: a) Construir uma tabela de frequências para dados agrupados em nove classes contendo as seguintes frequências simples: Absoluta, Relativa, Percentual e Acumulada. E os pontos médios de classes b) Construir um histograma para a distribuição. 7 3. Numa turma de Estatística com 50 alunos foram coletadas as seguintes notas na Prova II 3,0 3,0 4,0 4,0 4,0 4,0 4,0 5,0 5,0 5,0 5,0 5,0 5,0 5,0 5,0 5,0 5,0 5,0 5,0 5,0 5,0 5,0 5,0 5,0 5,0 5,0 6,0 6,0 6,0 6,0 6,0 6,0 6,0 6,0 6,0 6,0 6,0 7,0 7,0 7,0 7,0 7,0 7,0 7,0 7,0 9,0 9,0 9,0 10,0 10,0 Construir uma tabela de freqüências em dados não agrupados ou seja de dados discretos contendo: Freqüência absoluta simples, freqüência relativa e percentual, freqüência acumulada. 4. . Considerando a relação de 50 comissões pagas por uma Empresa de médio porte a seus consultores no mês de fevereiro 2013. Construa uma distribuição de freqüências com 6 classes e esboce um histograma para a distribuição. 600 670 680 680 730 730 740 750 750 785 790 800 800 800 820 820 820 820 850 850 890 900 900 920 920 930 930 940 950 955 960 980 980 1000 1000 1000 1050 1050 1060 1060 1070 1090 1101 1105 1108 1150 1150 1150 1180 1200 5. : O quadro abaixo representa o rol das comissões pagas a 50 vendedores em uma loja especializada em material para esportes no mês de junho de 2012 (Dados fictícios) 200 250 260 260 261 275 290 300 310 339 341 342 345 378 402 408 410 418 420 420 430 434 435 436 491 494 495 500 510 520 530 540 545 545 555 600 620 620 630 630 730 730 740 810 820 850 876 900 900 920 a) Construir uma distribuição de frequências com oito intervalos de classes contendo Freqüência absoluta simples, frequência relativa e percentual, frequência acumulada e pontos médios. b) Construir um histograma para a distribuição. 6.. Por engano, um professor omitiu uma nota no conjunto 20 alunos. As notas restantes estão descritas no quadro abaixo: Notas 50 55 65 70 75 80 ? 90 94 96 Número de alunos 1 2 1 3 2 3 1 3 2 2 a) Se a média dessas notas é 78. Qual é o valor da nota omitida? b) Qual é o coeficiente de variação das notas? 7.. Considerando a distribuição de 80 salários pagos a funcionários de nível básico por uma Empresa de grande porte no mês de janeiro de 2013. Preencher a tabela com as outras freqüências. Calcular a Média Aritmética, a Mediana, a Moda e o Desvio padrão e o coeficiente de variação dos salários SALÁRIOS FI 2650 5 2670 8 2690 5 2700 6 2710 10 2725 4 2730 7 2740 5 TOTAL 50 8 8 O quadro abaixo representa o rol do número de pontos obtidos por 50 candidatos classificados em um Concurso Publico. 100 105 110 120 145 145 150 150 160 175180 195 200 200 210 215 220 230 240 247 250 251 251 252 270 275 278 278 280 290 298 300 320 330 330 330 340 343 349 350 350 350 350 390 390 425 425 430 440 450 Pede-se: Construir uma distribuição de freqüências com 7 intervalos de classes. Contendo as Freqüências simples absoluta, relativa, percentual e acumulada e o ponto médio de cada classe. Construir um polígono de frequências para a distribuição. 9. O quadro abaixo representa o rol das comissões pagas a 50 colaboradores de Empresa de Publicitária no mês de dezembro de 2012 100 100 100 120 140 140 150 150 170 175 190 195 200 200 210 215 220 230 240 247 250 250 251 252 270 275 278 278 280 290 290 300 320 330 330 335 340 345 349 350 350 350 360 395 405 410 430 435 500 500 Construir uma distribuição de freqüências com oito intervalos de classes. Contendo as Freqüências simples absoluta, relativa, percentual e acumulada e o ponto médio de cada classe. Estime o valor da média aritmética da distribuição. Construir um polígono de freqüências para a distribuição 10 Num concurso para preenchimento de uma vaga foram propostas quatro provas de Conhecimentos. Constava no Edital que em caso de empate seria considerada as notas da prova Específica e a nota da prova de Português. Nos demais quesitos o Edital foi omisso. Por obra do acaso dois candidatos empataram em primeiro lugar e suas notas estão descritas tabela abaixo. A banca examinadora então resolveu calcular a (a) Média Aritmética e o (b) o desvio padrão das notas de cada um dos candidatos. Sabendo que a Média é uma medida de posição e o desvio padrão é uma medida de dispersão, seguindo o critério de menor dispersão, qual deve ter sido o candidato escolhido? Candidato Matemática Português Informática Especifica Augusto Sérgio 400 500 600 100 Sérgio Augusto 500 700 100 300 11. Considerando a relação de 40 comissões pagas pela TEC-ENG a seus colaboradores eventuais no mês de janeiro de 2010. Construa uma distribuição de freqüências (Freqüência simples absoluta) com 7 classes. Construa um polígono de freqüências para a Distribuição. 800 800 850 870 870 900 900 910 920 930 940 940 1000 1000 1010 1020 1020 1050 1050 1090 1100 1111 1111 1111 1132 1150 1150 1150 1150 1150 1200 1200 1200 1300 1350 1400 1450 1450 1500 1500 9 12. Considerando a distribuição dos salários de uma categoria de Funcionários da empresa de Consultoria INF/PN em fevereiro de 2012 (Salários –R$) 240 320 400 450 600 700 800 900 1000 Fi 30 40 50 30 50 70 50 40 40 Pede-se: a) Completar a tabela com; Freqüência Simples Relativa, Freqüência Simples percentual, Freqüência Simples Acumulada. b) Determinar a moda, a mediana e a média aritmética da distribuição. c) Determinar a variância e o desvio padrão da distribuição. 13. Considerando a relação de 50 comissões pagas pela Empresa Fictícia Consultoria a seus consultores no mês de junho 2012. Construa uma distribuição de freqüências com 6 classes. Construa um Histograma para a Distribuição. 600 600 600 700 730 730 740 750 750 789 790 800 800 800 820 820 820 820 850 850 890 900 900 920 920 930 930 940 950 955 960 980 980 1000 1000 1000 1050 1050 1060 1060 1070 1090 1101 1105 1108 1150 1150 1150 1150 1240 14. .O quadro abaixo representa o rol das comissões pagas a 50 Cabos Eleitorais por Certa Empresa de Propaganda Política no mês de maio de 2010 (Dados fictícios) 100 100 100 120 140 140 150 150 170 175 190 195 200 205 210 215 220 230 240 247 250 251 251 252 270 275 278 278 280 290 298 300 320 330 330 335 340 345 349 350 350 350 360 395 405 405 425 435 445 500 Construir uma Distribuição de Freqüências com oito intervalos de classes. Contendo as Freqüências simples absoluta, relativa, percentual e acumulada e o ponto médio de cada classe. Construir um histograma para a distribuição. 15. Considerando a distribuição de 100 salários pagos por certa Companhia no mês de janeiro de 2013 Pede-se a média aritmética, a mediana, a moda e o desvio padrão dos salários. SALÁRIOS FI 800 16 850 10 990 8 1000 13 1200 12 1520 8 1550 18 1600 15 TOTAL 100
Compartilhar