Baixe o app para aproveitar ainda mais
Prévia do material em texto
Estatística Prof Paulo Renato A. Firmino praf62@gmail.com Aulas 03-04 EstatEstatíísticastica -- Paulo Renato A. FirminoPaulo Renato A. Firmino 2 Estatística Descritiva – Tabelas • Distribuições de frequência para variáveis contínuas: De maneira geral, temos O nº de observações: n O valor mínimo observado: min O valor máximo observado: max O nº de categorias (subintervalos): • int(x) representa o número inteiro mais próximo de x • Se a parte decimal for maior que 0.5, x é arredondado para cima • Caso contrário, x é arredondado para baixo O tamanho (amplitude) de cada subintervalo: h = (max-min)/k Temos assim os seguintes subintervalos [min, min+h), [min+h, min+2h), ..., [max-h, max] ( )nintk = min min+h min+2h max-h... max EstatEstatíísticastica -- Paulo Renato A. FirminoPaulo Renato A. Firmino 3 Estatística Descritiva – Tabelas • Distribuições de frequência para variáveis contínuas: Exemplo tempo de desemprego (meses): 5, 10, 2.3, 4.5, 4.1, 3, 7, 2, 4, 0.3 O nº de observações: n=10 tempos Os valores mínimo e máximo observados: min = 0.3 e max = 10 O nº de categorias: A amplitude de cada intervalo: h = (max-min)/k = (10-0.3)/3 ≈ 3.2 Temos assim os seguintes intervalos Devido aos arredondamentos, podemos não chegar ao máximo (o valor 10 nesse caso) Recomenda-se, para o último intervalo, arredondar o valor final para o máximo ( ) ( ) 3)16.3int(10intnintk ==== categoria freq absoluta (ni) freq relativa (fi) [0.3, 0.3 + 3.2 = 3.5) 4 0.4 [3.5, 3.5 + 3.2 = 6.7) 4 0.4 [6.7, 6.7 + 3.2 = 9.9] 2 0.2 Total 10 1 EstatEstatíísticastica -- Paulo Renato A. FirminoPaulo Renato A. Firmino 4 Estatística Descritiva – Tabelas • Distribuições de frequência De maneira geral Categoria freq absoluta ni freq relativa fi = ni/n freq absoluta acumulada freq relativa acumulada Fi = Ni/n 1 n1 n1/n n1 n1/n 2 n2 n2/n n1+n2 (n1+n2)/n ... ... ... ... ... k nk nk/n n1+n2+...+nk (n1+n2+...+nk)/n Total n= 1 - -∑ = k 1i in ∑ = = i 1j ji nN minimum = min(x); maximum = max(x) n = length(x) k = round(sqrt(n)) h = (maximum-minimum)/k grid = seq(minimum, maximum, by=h) freq = cut(x, grid, include.lowest=TRUE, right=FALSE) cumsum(table(freq)) EstatEstatíísticastica -- Paulo Renato A. FirminoPaulo Renato A. Firmino 5 Estatística Descritiva – Tabelas • Exercício 1: Elabore a distribuição de frequências absolutas e relativas, incluindo as acumuladas, para os seguintes casos 1. tempos de falha (em anos): 5, 10, 2.3, 4.5, 4.1, 3, 7, 2, 4, 0.3 2. Sexo de entrevistados (1- masc, 2-femin): 1, 2, 2, 1, 1, 1, 2, 2, 2, 1, 1, 2, 1 3. Grau de instrução de entrevistados (1- sem formação, 2-ens fundam, 3-ens médio, 4-ens superior): 1, 4, 1, 2, 2, 4, 3, 3, 1, 2, 3, 2, 2, 3 4. Nº de leitos ocupados de um hospital (por dia): 33, 21, 26, 22, 24, 28, 35, 23, 27, 25, 32, 34 5. Nº de peças defeituosas em lotes de 6 unidades de uma fábrica: 0, 3, 2, 1, 5, 3, 2, 1, 0, 2, 3, 1, 2, 4, 3, 2, 3, 4, 0, 0 EstatEstatíísticastica -- Paulo Renato A. FirminoPaulo Renato A. Firmino 6 Estatística Descritiva – Tabelas • Distribuições de Frequências Bivariadas Agrupam os dados relativos a duas variáveis Generalizam distribuições univariadas (que envolvem uma variável apenas) Para cada combinação de resultados entre as variáveis, computa-se sua frequência de ocorrências (absolutas ou relativas) Pessoa Sexo Preferência de voto 1 F D 2 M S 3 F D 4 M D 5 M M 6 F S 7 M D 8 F S 9 F D 10 M S 10415Total 5212M 5203F TotalSMD Preferência de voto Sexo table(x, y) EstatEstatíísticastica -- Paulo Renato A. FirminoPaulo Renato A. Firmino 7 Estatística Descritiva – Tabelas • Exercício 2: Elabore a distribuição de frequências absolutas e relativas bivariada para os seguintes casos (os dados estão ordenados de acordo com a 3ª coluna): Computador fabricante tempo até a 1ª falha (anos) 1 B 0.0180 2 A 0.0271 3 A 0.0616 4 B 0.1177 5 B 0.3139 6 A 0.3697 7 B 0.6178 8 A 0.7553 9 A 1.2263 10 B 1.3572 1. Relação entre fabricante e tempo de falha de computadores Projeto folha de pagamento (R$10000.00) tempo de execução do projeto (anos) 1 11.2231 1.6157 2 10.9458 1.7378 3 10.6211 1.7683 4 10.2692 1.8047 5 10.7836 1.9813 6 9.8028 2.0228 7 9.5773 2.0832 8 8.5484 2.2941 9 8.0323 2.3023 10 9.2080 2.4593 2. Relação entre folha de pagamento e tempo de execução de projeto EstatEstatíísticastica -- Paulo Renato A. FirminoPaulo Renato A. Firmino 8 Estatística Descritiva – Gráficos • Por muitas vezes, extrair informação de distribuições de frequência mostra-se também difícil Gráficos podem dizer mais • Gráficos podem facilitar a compreensão da informação que se deseja transmitir Por vezes, um gráfico pode dizer mais que “mil palavras” Faz-se importante, então, saber elaborar e ler gráficos • Falaremos sobre a representação gráfica de distribuições de frequências Esboçaremos a relação entre cada categoria da variável e sua frequência EstatEstatíísticastica -- Paulo Renato A. FirminoPaulo Renato A. Firmino 9 Estatística Descritiva – Gráficos • Gráficos de barras: Exibem a forma da distribuição de variáveis qualitativas 0 10 20 30 40 50 60 f r e q Baixa Moder Alta Degradação Distribuição do nível de degradação do componente c barplot(table(x)) EstatEstatíísticastica -- Paulo Renato A. FirminoPaulo Renato A. Firmino 10 Estatística Descritiva – Gráficos • Gráficos de barras Gráfico de pareto: as categorias são ordenadas, da mais frequente à menos frequente Pareto Package ‘qcc’ pareto.chart(table(x)) EstatEstatíísticastica -- Paulo Renato A. FirminoPaulo Renato A. Firmino 11 Estatística Descritiva – Gráficos • Gráficos de setor (de pizza): Exibem a distribuição de variáveis qualitativas. Em um círculo, cada “fatia” é proporcional à frequência Distribuição do nível de degradação do componente c Baixa Moderada Alta Package ‘MASS’ pie(table(x)) EstatEstatíísticastica -- Paulo Renato A. FirminoPaulo Renato A. Firmino 12 Estatística Descritiva – Gráficos • Gráficos de Pares (ou de pontos): Exibem a forma da distribuição de variáveis quantitativas discretas. Trata-se do eixo dos números reais. Pareto, nem pensar!! plot(table(x)) EstatEstatíísticastica -- Paulo Renato A. FirminoPaulo Renato A. Firmino 13 Estatística Descritiva – Gráficos • Histogramas: Exibem a forma da distribuição de variáveis quantitativas em geral. Distribuição do tempo até a falha do componente c 0 10 20 30 40 50 60 70 80 90 100 Tempo até a falha de c 0 5 10 15 20 25 30 35 40 45 50 f r e q hist(x) EstatEstatíísticastica -- Paulo Renato A. FirminoPaulo Renato A. Firmino 14 Estatística Descritiva – Gráficos • Exercício 3: Esboce as distribuições de frequência construídas no Exercício 1 1. tempos de falha (em anos): 5, 10, 2.3, 4.5, 4.1, 3, 7, 2, 4, 0.3 2. Sexo de entrevistados (1- masc, 2-femin): 1, 2, 2, 1, 1, 1, 2, 2, 2, 1, 1, 2, 1 3. Grau de instrução de entrevistados (1- sem formação, 2-ens fundam, 3-ens médio, 4-ens superior): 1, 4, 1, 2, 2, 4, 3, 3, 1, 2, 3, 2, 2, 3 4. Nº de leitos ocupados de um hospital (por dia): 33, 21, 26, 22, 24, 28, 35, 23, 27, 25, 32, 34 5. Nº de peças defeituosas em lotes de 6 unidades de uma fábrica: 0, 3, 2, 1, 5, 3, 2, 1, 0, 2, 3, 1, 2, 4, 3, 2, 3, 4, 0, 0 6. Elabore distribuições e gráficos para o conjunto de dados “BD01”. EstatEstatíísticastica -- Paulo Renato A. FirminoPaulo Renato A. Firmino 15 Estatística Descritiva – Medidas • Elas permitem sumarizar as informações contidas em tabelas, distribuições de frequência e/ou gráficos: Tornam possível a comunicaçãoefetiva entre os gestores Permitem elaborar e analisar diretrizes e/ou metas • Não são apenas números… • Pode-se destacar dois tipos de medidas: 1. Medidas de posição- Possibilitam inferir sobre o resultado de determinada variável 2. Medidas de dispersão- Permitem medir as incertezas em torno do resultado de determinada variável EstatEstatíísticastica -- Paulo Renato A. FirminoPaulo Renato A. Firmino 16 Estatística Descritiva – Medidas de Posição • Moda: É o valor mais frequente da amostra Quando trata-se de variáveis cuja distribuição é modelada por funções matemáticas, ela representa o ponto de máximo de tais funções Pode ser usada sobre qualquer tipo de variável, pois faz uso apenas da freqüencia de cada categoria das variáveis • Exemplo 1: sexo = {0, 0, 0, 1, 0, 1, 1, 1, 0, 0} →Moda = 0 • Exemplo 2: Degradação = {0, 2, 0, 1, 2, 1, 2, 2, 0, 0} → Moda = 0 e Moda = 2 → tem-se uma distribuição bimodal • Exemplo 3: tempo de aposentadoria = {5, 10, 2.3, 4, 4.1, 3, 7, 2, 4.5, 0.3} → Não há qualquer valor particular mais frequente ... EstatEstatíísticastica -- Paulo Renato A. FirminoPaulo Renato A. Firmino 17 Estatística Descritiva – Medidas de Posição • Moda de Czuber para dados agrupados de variáveis quantitativas: l - limite inferior da classe modal freqm - freq da classe modal (mais frequente) freqa - freq da classe anterior à modal freqp - freq da classe posterior à modal Δa = freqm – freqa eΔp = freqm – freqp h - amplitude da classe modal • Se a variável for discreta, pode-se arredondar o resultado para o inteiro mais próximo h pa alModa ⋅⎟⎟⎠ ⎞ ⎜⎜⎝ ⎛ Δ+Δ Δ+= l Δa Δp l+h y1=freqm–(x-l)·Δp/h y2 = freqa + (x-l)·Δa/h freqa freqp freqm EstatEstatíísticastica -- Paulo Renato A. FirminoPaulo Renato A. Firmino 19 Estatística Descritiva – Medidas de Posição • Exercício 4: Obtenha a moda nos seguintes casos 1. A distribuição de frequências para os juros da poupança é dada por 2. Tempos de aposentadoria em dada comunidade (em anos): 5, 10, 2.3, 4, 4.1, 3, 7, 2, 4.5, 0.3 3. Considera-se que o seguinte modelo se ajusta bem à distribuição de renda (x) de dado local: 4. Obtenha a moda das variáveis do banco BD01. categoria freq absoluta (ni) [0.3, 3.5) 3 [3.5, 6.7) 5 [6.7, 10] 2 Total 10 ( )2630x 2 1 e)x(f −−=
Compartilhar