Baixe o app para aproveitar ainda mais
Prévia do material em texto
Estatística – Prof. Ricardo Luís Rocha Introdução à Estatística Unidade 1 Estatística – Prof. Ricardo Luís Rocha Ementa: 1.1 – Coleta de Dados 1.2 – Amostragem 1.3 – Estatística Descritiva 1.4 – Medidas de Tendência Central 1.5 – Medidas de Dispersão 1.6 – Gráficos Unid.1 – Introdução à Estatística Estatística – Prof. Ricardo Luís Rocha 1.1 – Coleta de Dados • É a fase inicial de muitos estudos sociais, tecnológicos, econômicos ou biológicos. • Trata-se da escolha das unidades de análise que serão consideradas no estudo, na determinação das características destas unidades que serão medidas e da logística do trabalho de campo. • Conforme as necessidades, os dados serão coletados através de amostragem ou de métodos de planejamento de experimentos. Unid.1 – Introdução à Estatística Estatística – Prof. Ricardo Luís Rocha Dados primários e secundários Dados primários são aqueles dados que são coletados diretamente da fonte pelo pesquisador, através de questionários de pesquisa, entrevistas, etc. Dados secundários são dados que foram coletados por outras pessoas com outros propósitos, que você aproveita em sua pesquisa. Unid.1 – Introdução à Estatística Estatística – Prof. Ricardo Luís Rocha Unid.1 – Introdução à Estatística Além da classificação entre primários e secundários, relativas à origem dos dados, eles ainda podem ser classificados como: -Dados quantitativos: consistem de números que representam contagens ou medidas. -Dados qualitativos: são aqueles que podem ser separados em diferentes categorias que se distinguem por alguma característica não numérica. Estatística – Prof. Ricardo Luís Rocha Unid.1 – Introdução à Estatística Os dados quantitativos são separados em: Dados contínuos: possuem um número infinito de valores que podem ser associados a pontos em uma escala contínua de forma que não haja lacunas ou interrupções entre um ponto e o próximo. Dados discretos: possuem um número finito de valores, sendo que não existem valores intermediários entre dois valores seqüenciais. Estatística – Prof. Ricardo Luís Rocha Unid.1 – Introdução à Estatística Os dados qualitativos são separados em: Dados nominais: São caracterizados por dados que consistem apenas em nomes, rótulos ou categorias. Os dados não podem ser dispostos em ordem. Dados Ordinais: São dados que podem ser dispostos em ordem, mas as diferenças entre os valores não podem ser determinados ou não têm sentido. Dados intervalares: Semelhantes aos ordinais, onde podemos determinar diferenças significativas entre os dados. Todavia, não existe um ponto de partida zero inerente, ou natural. Estatística – Prof. Ricardo Luís Rocha Unid.1 – Introdução à Estatística Exemplos de classificação de dados: Dados Quantitativos Discretos Ovos postos por uma galinha. Acidentes em uma estrada. Contínuos Peso de uma pessoa. Comprimento de uma barra de aço. Dados Qualitativos Nominais Sexo dos estudantes de estatística. Respostas do tipo “sim”, “não” ou “indeciso”. Ordinais Classificação de livros entre excelente, bom e ruim. Ordem de chegada em uma corrida. Intervalares Os anos. (O tempo não começou no ano zero. Portanto, 0 é arbitrário, e não um ponto de partida zero natural) Estatística – Prof. Ricardo Luís Rocha Unid.1 – Introdução à Estatística – Tabelas de frequência Vamos começar este tópico com um exemplo. Vamos considerar as alturas em centímetros de 30 atletas do sexo masculino de uma universidade: 168 172 170 181 169 173 164 175 182 177 176 173 170 186 183 170 168 166 169 180 175 164 181 179 172 169 174 171 178 166 Estatística – Prof. Ricardo Luís Rocha Unid.1 – Introdução à Estatística Estes dados são chamados de dados brutos, pois ainda não sofreram nenhum tipo de tratamento. Do jeito que estão têm pouca utilidade, passando-nos somente a informação de que são 30 dados. Colocando-os então em ordem crescente: 164 164 166 166 168 168 169 169 169 170 170 170 171 172 172 173 173 174 175 175 176 177 178 179 180 181 181 182 183 186 Estatística – Prof. Ricardo Luís Rocha Unid.1 – Introdução à Estatística Nesta forma, percebemos que o menor valor é 164 e o maior 186, fazendo com que a amplitude do conjunto de observações seja: 186-164 = 22cm. Mesmo com esta separação, pode ser difícil visualizar mais informações, principalmente se a quantidade de observações for muito grande. Neste caso, seria melhor agrupar os dados em um certo número de classes, em uma tabela de frequências. Estatística – Prof. Ricardo Luís Rocha Unid.1 – Introdução à Estatística A tabela de frequências relaciona categorias (ou classes) de valores, juntamente com contagens (ou frequências) do número de valores que se enquadram em cada categoria. Os limites inferiores de classes são os menores números que podem efetivamente pertencer às diferentes classes. Os limites superiores de classes são os maiores números que podem efetivamente pertencer às classes. Estatística – Prof. Ricardo Luís Rocha Unid.1 – Introdução à Estatística As fronteiras de classes são os números usados para separar as classes, mas sem as lacunas deixadas pelos limites de classe. A fronteira de duas classes é a média entre o limite superior de uma classe e o limite inferior da classe subseqüente. Marcas de classe são o ponto médio das classes, encontrados calculando-se a média entre os limites da classe. Amplitude da classe é a diferença entre dois limites inferiores consecutivos. Estatística – Prof. Ricardo Luís Rocha Unid.1 – Introdução à Estatística Para agruparmos os dados em uma tabela de frequência, seguimos os passos: 1 – Determinar o número de classes; 2 – Determinar a amplitude das classes; 3 – Escolher o limite inferior da primeira classe; 4 – Determinar os limites inferiores das demais classes; 5 – Determinar os limites superiores; 6 – Realizar a contagem dos dados de cada classe. Estatística – Prof. Ricardo Luís Rocha Unid.1 – Introdução à Estatística 1 – Determinar o número de classes: Não existe uma regra fixa para o número de classes. Alguns autores defendem a tese de que este número deve estar entre 5 e 25, sendo que normalmente são utilizadas as seguintes fórmulas de cálculo: Neste curso utilizaremos a primeira equação. )log(32,31 nk nk Estatística – Prof. Ricardo Luís Rocha Unid.1 – Introdução à Estatística 2 – Determinar a amplitude das classes Para isso, devemos ter em mãos a amplitude do conjunto de dados, e então fazemos: O resultado encontrado deve ser arredondado para cima, até um número conveniente. Isto garante que todos os elementos do conjunto de dados estarão incluídos na tabela. classes de número amplitude Classe da Amplitude Estatística – Prof. Ricardo Luís Rocha Unid.1 – Introdução à Estatística 3 – Escolher o limite inferior da primeira classe Deve-se tomar o menor valor do conjunto de dados ou algum valor menor mais próximo. Deve-se tomar o cuidado para que a amplitude de todas as classes seja suficiente para receber todo o conjunto de dados. Se necessário, pode-se aumentar a amplitude de cada classe ou mesmo o número de classes. Estatística – Prof. Ricardo Luís Rocha Unid.1 – Introdução à Estatística 4 – Determinar os limites inferiores das demais classes: Basta somar a amplitude das classes ao limite inferior já encontrado. Coloca-se cada limite inferior em uma linha da tabela de frequência. 5 – Determine os limites superiores Coloca-se na tabela os limites superiores, que são os maiores números quepodem ser representados na classe ou o limite inferior da próxima classe. Estatística – Prof. Ricardo Luís Rocha Unid.1 – Introdução à Estatística 6 – Realizar a contagem dos dados de cada classe Conte os dados do conjunto de dados original, separando-os por classe de acordo com seu valor. Os valores totais da contagem serão a tabela de frequência, que ainda pode se apresentar na forma percentual, aplicando-se a seguinte fórmula: elementos de Total X Classe da Frequência % F Estatística – Prof. Ricardo Luís Rocha Unid.1 – Introdução à Estatística Exemplo: Para os dados dos atletas: Passo 1 – Número de classes: 164 164 166 166 168 168 169 169 169 170 170 170 171 172 172 173 173 174 175 175 176 177 178 179 180 181 181 182 183 186 classesk nk 648,530 Estatística – Prof. Ricardo Luís Rocha Unid.1 – Introdução à Estatística Passo 2 – Amplitude das classes Arredondamos o valor para 4. Passo 3 – Limite Inferior O menor valor da tabela é 164. Se tomarmos ele como limite inferior, no outro extremo da escala teremos 6*4+164=188. Para centralizarmos os dados na amplitude calculada, dividimos a sobra (2cm) nos extremos da tabela: Limite inferior = 163. 6666666,3 6 164-186 Classe da Amplitude Estatística – Prof. Ricardo Luís Rocha Unid.1 – Introdução à Estatística 4 – Limites inferiores das demais classes: Tomando como base o primeiro limite inferior, somamos 4 a cada limite para encontrarmos o próximo. Assim: Lim. Inferior 163 167 171 175 179 183 Estatística – Prof. Ricardo Luís Rocha Unid.1 – Introdução à Estatística Passo 5 – Limites superiores: Basta buscar o limite inferior da classe seguinte. A última classe é obtida somando-se 4 ao limite superior da classe anterior. Lim. Inferior Lim. Sup. 163 167 167 171 171 175 175 179 179 183 183 187 Estatística – Prof. Ricardo Luís Rocha Unid.1 – Introdução à Estatística Passo 6 – Contagem Contamos os dados da tabela e os colocamos nas classes correspondentes. Lim. Inferior Lim. Sup. n 163 167 | | | | 4 167 171 | | | | | | | | 8 171 175 | | | | | | 6 175 179 | | | | | 5 179 183 | | | | | 5 183 187 | | 2 Total 30 Estatística – Prof. Ricardo Luís Rocha Unid.1 – Introdução à Estatística Podemos também representar a tabela de frequências em forma de percentual. Para isso, basta dividir cada valor pelo número total de observações: Lim. Inferior Lim. Sup. n f (%) 163 167 | | | | 4 0,133 167 171 | | | | | | | | 8 0,267 171 175 | | | | | | 6 0,20 175 179 | | | | | 5 0,167 179 183 | | | | | 5 0,167 183 187 | | 2 0,067 Total 30 1,000 Estatística – Prof. Ricardo Luís Rocha Unid.1 – Introdução à Estatística Também podemos construir uma tabela de frequências acumulada, fazendo cada linha igual à soma de todas as anteriores: Lim. Inferior Lim. Sup. n f (%) fa(%) 163 167 | | | | 4 0,133 0,133 167 171 | | | | | | | | 8 0,267 0,400 171 175 | | | | | | 6 0,20 0,600 175 179 | | | | | 5 0,167 0,767 179 183 | | | | | 5 0,167 0,933 183 187 | | 2 0,067 1,000 Total 30 1,000 Estatística – Prof. Ricardo Luís Rocha Unid.1 – Introdução à Estatística Observe que, ao construir uma tabela de frequências, os dados originais são codificados de tal forma que não é mais possível restaurar os valores individuais dos elementos. Desta forma, considera-se que há perda de informação ao gerar a tabela (mas ganha-se pela compactação dos dados e visualização mais harmônica do conjunto de dados). Estatística – Prof. Ricardo Luís Rocha Unid.1 – Introdução à Estatística Exercício: 1) Trinta estudantes foram submetidos a um exame de estatística, obtendo as seguintes notas: Construa a tabela de distribuição de freqüências absoluta e acumulada para este conjunto de dados. 70 76 76 77 77 78 80 81 81 83 83 83 84 86 86 87 87 88 89 90 90 91 92 92 93 94 94 95 98 99 Estatística – Prof. Ricardo Luís Rocha 1.2 – Amostragem: Em estatística, define-se população como a coleção de todas as observações potenciais sobre determinado fenômeno. O conjunto de dados realmente observados, ou extraídos, constitui uma amostra da população. É sobre a amostra que se desenvolvem os estudos, visando à produção de inferências sobre a população. Unid.1 – Introdução à Estatística Estatística – Prof. Ricardo Luís Rocha População, Estatística e Amostra Iniciaremos o estudo definindo formalmente alguns conceitos básicos da estatística: -População: É uma coleção completa de todos os elementos (valores, pessoas, medidas, etc) a serem estudados; -Amostra: É uma sub coleção de elementos extraídos de uma população; -Censo: É uma coleção de dados relativos a todos os elementos de uma população. Unid.1 – Introdução à Estatística Estatística – Prof. Ricardo Luís Rocha Unid.1 – Introdução à Estatística -Parâmetro: É uma medida numérica que descreve uma característica de uma população; -Estatística: É uma medida numérica que descreve uma característica de uma amostra. População Amostra Parâmetros EstatísticasMédia Desvio padrão Proporção etc. Média Desvio padrão Proporção etc. Inferência Estatística – Prof. Ricardo Luís Rocha Unid.1 – Introdução à Estatística Exemplos: População Amostra Altura de todos os alunos da faculdade. Altura dos alunos da sala 318. Quantidade de carros que passam por um cruzamento em um dia. Número de carros que passam por um cruzamento em 1 hora. Produção mensal de uma fábrica. Produção de 1 dia de uma fábrica. N° de notas fiscais emitidas em 2007. Notas fiscais emitidas em Julho/2007. Ph de todos os vinhos produzidos no Brasil em 2007. Ph de 300 garrafas de vinho produzidas no Brasil em 2007. Estatística – Prof. Ricardo Luís Rocha Exercício: Classifique os dados entre contínuos e discretos: Unid.1 – Introdução à Estatística 1 – Número de jogadores convocados para a seleção brasileira 2 – Massa da terra 3 – Nº de alunos da sala 4 – Peso médio das mulheres da sala 5 – Número de faturas emitidas na semana pelo comércio 6 – Valor das faturas emitidas pelo comércio 7 – Idade média da população de Ipatinga 8 – Número de carros emplacados em Ipatinga em 2003 9 – Volume de água despejado pelas chuvas de janeiro/2004 10 – Diâmetro de uma bola de futebol em centímetros Estatística – Prof. Ricardo Luís Rocha 1.3 – Estatística Descritiva É a parte mais conhecida da Estatística. Freqüentemente somos bombardeados com médias, índices e gráficos na descrição de uma realidade social ou econômica. No entanto, seu conceito é mais amplo. Na realidade, nunca devemos fazer análises estatísticas baseadas em modelos sofisticados sem uma prévia descrição dos dados. Unid.1 – Introdução à Estatística Estatística – Prof. Ricardo Luís Rocha Exemplos: - O INPC, construído pelo IBGE, é um índice da maior importância em nossa sociedade. Sua construção envolve a sintetização, em um único número, dos aumentos dos produtos de uma cesta básica. Seu processo de cálculo é um sucessivo cálculo de médias. - Anuário Estatístico Brasileiro, publicado a cada ano pelo IBGE, sintetiza os mais diver-sos dados sobre o Brasil em tabelas fáceis de se entender. Unid.1 – Introdução à Estatística Estatística – Prof. Ricardo Luís Rocha 1.4 – Medidas de Tendência Central Uma medida de tendência central é um valor no centro ou no meio de um conjunto de dados. Veremos nesta seção as seguintes medidas de tendência central: - Média aritmética simples; - Média aritmética ponderada;- Mediana; - Moda. Unid.1 – Introdução à Estatística Estatística – Prof. Ricardo Luís Rocha 1.4.1 – Média Aritmética Simples A média aritmética simples é, de modo geral, a mais importante de todas as mensurações numéricas descritivas. Ela é definida como o centro do conjunto de dados, no sentido de que é um ponto de equilíbrio dos mesmos. 2 4 3 +1-1 Unid.1 – Introdução à Estatística Estatística – Prof. Ricardo Luís Rocha Definição: A média aritmética simples de um conjunto de dados é o valor obtido somando-se todos eles e dividindo-se o total pelo número de valores. Esta definição é melhor expressa pela fórmula abaixo: ou n x x n i i 1 n x x Unid.1 – Introdução à Estatística Estatística – Prof. Ricardo Luís Rocha Uma distinção importante deve ser feita com relação à representação das estatísticas e dos parâmetros. Via de regra, os valores das estatísticas são representados por letras do alfabeto latino, enquanto que parâmetros populacionais são representados por letras gregas. Exemplos: População Amostra Média µ x Desvio Padrão σ s Tamanho do conjunto de dados N n Unid.1 – Introdução à Estatística Estatística – Prof. Ricardo Luís Rocha Exemplo: 1) Calcule a média aritmética simples da seguinte amostra de dados: 10 29 26 28 15 23 17 25 0 20 Resolução: Como se trata de uma amostra de dados, utilizamos as representações da amostra: 3,19 10 193 10 20025172315282629101 x n x x n i i Unid.1 – Introdução à Estatística Estatística – Prof. Ricardo Luís Rocha Outro conceito importante a ser abordado é o arredondamento de valores. Sempre que for necessário arredondar algum valor, valerão as seguintes regras: -Se o algarismo a se arredondar for menor que 5, mantemos o penúltimo algarismo; -Se o algarismo a se arredondar for maior que 5, somamos 1 ao penúltimo algarismo; -Se o algarismo a se arredondar for 5, fazemos com que o penúltimo algarismo seja par. Unid.1 – Introdução à Estatística Estatística – Prof. Ricardo Luís Rocha Exemplos: Arredonde o valor 1,594066935 para: a) 0 casas decimais: 1,594066935 → 2 (o penúltimo dígito tem que ser par quando o último é 5) b) 1 casa decimal: 1,594066935 → 1,6 (o último dígito é maior que 5) c) 2 casas decimais: 1,594066935 → 1,59 (o último dígito é menor que 5) Unid.1 – Introdução à Estatística Estatística – Prof. Ricardo Luís Rocha 1.4.2 – Média aritmética ponderada Em alguns casos, os valores dos dados têm graus de importância diferentes, o que nos leva a calcular a média ponderada destes dados. Esta média é também uma média, mas afetada pelos diferentes pesos de cada valor: ou n i i n i ii p xp x 1 1 ).( p xp x ).( Unid.1 – Introdução à Estatística Estatística – Prof. Ricardo Luís Rocha Exemplo: Dada a amostra abaixo, calcule a média das 5 notas de prova abaixo, sabendo que as 4 primeiras têm peso 15 e a última tem peso 40. Notas: 85 90 75 80 95 Resolução: 5,87 100 8750 4015151515 95.4080.1575.1590.1585.15).( x p xp x Unid.1 – Introdução à Estatística Estatística – Prof. Ricardo Luís Rocha 1.4.3 – Mediana A Mediana de um conjunto de valores é o valor do meio deste conjunto, quando os valores estão dispostos em ordem crescente (ou decrescente). A Mediana é representada geralmente por . Para calcular a Mediana: - Coloque os dados em ordem crescente; - Se o número de dados é ímpar, a mediana será o valor do meio da lista. - Se o número de dados é par, a mediara será a média dos dois valores do meio da lista. x~ Unid.1 – Introdução à Estatística Estatística – Prof. Ricardo Luís Rocha Exemplos: Calcule a Mediana dos conjuntos de dados abaixo: a) 10 29 26 28 15 b) 500 600 800 5000 1000 500 Resolução: a) Colocando em ordem: 10 15 26 28 29 Como o número de dados é ímpar, a mediana será 26. b) Em ordem: 500 500 600 800 1000 5000 Como o número de dados é par, a mediana será: (600+800)/2 = 700. Unid.1 – Introdução à Estatística Estatística – Prof. Ricardo Luís Rocha 1.4.4 – Moda A moda de um conjunto de dados é o valor que ocorre com maior frequência. Quando dois valores ocorrem com a mesma frequência máxima, cada um deles é uma moda e o conjunto se diz bimodal. Se mais de dois valores ocorrem com a mesma frequência máxima, cada um deles é uma moda, e o conjunto é multimodal. Quando nenhum valor é repetido, o conjunto não tem moda. Costuma-se denotar a moda por M. Unid.1 – Introdução à Estatística Estatística – Prof. Ricardo Luís Rocha Exemplos: Determine a moda nos conjuntos de dados abaixo: a) 5 5 5 3 1 5 1 4 3 5 b) 1 2 2 2 3 4 5 6 6 6 7 9 c) 1 2 3 6 7 8 9 10 Solução: a) A moda é 5 (ocorre 5 vezes) b) As modas são 2 e 6 (3 vezes cada) c) Não há moda. Unid.1 – Introdução à Estatística Estatística – Prof. Ricardo Luís Rocha Exercício: 1) Trinta estudantes foram submetidos a um exame de estatística, obtendo as seguintes notas: Determine a média, mediana e moda destes dados. 70 76 76 77 77 78 80 81 81 83 83 83 84 86 86 87 87 88 89 90 90 91 92 92 93 94 94 95 98 99 Unid.1 – Introdução à Estatística Estatística – Prof. Ricardo Luís Rocha 1.5 – Medidas de Variabilidade Abordaremos a característica da variação em um conjunto de dados. Os seguintes conceitos chave serão apresentados: -A variação se refere a quanto os valores diferem entre si e pode ser medida; -Conjuntos de dados com valores próximos entre si possuem baixa medida de variação -O desvio padrão é uma medida de variação importante, e devemos saber calculá-lo e interpretá- lo corretamente. Unid.1 – Introdução à Estatística Estatística – Prof. Ricardo Luís Rocha Exemplo: Atualmente, todos os bancos empregam a fila única em seu atendimento ao invés de filas separadas por caixa. Na época desta mudança, dois grandes bancos americanos tiveram seus tempos de fila medidos, sendo observados os seguintes valores: Banco Jefferson Valley (fila única) 6,5 6,6 6,7 6,8 7,1 7,3 7,4 7,7 7,7 7,7 Banco da Providência (filas múltiplas) 4,2 5,4 5,8 6,2 6,7 7,7 7,7 8,5 9,3 10 Unid.1 – Introdução à Estatística Estatística – Prof. Ricardo Luís Rocha De acordo com estes dados, ambos os bancos têm a mesma média de 7,15, a mesma mediana de 7,20 e a mesma moda de 7,7. Com base apenas nestas medidas de tendência central, podemos estabelecer qual modelo é o melhor? Não. Observando os dados individuais, vemos que o banco Jefferson Valley possui tempos de espera com variação menor que o banco da Providência. Estudaremos agora justamente como medir esta variação. Unid.1 – Introdução à Estatística Estatística – Prof. Ricardo Luís Rocha 1.5.1 – Amplitude, Range ou Intervalo A amplitude é a diferença entre o maior e o menor valor do conjunto de dados. Esta medida é representada por A ou R. O cálculo da amplitude é bastante fácil, mas como ele depende apenas do maior e menor valor do conjunto de dados, em geral ele não é tão bom quanto outras medidas de variação. No exemplo dos bancos, a amplitude seria: Banco Jefferson Valley: A=7,7–6,5 = 1,2 min. Banco da Providência: A = 10–4,2 = 5,8 min. Unid.1 – Introdução à Estatística Estatística – Prof. Ricardo Luís Rocha 1.5.2 – Desvio padrão Se tomarmos o quadrado da diferença de cada valor para a média, tirarmos a média entre estes valores e em seguida tirar a raiz quadrada do valor obtido, teremos umamedida importante da estatística chamada de desvio padrão. Ele é amplamente utilizado porque a sua unidade é sempre a mesma unidade do conjunto de dados. Unid.1 – Introdução à Estatística Estatística – Prof. Ricardo Luís Rocha A fórmula para o cálculo do desvio padrão de uma amostra é: Como alternativa, podemos reescrever a fórmula acima da seguinte forma: 1 )( 2 n xx s )1( )()(. 22 nn xxn s Unid.1 – Introdução à Estatística Estatística – Prof. Ricardo Luís Rocha Quando os dados se referem à população, devemos calcular o desvio padrão com outra fórmula: TOMAR CUIDADO: o valor no denominador é diferente do cálculo do desvio padrão de uma amostra. Muitas calculadoras trazem ambas as formas de cálculo. Verificar no manual da sua qual a forma correta. N x 2 )( Unid.1 – Introdução à Estatística Estatística – Prof. Ricardo Luís Rocha O desvio padrão é a medida de variabilidade mais utilizada. Quanto maior o desvio padrão, maior será a dispersão dos dados em torno da média. s = 3 1 2 3 4 5 6 7 s = 1,0 1 2 3 4 5 6 7 s = 0,8 1 2 3 4 5 6 71 2 3 4 5 6 7 s = 0 7 6 5 4 3 2 1 0 O desvio-padrão cresce quando a dispersão dos dados aumenta Unid.1 – Introdução à Estatística Estatística – Prof. Ricardo Luís Rocha Exemplo: Desvio padrão dos bancos: Jefferson Valley Tempo (x) x (x-x)2 6,5 7,15 0,4225 6,6 7,15 0,3025 6,7 7,15 0,2025 6,8 7,15 0,1225 7,1 7,15 0,0025 7,3 7,15 0,0225 7,4 7,15 0,0625 7,7 7,15 0,3025 7,7 7,15 0,3025 7,7 7,15 0,3025 Banco da Providência Tempo (x) x (x-x)2 4,2 7,15 8,7025 5,4 7,15 3,0625 5,8 7,15 1,8225 6,2 7,15 0,9025 6,7 7,15 0,2025 7,7 7,15 0,3025 7,7 7,15 0,3025 8,5 7,15 1,8225 9,3 7,15 4,6225 10 7,15 8,1225 Unid.1 – Introdução à Estatística Estatística – Prof. Ricardo Luís Rocha Para o banco Jefferson Valley: Para o banco da Providência: Pode-se ver novamente que a dispersão dos dados do banco da providência é muito maior. min48,02272222,0 9 0450,2 110 3025,03025,03025,0...2025,03025,04225,0 1 )( 2 s n xx s min82,1318333333,3 9 8650,29 110 1225,86225,48225,1...0625,37025,8 1 )( 2 s n xx s Unid.1 – Introdução à Estatística Estatística – Prof. Ricardo Luís Rocha 1.5.3 – Variância A variância é simplesmente o quadrado do desvio padrão. A razão para ela existir é que o desvio padrão nos fornece um significado físico para a dispersão, mas não um significado matemático. A variância nos fornece um significado matemático para a variação, sendo utilizada em diversas equações, enquanto carece de um significado físico. Unid.1 – Introdução à Estatística Estatística – Prof. Ricardo Luís Rocha As fórmulas para o cálculo da variância são as mesmas do desvio padrão. Inclusive, a variância é representada pela sigla s2 ou σ2, dependendo se o conjunto de dados se refere a uma amostra ou população. 1 )( 2 2 n xx s )1( )()(. 22 2 nn xxn s N x 2 2 )( Unid.1 – Introdução à Estatística Estatística – Prof. Ricardo Luís Rocha Exemplo: Variância dos bancos: Jefferson Valley Tempo (x) x (x-x)2 6,5 7,15 0,4225 6,6 7,15 0,3025 6,7 7,15 0,2025 6,8 7,15 0,1225 7,1 7,15 0,0025 7,3 7,15 0,0225 7,4 7,15 0,0625 7,7 7,15 0,3025 7,7 7,15 0,3025 7,7 7,15 0,3025 Banco da Providência Tempo (x) x (x-x)2 4,2 7,15 8,7025 5,4 7,15 3,0625 5,8 7,15 1,8225 6,2 7,15 0,9025 6,7 7,15 0,2025 7,7 7,15 0,3025 7,7 7,15 0,3025 8,5 7,15 1,8225 9,3 7,15 4,6225 10 7,15 8,1225 Unid.1 – Introdução à Estatística Estatística – Prof. Ricardo Luís Rocha Para o banco Jefferson Valley: Para o banco da Providência: Pode-se ver novamente que a dispersão dos dados do banco da providência é muito maior. 22 2 min2272222,0 9 0450,2 110 3025,03025,03025,0...2025,03025,04225,0 1 )( s n xx s 2 2 min318333333,3 9 8650,29 110 1225,86225,48225,1...0625,37025,8 1 )( s n xx s Unid.1 – Introdução à Estatística Estatística – Prof. Ricardo Luís Rocha 1.5.5 – Coeficiente de Variação Por vezes, é conveniente exprimir a variabilidade em termos relativos. Toma-se, então, uma medida relativa de variabilidade, comparando-se o desvio padrão com a média. Essa medida é o coeficiente de variação. Como o desvio padrão e a média possuem a mesma unidade de medida, o coeficiente de variação é adimensional. x s CV Unid.1 – Introdução à Estatística Estatística – Prof. Ricardo Luís Rocha Exemplo: Calcule o coeficiente de variação para os bancos do início desta unidade. Resolução: Para o Jefferson Valley, a média é 7,15 e o desvio padrão 0,48: Já no banco da providência: %713,6ou 06713,0 15,7 48,0 x s CV %5,452ou 2545,0 15,7 82,1 x s CV Unid.1 – Introdução à Estatística Estatística – Prof. Ricardo Luís Rocha Unid.1 – Introdução à Estatística Exercício: 1) Trinta estudantes foram submetidos a um exame de estatística, obtendo as seguintes notas: Determine a amplitude, variância, desvio padrão e coeficiente de variação destes dados. 70 76 76 77 77 78 80 81 81 83 83 83 84 86 86 87 87 88 89 90 90 91 92 92 93 94 94 95 98 99 Estatística – Prof. Ricardo Luís Rocha 1.6 – Gráficos Gráficos são representações pictóricas dos dados, muito valiosas na visualização dos resultados. Nesta unidade veremos: -Histograma -Gráfico de barras Unid.1 – Introdução à Estatística Estatística – Prof. Ricardo Luís Rocha 1.6.1 – Histograma Utilizados para representar a distribuição de frequências de dados contínuos. Trata-se de um conjunto de retângulos com as bases sobre um eixo dividido de acordo com o tamanho das classes, centros nos pontos médios das classes e áreas proporcionais às frequências. Unid.1 – Introdução à Estatística Estatística – Prof. Ricardo Luís Rocha Exemplo: Com os dados das alturas dos atletas, resumidos na tabela de frequência abaixo, construa o histograma dos dados. Lim. Inferior Lim. Sup. n % 163 167 4 0,133 167 171 8 0,267 171 175 6 0,20 175 179 5 0,167 179 183 5 0,167 183 187 2 0,067 Total 30 1,000 Unid.1 – Introdução à Estatística Estatística – Prof. Ricardo Luís Rocha Solução: Basta calcular os centros das classes e plotar as barras com alturas proporcionais às contagens. As barras se tocam entre as classes. Com relação ao eixo vertical, podemos colocar tanto os valores das contagens como os valores das frequências (o gráfico não se altera por causa disso). Unid.1 – Introdução à Estatística Estatística – Prof. Ricardo Luís Rocha 0 1 2 3 4 5 6 7 8 9 165 169 173 177 181 185 Unid.1 – Introdução à Estatística Estatística – Prof. Ricardo Luís Rocha 1.6.2 – Gráfico em Barras Por vezes, os dados consistem em contagens, tais como o número de filhos em um conjunto de famílias, o número de acidentes de trânsito por dia – e não em mensurações em uma escala contínua. Se o número de valores distintos não é muito grande, constrói-se uma distribuição de frequência utilizando os próprios valores individuais como “Classes”, em lugar de intervalos de classes. Neste gráfico, as barras não se tocam. Unid.1 – Introdução à Estatística Estatística– Prof. Ricardo Luís Rocha Exemplo: Construir o gráfico de barras das frequências relativas do número de filhos por família em 25 domicílios de uma certa localidade. N° de Filhos n f 0 1 0,04 1 4 0,16 2 10 0,40 3 6 0,24 4 2 0,08 5 2 0,08 Total 25 1,00 0 0,05 0,1 0,15 0,2 0,25 0,3 0,35 0,4 0,45 0 1 2 3 4 5 Unid.1 – Introdução à Estatística Estatística – Prof. Ricardo Luís Rocha Lim. Inf. da Classe Lim. Sup. da Classe n Freq. relativa (%) 70 75 1 3,3 75 80 5 16,7 80 85 7 23,3 85 90 6 20,0 90 95 8 26,7 95 100 3 10,0 Totais 30 100,0 Unid.1 – Introdução à Estatística Exercício: Construa o histograma para a tabela de frequências abaixo.
Compartilhar