Baixe o app para aproveitar ainda mais
Prévia do material em texto
PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO GRANDE DO SUL DEPARTAMENTO DE ESTATÍSTICA _____________________________________________________________________ ESTATÍSTICA DESCRITIVA 1. INTRODUÇÃO: A palavra estatística é comumente associada a pesquisas de opinião pública, recenseamentos, índices governamentais. Na realidade engloba vários outros aspectos como veremos a seguir, sendo fundamental na análise de dados provenientes de processos onde exista variabilidade. Exemplos: O número médio de filhos no Brasil é 2,6. A população brasileira cresce a uma taxa de 1,9% ao ano. A taxa de desemprego é de 7,5%. O setor de Vestuário demitiu 21,9% de empregados no primeiro trimestre de 1996. O salário médio de Assistente Administrativo, em empresas médias, é de R$ 717,00. O número de acidentes de trânsito nas estradas gaúchas no verão foi 15. ESTATÍSTICA é a ciência que tem por objetivo orientar a coleta, organização, apresentação, análise e interpretação dos dados para tomar decisões. Divide-se em: ESTATÍSTICA DESCRITIVA: está envolvida com o resumo e a apresentação dos dados. ESTATÍSTICA INFERENCIAL: ajuda a concluir sobre conjuntos maiores de dados (populações) quando apenas partes destes conjuntos (amostras) foram estudados. Alguns conceitos: POPULAÇÃO: É um conjunto de elementos com alguma característica comum. Exemplos: habitantes de P. Alegre; alunos da PUCRS; sócios de um clube; pinheiros do município de Canela. CENSO: É o levantamento efetuado em toda a população. Todos os sócios de um clube são pesquisados, por exemplo, e não apenas uma parte deles. Geralmente pesquisas em toda a população implicam em custo elevado e muito tempo, sendo necessário o estudo de apenas parte da população, ou amostra. AMOSTRA: É apenas uma parte da população. Exemplos de pesquisas amostrais: a) pesquisas de opinião para conhecer o provável eleito em eleições; b) o IBGE faz, periodicamente, pesquisas sobre emprego, desemprego, inflação, etc.; c) redes de rádio e televisão realizam pesquisas para conhecer a popularidade dos programas; d) biólogos marcam pássaros, peixes, etc. para uma previsão sobre hábitos de migração; e) os dirigentes de uma empresa de ônibus precisam determinar o consumo de óleo diesel.; f) verificar as causas de uma doença. AMOSTRAGEM: É o processo que estabelece critérios para a seleção de uma amostra. Quando não é possível realizar um estudo sobre todos os elementos da população utiliza-se a amostragem. PARÂMETRO: Descreve uma informação sobre uma população. Por exemplo: a idade média de todos os alunos de uma escola de 2o grau é 16,5 anos. ESTATÍSTICA AMOSTRAL (ou apenas estatística): Descreve a informação contida em uma amostra. Por exemplo: a idade média de uma amostra de alunos de uma escola de 2o grau é 17 anos. VARIÁVEL: É toda característica que pode variar de um indivíduo para outro. Pode ser qualitativa ou quantitativa. Variável qualitativa (var. categóricas ou atributos): é aquela que fornece dados de natureza não numérica. Mesmo que os dados possam ser codificados numericamente (masculino = 1; feminino = 2), os números são apenas símbolos sem valor quantitativo. A variável encontra-se no nível nominal quando diferencia-se uma categoria da outra somente através da denominação da categoria. Os dados são identificados pela atribuição de um “nome”, não existindo nenhuma relação de ordem entre as categorias. Por exemplo: profissão, curso, sexo, nacionalidade. Ao nível ordinal é possível além de identificar diferentes categorias, reconhecer graus de intensidade entre elas. Indivíduos podem ser classificados como mais perturbado; mais agressivo; mais imaturo. Outros exemplos: grau de instrução, conceitos, dias da semana. Variável quantitativa: é aquela em que os dados são numéricos e expressam quantidades. A variável é denominada discreta quando assume apenas valores determinados dentro de certo intervalo. Geralmente são números inteiros. Por exemplo: número de irmãos; número de acertos; número de acidentes. A variável é contínua quando pode assumir infinitos valores em certo intervalo. Por exemplo: peso, altura, temperatura, diâmetro. 2. ORGANIZAÇÃO DOS DADOS: Os dados coletados através de entrevistas ou outra técnica serão transformados em informações, através da organização em tabelas estatísticas adequadas. Se um conjunto tiver aproximadamente 30 dados ou menos a análise será feita sem agrupamento, caso contrário se tiver mais de 30 dados será feito um agrupamento, conhecido como distribuição de freqüência. TABELA PARA DADOS NÃO AGRUPADOS: Quando o conjunto de dados for pequeno a tabela pode ser como a que segue: TAB.1 - Número de faltas de um grupo de alunos da turma 120-Escola XYZ em março/2005 Nome do aluno No de faltas Marcos Daniela Lucas Michele 3 2 0 3 Fonte: Secretaria da escola. b) DISTRIBUIÇÃO DE FREQUÊNCIA (TABELA PARA DADOS AGRUPADOS): Se o caso é um grande conjunto de dados, ou seja, quando for impossível personalizá-los constrói-se uma distribuição de frequência como os exemplos abaixo, dependendo da classificação da variável entre discreta e contínua. A distribuição de freqüência é por ponto, quando geralmente a variável é discreta, como na tabela abaixo: TAB. 2 - Números de faltas de um grupo de alunos da Escola XYZ em março/2005 N.de faltas ( x ) N.de alunos ( f ) 0 12 1 13 2 20 3 11 4 4 ( 60 Fonte: Secretaria da escola . O número de alunos para cada número de faltas é chamado freqüência simples ou absoluta e é representado por f. Dividindo-se f por (f = n obtém-se a freqüência relativa simples ou proporção. Por exemplo: freqüência relativa para 0 falta é 12/60 = 0,20 (ou 20% do total de alunos). A tabela pode fornecer também as freqüências simples acumuladas (F), que indicam o número de alunos que têm um número de faltas igual ou menor que determinado valor. Na tabela existem 45 alunos com 2 ou menos faltas. A proporção de alunos com número de faltas igual ou menor que 2 é obtida dividindo-se a freqüência simples acumulada pelo número total de alunos. Ou seja: 45/60 = 0,75 (ou 75% dos alunos) e é chamada freqüência relativa acumulada (Fr). A distribuição é por intervalo (ou por classe), quando geralmente a variável é contínua, como abaixo: TAB. 3 - Altura dos atletas da modalidade “A” no clube “B” – 1o sem/2005 Altura (em cm) N.de atletas 162 (( 167 4 167 (( 172 9 172 (( 177 8 177 (( 182 6 182 (( 187 3 ( 30 Fonte: Instrutores do clube “B” O sinal (( indica intervalo fechado à esquerda e aberto à direita, ou seja, o valor da esquerda está incluído neste intervalo e o da direita, excluído. Para esta tabela com intervalos ou classes outro elemento é necessário: o ponto médio (x), que representa o valor da variável em cada classe. O ponto médio da 1a. classe é obtido pela soma de 162 e 167, dividida por 2. Portanto 164,5 cm. A distribuição de freqüência pode ser, ainda, para uma variável qualitativa (nominal ou ordinal) como, por exemplo, na tabela abaixo que indica o número de correspondências recebidas por uma revista em certa semana: TAB. 4 – Correspondências recebida pela revista Veja – 22/02/06 a 01/03/06 Categorias N.de correspondências E-mails 1 567 Cartas 39 Fax 20 ( 1 626 Fonte: Revista Veja 3. MEDIDAS ESTATÍSTICAS: Podem ser divididas em medidas de tendência central e medidas de dispersão. Medidas de tendência central ou de posição:a) Média aritmética: É a soma dos valores da variável dividida pelo número de valores. Ou seja: onde: n = é o tamanho da amostra. Exemplo: O número médio de faltas da TAB.1 é: faltas. O símbolo da média depende dos dados constituírem uma amostra ou uma população. Na população utilizam-se letras gregas, geralmente, para representar as medidas. Portanto a fórmula para a média na população será: onde: N = é o tamanho da população. A média aritmética de uma distribuição de freqüências por pontos ou por classes é dada por: onde: n = ( f Exemplo: A média do número de faltas de um grupo de alunos da Escola XYZ da TAB.2 é: faltas. b) Moda: A moda é o valor que mais se repete, o mais freqüente, de um conjunto de dados. A moda pode não ser única, isto é, um conjunto pode ser bimodal, trimodal, etc. ou mesmo amodal (sem moda). Exemplo: Dado o conjunto: 1 2 2 3 3 4 4 4 7 9 15 A moda é 4. Se a variável for qualitativa nominal, como por exemplo, estado civil, a moda será o estado civil que mais se repetiu. Exemplo: A moda do número de faltas da TAB.1 é 3. Na distribuição de freqüência, a moda é obtida da mesma maneira que no caso dos dados não agrupados, ou seja, é o valor que possui maior freqüência. A Assim, a moda da TAB.2 é 2 faltas. A moda de uma distribuição de frequência por classes ou intervalos pode ser obtida pelo ponto médio da classe ou intervalo que possui maior frequência. É chamada “moda bruta”. A moda da TAB.3 é 169,5 cm. Na TAB.4, a moda é a categoria E-mails. c) Mediana: A mediana de um conjunto ordenado de valores é definida como sendo o valor que separa o conjunto em dois subconjuntos do mesmo tamanho. Assim se “n” (número de elementos) é ímpar a mediana é o valor central do conjunto. Caso contrário a mediana é a média dos valores centrais do conjunto. Me = x(n+1)/2 se “n” é ímpar e Me = [x(n/2) + x(n/2) +1] / 2 se “n” é par. Exemplo: Para o conjunto: 15 18 21 32 45 46 49 A mediana é: Me = x(7+1)/2 = x4 = 32 Ou seja, a mediana é o quarto valor na seqüência ordenada de elementos. Se o conjunto fosse: 15 18 21 32 45 46 A mediana será: Me = [x(n/2) + x(n/2)+1] / 2 = [x(6/2) + x(6/2)+1] / 2 = (x3 + x4) / 2 = (21 + 32) / 2 = 53/2 = 26,50 No caso de uma distribuição de freqüência: 1. a mediana de uma distribuição de freqüência por pontos é obtida da mesma forma que para dados não agrupados, isto é: Exemplo: Para os valores da TAB.2 referente ao número de faltas a mediana é: Me = [x60/2 + x(60/2)+1] / 2 = [x30 + x31] / 2 = (2 + 2) / 2 = 2 2. a mediana para uma distribuição de freqüência por classes ou intervalos é dada pela seguinte expressão: onde: li = limite inferior da classe mediana; Fa = freqüência acumulada simples da classe anterior à classe mediana; f = freqüência simples da classe mediana; h = amplitude da classe mediana. Exemplo: Considerando que a classe mediana da TAB.3 referente à altura dos 30 atletas é a que contém os valores x15 e x16, isto é, a segunda classe, então: �� EMBED Equation.3 cm Ou seja, 50% dos atletas possuem menos de 173,25 cm de altura. Medidas de DISPERSÃO OU VARIABILIDADE: Indicam a dispersão dos valores da variável em relação a sua média. Variância absoluta Desvio padrão Coeficiente de variação a) Variância absoluta: A variância é representada por s² (para amostra) e definida como sendo “a média dos quadrados dos desvios em relação à média aritmética”. Por desvio entende-se a diferença entre um valor do conjunto e a média. s ou s � Se os dados forem de uma população a variância será: ou No caso de distribuição de freqüência o cálculo da variância será: s ou s Na população a variância é: ou b) Desvio padrão: A variância por ser um quadrado não permite comparações com a unidade que se está trabalhando. Para se ter uma medida de variabilidade com a mesma unidade do conjunto utiliza-se a raiz quadrada da variância, que é denominada de desvio padrão. Assim a expressão para o desvio é: Na população será: Exemplo: Calcular a variância e o desvio padrão dos seguintes dados amostrais: 3 4 0 3 8 6 = 24/6 = 4 (x² = 134 A variância é: E o desvio padrão: s = 2,76 c) Coeficiente de variação: O coeficiente de variação é uma medida de dispersão relativa, isto é, não possui unidade de medida e é calculado por: Usando os símbolos populacionais: Por não ter unidade de medida, o coeficiente de variação pode ser utilizado na comparação de duas ou mais séries de valores e conhecer a séria mais homogênea, uniforme. Ou seja, que tem menor variabilidade. OBS.: Quanto maior o C.V. mais heterogêneo será o conjunto de dados. PROPRIEDADES DAS MEDIDAS: MEDIDAS DE TENDÊNCIA CENTRAL: Se todos os valores de um conjunto de dados forem somados a uma constante então as medidas de tendência central aumentam desta constante. Em símbolos: dado um conjunto de dados x e somando a este conjunto uma constante “c”, então y = x + c. Tem-se: = + c O mesmo ocorre com a mediana e a moda. Se todos os valores de um conjunto forem multiplicados a uma constante então as medidas de tendência central ficam multiplicadas por esta constante. Ou seja, y = cx. Tem-se: = c O mesmo ocorre com a mediana e a moda. MEDIDAS DE DISPERSÃO: Se todos os valores de um conjunto de dados forem somados a uma constante então as medidas de dispersão não se alteram. Em símbolos: dado um conjunto de dados x e somando a este conjunto uma constante “c” , ou seja, y = x + c. Tem-se: sy = sx O mesmo vale para a variância. O coeficiente de variação é exceção, pois é medida derivada que combina uma medida de tendência central, que se altera, e uma medida de dispersão que não se altera. Se todos os valores de um conjunto de dados forem multiplicados a uma constante então as medidas de dispersão ficam multiplicadas por esta constante, sendo que a variância fica multiplicada pelo quadrado da constante. Ou seja: y = cx. Tem-se: sy = csx �PAGE � �PAGE �8� Prof. João Feliz Duarte de Moraes _1184085293.unknown _1184089848.unknown _1202242192.unknown _1207333171.unknown _1184091995.unknown _1184334500.unknown _1184091946.unknown _1184087741.unknown _1184088006.unknown _1184088069.unknown _1184088512.unknown _1184087874.unknown _1184087713.unknown _1143298390.unknown _1143408655.unknown _1184084622.unknown _1143409375.unknown _1143409893.unknown _1143408713.unknown _1143298703.unknown _1142886885.unknown _1143297900.unknown _1142888458.unknown _914004316.unknown
Compartilhar