Baixe o app para aproveitar ainda mais
Prévia do material em texto
AULA 01 CONCEITOS FUNDAMENTAIS ESTATÍSTICA Estatística é uma parte da Matemática Aplicada que fornece métodos para a coleta, organização, descrição, análise e interpretação de dados e para a utilização dos mesmos nas tomadas de decisão. A estatística divide-se em dois ramos: ESTATÍSTICA DESCRITIVA É a parte da estatística que se preocupa com a coleta, organização e a descrição dos dados observados, porém sem tirar conclusões mais genéricas. ESTATÍSTICA INDUTIVA OU INFERENCIAL É a parte que em baseando-se em resultados obtidos de uma amostra, procura inferir ou tirar conclusões para o comportamento da população, dando a precisão dos resultados e com que probabilidade se pode confiar neles. POPULAÇÃO OU UNIVERSO É um conjunto de indivíduos ou objetos que apresentam pelo menos uma característica comum. AMOSTRA É um subconjunto finito de uma população. FENÔMENO É o número de resultados possíveis. Assim, por exemplo: para o fenômeno “número de filhos” há um número de resultados possíveis expresso através de números naturais: 0, 1, 2, 3, ..., n VARIÁVEL É, convenientemente, o conjunto de resultados possíveis de um fenômeno. Quando seus valores são expressos por atributos: cor dos olhos, sexo), etc ela é denominada qualitativa. Quando os seus valores são expressos em números (salários, idade dos alunos de uma escola, etc) ela é denominada quantitativa. Uma variável quantitativa que pode assumir, teoricamente, qualquer valor entre dois limites recebe o nome de variável contínua; uma variável que só pode assumir valores pertencentes a um conjunto enumerável recebe o nome de variável discreta. Assim, o número de alunos de uma escola pode assumir qualquer um dos valores do conjunto N = ( 1, 2, 3, ...), mas nunca valores como2,34 ou 5,76. Logo é uma variável discreta. Já o peso desses alunos é uma variável contínua, pois um aluno pode pesar 72 kg, como 72,5 kg, como 72,53 kg, etc, dependendo esse valor da precisão da medida. De modo geral, as medições dão origem a variáveis contínuas e as contagens ou enumerações a variável discretas. Quando uma variável é quantitativa discreta ela é manipulada como se apresenta. Entretanto quando a variável é quantitativa contínua há sempre um limite para a precisão com a qual a mensuração pode ser feita, o que nos leva a concluir que o valor verdadeiro nunca é conhecido. Na verdade, os valores observados são discretos e aproximados. Convencionaremos que a precisão da medida será automaticamente indicada pelo número de decimais com que se escrevem os valores da variável. Assim, um valor 4,60 indica que a variável em questão foi medida com a precisão de centésimos, não sendo exatamente o mesmo que 4,6, valor correspondente a uma precisão de décimos. Para suprimir unidades inferiores às de determinada ordem recorremos a técnica de ARREDONDAMENTO DE DADOS. ARREDONDAMENTO DE DADOS A técnica de arredondamento de dados é normatizada pelo Instituto Brasileiro de Geografia e Estatística, IBGE através da resolução 886/66, da seguinte maneira: Quando o primeiro algarismo a ser abandonado é 0, 1, 2, 3, 4, fica inalterado o último algarismo a permanecer. Ex. 53,24 passa a 53,2 Quando o primeiro algarismo a ser abandonado é 6, 7, 8, 9, aumenta-se uma unidade o algarismo a permanecer. Ex. 42,87 passa a 42,9 88, 08 passa a 88,1 Quando o primeiro algarismo a ser abandonado é 5, há duas soluções: Se ao 5 seguir em qualquer casa um algarismo diferente de zero, aumenta-se uma unidade ao algarismo a permanecer. Ex. 2,352 passa a 2,4 109,250003 passa a 109,3 Se o 5 for o último algarismo ou se ao 5 só se seguirem zeros, o último algarismo a permanecer só será aumentado de uma unidade se for impar. Ex. 24,75 passa a 24,8 24,65 passa a 24,6 24,75000 passa a 24,8 24,65000 passa a 24,6 OBS Não devemos nunca fazer arredondamentos sucessivos. EX. 17,3452 passa a 17,3 e não 17,35, a 17,4 Se tivermos a necessidade de um novo arredondamento, voltamos sempre aos dados originais. PRECISÃO milésimo centésimo Décimo unidade dezena centena milhar 3.876,55239 3.876,552 3.876,55 3.876,6 3.877 3.880 3.900 4.000 COMPENSAÇÃO Compensar é suprimir ou adicionar unidades conforme a precisão a ser requerida do resultado. Supondo os dados abaixo, aos quais aplicamos as regras do arredondamento: 25,32 25,3 + 17,85 + 17,8 10,44 10,4 31,17 31,2 84,78 84,8 84,7 Se arredondarmos a soma original para uma casa decimal vemos que o resultado é 84,8; a nova soma com as parcelas arredondadas difere em uma unidade. Entretanto para a apresentação dos resultados, é necessário que desapareça tal diferença, o que é possível com a técnica da COMPENSAÇÃO, conservando o mesmo número de casas decimais. Praticamente, usamos descarregar a diferença na(s) maio(res) parcela(s). assim passamos a ter: 25,3 + 17,8 10,4 31,3 84,8 AULA 02 APRESENTAÇÃO DOS DADOS A apresentação dos dados pode ser efetuada de duas formas, não mutuamente excludentes. A primeira é a apresentação tabular, necessária quando se deseja uma apresentação sistemática dos dados; a outra forma é a gráfica, que se constitui em um importante complemento à apresentação tabular, principalmente por permitir uma visualização quase imediata das distribuições dos valores estudados. SÉRIES ESTATÍSTICAS Segundo o Conselho Nacional de Estatística, a organização dos dados denomina-se série estatística, e esta deverá apresentar, o título, o cabeçalho, o corpo e o rodapé. Título - conjunto de informações, as mais completas possíveis, respondendo às perguntas: O que?, Quando?, Onde?, localizado no topo da série estatística; Cabeçalho - parte superior da tabela que especifica o conteúdo das colunas ( as categorias, as modalidades da variável); Corpo – conjunto de linhas e colunas que contém informações sobre a variável em estudo; Rodapé – elementos complementares da tabela, que são a fonte, as notas, as chamadas. ELEMENTOS COMPONENTES DE UMA TABELA – SÉRIE ESTATÍSTICA TABELA 1 - VENDA DE TRATORES BRASIL 2000 – 2001 Título 2000 2001 Cabeçalho TRATORES 12.595 14.892 Corpo COLHEITADEIRAS 2.003 2.010 Anfavea Fonte De acordo com a Resolução 886 da Fundação IBGE, nas casas ou células devemos colocar: Um traço horizontal ( -) quando o valor é zero, não só quanto à natureza das coisas como quanto ao resultado do inquérito; Três pontos (...) quando não temos os dados; Um ponto de interrogação (?) quando temos dúvida quanto à exatidão de determinado valor; Zero (0) quando o valor é muito pequeno para ser expresso pela unidade utilizada. Se os valores são expresso em numerais decimais, precisamos acrescentar à parte decimal um número correspondente de zeros ( 0,0; 0,00; 0,000;...). TIPOS DE SÉRIES ESTATÍSTICAS Conforme o critério de agrupamento, as séries classificam-se em 4 tipos: temporal ou cronológica, geográfica ou espacial, específica ou categórica e distribuição de freqüências. SÉRIE CRONOLÓGICA É a série estatística em que os dados são observados segundo época de ocorrência. TABELA 2 – ARRECADAÇÀO MENSAL DE ICMS NO PARANÁ – 1991 MESES ARRECADAÇÃO R$ MESES ARRECADAÇÃO R$ JANEIRO 24.856 JULHO 48.931 FEVEREIRO 27.093 AGOSTO 53.564 MARÇO 30.912 SETEMBRO 60.310 ABRIL 36.870 OUTUBRO 69.065 MAIO 41.442 NOVEMBRO 83.857 JUNHO 42.042 DEZEMBRO 90.336 SEFA SÉRIE GEOGRÁFICA É a série em que os dados são observados segundo a localidade de ocorrência. TABELA 3 - METALÚRGICA S/A VENDAS POR REGIÃO (2003)REGIÃO VENDAS (R$ 1000,00) SUL 6.900 SUDESTE 7.700 CENTRO-OESTE 6.500 NORDESTE 5.800 NORTE 4.200 TOTAL 31.500 Dados fictícios SÉRIE ESPECÍFICA É a série em que os dados são observados segundo modalidades diferentes de ocorrência. TABELA 4 - VENDA DE TRATORES/ COLHEITADEIRAS BRASIL 2000/2001 TIPO UNIDADES (2.000) UNIDADES(2.000) TRATORES 12.595 14.892 COLHEITADEIRAS 2.003 2.010 Anfavea DISTRIBUIÇÃO DE FREQÜÊNCIAS É o método de agrupamento de dados em classes, ou intervalos, de tal forma que se possa determinar o número ou a percentagem de cada classe. Estatura de 40 alunos do Colégio “A” I Estatura (cm) fi xi fri Fi Fri 1 150 |--- 154 4 152 0,100 4 0,100 2 154 |--- 158 9 156 0,225 13 0,325 3 158 |--- 162 11 160 0,275 24 0,600 4 162 |--- 166 8 164 0,200 32 0,800 5 166 |--- 170 5 168 0,125 37 0,925 6 170 |--- 174 3 172 0,075 40 1,000 =40 REPRESENTAÇÀO GRÁFICA A apresentação dos dados e respectivos resultados de sua análise pode também ser feita sob a forma de figuras, em geral gráficos ou diagramas. Gráficos devem ser auto-explicativos e de fácil compreensão, de preferência sem comentários inseridos. Devem ser simples, atrair a atenção do leitor e inspirar confiança. Alguns pontos devem ser respeitados na construção de um gráfico: - o tamanho deve ser adequado à sua publicação em revistas, periódicos, cartazes ou livros; - deve ter sempre um título; - deve ser construído em uma escala que não desfigure os fatos ou as relações que se deseja destacar. Os gráficos podem ser cartogramas ou diagramas; entende-se por cartogramas o mapa geográfico ou topográfico em que as freqüências das categorias de uma variável são projetadas nas áreas específicas do mapa, utilizando-se cores ou traçados cujos significados constam em legendas anexadas às figuras. Diagramas são gráficos em que a magnitude das freqüências é representada por certa mensuração de uma determinada figura geométrica. Se a medida utilizada for o comprimento, tem-se o diagrama de ordenadas (gráfico de linhas); caso se utilize superfície de figura, tem-se diagrama de barras, histograma e gráfico de setores, alem de gráficos representativos de distribuições de freqüência. GRÁFICO EM LINHAS - ARRECADAÇÃO MENSAL DE ICMS NO PARANÁ – 1991 GRÁFICO EM COLUNAS MÚLTIPLAS - VENDA DE TRATORES/ COLHEITADEIRAS BRASIL 2000/2001 Fonte: Anfavea GRÁFICO EM BARRAS- METALÚRGICA S/A VENDAS POR REGIÃO (2002) Fonte: Dados fictícios GRÁFICO EM SETORES- METALÚRGICA S/A VENDAS POR REGIÃO (2001) Fonte: Dados fictícios GRÁFICO POLAR - ARRECADAÇÃO MENSAL DE ICMS NO PARANÁ – 1991 Fonte: SEFA HISTOGRAMA: ESTATURA DE 40 ALUNOS DO COLÉGIO A Fonte: Dados fictícios F 12 10 8 6 4 2 0 150 154 158 162 166 170 174 Estatura GRÁFICO DE DISTRIBUIÇÃO DE FREQÜÊNCIA – HISTOGRAMA/POLÍGONO DE FREQÜÊNCIA - NÚMERO MÉDIO DE ACIDENTES POR MIL HOMENS/HORA EM UMA INDÚSTRIA Dados fictícios AULA 03 DISTRIBUIÇÃO DE FREQÜÊNCIAS Distribuição de freqüências são descrições de dados resultantes de variáveis quantitativas agrupadas em classes. TABELA PRIMITIVA É assim denominada quando os valores são diretamente organizados conforme coletados, isto é sem critérios de ordem numérica. Suponhamos termos feito uma coleta de dados relativos às estaturas de quarenta alunos, que compõem uma amostra dos alunos de um colégio A, resultando na seguinte tabela de valores: Estatura de 40 alunos do Colégio “A” 166 160 161 150 162 160 165 167 164 160 162 161 168 163 156 173 160 155 164 168 155 152 163 160 155 155 169 151 170 164 154 161 156 172 153 157 156 158 158 161 ROL Ë uma ordenação dos dados da tabela primitiva. Estatura de 40 alunos do Colégio “A” 150 154 155 157 160 161 162 164 166 169 151 155 156 158 160 161 162 164 167 170 152 155 156 158 160 161 163 164 168 172 153 155 156 160 160 161 163 165 168 173 DISTRIBUIÇÃO DE FREQÜÊNCIA É uma ordenação em freqüências, sendo no exemplo anterior o numero de alunos componentes da amostra. Estatura de 40 alunos do Colégio “A” Estatura Freqüência Estatura Freqüência 150 1 163 2 151 1 164 3 152 1 165 1 153 1 166 1 154 1 167 1 155 4 168 2 156 3 169 1 157 1 170 1 158 2 172 1 160 5 173 1 161 4 Total 40 162 2 DISTRIBUIÇÃO DE FREQÜÊNCIA COM INTERVALOS DE CLASSES É uma representação dos valores em vários intervalos; onde perde-se a sensibilidade ou pormenores mas ganha-se em simplicidade. No exemplo estudado agrupamos em intervalos de classe conforme critérios a serem estudados. Estatura de 40 alunos do Colégio “A” ESTATURA FREQÜÊNCIA 150 |--- 154 4 154 |--- 158 9 158 |--- 162 11 162 |--- 166 8 166 |--- 170 5 170 |--- 174 3 TOTAL 40 ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQÜÊNCIA Classes de freqüência, ou simplesmente classes - são os intervalos de variação da variável Limites de classe - são os extremos de cada classe l1 = 150 L5 = 170 Amplitude de um intervalo de classe, ou simplesmente intervalo de classe é a medida do intervalo que define a classe. hi = Li – li h2 = L2 – l2 = 158 – 154 = 4 cm Amplitude total de distribuição (AT) – é a diferença entre o limite superior da última classe ( limite superior máximo) e o limite inferior da primeira classe (limite inferior mínimo) AT = L(máx) – l(mín) = 174 – 150 = 24 cm Amplitude amostral (AA) – é a diferença entre o valor máximo e o valor mínimo da amostra AA = x(máx) – x(mín) = 173 – 150 = 23 cm Ponto médio de uma classe (xi) é o ponto que divide o intervalo de classe em duas partes iguais xi = (li + Li) / 2 x2 = (154 + 158) / 2 = 156 cm Note que a colocação de um índice i para x para f e os demais elementos da tabela tem a finalidade de referência. Deste modo x2 representa o segundo valor distinto da série, f3 representa a freqüência simples do terceiro valor da série e assim sucessivamente. PASSOS PARA A CONSTRUÇÃO DE UMA DISTRIBUIÇÃO DE FREQÜÊNCIA Estabelecer o número de classes Pela fórmula de Sturges: i = 1 + 3,3 log n Onde n representa o número total de observações Esta regra nos permite obter a seguinte tabela: n I 3 |---| 5 3 6 |---| 11 4 12 |---| 22 5 23 |---| 46 6 47 |---| 90 7 91 |---| 181 8 182 |---| 362 9 ... ... i = 1 + 3,3 log n = 1 + 3,3 log 40 = 1 + 3,3 * 1,602 = 1 + 5,2866 = 6,2866 = 6 Portanto no exemplo usam-se 6 intervalos Determinar a amplitude total dos dados AT = L(máx) – l (mín) AT = (173 + 1) – 150 = 24 cm Estabelecer o intervalo ou amplitude de classe h = AT / i h = 24 / 6 = 4cm OBS: se h fosse decimal aplicar-se-ia o inteiro maior que o número dado, exemplo se h fosse 4,03 usar-se-ia 5 para amplitude de intervalo e não 4 como manda a regra de arredondamento, constituindo em estatística a única exceção a regra. Estabelecer os limites dos intervalos, começando com um inteiro em relação ao menor valor da série. O limite superior da primeira classe é determinado acrescendo-se o valor de h ao limite mínimo. L1= 150 + 4 = 154 cm O limite inferior da segunda classe é igual ao limite máximo da primeira classe. l2 = 154 cm TIPOS DE FREQÜÊNCIA Estatura de 40 alunos do Colégio “A” i Estatura (cm) fi xi fri Fi Fri 1 150 |--- 154 4 152 0,100 4 0,100 2 154 |--- 158 9 156 0,225 13 0,325 3 158 |--- 162 11 160 0,275 24 0,600 4 162 |--- 166 8 164 0,200 32 0,800 5 166 |--- 170 5 168 0,125 37 0,925 6 170 |--- 174 3 172 0,075 40 1,000 =40 Freqüências Simples ou Absolutas (fi) – são os valores que realmente representam o número de dados de cada classe. Freqüências Relativas (fri) – são os valores das razões entre as freqüências simples e a freqüência total. Fri = fi / fi Freqüência Acumulada (Fi) – é o total das freqüências de todos os valores inferiores ao limite superior de intervalo de uma dada classe. Fi = f1 + f2 + .... + fi Freqüência Acumulada Relativa (Fri) – é a freqüência acumulada da classe dividida pela freqüência total de distribuição. Fri = Fi / fi Fri = fr1 + fr2 + .... + fri HISTOGRAMA POLÍGONO DE FREQÜÊNCIA São a representação gráfica das distribuições de freqüência, onde no histograma os valores de fi são representados no eixo de y, paralelos aos limites de cada classe. No polígono de freqüência as freqüências fi são representadas no eixo y porem no ponto médio de cada classe. I Estatura (cm) fi 1 150 |--- 154 4 2 154 |--- 158 9 3 158 |--- 162 11 4 162 |--- 166 8 5 166 |--- 170 5 6 170 |--- 174 3 =40 _1415706336.unknown _1415706338.unknown _1415706340.unknown _1415706341.unknown _1415706339.unknown _1415706337.unknown _1415706335.unknown
Compartilhar