Prévia do material em texto
Prof. Herondino IV - Descrição e Apresentação dos Dados Dados A palavra "dados" é um termo relativo, tratamento de dados comumente ocorre por etapas, e os "dados processados" a partir de uma etapa podem ser considerados os "dados brutos" do próximo. (Wikipédia) Dados Brutos Em informática dados brutos (raw data) designam os dados/valores recolhidos e estocados tal qual foram adquiridos, sem terem sofrido o menor tratamento (Wikipédia) Dados Brutos Suponhamos o seguintes dados Brutos como sendo a idade de alunos de uma turma de informática 14 12 13 11 12 13 16 14 14 15 17 14 11 13 14 15 13 12 14 13 14 13 15 16 12 12 Frequência A frequência de uma observação é o número de repetições dessa observação no conjunto de observações, ou ainda, é o número de vezes que conjuntos de dados aparecem em uma “população”. Tipos de Frequências Frequência simples ou absoluta (fi ) - são os valores que representam o número de dados de cada classe. Frequência relativa(fr ) - são os valores das razões entre as frequências simples e a frequência total. Frequência acumulada(fa ) – é o total das frequências de todos os valores inferiores ao limite superior do intervalo de uma dada classe. Frequência acumulada relativa(far ) é a frequência acumulada da classe, dividida pela frequência total da distribuição. Distribuição de Frequência Simples ( ) 11 2 12 5 13 6 14 7 15 3 16 2 17 1 ix if if Dados ou variável (Idade) Frequência (nº de Alunos) Frequências Relativas A frequência relativa é o valor da frequência absoluta dividido pelo número total de observações. Variável (idade) frequência absoluta (Nº de alunos) frequência relativa 11 2 2/26 = 0,0769 12 5 5/26 = 0,1923 13 6 6/26 = 0,2308 14 7 7/26 = 0,2692 15 3 3/26 = 0,1154 16 2 2/26 = 0,0769 17 1 1/26 = 0,0385 TOTAL = 26 1,0000 ix if rf ifN Frequência Acumulada Variável freqüência absoluta freqüência relativa frequência absoluta acumulada frequência relativa acumulada 11 2 2/26 = 0,0769 2 2/26 = 0,0769 12 5 5/26 = 0,1923 7 7/26 = 0,2692 13 6 6/26 = 0,2308 13 13/26 = 0,5000 14 7 7/26 = 0,2692 20 20/26 = 0,7692 15 3 3/26 = 0,1154 23 23/26 = 0,8846 16 2 2/26 = 0,0769 25 25/26 = 0,9615 17 1 1/26 = 0,0385 26 26/26 = 1,0000 TOTAL = 26 =1,0000 ix if rf af raf if rf Regras de arredondamento na Numeração Decimal Norma ABNT NBR 5891 1) Quando o algarismo imediatamente seguinte ao último algarismo a ser conservado for inferior a 5, o último algarismo a ser conservado permanecerá sem modificação Exemplo: 1,333 3 arredondado à primeira decimal tornar-se-á 1,3 Regras de arredondamento na Numeração Decimal 2) Quando o algarismo imediatamente seguinte ao último algarismo a ser conservado for superior a 5, ou, sendo 5, for seguido de no mínimo um algarismo diferente de zero, o último algarismo a ser conservado deverá ser aumentado de uma unidade Exemplo 1,666 6 arredondado à primeira decimal tornar-se-á: 1,7. 4,850 5 arredondados à primeira decimal tornar-se-ão : 4,9. Regras de arredondamento na Numeração Decimal 3) Quando o algarismo imediatamente seguinte ao último algarismo a ser conservado for 5 seguido de zeros, dever-se-á arredondar o algarismo a ser conservado para o algarismo par mais próximo. Consequentemente, o último a ser retirado, se for ímpar, aumentará uma unidade. Exemplo: 4,550 0 arredondados à primeira decimal tornar-se-ão: 4,6. Regras de arredondamento na Numeração Decimal 4) Quando o algarismo imediatamente seguinte ao último a ser conservado for 5 seguido de zeros, se for par o algarismo a ser conservado, ele permanecerá sem modificação. Exemplo: 4,850 0 arredondados à primeira decimal tornar-se-ão: 4,8. Atividade - III 1. Verificar a altura em centímetro de cada aluno da turma e construir uma sequência de Dados Brutos; 2. A partir dos Dados Brutos obtidos, construir a distribuição de frequência absoluta simples, a frequência relativa, frequência acumulada e frequência relativa acumulada. Para o arredondamento utilize a regra da ABNT 5891. Séries Estatísticas Tabela é um quadro que resume um conjunto de observações. Elementos da Tabela: Título – o que? Quando? Onde? Cabeçalho – parte superior da tabela que especifica o conteúdo Corpo – linha e colunas que contém as informações Rodapé – elementos complementares Séries Estatísticas Séries Históricas Descrevem os valores da variável, em determinado local, discriminado segundo intervalos de tempo variáveis. Série Geográficas ou espaciais Descrevem os valores da variável, em determinado instante, discriminado segundo regiões. Series Específicas ou categóricas Descrevem os valores da variável, em determinado tempo e local, discriminados segundo especificações ou categorias. Exemplo: Séries Conjugadas Quando apresenta em uma única tabela, a variação de valores de mais de uma variável. Apresentação dos dados “O gráfico estatístico é uma forma de apresentação dos dados estatísticos, cujo objetivo é o de produzir, o investigador ou no público em geral, uma impressão mais rápida e viva do fenômeno em estudo, já que os gráficos falam mais rápido à compressão que as séries” (Crespo, 2002) Quando se dispõe de um grande número de observações, torna-se extremamente difícil a leitura de valores colocados em tabela. Colunas ou em barras É a representação de uma série por meio de retângulos, dispostos verticalmente (em colunas) ou horizontalmente (em barras) Histograma Um histograma é uma representação gráfica de uma única variável que representa a frequência de ocorrências (valores dos dados) dentro de categorias de dados. O histograma tanto pode ser representado para as frequências absolutas como para as frequências relativas. 0 2 4 6 8 10 12 14 0 1 2 3 4 5 6 7 8 9 10 Nota nº de Alunos 0 1 1 1 2 2 3 4 4 6 5 8 6 12 7 10 8 3 9 2 10 1 Total 50 Polígono de Frequência 1 1 2 4 6 8 12 10 3 2 1 0 2 4 6 8 10 12 14 0 1 2 3 4 5 6 7 8 9 10 O Polígono de frequências é obtido ligando-se os pontos médios dos topos dos retângulos de um histograma. Sobrepondo 0 2 4 6 8 10 12 14 0 1 2 3 4 5 6 7 8 9 10 1 1 2 4 6 8 12 10 3 2 1 0 2 4 6 8 10 12 14 0 1 2 3 4 5 6 7 8 9 10 Histograma de frequência acumulada (ou ogiva) histograma de frequência acumulada (ou ogiva) é a representação gráfica do comportamento da frequência acumulada. 0 10 20 30 40 50 60 0 1 2 3 4 5 6 7 8 9 10 F re q u ê n c ia A c u m u la d a Distribuição por Frequência Acumulada Gráfico de Setores 0% 2% 4% 5% 7% 9% 11% 13% 15% 16% 18% Gráfico de Setores 0 1 2 3 4 5 6 7 8 9 10 É designado por um círculo, onde cada classe é representada por um setor circular, cujo ângulo é proporcional ao tamanho da amostra. Distribuição de Frequência agrupadas em Classe Para a determinação de classes não existe uma regra pré estabelecida, sendo necessário um pouco de tentativa e erro para a solução mais adequada. 1. Definir o número de classes Se n representa o número de observações (na amostra ou na população, conforme for o caso) o número aproximado de classes pode ser calculadopor Número de Classes = arredondando os resultados. n Exemplo Nº de Classes = Fonte: Marques, 2013 47,530 Fazendo arredondamento para 6 Altura em cm da Turma CA 2013 2. Calcular a amplitude das classes Essa será obtida conhecendo-se o número de classes e amplitude total dos dados. A amplitude total dos dados é o resultado da subtração valor máximo - valor mínimo da série de dados classes de Total Amplitude = classe de Amplitude número MinValor -MaxValor = Total Amplitude Distribuição de Frequência agrupadas em Classe Exemplo 6 6 36 = classe de Amplitude 36152-188 = Total Amplitude Rol Fonte: Vaz,2013 3. Distribui a frequência dos dados agrupados por classe O limite superior de cada classe é aberto (e consequentemente, o limite inferior de cada classe é fechado), ou seja, cada intervalo de classe não inclui o valor de seu limite superior, com exceção da última classe. (Nº de Ordem) (Altura em cm) ( Nº de alunos) 01 152 158 02 158 164 03 164 170 04 170 176 05 176 182 06 182 188 Total i ix if Limite Inferior Limite Superior Distribuição de Frequência agrupadas em Classe Distribuição de Frequência agrupadas em Classe (Nº de Ordem) (Altura em cm) ( Nº de alunos) 01 152 158 9 02 158 164 8 03 164 170 5 04 170 176 4 05 176 182 3 06 182 188 1 Total 30 if i i x if Fonte: Tillmann, 2013 Medidas de posição ou tendência central n x n xxx X n i i n 121 ... 1. Média Aritmética Exemplo: A nota final (NF) do curso será dada pela fórmula: Em que: AP – Avaliação Parcial AF – Avaliação Final Sendo AP (Avaliação Parcial) a média aritmética das atividades propostas (AT1, AT2,...,ATn) A cada AT será atribuído valores de 1 a 5. 2 AFAP NF n ATnATAT AP ...21 Exemplo: 164163,833... 30 188...156155154154152152 X 1641 n x X n i i Medidas de posição ou tendência central Propriedades da média aritmética 1. A média é um valor típico, ou seja, ela é o centro de gravidade da distribuição, um ponto de equilíbrio. Seu valor pode ser substituído pelo valor de cada item na série de dados sem mudar o total. Simbolicamente temos: 2. A soma dos desvios das observações em relação a média é igual a zero. 3. A soma dos desvios elevados ao quadrado das observações em relação a média é menor que qualquer soma de quadrados de desvios em relação a qualquer outro número. Em outras palavras, é um mínimo. 0)( Xxi )( 2 Xxi n x n x X n i i i 1 Exemplo n x n x X n i i i 1 0)( Xxi )( 2 Xxi ix X Xxi 2)( Xxi 2. Média Ponderada Medidas de posição ou tendência central i n i ii n nn P p px ppp pxpxpx X 1 21 2211 ... ...... Onde é o peso da observação i ip A universidade definiu que as avaliações parciais teriam peso de 30% e a prova final teria peso de 40% no cálculo dos rendimentos dos alunos. Veja o quadro abaixo e calcule a média do aluno. Exemplo 4,03,03,0 4,06,93,093,08 PX8,0 0,30 0,30 Ap 2 9,0 9,6 Ap nota peso Ap 1 Final 0,40 Média aritmética Ponderada em dados agrupados (Nº de Ordem) (Altura em cm) ( Nº de alunos) 01 152 158 9 02 158 164 8 03 164 170 5 04 170 176 4 05 176 182 3 06 182 188 1 Total i i x if ( Ponto médio) mx 30 if im fx i n i im f fx X 1 n i im fx 1 . Média aritmética Ponderada em dados agrupados (Nº de Ordem) (Altura em cm) ( Nº de alunos) 01 152 158 9 02 158 164 8 03 164 170 5 04 170 176 4 05 176 182 3 06 182 188 1 Total i i x if ( Ponto médio) 155 1395 161 1288 167 835 173 692 179 537 185 185 4932 mx 2 supinf LL xm 30 if im fx i n i im f fx X 1 164 30 932.4 X n i im fx 1 . Mediana (Md) A mediana é o valor do item central da série quando estes são arranjados em ordem de magnitude Exemplo: a) 2, 4, 5, 7, 8 Md=5 b) 2, 5, 6, 9, 10, 13, 15 Md=9 c) 3, 5 ,8 ,10, 15 ,21 Md=9 Para o calculo da mediana, têm-se: Se a série for ímpar sua posição será dada por ou se for Par a sua posição é dada por 2 1 n posição 2 1 22 nn posição Mediana (Md) Cálculo da mediana Se série ímpar Ex: Calcule a mediana da série { 1, 3, 0, 0, 2, 4, 1, 2, 5 } Md=2 2 1 n posição 1ª 2ª 3ª 4ª 5ª 6ª 7ª 8ª 9ª 0 0 1 1 2 2 3 4 5 ª5 2 19 posição Mediana (Md) Cálculo da mediana Se a sequência for par Ex: Calcule a mediana da série { 1, 3, 0, 0, 2, 4, 1, 3, 5, 6 } 1ª 2ª 3ª 4ª 5ª 6ª 7ª 8ª 9ª 10ª 0 0 1 1 2 3 3 4 5 6 2 1 22 nn posição 2 ª6ª5 2 1 2 10 2 10 posição 5,2 2 32 Md Dados Agrupados Sem intervalos de Classe Identificar a frequência Acumulada imediatamente superior à metade da soma das frequência, ou seja, 15 2 30 2 if Dados Agrupados Se existir uma frequência acumulada (fa ), tal que: a mediana será dada por: Veja no exemplo ao lado. 2 i a f f 2 1 ii xx Md xi fi fa 12 1 1 14 2 3 15 1 4 16 2 6 17 1 7 20 1 8 8 if 4 2 8 af 5,15 2 31 2 1615 Md Mediana em dados Agrupados 1º Determinar as frequências acumuladas. 2º Calcular 3º Encontrar a classe correspondente à frequência acumulada imediatamente superior à - classe mediana 2 if 2 if 2 i a f f Mediana (Md) para valores agrupados af ix 17 9 5,15 2 130 2 1 n 158 164Md 917 95,15 158164 158 Md 1586 8 5,6 Md 8,162Md c f fn LMd Md a Md 2/)1( inf = limite de classe inferior da classe da mediana; = frequência acumulada da classe imediatamente anterior à classe da mediana; = frequência absoluta simples da classe da mediana, = amplitude (tamanho) da classe da mediana. MdL inf af Mdf c Mediana (Md) para valores agrupados c f fn LMd Md a Md 2/)1( inf 158inf MdL 9af 8Mdf 6c Exemplo: 6 8 92/)130( 158 Md 6 8 95,15 158 Md 6 8 5,6 158 Md 87,4158Md 87,162Md Moda (Mo) É o valor que ocorre com maior frequência em uma série de valores. Exemplos: a){ 7 , 8 , 9 , 10 , 10 , 10 , 11 , 12 } a moda é igual a 10. b){ 3 , 5, 8 , 10 , 12 } não apresenta moda. A série é amodal. c){ 2 , 3 , 4 , 4 , 4 , 5 , 6 , 7 , 7 , 7 , 8 , 9 } apresenta duas modas: 4 e 7. A série é bimodal. Moda (Mo) – Dados agrupados o Sem intervalo de classe: é o valor da variável de maior frequência. o Exemplo: Nota nº de Alunos 0 1 1 1 2 2 3 4 4 6 5 8 6 12 7 10 8 3 9 2 10 1 Total 50 Moda (Mo) – Dados agrupados o Com intervalos de classe: A classe que apresenta a maior frequência é denominada classe modal. Nesta, é o valor dominante que está compreendido entre os limites da classe modal. O cálculo da moda consiste em tomar o ponto médio da classe modal (Moda Bruta). 155 2 158152 2 )( supinf Mo LL Mo (Nº de Ordem) (Altura em cm) 01 152 158 9 02 158 164 8 03 164 170 5 04 170 176 4 05 176 182 3 06 182 188 1 Total i i x if Método pela fórmula de CZUBER: : limite inferior da classe modal : frequência anterior a classe modal : frequência posterior a classe moda : frequência da classe modal : amplitude da classe modal Moda (Mo) – Classes agrupada 4 )811()911( 911 58 Mo 54 58 9 58 62 11 62 66 8 66 70 5 ix if 4 32 2 58 Mo 4 5 2 58 Mo 6,596,158 Mo h dd d LMo 21 1 inf antffd Mo 1 postffd Mo 2 infL antf Mof h postf Interpretação Geométrica Mo if ix Atividade IV 1. Procure exemplos de séries estatísticas em jornais e revistas de enfoque ambiental e classifique essas séries; 2. Procure exemplos de gráficos em jornais e revistas de enfoque ambiental e classifique esses gráficos 3. Um processo de medida no laboratório foi avaliada através da inserção aleatoriamente de 27 amostras possuindo uma concentração conhecida de η=8.0 mg/L para o fluxo normal de trabalho ao longo de um período de 2 semanas. O resultado na ordem de observação foram 6.8, 7.8, 8.9, 5.2, 7.7, 9.6, 8.7, 6.7, 4.8, 8.0, 10.1, 8.5, 6.5, 9.2, 7.4, 6.3, 5.6, 7.3, 8.3, 7.2, 7.5, 6.1, 9.4, 5.3, 7.6, 8.1, e 7.9 mg/L. A partir dos valores observados, obter: a distribuição de frequência agrupada em classe, a frequência relativa, frequência acumulada e frequência relativa acumulada. Para o arredondamento utilize a regra da ABNT 5891; Construa o seu histograma, o polígono de frequência, ogiva e o gráfico de setores; A média aritmética, a moda, a mediana e localize essas medidas no histograma. 4) Considerando os conjuntos de dados: a)3,5,2,6,5,9,5,2,8,6 b)20,9,7,2,12,7,20,15,7 c)51,6; 48,7; 50,3; 49,5; 48,9 d)15, 18, 20, 13, 10, 16, 14 Calcule a média, a mediana e a moda. 5) Os dados de DBO coletados na tabela ao lado, são do baixo Rio Jari, realizada no período de novembro de 2009 a novembro de 2010. A partir desses dados construa: a) a sua distribuição de frequência agrupada em classe; b) O histograma, a ogiva e o gráfico em função do tempo; c) A media, a mediana e a moda. Atividade IV Mês DBO(mg/L) L 1 L2 L3 L4 nov 8,09 8,22 8,20 8,11 dez 8,46 9,11 9,72 8,66 jan 6,75 5,96 6,41 6,24 fev 5,51 5,48 5,39 4,91 mar 4,96 5,22 4,38 4,77 abr 6,37 6,24 5,74 5,92 mai 8,92 8,85 7,94 8,08 jul 7,87 7,94 7,75 7,85 ago 0,83 1,28 1,70 1,18 set 1,07 1,47 1,41 1,84 out 1,82 1,62 1,74 2,33 nov 2,53 2,58 2,44 2,31 Fonte: Oliveira,2013 Referência BERTHOUEX, Paul Mac; BROWN, Linfield C.. Statistics for Environmental Engineers. 2ª Boca Raton London New York Washington, D.c: Lewis Publishers, 2002. MORETTIN, Pedro Alberto; BUSSAB, Wilton de Oliveira. Estatística básica. São Paulo: Saraiva, 2006. TRIOLA, Mario F. Introdução à estatística. Rio de Janeiro: LTC, 1999. OLIVEIRA, B. S. Sangel. Qualidade da água associada à vulnerabilidade climática e riscos sanitários no baixo Rio Jarí – AP / Brunna Stefanny Sangel de Oliveira; orientador Alan Cavalcanti da Cunha. Macapá, 2013.