Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 Técnico em Química Estatística Aplicada 2 1. COLETA E APRESENTAÇÃO DE DADOS ................................................................................... 3 1.1. Introdução ................................................................................................................................. 3 1.2. Conceituação ............................................................................................................................ 3 1.3. Método estatístico ..................................................................................................................... 3 1.4. Variáveis.................................................................................................................................... 4 1.5. População e amostra ................................................................................................................. 5 1.6. Amostragem .............................................................................................................................. 6 1.7. Apresentação de resultados ...................................................................................................... 7 2. MEDIDAS ................................................................................................................................... 17 2.1. Algarismos significativos .......................................................................................................... 17 2.2. Regras para arredondamento .................................................................................................. 18 2.3. Notação científica (notação exponencial) ................................................................................ 19 2.4. Ordem de grandeza ................................................................................................................. 20 2.5. Operações com calculadoras científicas .................................................................................. 20 3. MEDIDAS DE POSIÇÃO ............................................................................................................ 22 3.1. Média aritmética ...................................................................................................................... 22 3.2. Média geométrica simples ....................................................................................................... 25 3.3. Média harmônica simples ........................................................................................................ 25 3.4. Média quadrática ..................................................................................................................... 25 3.5. Moda ....................................................................................................................................... 25 3.6. Mediana .................................................................................................................................. 26 4. MEDIDAS DE DISPERSÃO ........................................................................................................ 29 4.1. Amplitude total ......................................................................................................................... 29 4.2. Variância populacional............................................................................................................. 29 4.3. Desvio padrão populacional .................................................................................................... 29 4.4. Propriedades da média e do desvio padrão ............................................................................. 30 4.5. Desvio padrão populacional (dados agrupados sem intervalos de classe) .............................. 30 4.6. Variância amostral e desvio padrão amostral .......................................................................... 31 4.7. Coeficiente de variação ........................................................................................................... 31 4.8. Escore padronizado ................................................................................................................. 32 4.9. Desvio padrão da média .......................................................................................................... 33 5. DEFINIÇÕES BÁSICAS DE PROBABILIDADE .......................................................................... 33 DEFINIÇÃO ........................................................................................................................................... 33 PROBABILIDADE É O ESTUDO DAS CHANCES DE OBTENÇÃO DE CADA RESULTADO DE UM EXPERIMENTO ALEATÓRIO. A ESSAS CHANCES SÃO ATRIBUÍDOS OS NÚMEROS REAIS DO INTERVALO ENTRE 0 E 1. RESULTADOS MAIS PRÓXIMOS DE 1 TÊM MAIS CHANCES DE OCORRER. ALÉM DISSO, A PROBABILIDADE TAMBÉM PODE SER APRESENTADA NA FORMA PERCENTUAL. ........................................................................................................................ 33 5.1. EXPERIMENTO ALEATÓRIO E PONTO AMOSTRAL ................................................................... 33 REFERÊNCIAS BIBLIOGRÁFICAS ....................................................................................................... 37 3 ESTATÍSTICA DESCRITIVA 1. COLETA E APRESENTAÇÃO DE DADOS 1.1. Introdução O Vocábulo Estatística é originado do latim Status (Estado). Foi empregado pela primeira vez por Godofredo Achenwall, em meados do século XVIII. A Estatística é historicamente relacionada às coisas do Estado, do Governo e da Administração. Na mão dos estadistas, constituiu-se de verdadeira ferramenta administrativa. A própria Bíblia nos leva a essa recuperação histórica: Maria e José viajaram de Nazaré para Belém, na época do nascimento de Jesus Cristo, para que fossem recenseados. Naquele tempo, por imposição do imperador César Augusto, toda a população do império romano deveria se alistar em suas cidades de origem (a palavra “censo” deriva de censere, que em latim significa “taxar”). 1.2. Conceituação A Estatística possui alguns conceitos antigos. Ela ainda é usada como simples contagem aritmética; como sinônimo de dados publicados oficialmente ou como transformações matemáticas. Assim, é comum ouvir alguém dizer: “Aqui estão as estatísticas sobre o jogo realizado ontem!”. Eis alguns conceitos modernos para a Estatística: “É a parte da matemática aplicada que se ocupa em obter conclusões a partir de dados observados”. “É a estimativa de um parâmetro a partir de uma amostra” (parâmetro é o elemento numérico usado para caracterizar todo o conjunto). 1.3. Método estatístico Método é um conjunto de meios dispostos convenientemente para se chegar a um fim que se deseja. Podemos distinguir no método estatístico as seguintes fases: 1.3.1. Coleta de informações Após cuidadoso planejamento e a devida determinação das características mensuráveis do fenômeno que se quer pesquisar, damos início à coleta de informações (ou dados). A coleta pode ser direta ou indireta. A coleta é direta quando feita sobre elementos informativos de registro obrigatório (nascimentos, casamentos e óbitos, importação e exportação de mercadorias), elementos pertinentes aos prontuários dos pacientes de um hospital ou, ainda, quando os dados são coletados pelo próprio pesquisador através de inquéritos e questionários. A coleta se diz indireta quando é inferida de elementos conhecidos (coleta direta) e/ou do conhecimento de outros fenômenos relacionados com o fenômeno estudado. Como exemplo, podemos citar a pesquisa sobre a mortalidade infantil, que é feita através de dados colhidos por uma coleta direta. 1.3.2. Crítica dos dados Obtidos os dados, eles devem ser cuidadosamente criticados, à procura de possíveis falhas e imperfeições, a fim de não incorrermos em erros grosseiros ou de certo vulto,que possam influir sensivelmente nos resultados. A crítica é externa quando visa às causas dos erros por parte do infor- mante, por distração ou má interpretação das perguntas que lhe foram feitas; é interna quando visa observar os elementos originais dos dados da coleta. 1.3.3. Apuração dos dados Nada mais é do que a soma e o processamento dos dados obtidos e a disposição mediante critérios de classificação. Pode ser manual, eletromecânica ou eletrônica. 1.3.4. Exposição ou apresentação dos dados Por mais diversa que seja a finalidade que se tenha em vista, os dados devem ser a representados sob forma adequada (tabelas ou gráficos), tornando mais fácil o exame daquilo que está sendo objeto de tratamento estatístico. 4 1.3.5. Análise dos resultados O objetivo último da Estatística é tirar conclusões sobre o todo (população) a partir de informações fornecidas por parte representativa do todo (amostra). Assim, realizadas as fases anteriores (Estatística Descritiva), fazemos uma análise dos resultados obtidos, através dos métodos da Estatística Indutiva ou Inferencial, que tem por base a indução ou inferência, e tiramos desses resultados conclusões e previsões. 1.4. Variáveis A cada fenômeno corresponde um número de resultados possíveis. Exemplos: Ex.1: para o fenômeno "sexo" são dois os resultados possíveis: sexo masculino e sexo feminino; Ex.2: para o fenômeno "número de filhos" há um número de resultados possíveis expresso através dos números naturais: 0, 1, 2, 3, ..., n; Ex.3: para o fenômeno "estatura" temos uma situação diferente, pois os resultados podem tomar um número infinito de valores numéricos dentro de um determinado intervalo. Variável: é o conjunto de resultados possíveis de um fenômeno. Podem ser classificadas como qualitativas ou quantitativas. 1.4.1. Variável qualitativa Quando seus valores são expressos por atributos: sexo (masculino ou feminino); religião (católica, protestante,...); escolaridade (fundamental, médio, superior), etc. Podem ser classificadas como nominais ou ordinais. Variáveis qualitativas ordinais Quando apresentam alguma ordenação ou hierarquia. Exemplos: Escolaridade: 1ºgrau, 2ºgrau, 3ºgrau; Funcionários de uma escola: diretor, chefe de departamento, coordenador, professor, etc. Variáveis qualitativas nominais Quando não representam ordenação ou hierarquia. Exemplos: Sexo (masculino; feminino); Religião (católica, protestante, espírita...); Município de origem: Campos dos Goytacazes, São Fidélis, São João da Barra, etc. 1.4.2. Variável quantitativa Quando seus valores são expressos em números. Exemplo: os salários dos operários, a idade dos alunos de uma escola, etc. Uma variável quantitativa que pode assumir, teoricamente, qualquer valor entre dois limites recebe o nome de variável contínua; uma variável que só pode assumir valores pertencentes a um conjunto enumerável recebe o nome de variável discreta. Assim, o número de clientes de um banco pode assumir qualquer um dos valores do conjunto N = { 1, 2, 3, ..., 188, ...}, mas nunca valores como 2,5 ou 3,78 ou 4,325. Logo, o número de clientes é uma variável discreta. Já o saldo da conta desses clientes é uma variável contínua, pois pode assumir um conjunto não enumerável de valores, como R$172,54 ou R$172,5402, etc. Outro exemplo de variável contínua é o peso de atletas de uma determinada equipe: um atleta pode pesar 72 kg, como 72,5 kg ou ainda 72,520 kg. A medida depende da precisão do equipamento utilizado, no caso, uma balança. De um modo geral, as medições dão origem a variáveis contínuas e as contagens ou enumerações dão origem a variáveis discretas. Designamos as variáveis por letras latinas, em geral, as últimas: X, Y, Z. Por exemplo, sejam 2, 3, 5 e 8 todos os resultados possíveis de um determinado fenômeno. Usando a letra X para indicar a variável relativa ao fenômeno considerado, temos: X {2, 3, 5, 8}. 1º. Exercício Proposto Classifique as variáveis em qualitativas (nominal ou ordinal) ou quantitativas (discreta ou contínua): Universo: alunos de uma escola. 5 Variável 1: Cor dos cabelos. ......................................................................................... Variável 2: Série ........................................................................................................... Variável 3: Estatura ...................................................................................................... Variável 4: Número de irmãos ...................................................................................... Universo: casais residentes em uma cidade. Variável 1: Número de filhos ........................................................................................ Variável 2: Renda familiar .............................................................................................. Variável 3: Classe social .............................................................................................. Variável 4: Saldo bancário ........................................................................................... 1.5. População e amostra 1.5.1. População População Estatística ou Universo Estatístico é o conjunto de entes portadores de pelo menos uma característica comum. Os estudantes, por exemplo, constituem uma população, pois apresentam pelo menos uma característica comum: são os que estudam. Em qualquer estudo estatístico, as características dos elementos que constituem a população devem estar perfeitamente definidas a priori. Isso se dá quando, considerado um elemento qualquer, podemos afirmar, sem ambiguidade, se esse elemento pertence ou não à população. É necessário, pois, existir um critério de constituição da população que seja válido para qualquer pessoa, no tempo ou no espaço. Por isso, quando pretendemos fazer uma pesquisa entre os alunos das escolas de 1° grau, precisamos definir quais são os alunos que formam o universo: os que atualmente ocupam as carteiras das escolas, ou devemos incluir também os que já passaram pela escola? É claro que a solução do problema vai depender de cada caso em particular. Na maioria das vezes, por impossibilidade ou inviabilidade econômica ou temporal, limitamos as observações referentes a uma determinada pesquisa a apenas uma parte da população. A essa parte proveniente da população em estudo denominamos amostra. 1.5.2. Amostra É um subconjunto finito de uma população. Como vimos a Estatística Indutiva tem por objetivo tirar conclusões sobre as populações, com base em resultados verificados em amostras retiradas dessa população. Mas, para as inferências serem corretas, é necessário garantir que a amostra seja representativa da população, isto é, a amostra deve possuir as mesmas características básicas da população, no que diz respeito ao fenômeno que desejamos pesquisar. E preciso, pois, que a amostra ou as amostras que vão ser usadas sejam obtidas por processos adequados. Há casos, como o de pesquisas sociais, econômicas e de opinião, em que os problemas de amostragem são de extrema complexidade. Mas existem também casos em que os problemas de amostragem são bem mais fáceis. Como exemplo, podemos citar a retirada de amostras para controle de qualidade dos produtos ou materiais de determinada indústria. 2º. Exercício Proposto Nem sempre é possível coletar todos os dados da população para a análise desejada (censo). Faz- se então uma amostragem representativa dessa população. Tanto a amostragem quanto o censo apresentam vantagens e desvantagens em relação ao outro. Cite duas vantagens de cada tipo de coleta de dados. Vantagens do censo: ___________________________________________________________ _____________________________________________________________________________ Vantagens da amostragem: ______________________________________________________ _____________________________________________________________________________6 1.6. Amostragem A amostragem é uma técnica especial para recolher amostras que garante, tanto quanto possível, o acaso na escolha. Dessa forma, cada elemento da população passa a ter a mesma chance de ser escolhido, o que garante à amostra o caráter de representatividade. 1.6.1. Amostragem casual ou aleatória simples Este tipo de amostragem é equivalente a um sorteio lotérico. Pode ser feita numerando-se a população de 1 a n e sorteando-se, a seguir, por meio de um dispositivo aleatório qualquer, k números dessa sequência, os quais corresponderão aos elementos pertencentes à amostra. Exemplo: Para obter uma amostra representativa para uma pesquisa sobre estatura de uma turma de noventa alunos de uma escola, seguimos os seguintes passos: 1º passo: numeramos os alunos de 01 a 90. 2º passo: escrevemos os números, de 01 a 90, em pedaços iguais de um mesmo papel, colocando- os dentro de uma caixa. Agitamos sempre a caixa para misturar bem os pedaços de papel e retiramos, um a um, nove números que formarão a amostra. Nesse caso, 10% da população. Quando o número de elementos da amostra é grande, esse tipo de sorteio torna-se muito trabalhoso. A fim de facilitá-lo, foi elaborada uma tabela (Tabela de Números Aleatórios), construída de modo que os dez algarismos (0 a 9) são distribuídos ao acaso nas linhas e colunas. Para obtermos os elementos da amostra usando a tabela, sorteamos um algarismo qualquer da mesma, a partir do qual iremos considerar números de dois, três ou mais algarismos, conforme nossa necessidade. Os números assim obtidos irão indicar os elementos da amostra. A leitura da tabela pode ser feita horizontalmente (da direita para a esquerda ou vice-versa), verticalmente (de cima para baixo ou vice-versa), diagonalmente (no sentido ascendente ou descendente) ou formando o desenho de uma letra qualquer. A opção, porém, deve ser feita antes de iniciado o processo. 1.6.2. Amostragem proporcional estratificada Muitas vezes a população se divide em subpopulações (estratos). Como é provável que a variável em estudo apresente, de estrato em estrato, um comportamento heterogêneo e, dentro de cada estrato, um comportamento homogêneo, convém que o sorteio dos elementos da amostra leve em consideração tais estratos. É exatamente isso que fazemos quando empregamos a amostragem proporcional estratificada, que, além de considerar a existência dos estratos, obtém os elementos da amostra proporcional ao número de elementos dos mesmos. Exemplo: Suponhamos que no exemplo anterior, dentre os noventa alunos, 54 sejam meninos e 36 sejam meninas, vamos obter a amostra proporcional estratificada. São, portanto, dois estratos (sexo masculino e sexo feminino) e queremos uma amostra de 10% da população. Logo, temos: a) Definição dos estratos: Sexo População Amostra M 54 5 F 36 4 Total 90 9 Numeramos os alunos de 01 a 90, sendo que de 01 a 54 correspondem meninos e de 55 a 90, meninas. A amostra é obtida usando-se uma Tabela de Números Aleatórios ou simplesmente por sorteio dos números. 1.6.3. Amostragem sistemática Quando os elementos da população já se acham ordenados, não há necessidade de construir o sistema de referência. São exemplos os prontuários médicos de um hospital, os prédios de uma rua, as linhas de produção etc. Nestes casos, a seleção dos elementos que constituirão a amostra pode ser feita por um sistema imposto pelo pesquisador. Assim, no caso de uma linha de produção, podemos, a cada dez itens produzidos, retirar um para pertencer a uma amostra da produção diária. Neste caso, estaríamos fixando o tamanho da amostra em 10% da população. 7 Exemplo: Suponhamos uma rua contendo novecentas casas, das quais desejamos ter uma amostra formada de cinquenta casas. Podemos, neste caso, usar o seguinte procedimento: como 900/50 = 18, escolhemos por sorteio casual um número de 1 a 18 (inclusive), o qual indicaria o primeiro elemento sorteado para a amostra; os demais elementos seriam periodicamente considerados de 18 em 18. Assim, se o número sorteado fosse o 4, tomaríamos, pelo lado direito da rua, a 4a casa, a 22a, a 40a e assim sucessivamente, até voltarmos ao início da rua, pelo lado esquerdo. 3º. Exercício proposto Dentre os 3 tipos de amostragem estudados, qual seria o mais indicado para se obter uma amostra de 10% dos fregueses que almoçam num restaurante self service? Justifique. __ ____________________________________________________________________________ ______________________________________________________________________________ 1.7. Apresentação de resultados Um dos objetivos da Estatística é sintetizar os valores que uma determinada variável pode assumir, de forma que tenhamos uma visão global da sua variabilidade. Isso se consegue, inicialmente, apresentando os dados em tabelas e gráficos, que fornecem informações rápidas e seguras aos tomadores de decisão. 1.7.1. Tabelas estatísticas Uma tabela deve apresentar a seguinte estrutura: cabeçalho, corpo e rodapé. Cabeçalho Conjunto de informações localizado no topo da tabela que responde às perguntas: O que? (fato); Onde? (local) e Quando? (tempo). Corpo Conjunto de linhas, colunas e subcolunas que contém informações sobre a variável em estudo. O corpo da tabela é formado por uma coluna indicadora: parte da tabela que especifica o conteúdo das linhas; por linhas: retas imaginárias que facilitam a leitura, no sentido horizontal, de dados que se inscrevem nos seus cruzamentos com as colunas; e por casas ou células: interseções entre linhas e colunas que comportam somente um dado numérico. Rodapé Espaço abaixo do corpo da tabela reservado para observações pertinentes a tabela, bem como o registro e identificação da fonte dos dados. Os seguintes pontos devem ser observados na preparação das tabelas: Organizar as tabelas, de tal forma que o leitor possa entendê-las sem que seja necessário recorrer ao texto para a sua compreensão; Delimitar a estrutura da tabela na parte superior e na parte inferior por traços paralelos; Recomenda-se não fechar por traços verticais os lados externos da tabela, tanto à direita como à esquerda; Quando for necessário deitar a tabela numa página, fazendo a rotação no sentido anti-horário. Exemplo geral Produção de café - Brasil - 1991-1995 Anos Produção (1.000t) 1991 2.535 1992 2.666 1993 2.122 1994 3.750 1995 2.007 Fonte: IBGE cabeçalho corpo 8 1.7.2. Séries São tabelas estatísticas. Conforme critério de agrupamento, as tabelas são classificadas em série cronológica, temporal, evolutiva ou histórica, série geográfica ou de localização e série específica. Série cronológica É uma série estatística em que os dados são representados segundo a época de ocorrência. Exemplo dado acima. Série geográfica ou de localização Ë uma série estatística em que os dados são observados segundo a localidade de ocorrência. Série específica É uma série estatística em que os dados são agrupados segundo a modalidade de ocorrência. Exemplo Matrículas no Ensino de Terceiro Graus no Brasil em 1973 (ciclo básico) Áreas de ensino Matrículas Ciências biológicas 32.109 Ciências exatas e tecnológicas 65.949 Ciências agrárias 2.419 Ciências humanas 148.842 Letras 9.883 Artes 7.464 Duas ou mais áreas 16.323 Fonte: Serviço de Estatística da Educação e Cultura 1.7.3. Gráficos O gráfico é uma forma de comunicação do fenômeno em termos visuais. Portanto, representa um relato matemático-geométrico de um problema, o que facilita sobremaneira a compreensão do fenômeno estudado. Os relatos científicos, os relatórios técnicos, os relatórios administrativos, os estudos realizados por professores ou mesmo alunos fazem uso extensivo de gráficos. Um gráfico, da mesma forma que a tabela, deve ser estruturado com: cabeçalho, corpo e rodapé. Recomenda-se que o gráfico mantenha uma proporção entre alturae largura entre 3/4 a 2/3 e que contenha essencialmente, as seguintes características: Simplicidade: o gráfico deve ser destituído de detalhes de importância secundária, assim como de traços desnecessários que possam levar a uma análise morosa ou com erros; Clareza: o gráfico deve possibilitar uma correta interpretação dos valores representativos do fenômeno em estudo; Veracidade: o gráfico deve expressar a veracidade sobre o fenômeno em estudo. Os principais tipos de gráficos são: diagramas, cartogramas e pictogramas. Os pictogramas são representações pictóricas sobre o fenômeno representado. Os cartogramas apresentam os dados em cartas geográficas. Nessa apostila apresentaremos somente os principais tipos de diagramas. Diagramas São gráficos geométricos de no máximo duas dimensões, e para a sua construção, em geral, faz-se uso do sistema cartesiano. Nesse sistema, faz-se uso de duas retas perpendiculares; as retas são os eixos coordenados e o ponto de interseção, a origem. O eixo horizontal é denominado eixo das abscissas (ou eixo x) e o vertical, eixo das ordenadas (ou eixo dos Y). Exemplo: 9 Potencial de ionização dos primeiros vinte elementos da tabela periódica Element o Número atômico (Z) Potencial de ionização (kJ/mol) Element o Número atômico (Z) Potencial de ionização (kJ/mol) H 1 1312 Na 11 495,8 He 2 2371 Mg 12 737,6 Li 3 520 Al 13 577,4 Be 4 900 Si 14 786,4 B 5 800 P 15 1021 C 6 1086 S 16 999,6 N 7 1402 Cl 17 1255 O 8 1314 Ar 18 1520 F 9 1681 K 19 418,8 Ne 10 2080 Ca 20 589,5 Fonte: BRADY - Química Geral - volume 1 Diagramas triangulares Usam-se os gráficos triangulares, quando se pretende representar três variáveis ao mesmo tempo. Essas variáveis deverão estar relacionadas entre si, e suas intensidades podem ser representadas em termos percentuais. 10 Exemplo: Diagrama ternário de uma liga hipotética formada pelos elementos A, B e C. 4º. Exercício proposto Determine a composição da liga no ponto marcado no diagrama. Localize no diagrama a liga com 40% de B, 30% de A e 30% de C. 5º. Exercício proposto No diagrama ternário a seguir, têm-se as composições em massa de nitrogênio (N2), metano (CH4) e oxigênio (O2) numa mistura gasosa a uma dada temperatura. As composições do triângulo de linhas em negrito indicam que a mistura é explosiva. Com base no diagrama apresentado, responda às seguintes questões. a) A mistura de 30% de N2, 50% de O2 e 20% de CH4 em massa, num reator, é explosiva? Justifique sua resposta. b) A partir de que percentagem em massa de N2, a condição do item anterior será modificada, caso seja mantida a percentagem de CH4 na mistura? Justifique sua resposta. 0 20 40 60 80 100 % B % de B 100% C % C % A 100% A 100%A 90 80 70 60 50 40 30 20 10 0 %m/m A 11 Montagem de gráficos Não existe fórmula pronta para a montagem de um bom gráfico. Existem alguns aspectos que devem ser observados para não comprometer a qualidade dos dados coletados e algumas dicas que quando seguidas levam a produção de um bom gráfico, além, é claro de um bom senso crítico. 1o - A escolha do papel deve ser feita de forma que permita a leitura no gráfico do mesmo número de algarismos significativos que aparecem nos dados; 2o - Para melhor organização do gráfico deve-se deixar uma margem de no mínimo 1cm de cada lado e na margem inferior e de 3 a 5 cm na margem superior para indicar o que será representado no gráfico; 3o - Sempre que for possível, utilize todo o papel a fim de não de não comprometer a precisão dos dados. Escalas Aqui reside a maior dificuldade de construção de gráficos. Quando se vence esta etapa, o restante fica fácil. Algumas dicas: 1o - Determine o comprimento útil do eixo em unidades do papel (mm ou cm) - L, conforme o caso; 2o - Determine a amplitude da grandeza a ser representada sobre o eixo (G); 3o - Calcule a razão (escala) L G E 4o - Procure fazer com que cada unidade de divisão do papel corresponda a um intervalo igual a 1, 2 ou 5 unidades da grandeza representada ou, então 1.10n , 2.10n ou 5.10n , onde n é um número inteiro. Algumas vezes é tolerável fazer corresponder a cada unidade do papel 4.10n ou 8.10n. Exemplo Supondo que se disponha de um papel milimetrado com espaço útil de 150mm, construir uma escala para representar num eixo os seguintes valores de massa: 5,50; 10,7; 22,4; 45,6; 95,3g. 6º. Exercício proposto Numa prática de determinação de densidade no laboratório, foram obtidas experimentalmente as seguintes massas para corpos de provas em forma de cubos um metal dado pelo professor. 0 20 40 60 80 100 % % de N2 N2 100% CH4 % CH4 % O2 100% O2 Misturas explosivas 12 Amostra Aresta do cubo (cm) Volume (cm3) Massa (g) 1 1,00 2,86 2 2,00 22,72 3 3,00 74,52 4 4,00 176,67 5 5,00 345,43 Com base no que foi discutido até agora, determine numa folha de papel milimetrado, a porção útil do papel e proponha uma escala para cada grandeza acima (massa versus volume). Plote os pontos e responda as seguintes perguntas: Existe proporcionalidade entre volume e massa? Existe a possibilidade de descrever a relação entre o volume e a massa por uma relação linear? Caso exista, ajuste uma reta que represente tal relação. Determine o coeficiente de inclinação da reta. Interprete esse resultado. Gráfico em colunas ou em barras É a representação de uma série por meio de retângulos, dispostos verticalmente (em colunas) ou horizontalmente (em barras). Quando em colunas, os retângulos têm a mesma base e as alturas são proporcionais aos respectivos dados. Quando em barras, os retângulos têm a mesma altura e os comprimentos são proporcionais aos respectivos dados. Estas condições asseguram a proporcionalidade entre as áreas dos retângulos e os dados estatísticos. Exemplos de gráficos em colunas: Histogramas São representações gráficas da distribuição de frequência em forma de gráficos em colunas justapostas. Considere a distribuição de frequências abaixo, resultante da apuração das alturas de uma turma de alunos. I Altura ( cm ) xj fi fir fi% fiAC 1 154 159 156,5 3 3/50 6 3 2 159 164 161,5 6 6/50 12 9 3 164 169 166,5 9 9/50 18 18 4 169 174 171,5 14 14/50 28 32 5 174 179 176,5 11 11/50 22 43 6 179 184 181,5 4 4/50 8 47 7 184 189 186,5 3 3/50 6 50 TOTAL - 50 1 100 - 13 7º. Exercício proposto Construa esse mesmo histograma no Excel. Gráfico de Barras de uma distribuição ocupacional. Seja o quadro de distribuição de frequências abaixo, referente a uma pesquisa que tem por objetivo categorizar a ocupação (profissão) de 180 pessoas entrevistadas. Ocupação (Profissão) Frequências (fi) Artesanato 52 Trabalho não qualificado 65 Gerencial 29 Serviços burocráticos 34 Total 180 Como se vê, esta é outra forma de se apresentar o gráfico de colunas. Aqui não se trata de contagem, mas ao se categorizar os dados em 4 classes de ocupação que não são mensurados continuamente, o que se faz é revestir esses dados de um nível categórico ou nominal e, portanto, destacar a natureza discreta dos mesmos. A utilização de retângulos neste exemplo (não é obrigatória) objetiva apenas destacar as classes de profissão, que são efetivamente classes (categorias) e não pontos. Entretanto,observar que os retângulos não estão unidos; caso contrário, existe um hiato entre as bases representativas das classes, de modo a ressaltar o caráter discreto dos dados. Histograma da distribuição de frequência para a variável altura dos alunos. 0 10 20 30 40 50 60 70 Artesanato Trabalho não qualificado Gerencial Serviços burocráticos F re q u ê n c ia Profissão 14 Exemplo de gráfico em barras Produção de cebola - Brasil -1982 Estados Quantidades (t) São Paulo 255.620 R. G. do Sul 168.555 S. Catarina 113.602 Pernambuc o 54.091 Minas Gerais 46.903 Paraná 21.903 Fonte: IBGE Polígonos de frequências Um polígono de frequência é um gráfico em linha, sendo as frequências marcadas sobre perpendiculares ao eixo horizontal, levantadas pelos pontos médios dos intervalos de classe, ou quando for o caso, pelos valores constantes no eixo horizontal. Exemplo: Polígono de frequência 154 159 164 169 174 179 184 189 15 8º. Exercício proposto Construa esse mesmo polígono de frequência no Excel. As distribuições de frequências assumem uma variedade de formatos. As classificações mais importantes são: distribuições simétricas e distribuições assimétricas. As distribuições simétricas são aquelas caracterizadas por apresentar o valor máximo no ponto central e os pontos equidistante desse ponto terem a mesma frequência - distribuição normal ou distribuição gaussiana (distribuição de Gauss). A figura abaixo mostra uma curva simétrica. Exemplo Os erros indeterminados seguem uma distribuição normal Na prática, as observações obtidas de medições reais são mais ou menos assimétricas em relação à frequência máxima. Curva assimétrica negativa Curva assimétrica positiva Portanto, as variações nas formas das distribuições (entender como curvas de frequência) podem ser caracterizar em termos de simetria ou, conforme haja um acúmulo de dados extremos na cauda esquerda ou na cauda direita da curva, em termos de assimetria negativa ou positiva. 1.7.4. Ogivas São gráficos que apresentam a distribuição de frequência acumulada abaixo de qualquer limite superior de classe, locado (plotado) em relação a esse limite. Exemplo: Distribuição das alturas de uma turma de alunos. 16 Gráficos setoriais O gráfico setorial é um dos mais simples recursos gráficos, pois consiste em um círculo cujos setores ou partes do mesmo círculo totalizam 100%. Eles são especialmente úteis quando se deseja ressaltar a participação do dado no total. O total é representado pelo círculo que fica dividido em tantos setores quantas forem às partes. As áreas dos setores circulares são respectivamente proporcionais aos dados da série. Obtêm-se as áreas proporcionais a cada setor por regra de três simples e direta, lembrando que o total corresponde a 360o. Exemplo: A turma de Licenciatura do IFF apresenta a seguinte distribuição de frequência com relação a opção de especialização: O correspondente gráfico setorial está representado na figura a seguir: Opção de especialização Frequência (fi) % Biologia 16 32 Física 15 30 Indeciso 3 6 Química 16 32 Total 50 100 17 9º. Exercício proposto Construa um gráfico setorial do meio de transporte usado pelos estudantes da turma de licenciatura do TEFEC/2008. Meio de transporte (fi) (fi%) Angulo (0) A pé 4 Bicicleta 3 Carro 8 Moto 6 Ônibus 29 Total 2. MEDIDAS Conforme visto, medir uma variável constitui o primeiro passo no exame de um determinado fenômeno. Medir é o ato de expressar numericamente a intensidade de uma determinada grandeza, em termos de uma unidade. Uma unidade de medida se constitui numa quantidade precisamente definida da grandeza que se quer medir. Exemplo: Grandeza: largura de uma sala; Unidade: metro Medida da largura da sala: 3m = 3xm = 3x1m (três vezes a unidade metro). 2.1. Algarismos significativos Considere a medida de volume feita nas seguintes buretas: Veja que na leitura do volume gasto na 1a bureta, há uma incerteza em estimar valor (interpolação) do número de décimos de mL, enquanto que na 2a bureta, a incerteza está em estimar o valor do número de centésimos de mL gastos (bureta mais precisa). Os algarismos necessários para expressar o resultado de uma medida com a mesma precisão do instrumento usado são chamados algarismos significativos. Portanto, faz-se necessário aprender a representar uma medida com a precisão do instrumento usado. A determinação dos algarismos significativos em um número pode ser feita mediante o emprego das seguintes regras: 1o) Todos os algarismos não nulos em um número, são significativos. 2o) Todos os zeros entre dois algarismos significativos não nulos, são significativos. Exemplo: 18 100,122 120,012 110,101 11,0011 todos com 6 algarismos significativos 3o) Todos os zeros tanto à direita da vírgula decimal, como à direita de um dígito não nulo, são significativos. Exemplos: 12,00 0,1200 1,200 120,0 todos com 4 algarismos significativos 4o) Todos os zeros à esquerda de um algarismo não nulo, mas à direita de uma vírgula decimal não são significativos, se não houver algarismos não nulo à sua esquerda. Exemplos: 0,0123 0,000123 0,00000321 0,123 todos com 3 algarismos significativos 5o) = 3,1415926... O valor de é conhecido com um número de algarismos significativos maior do que você jamais usará num cálculo. Conhece-se com 1.011.196.691 algarismos significativos. 2.1.1. Adição e subtração Será mantido na resposta, somente o número de algarismos significativos correspondentes a quantidade (parcela) com menor número de algarismos significativos à direita da vírgula. Massa 1 104,65 g (balança de precisão) Massa 2 0,2248 g (balança analítica) Massa total 104,87 g 2.1.2. Multiplicação e divisão As regras são mais complicadas, porém para as pretensões pode-se adotar para a resposta, o mesmo número de algarismos significativos da medida menos precisa: Exemplo: 6,3 x 2,14 = 13,482 = 13 9,29439252,2 14,2 3,6 Observação: Em determinadas situações faz-se necessário expressar a resposta em notação científica: 50,3 x 20,7 = 1041,21 = 1,04.103 Os números resultantes de enumerações ou de contagens, ao contrário das medições, são naturalmente exatos, e assim, têm uma quantidade ilimitada de algarismos significativos. 2.2. Regras para arredondamento Um número é arredondado para outro com o número desejado de algarismo significativos, pelo cancelamento de um ou mais algarismos à direita. A regra é a seguinte: 1o) Se o dígito a ser suprimido é menor que 5 (cinco), o algarismo precedente não é alterado. 2o) Se o dígito a ser suprimido é exatamente 5 (cinco), o algarismo precedente é acrescido de 1 caso seja ímpar, e mantido caso seja par. 3o) Se o dígito a ser suprimido é maior que cinco ou cinco sucedido de algum algarismo não nulo, o algarismo precedente é acrescido de 1. Ao resolver problemas com calculadoras portáteis, os cálculos se fazem com todos os algarismos admitidos pelas calculadoras, e o arredondamento deve ser feito no final dos cálculos. O arredondamento no meio dos cálculos pode introduzir erros. 19 2.3. Notação científica (notação exponencial) Em química e física principalmente, trabalha-se muitas vezes com números extremamente grandes ou extremamente pequenos. Exemplos: 1o) massa de um átomo de carbono = 0,000 000 000 000 000 000 000 019 94 g 2o) 1 mol de átomos = 602 204 500 000 000 000 000 000 átomos Ao escrever esses números, especialmente àquele que comportam muitos zeros, antes ou depois da vírgula,é conveniente empregar a notação científica, que utiliza as potências de dez (10), para simplificar a escrita destes números. Um número escrito em notação científica consiste de duas partes multiplicadas (um coeficiente e uma potência decimal): C x 10n onde: C = coeficiente, um número entre 1 (inclusive) e 10 (exclusive): 1 C <10 10n = potência decimal onde n é um número inteiro qualquer. Exemplos: a) Números maiores que 1 321 = 3,21 x 102 veja que 1 3,21 < 10 376000 = 3,76 x 105 veja que 1 3,76 < 10 b) Número menor que 1 0,001 = 1 x 10-3 veja que 1 1 < 10 0,0000431 = 4,31 x 10-5 veja que 1 4,31 < 10 2.3.1. Adição e subtração Para adicionar ou subtrair números escritos em notação científica, primeiro cada número deve ser escrito com a mesma potência de 10. Em seguida, os coeficientes são adicionados ou subtraídos, conforme o caso, e o resultado é multiplicado pela potência de 10 comum. Exemplo: 2,17x105 + 0,30x105 = (2,17 + 0,30)x105 = 2,47x105 (2,17x105) + ( 3,0x104) = ou 21,7x104 + 3,0x104 = 24,7x104 = 2,47x10 5 2.3.2. Multiplicação e divisão Para multiplicar números escritos em notação exponencial, primeiro multiplicam-se os coeficientes e em seguida repete-se (multiplica-se) a base 10 e somam-se os expoentes: Exemplo: (5,00 x 104) x (1,60 x 102) = (5,00 x 1,60) x 10 4 + 2 = 8,00 x 106 Para dividir números escritos em notação exponencial, primeiro dividem-se os coeficientes e em seguida repete-se (multiplica-se) a base 10 e subtraem-se os expoentes: Exemplo: (6,01 x 10-3) / (5,23 x 10-6) = (6,01 / 5,23) x 10-3-(-6) = 1.149, 14 2.3.3. Potenciação e radiciação Para elevar um número em notação exponencial a uma potência ou extrair uma raiz utiliza-se as seguintes regras: Potenciação: (Cx10n)a = Cax10nxa Radiciação: 1010 .. a n aa n cc Exemplo: 20 632332 10x0,810x0,210x0,2 2,010x0,210x0,410x0,4 12 2 2 46,63210x0,210x0,410x0,4 2 5 2 5 5 2.4. Ordem de grandeza Para encontrarmos a ordem de grandeza de um número, procedemos da seguinte forma: 1 – Escreva-o em notação cientifica: C x 10n 2 – Se C 3,16, a ordem de grandeza será 10n+1 3 – Se C 3,16, a ordem de grandeza será 10 n Exemplos: 6,0x107 OG = 108 3,0x103 OG = 103 4,51 OG = 101 2.5. Operações com calculadoras científicas Estas operações ficam extremamente facilitadas quando são utilizadas calculadoras científicas. Daí, que se recomenda aprender a realizar as principais operações matemáticas mencionadas abaixo. Use uma calculadora científica para fazer as seguintes operações, anotando a seqüência de operações: Operação matemática Tecla Exemplo Operação Resultado Raiz quadrada 25 5 Raiz enésima yx 1 3 125 5 Potência yx 5 3 125 Quadrado 2x 2,5 2 6.25 = 6,25 Expoente e x p 6,02x1023 6.02x1023 = 6,02x1023 Logaritmo decimal log Log1,25x10-3 -2.90309 = -2,90309 Logaritmo neperiano ln Ln1,25x10-3 -6.6846117 = -6,6846117 Antilogaritmo decimal x10 Antilog 1 10 Antilogaritmo neperiano xe Antiln 1 2,71828182 8 21 Notação Científica (Exercício avaliativo) 1) Efetue as operações: a) 3,2.10-19 x 1,9.10-7 b) 9.109 x 6.1023 c) 6,96.1011 / 5,8.10-14 d)1,794.10-6 / 2,3.10-8 e) 9,3.10-3 + 1,11.10-3 f) 5,9.108 - 1,6.108 g) 4,6.10-6 + 3,3.10-4 h) 7,5.1014 - 2,2.1012 i) (2.10-22)3 j) (3.109)4 k) 38,1.10 l) 94,9.10 22 3. MEDIDAS DE POSIÇÃO Uma medida de posição é um valor calculado para um grupo de dados que, de alguma forma, é utilizado para descrevê-los. Tipicamente o que se deseja é que o valor seja representativo de todos os valores do grupo. As medidas de posição mais importantes são as medidas de tendência central e as separatrizes. As medidas de tendência central recebem esta denominação pelo fato de os dados observados tenderem, geralmente, a se agrupar em torno dos valores centrais. As principais medidas de tendência central são: Média aritmética (simples e ponderada); Moda e Mediana. As separatrizes são medidas de posição que dividem uma série de dados em duas partes quaisquer. Não tendem, portanto a um valor central. São elas a própria mediana, o quartil; o decil e o percentil. 3.1. Média aritmética 3.1.1. Média aritmética simples (dados não-agrupados ou isolados) É a soma de todos os valores observados dividida pelo número total de observações. n X X n 1i i n x...xx n21 onde: X = média aritmética ou simplesmente média; n = número de total de observações (tamanho da amostra); Xi , i = 1, 2, ..., n = observações individuais. Exemplo: Determinar a média aritmética da série: A = 3, 4, 1, 3, 6, 5, 6. n X X n 1i i 0,4 7 6563143 A média aritmética simples é uma medida de posição que procura representar o centro da distribuição e é utilizada quando os dados não são agrupados ou se apresentam em estado bruto (dados isolados). 1º. Exercício resolvido Dadas as alturas, em cm, de 6 jogadores de vôlei da seleção brasileira: 194, 198, 189, 201, 180, 190, determinar a altura média do time. Resolução: n X X n 1i i 6 190180201189198194 = 192,0 cm 2) Dado as notas de uma avaliação de 7alunos: 3, 5, 1, 2, 6, 5, 6, determinar a nota média. n X X n 1i i 7 6562153 = 4,0 Observe que a média aritmética é um parâmetro de medida de existência nem sempre concreta, ou seja, não existe jogador com 192 cm no primeiro exemplo, nem nota igual a 4,0 no segundo. A média aritmética significa que o conjunto se comporta como se cada um de seus elementos fosse igual à média. Em estatística, convencionou-se representar uma medida descritiva de uma população (parâmetro populacional) por uma letra grega, enquanto que uma medida descritiva de uma amostra (estatística amostral) é representada por uma letra romana. Desse modo, a média aritmética x representa a média de uma amostra de tamanho n. A média aritmética populacional, , é definida de modo semelhante: N x i , i = 1, 2, . . . , N 23 onde é a média aritmética populacional, Xi é o valor da variável e N é o número de itens da população. Operacionalmente, as duas fórmulas são idênticas: em ambos os casos são somados todos os valores, e então o resultado da soma é dividido pelo número de valores da amostra (n) ou da população (N). 3.1.2. Média aritmética ponderada (dados agrupados sem intervalos de classe) Nestes casos, em que os dados se revestem de caráter nominal (quase sempre são contagens), as frequências são números indicadores da intensidade de cada valor da variável e funcionam como pesos ou fatores de ponderação. Assim, a média aritmética é dada pela fórmula, n nn i ii fff fxfxfx f fx X ... ... 21 2211 onde X é a média aritmética (ponderada), Xi é o valor da variável e f i é a frequência observada do valor xi. Veja os exemplos a seguir: 2º. Exercício resolvido Considere a distribuição abaixo, relativa a 34 famílias de quatro filhos. Tomando como variável o número de filhos do sexo masculino, calcule o número médio de meninos. Número de meninos (Xi) Frequência (fi) 0 2 1 6 2 10 3 12 4 4 Total 34 Resolução: Vê-se que se trata de uma média aritmética “ponderada” pelas frequências. Portanto, aplica-se a fórmula: i ii f fx X . Logo, 3,2 34 78 4121062 )4x4()3x12()2x10()1x6()0x2( X meninos Obs.: Um modo mais prático de se obter a média ponderada, é abrir na tabela uma coluna correspondente aos produtos xifi : Número de meninos (xi) Frequência (fi) xi fi 0 2 0 1 6 6 2 10 20 3 12 36 4 416 34 78 3,2 34 78 f fx X i ii meninos Obs.: Se x, o número de meninos numa família, é uma variável discreta (inteira), a interpretação do resultado obtido (2 meninos e 3 décimos de menino) pode ser dita como: o maior número de famílias 24 tem 2 meninos e 2 meninas, sendo que a tendência geral aponta para uma leve superioridade numérica em relação ao número de meninos. 3º. Exercício resolvido Determine a média aritmética da série: Xi 3 4 7 8 12 fi 2 5 8 4 3 Resolução: Tem-se que Xi são os valores da variável X e fi corresponde a frequência simples (repetição) de cada valor Xi. Determina-se a média da seguinte forma: i Xi f i Xi f I 1 3 2 6 2 4 5 20 3 7 8 56 4 8 4 32 5 12 3 36 - 22 150 Observe que a média aritmética simples se iguala à média aritmética ponderada quando os pesos (frequências) são exatamente iguais. 3.1.3 Média aritmética (Dados agrupados com intervalo de classe) Em algumas situações estatísticas, os dados são apresentados em intervalos agrupados. Dessa forma, o cálculo da média aritmética é realizado de forma mais complexa. Nesse caso, temos que determinar primeiramente a média de cada intervalo multiplicando o resultado pela frequência absoluta do intervalo. O somatório desses produtos deverá ser dividido pelo somatório da frequência absoluta, constituindo a média dos valores agrupados em intervalos. Observe o seguinte exemplo: A tabela a seguir mostra a massa (em quilograma) de um grupo de pessoas. Os dados foram informados em intervalos. Veja: i ii f fx X Classe fi xi Xi . fi 41 ˫ 45 13 43 559 45 ˫ 49 6 47 282 49 ˫ 53 8 51 408 53 ˫ 57 2 55 110 57 ˫ 61 10 59 590 61 ˫ 65 1 63 63 40 2012 Ẋ = 2012/40= 50,3 i ii f fx X 8,6 22 150 X 25 3.2. Média geométrica simples A média geométrica de um conjunto n de valores X1, X2, X3,...,Xn é a raiz de ordem n do produto desses números. n n n i n i XXXXXG ...... 321 1 10º. Exercício Proposto Calcule a média aritmética simples e a média geométrica simples dos seguintes conjuntos de valores A = {2, 4 e 8} e B = {2, 2 e 2}. Compare os valores. Na prática, quando o número de fatores é muito grande, a média geométrica pode ser calculada usando logaritmo. Assim: i n 1i n 1 i n 1i n i n 1i xlog n 1 GlogxxG 3.3. Média harmônica simples É o inverso da média aritmética simples dos inversos. Dado o conjunto de n valores X1, X2, X3,...,Xn, a média harmônica simples dos n valores é; i n 1i n21i n 1i x 1 n n x 1 ... x 1 x 1 1 n x 1 1 H 11º. Exercício Proposto Calcule a média harmônica dos seguintes conjuntos de valores A = {2, 4 e 8} e B = {2, 2 e 2}. Compare com os valores da proposta anterior. 3.4. Média quadrática A média quadrática de um conjunto de valores X1, X2, X3,...,Xn é a raiz quadrada da média aritmética dos quadrados dos n valores. n X n X...XXX MQ 22 n 2 3 2 2 2 1 12º. Exercício Proposto Calcule a média quadrática dos seguintes conjuntos de valores A = {2, 4 e 8} e B = {2, 2 e 2}. Compare com os valores. Comente comparativamente as várias médias. 3.5. Moda É o valor que ocorre com maior frequência dentre os dados observados. Numa amostragem pode não haver moda (repetição de valores) ou pode haver mais de uma moda. 3.5.1. Moda (dados não-agrupados ou isolados) A moda de dados não-agrupados corresponde ao (s) valor (es) da série que mais se repete (m). 4º. Exercício resolvido Determine a moda das séries: a) A = 3, 4, 1, 3, 6, 5, 6 Mo1 = 3 e Mo2 = 6 (duas modas) b) B = 70, 75, 76, 80, 82, 83, 90, 180 Série amodal (não apresenta moda) 26 3.5.2. Moda (dados agrupados sem intervalos de classe) A moda de dados agrupados sem intervalos de classe também corresponde ao (s) valor(es) da série que mais se repete(m), ou seja, ela é determinada pelo valor da variável de maior frequência simples (fi). 5º. Exercício resolvido Determine a moda da série agrupada: Xi 3 4 7 8 12 fi 2 9 8 4 3 Resolução: A maior frequência simples é o 9, que corresponde ao valor 4 da variável. Logo, Mo = 4. 3.6. Mediana É o valor que divide os dados ordenados em duas partes iguais. Se o número de observações é par, a mediana corresponde à média dos dois valores centrais. 3.6.1. Mediana (dados não-agrupados ou isolados) 6º. Exercício resolvido Determine a mediana das séries: a) A = 3, 4, 1, 3, 6, 5, 6 A = 1, 3, 3, 4, 5, 6, 6 Md = 4 b) B = 70, 75, 76, 80, 82, 83, 90, 180 81 2 8280 Md 3.6.2. Mediana (dados agrupados sem intervalos de classe) Somar as frequências simples e dividir por 2 → 2 fi ; Abrir uma coluna para as frequências acumuladas (FiAC); Identificar a frequência acumulada imediatamente superior à metade da soma das frequências; A mediana será aquele valor da variável que corresponde a tal frequência acumulada. 7º. Exercício resolvido Determine a mediana da série agrupada: Xi 3 4 7 8 12 fi 2 5 8 4 3 Resolução: i X i f i FiAC 1 3 2 2 2 4 5 7 3 7 8 15 4 8 4 19 5 12 3 22 Total - 22 - 13º. Exercício proposto Dado a distribuição: A = -2; -1; -4; 0; -5; -3; 0; 4; 5; 2; determine: a) A média aritmética ( X ) b) A moda ( Mo ) 11 2 22 2 fi Frequência acumulada imediatamente superior a 11. Logo, Md = 7 27 c) A mediana (Md) 14º. Exercício proposto Dado o comportamento da bolsa de valores do Rio de Janeiro na primeira semana de janeiro de 2002, determine: 2a feira 3a feira 4a feira 5a feira 6a feira +1,4% +2,4% +2,0% -3,9% -1,9% a) a variação média é igual a: _____________ b) a variação mediana é igual a: _____________ 15º. Exercício proposto Qual medida de posição é mais influenciada pelos valores extremos? a) ( ) média b) ( ) moda c) ( ) mediana d) ( ) variância e) ( ) desvio padrão 16º. Exercício proposto Uma amostra é formada pelas massas de 82 ratos de laboratório. A massa mediana amostral é determinada pela: a) soma de todas as massas, dividida por 82 b) média das massas do 41o e 42o valor ordenado c) massa que mais se repete d) massa do 41o valor ordenado e) massa do 42o valor ordenado 17º. Exercício proposto Num teste aplicado numa turma de estatística foram obtidas as seguintes notas: Notas 2 4 6 8 10 Alunos 4 5 7 8 5 Determine: a) A nota média do agrupamento. b) A nota que mais se evidencia na turma. c) A nota que limita as 50% maiores notas. 18º. Exercício proposto Em uma pesquisa realizada para se estudar o efeito de um anorexígeno a ser lançado no mercado, foram constatadas as seguintes idades (anos) dos indivíduos entrevistados: 20 20 20 20 21 21 21 21 21 21 22 22 22 22 22 22 22 23 23 23 23 23 23 23 23 23 23 23 24 24 24 24 24 24 24 24 24 24 24 25 25 25 25 25 25 25 26 26 26 26 26 26 26 26 27 28 Pede-se agrupar os dados e em seguida determinar: a) A idade média ( X ) b) A idade modal ( Mo ) c) A idade mediana ( Md ) 28 3.6.3. Mediana (dados agrupados com intervalo de classe) Devemos seguir os seguintes passos: 1º) Determinamos as frequências acumuladas ; 2º) Calculamos ; 3º) Marcamos a classe correspondente à frequência acumulada imediatamente superior à . Tal classe será a classe mediana; 4º) Calculamos a Mediana pela seguinte fórmula: M Md = li + (n/2 - fac. Ant.) x h fi li = é o limite inferior da classe mediana. fac. Ant. = é a frequência acumulada da classe anterior à classe mediana. fi = é a frequência simples daclasse mediana. h = é a amplitude do intervalo da classe mediana n = somatório da frequência Classe fi fac. 41 ˫ 45 13 13 45 ˫ 49 6 19 49 ˫ 53 8 27 53 ˫ 57 2 29 57 ˫ 61 10 39 61 ˫ 65 1 40 40 = 40/2 = 20 devemos pegar um valor acima de 20, que é 27. Aplicando a equação: Med = 49 + (40/2 – 19) . 4 = 49,5 8 Média (Exercício Avaliativo) 1) No segundo bimestre, João alcançou as seguintes médias: Matemática: Português: História: Geografia: Inglês: Espanhol: Física: Química: Biologia: Educação Física: 8,5 7,3 7,0 7,5 9,2 8,4 9,0 7,2 8,0 9,5 Determine a média aritmética bimestral de João. 2) Um grupo de pessoas apresenta as idades de 10, 13, 15 e 17 anos. Se uma pessoa de 12 anos se juntar ao grupo, o que acontecerá com a média de idade do grupo? 3) A tabela abaixo representa a distribuição de frequências dos salários de um grupo de 50 empregados de uma empresa, em certo mês. Determine o salário médio dos empregados nesse mês. 29 4. MEDIDAS DE DISPERSÃO 4.1. Amplitude total É a diferença entre o maior e o menor valor observado, ou seja: R = xmáx - xmín 4.1.1. Amplitude total (dados não-agrupados) A amplitude total é determinada conforme a definição. 8º. Exercício resolvido 8) Determine a amplitude total das séries: a) A = 3, 4, 1, 3, 6, 5, 6 R = 6 – 1 = 5 b) B = 70, 75, 76, 80, 82, 83, 90, 180 R = 180 – 70 = 110 c) C = 70, 70, 70, 70, 70 R = 0 (dispersão nula) 4.1.2. Amplitude total (dados agrupados sem intervalos de classe) Mesmo procedimento anterior. 9º. Exercício resolvido 9) Determine a amplitude total da série agrupada: Xi 3 4 7 8 12 fi 2 5 8 4 2 Resolução: R = 12 – 3 = 9 4.2. Variância populacional É a média aritmética dos quadrados dos desvios tomados em relação à média populacional (μ). N x 2 i2 4.3. Desvio padrão populacional É a raiz quadrada da variância: N x 2 i2 Obs.: O desvio padrão populacional (σ ) pode ser obtido com maior rapidez e precisão quando calculado pela seguinte expressão: 22 N x N x ii ou ainda: N x x N 1 2 i2 i 30 19º. Exercício proposto Calcule para as séries (X, Y e Z) abaixo, a média aritmética e o desvio padrão populacional: Xi Xi2 Yi Yi2 Zi Zi2 2 12 1 4 14 2 6 16 3 8 18 4 10 20 5 4.4. Propriedades da média e do desvio padrão Obs.: Observe que no exercício anterior: Yi = Xi + 10 e Zi = Xi / 2. A partir dos resultados obtidos é possível fazer as seguintes afirmações sobre as propriedades da média e do desvio padrão: Somando-se (ou subtraindo-se) um valor constante de cada um dos valores de uma variável, a nova média fica aumentada (ou diminuída) dessa constante. Para o exemplo, 10XY . Multiplicando-se (ou dividindo-se) todos os valores de uma variável por um valor constante, a nova média fica multiplicada (ou dividida) por essa constante. Para o exemplo, 2/XZ . Somando-se (ou subtraindo-se) um valor constante de cada um dos valores de uma variável, o novo desvio padrão não será afetado. Para o exemplo, σy = σx. Multiplicando-se (ou dividindo-se) todos os valores de uma variável por um valor constante, o novo desvio padrão fica multiplicado (ou dividido) por essa constante. Para o exemplo, σz = σx / 2. 20º. Exercício proposto Dado as séries X, Y e Z, marque a alternativa correta: X = 2, 4, 6, 8, 10 Y = 20, 40, 60, 80, 100 Z = 12, 14, 16, 18, 20 a) ( ) Todas as séries apresentam a mesma amplitude total. b) ( ) As séries X e Y apresentam a mesma média aritmética. c) ( ) A série X apresenta o menor desvio padrão. d) ( ) As séries X e Y apresentam o mesmo desvio padrão. e) ( ) As séries X e Z apresentam o mesmo desvio padrão. 21º. Exercício proposto Determine o desvio padrão populacional da série abaixo: A = 0,0022; 0,0023; 0,0023; 0,0020; 0,0025; 0,0019; 0,0021 4.5. Desvio padrão populacional (dados agrupados sem intervalos de classe) Incluem-se as frequências na fórmula anterior, obtendo-se: 2 i ii i 2 ii f xf f xf 10º. Exercício resolvido 10) Determine o desvio padrão da série agrupada: Xi 3 4 7 8 12 fi 2 5 8 4 3 31 Resolução: I x i f i fi x i fi xi2 1 3 2 6 18 2 4 5 20 80 3 7 8 56 392 4 8 4 32 256 5 12 3 36 432 Total - 22 150 1178 4.6. Variância amostral e desvio padrão amostral Normalmente não conseguimos determinar os parâmetros média e variância da população que estamos estudando. Retiramos então uma amostra de tamanho n e estimamos o parâmetro desejado. A média μ da população é estimada pelo estimador: XEe n x X n 1i i , ou seja, o estimador da média é não tendencioso ou não viciado. Entretanto, a variância 2 da população é estimada por 1n xx S 2 i2 que é o estimador não viciado da variância. O estimador n xx S 2 i2 é um estimador tendencioso ou viciado, pois se demonstra que 22 )S(E . Assim, o desvio padrão amostral (S) será calculado por: 1n xx SS 2 i2 . O desenvolvimento desta equação fornece uma fórmula operacionalmente mais simples de ser aplicada: n x x 1n 1 S 2 i2 i Resumo de fórmulas das 2 principais medidas estatísticas (dados isolados) População (parâmetro) Amostra (estatística) Média N x i n x X i Desvio padrão N x x N 1 2 i2 i n x x 1n 1 S 2 i2 i 4.7. Coeficiente de variação É uma medida relativa de variabilidade, expressa em porcentagem, que compara o desvio padrão com a média. 100x X S CV A grande utilidade do coeficiente de variação é permitir a comparação das variabilidades de diferentes conjuntos de dados quando as médias dos conjuntos são diferentes. S = 22 i ii i ii f xf f xf S = 2 22 150 22 1178 = 06,7 = 2,66 32 11º. Exercício resolvido 11) Determine qual dos conjuntos de dados apresenta maior variabilidade: A = {1, 5, 10, 4} e B = {101, 105, 110, 104}. Resolução: 5 4 41051 AX 105 4 104110105101 BX 14 3 545105551 2222 2 AS 74,314 2 AA SS 14 3 )105104()105110()105105()105101( 22222 BS 74,3142 BB SS Neste exemplo tem-se que 1055 BA XX e SA = SB = 3,7 Qual conjunto é mais heterogêneo (apresenta maior variabilidade)? A resposta só pode ser obtida através da comparação entre os coeficientes de variação. Assim: %8,74100 5 74,3 100 xx X S CV A A A %6,3100 105 74,3 100 xx X S CV B B B Conclusão: Como CVB < CVA, pode-se afirmar que existe maior variabilidade entre os valores do conjunto A (o conjunto A é mais heterogêneo). Notar que o coeficiente de variação não tem dimensão. É expresso em porcentagem. 4.8. Escore padronizado É uma medida de afastamento de um elemento (X i) em relação ao conjunto (média). 500100 x S XX Z ii O escore padronizado normalmente varia entre 200 e 800. Se o valor do elemento a ser comparado (Xi) é igual à média, o escore padronizado será a igual a 500. Se Z i é maior que 500, é porque o elemento se encontra acima da média do conjunto. Caso contrário, se Zi é menor que 500, é porque o elemento se encontra abaixo da média do conjunto. 12º. Exercício resolvido 12) Determine em que medida (peso ou idade) o aluno de ordem 3 encontra-se mais afastado em relação à turma: Ordem 1 2 3 4 5 6 7 8 9 10 Peso (kg) 58 65 71 66 72 84 68 59 74 64 Idade (anos) 19 21 25 21 32 24 22 18 25 27 Resolução: Determina-seo escore de cada medida: peso (ZP) e idade (ZI) kgXP 1,68 10 681 10 64 7459 68847266176558 33 22 54,58 kgSP (faça os cálculos) kgSS PP 65,754,58 2 9,537500100 65,7 1,6871 500100 xx S XX Z P PP P anosXIdade 4,23 22 15,17 anosSI (faça os cálculos) anosSS II 14,415,17 2 6,538500100x 14,4 4,2325 500100x S XX Z I II I Conclusão: O aluno em questão encontra-se (ligeiramente) mais afastado da turma na variável idade, pois seu escore padronizado para essa medida (ZI = 538,6) foi maior que o escore determinado para a variável peso (ZP = 537,9). 4.9. Desvio padrão da média Se ao invés de uma amostra, tivermos várias amostras provenientes da mesma população, obteríamos também diversas médias, tantas quantas fossem as amostras e provavelmente todas diferentes entre si. Considerando o desvio de todas as médias em relação à média das médias, pode- se calcular o desvio padrão da média. Pode-se demonstrar que a partir de uma única média chega-se o desvio padrão da média, através da seguinte fórmula: n S S X O desvio padrão da média dá uma ideia da qualidade da média. Pode ser considerado como índice de precisão da média. Veja que ele diminui à medida que aumenta o número de observações. O resultado da média deve ser expresso por: X SvalorX 5. Definições básicas de probabilidade Definição Probabilidade é o estudo das chances de obtenção de cada resultado de um experimento aleatório. A essas chances são atribuídos os números reais do intervalo entre 0 e 1. Resultados mais próximos de 1 têm mais chances de ocorrer. Além disso, a probabilidade também pode ser apresentada na forma percentual. 5.1. Experimento aleatório e ponto amostral Um experimento aleatório pode ser repetido inúmeras vezes e nas mesmas condições e, mesmo assim, apresenta resultados diferentes. Cada um desses resultados possíveis é chamado de ponto amostral. São exemplos de experimentos aleatórios: a) Cara ou coroa Lançar uma moeda e observar se a face voltada para cima é cara ou coroa é um exemplo de experimento aleatório. Se a moeda não for viciada e for lançada sempre nas mesmas condições, poderemos ter como resultado tanto cara quanto coroa. https://mundoeducacao.bol.uol.com.br/matematica/chances-um-evento-acontecer.htm https://mundoeducacao.bol.uol.com.br/matematica/experimento-aleatorio-espaco-amostral.htm https://mundoeducacao.bol.uol.com.br/matematica/conjunto-dos-numeros-reais.htm https://mundoeducacao.bol.uol.com.br/matematica/porcentagem.htm 34 b) Lançamento de um dado Lançar um dado e observar qual é o número da face superior também é um experimento aleatório. Esse número pode ser 1, 2, 3, 4, 5 ou 6 e cada um desses resultados apresenta a mesma chance de ocorrer. Em cada lançamento, o resultado pode ser igual ao anterior ou diferente dele. Observe que, no lançamento da moeda, as chances de repetir o resultado anterior são muito maiores. c) Retirar uma carta aleatória de um baralho Cada carta tem a mesma chance de ocorrência cada vez que o experimento é realizado, por isso, esse é também um experimento aleatório. 5.2. Espaço amostral O espaço amostral (Ω) é o conjunto formado por todos os resultados possíveis de um experimento aleatório. Em outras palavras, é o conjunto formado por todos os pontos amostrais de um experimento. Veja exemplos: a) O espaço amostral do experimento “cara ou coroa” é o conjunto S = {Cara, Coroa}. Os pontos amostrais desse experimento são os mesmos elementos desse conjunto. b) O espaço amostral do experimento “lançamento de um dado” é o conjunto S = {1, 2, 3, 4, 5, 6}. Os pontos amostrais desse experimento são 1, 2, 3, 4, 5 e 6. O espaço amostral também é chamado de Universo e pode ser representado pelas outras notações usadas nos conjuntos. Além disso, todas as operações entre conjuntos valem também para espaços amostrais. O número de elementos do espaço amostral, número de pontos amostrais do espaço amostral ou número de casos possíveis em um espaço amostral é representado da seguinte maneira: n(Ω). 5.3. Evento Um evento é qualquer subconjunto de um espaço amostral. Ele pode conter nenhum elemento (conjunto vazio) ou todos os elementos de um espaço amostral. O número de elementos do evento é representado da seguinte maneira: n(E), sendo E o evento em questão. São exemplos de eventos: a) Sair cara em um lançamento de uma moeda O evento é sair cara e possui um único elemento. A representação dos eventos também é feita com notações de conjuntos: E = {cara} O seu número de elementos é n(E) = 1. b) Sair um número par no lançamento de um dado. O evento é sair um número par: E = {2, 4, 6} O seu número de elementos é n(E) = 3. Os eventos que possuem apenas um elemento (ponto amostral) são chamados de simples. Quando o evento é igual ao espaço amostral, ele é chamado de evento certo e sua probabilidade de ocorrência é de 100%. Quando um evento é igual ao conjunto vazio, ele é chamado de evento impossível e possui 0% de chances de ocorrência. 5.4. Cálculo da probabilidade Seja E um evento qualquer no espaço amostral Ω. A probabilidade do evento A ocorrer é a razão entre o número de resultados favoráveis e o número de resultados possíveis. Em outras palavras, é o número de elementos do evento dividido pelo número de elementos do espaço amostral a que ele pertence. https://mundoeducacao.bol.uol.com.br/matematica/operacoes-entre-conjuntos.htm https://mundoeducacao.bol.uol.com.br/matematica/operacoes-entre-conjuntos.htm 35 P(E) = n(E) n(Ω) Observações: O número de elementos do evento sempre é menor ou igual ao número de elementos do espaço amostral e maior ou igual a zero. Por isso, o resultado dessa divisão sempre está no intervalo 0 ≤ P(A) ≤ 1; Quando é necessário usar porcentagem, devemos multiplicar o resultado dessa divisão por 100 ou usar regra de três; A probabilidade de um evento não acontecer é determinada por: P(A-1) = 1 – P(A) Exemplos: → Qual é a probabilidade de, no lançamento de uma moeda, o resultado ser cara? Solução: Observe que o espaço amostral só possui dois elementos e que o evento é sair cara e, por isso, possui apenas um elemento. P(E) = n(E) n(Ω) P(E) = 1 2 P(E) = 0,5 = 50% → Qual é a probabilidade de, no lançamento de duas moedas, obtermos resultados iguais? Solução: Representando cara por C e coroa por K, teremos os seguintes resultados possíveis: (C, K); (C, C); (K, C); (K, K) O evento obter resultados iguais possui os seguintes casos favoráveis: (C, C); (K, K) Há quatro casos possíveis (número de elementos do espaço amostral) e dois casos favoráveis (número de elementos do evento), logo: P(E) = n(E) n(Ω) P(E) = 2 4 P(E) = 0,5 = 50% → No lançamento de um dado, qual é a probabilidade de sair um resultado menor que 3? Solução: Observe que os números do dado menores do que 3 são 1 e 2, por isso, o evento possui apenas dois elementos. O espaço amostral possui seis elementos: 1, 2, 3, 4, 5 e 6. P(E) = n(E) n(Ω) P(E) = 2 6 P(E) = 0,33... = 33,3% → Qual é a chance de não sair o número 1 no lançamento de um dado? Solução: Temos duas maneiras de resolver esse problema. Note que não sair o número 1 é o mesmo que sair qualquer outro número. Faremos o mesmo cálculo de probabilidade considerando que o evento possui cinco elementos. A outra maneira é usar a fórmula para a probabilidade de um evento não ocorrer: 36 P(A-1) = 1 – P(E) O evento que não pode ocorrer possui apenas um elemento, logo: P(A-1) = 1 – P(E) P(A-1) = 1 – n(E) n(Ω) P(A-1) = 1 – 1 6 P(A-1) = 1 – 0,166.. P(A-1) = 0,8333… = 83,3% 37 REFERÊNCIAS BIBLIOGRÁFICAS AKANIME, Carlos T.; YAMAMOTO, Roberto K. Estudo Dirigidode Estatística Descritiva. São Paulo: Érica, 1998. CIENFUEGOS, Freddy. Estatística Aplicada ao Laboratório. Rio de Janeiro: Interciência, 2005. DOWNING, Douglas; CLARK, Jeffrey. Estatística Aplicada. São Paulo: Saraiva, 1998. FARIAS, Alfredo Alves de; SOARES, José Francisco; CÉSAR, Cibele Comini. Introdução à estatística. Rio de Janeiro: LTC, 1998. FONSECA, Jairo S., MARTINS, Gilberto de A. Curso de Estatística. 6ª edição. São Paulo: Atlas, 1996. LAPPONI, Juan Carlos. Estatística usando Excel 5 e 7. São Paulo: Lapponi Treinamento e Editora Ltda, 1997. LEVINE, David M. et al. Estatística: Teoria e Aplicações usando Microsoft Excel em Português. Rio de Janeiro: LTC – Livros Técnicos e Científicos Editora S. A., 2000. MARTINS, Gilberto de Andrade & DONAIRE, Denis. Princípios de Estatística. São Paulo: Atlas, 1990. MORETTIN, Luiz Gonzaga. Estatística Básica – v.1 – Probabilidade. São Paulo: Makron Books, 1999. RIBEIRO JÚNIOR, José Ivo. Análises estatísticas no Excel: guia prático. Viçosa: UFV, 2004. SPIEGEL, Murray R. Estatística. São Paulo: Makron Books, 1994. VIEIRA, Sonia; WADA, Ronaldo. Estatística: introdução ilustrada. São Paulo: Atlas, 1986.
Compartilhar