Baixe o app para aproveitar ainda mais
Prévia do material em texto
MÓDULO 1 - Fundamentos da Estatística OBJETIVOS DA ESTATÍSTICA Teoria Estatística é definida em função de uma amostra em que a função por si mesma é única em relação à distribuição que gerou o evento. Esse termo é utilizado usualmente tanto para a função quanto para o valor numérico da função utilizada a uma dada amostra. Estatística descritiva, preocupa-se em fazer a dissertação de dados obtidos através da pesquisa, formando, assim, uma tabela ou tabulação de todas as informações obtidas durante a fase de coleta. Qual a forma mais rápida de apresentar o objeto em estudo de uma estatística? > GRÁFICOS Na estatística, temos três grandes divisões: · DESCRITIVA · INFERENCIAL · DE PROBABILIDADE POPULAÇÃO E AMOSTRA População: É o conjunto de pessoas ou itens quaisquer que compõe o universo a ser estudado. Essas pessoas ou itens precisam ter ao menos uma característica em comum, para que possamos delimitar nossa pesquisa. Amostra: São os subconjuntos de uma população, que são adequados para estudar a característica de interesse da população. A seleção dos elementos que irão compor a amostra pode ser feita de várias maneiras e irá depender do conhecimento que se tem da população e da quantidade de recursos disponíveis. AMOSTRA ALEATÓRIA Podemos dizer que a amostragem aleatória é um dos principais métodos usados nas técnicas estatísticas e de probabilidade. Esse método é um dos mais populares e serve como base para todos outros métodos de coleta de dados para uma amostragem real e compatível com o fato estudado. Podemos também definir outro tipo de amostragem, onde todos os elementos que fazem parte do conjunto amostral e estão interligados no espaço amostral têm a mesma probabilidade de serem usados para o evento. Seria como realizar um sorteio entre os funcionários de um escritório: dar a cada funcionário um bilhete com um número de série, colocar os números em uma roleta e sortear um número ao acaso. Todos funcionários possuem esse bilhete dentro da urna-roleta e formam uma amostra. Na verdade, esses métodos podem ser realizados com o uso de computadores. O que é melhor, usar a reposição ou não? Concluímos, então, que a amostragem aleatória e sem reposição é sempre melhor. (Aqui no caso, diz respeito à "devolver" a pessoa à "urna" fazendo com que tenha a chance de ela ser selecionada novamente. Essa é a reposição. A não reposição é a não devolução.) Portanto, o tamanho da amostra utilizada quando não usamos reposição é sempre menor em relação ao com reposição. Se estamos utilizando a reposição e, por acaso, sorteamos um indivíduo mais de uma vez na mesma amostra, o fato é igual ao da redução do tamanho da amostra, onde vemos uma menor probabilidade de sortearmos indivíduos diferentes. Do mesmo jeito, se o nosso conjunto de dados é infinito, os dois métodos terão o mesmo valor, uma vez que a chance de selecionar o mesmo indivíduo duas vezes no mesmo evento tende a ser muito pequena ou quase infinita. USANDO AMOSTRA ALEATÓRIA SIMPLES · Com o uso de computadores cada vez mais avançados, é possível retratar uma amostra aleatória simples de forma rápida e totalmente confiável. · A geração de números aleatórios mediante softwares (são números estritamente aleatórios) é cada vez mais confiável. · Desta forma, ao utilizar MAS (mostra aleatória simples), asseguramos a obtenção de amostras representativas, de modo que uma das únicas chances de erro que poderá alterar nossos resultados será o azar adverso. ASPECTOS NEGATIVOS DA AMOSTRA ALEATÓRIA SIMPLES · Um dos aspectos negativos é a dificuldade de se aplicar nas pesquisas reais. · Por essa técnica ser probabilística, é necessário um universo amostral considerando todos os participantes, em que todos possam ser selecionados para a amostra. · O objetivo é de alto grau de dificuldade a ser cumprido, pois, na maioria dos estudos reais, nos obrigam a aplicar outros métodos. EXEMPLIFICANDO: · Imagine uma pesquisa para sabermos o time mais popular do estado de São Paulo. · Se usarmos como base a pesquisa real, teremos de entrevistar todas as pessoas residentes no estado de São Paulo, o que, convenhamos, não é impossível, mas a dificuldade que teríamos seria enorme em relação à quantidade de pessoas entrevistadas. · Portanto, apesar de não ser 100% confiável, devemos criar um espaço ou quantidade que possa representar com confiança nossa pesquisa, a fim de que possa representar uma grande porcentagem da realidade do fato a ser estudado. FASES DO MÉTODO DE ANÁLISE ESTATÍSTICA Para termos um bom trabalho estatístico, devemos ter em mente a seguinte problemática: · a definição do problema visa determinar como a escolha de dados pode solucionar um problema, · e a coleta de dados busca reunir dados após o planejamento do trabalho pretendido, bem como estabelecer a definição da periodicidade da coleta (contínua, periódica, ocasional ou indireta). 1. DEFINIÇÃO DO PROBLEMA - Determinar como a recolha de dados pode solucionar um problema. 2. PLANEJAMENTO - Elaborar como fazer o levantamento dos dados. 3. COLETA DE DADOS - Reunir dados após o planejamento do trabalho pretendido, bem como definir a periodicidade da coleta. 4. CORREÇÃO DOS DADOS COLETADOS - Conferir dados para afastar algum erro por parte da pessoa que os coletou. 5. CONFERÊNCIA DOS DADOS - Organização e contagem dos dados. 6. DEMONSTRAÇÃO DOS DADOS - Montagem de tabelas ou gráficos que demonstrem o resultado da coleta de dados. 7. ANÁLISE DOS DADOS - Vista detalhada qualitativa, quantitativa e interpretação dos dados. Para um melhor entendimento, devemos estudar alguns dos itens apresentados de forma um pouco mais efetiva. Coletas de dados · Organizar dados obtidos por meio de TABELAS · Os dados que podemos usar precisam estar definidos, sejam eles primários ou secundários. · Dados de pesquisa são os materiais comumente registrados e aceitos na comunidade científica como necessários para validar os resultados de pesquisas. Eles incluem fatos e estatísticas recolhidas para posterior referência ou análise. Recenseamento · Pesquisa que determina o número de habitantes de uma região, cidade, país etc., especificando-os por sexo, idade, religião, estado civil. · Também pode ser a relação das pessoas que possuem as condições previstas pela lei para possuir certos cargos ou funções (como recenseamento eleitoral e recenseamento militar). · É a ação de listar ou enumerar um tipo de população, podendo ser também gado ou outros animais. Organização de dados · Organizar os dados é uma atividade que tem como finalidade a melhor compreensão desses dados dando-lhes, ao mesmo tempo, uma finalidade de ser e uma análise correta. · É analisar os dados de um problema e identificá-los. Variável · São características comuns aos elementos de uma população à qual atribuímos um número ou categoria, assumindo valores diferentes de unidade. · Podemos chamar essa população como a variável que vamos estudar, pelo fato de que a população é formada pelos valores que a variável pode assumir ou ter. · A esse método, que consiste em reconhecer uma observação de uma variável, damos o nome de experimento aleatório. · Por exemplo: suponhamos que pretendemos estudar o número de celulares de cada família dos alunos que frequentam a escola XXX, no ano letivo 2017/2018. Podemos dizer que a nossa população é constituída por todos os resultados obtidos para o número de celulares das famílias dos referidos alunos. Quando se considera um desses alunos e se questiona quanto ao número de celulares, estamos a realizar uma experiência aleatória. · Por esse fato, a variável tomará uma forma quantitativa, pois poderá ser medida, ou seja, poderá ser contada. · Podemos ainda ter uma variável que poderá ser medida e contada, chamada de variável contínua. · A variável será qualitativa se não for passível de medição ou contagem, mas unicamente de uma classificação, podendo assumir várias modalidades ou categorias. DISTRIBUIÇÃO DE FREQUÊNCIA Vamos calcular, agora, o tamanho amostral, ou seja, o número de observações obtidas na amostra. Após umacoleta de dados, temos um conjunto de informações e devemos colocá-las em uma tabela de distribuição de frequência, ou simplesmente uma tabela de frequência. Todos os dados dessa tabela serão divididos em classes predeterminadas, colocando-se a frequência de cada classe. Portanto, uma tabela de frequência é um conjunto de dados agrupados de forma organizada e sequencial, a fim de que os dados sirvam de base para a construção de futuros gráficos. 1. FREQUÊNCIA ABSOLUTA - É a frequência que leva em consideração a quantidade de eventos que temos em uma classe. 2. FREQUÊNCIA RELATIVA - É o quociente entre a frequência absoluta e a soma de todas as frequências. 3. FREQUÊNCIA PERCENTUAL - É a multiplicação da frequência relativa por 100. 4. FREQUÊNCIA ACUMULADA - É a somatória de todas as classes. 5. DISTRIBUIÇÃO DE FREQUÊNCIA PONTUAL - São os dados quantitativos. - Usamos a distribuição de frequência pontual quando se trabalha com dados discretos. O melhor tipo de gráfico utilizado para representar esse tipo de distribuição de frequência é o gráfico de barras. EXEMPLO: Em uma cidade, foram totalizados o número de pessoas com diabetes em 20 grupos de 1.000 pessoas cada. Nesse caso, obtemos os seguintes dados: 10, 12, 9, 11, 10, 8, 9, 10, 7, 10, 8, 9, 9, 10, 10, 11, 9, 11, 10, 10. Um possível resumo dos dados é desenvolvido na Tabela: PESSOAS COM DIABETES APURAÇÃO DOS GRUPOS Nº DE GRUPOS 7 / 1 8 // 2 9 ///// 5 10 //////// 8 11 /// 3 12 / 1 Portanto, a variável "quantidade de pessoas com diabetes" assume valores discretos, ou seja, inteiros: ...,7, 8, 9,... . Com o exemplo da Tabela 2, temos a distribuição de frequências para esse conjunto de dados e o gráfico de barras. NÚMERO DE PESSOAS COM DIABETES FREQUÊNCIA (f i) FREQUENCIA RELATIVA FREQUÊNCIA PERCENTUAL FREQUÊNCIA ACUMULADA 7 1 0,05 5 5 8 2 0,1 10 15 9 5 0,25 25 40 10 8 0,4 40 80 11 3 0,15 15 95 12 1 0,05 5 100 *cálculo da frequência relativa: divisão entre a frequência absoluta pela soma de todas as frequências. Ou seja: todas as frequências somadas = 20 (somar toda a segunda coluna), portanto, a primeira freqüência relativa se calcula dividindo o 1 sobre 20 que dá 0,05. E assim, por diante: 2/20 = 0,1; 5/20 = 0,25 etc. INTERVALOS DE CLASSE Intervalo de classe é a medida do intervalo que define a classe. A amplitude de uma classe é a diferença entre o maior e o menor valor de uma classe. Para um melhor entendimento, vamos estudar o assunto através de um exemplo. Foram coletas as alturas de 20 atletas de voleibol de um certo clube e os dados foram colocados em um rol aleatório. 1,91-1,78-1,69-1,82-1,80-1,72-1,73-1,76-1,77-1,94-1,84-1,87-1,85-1,89-1,70-1,91-1,86-1,70-1,71-1,94 O ideal agora será colocar todas essas alturas em um rol crescente. 1,69 - 1,70 - 1,70 - 1,71 - 1,72 - 1,73 - 1,76 - 1,77 - 1,78 - (...) 1,94. Vamos agora calcular os intervalos da seguinte forma - Realizamos a subtração entre a maior e a menor altura: 1,94 – 1,69 = 0,25. Para um melhor estudo e cálculos, devemos escolher um número de classes maior que quatro. Nesse exemplo, vamos escolher cinco intervalos de classe, dessa forma dividimos o intervalo total de alturas por cinco: 0,25:5 = 0,05. Veja os intervalos: 1,69 | 1,74(1,69+0,05) 1,74 1,79(1,74+0,05) 1,79 1,84(1,79+0,05) 1,84 1,89(1,84+0,05) 1,89 1,94(1,89+0,05) OBS: IMPORTANTE - O SIMBOLO | SIGNIFICA FECHADO À ESQUERDA E ABERTO À DIREITA, ISTO É, AS ALTURAS, 1,74 - 1,79 - 1,84 - 1,89, SERÃO USADAS APENAS UMA VEZ. Tabela de frequências: ALTURAS FREQUÊNCIA ABSOLUTA FREQUÊNCIA RELATIVA RELATIVA PERCENTUAL 1,69 -> 1,74 6 6/20 = 0,30 30% 1,74 -> 1,79 3 3/20 = 0,15 15% 1,79 -> 1,84 2 2/20 = 0,10 10% 1,84 -> 1,89 4 4/20 = 0,20 20% 1,89 -> 1,94 5 5/20 = 0,25 25% TOTAL 20 100% Você pode também calcular o número de classe através de “K”, em que: K= raiz quadrada de n E em que n é a quantidade de dados coletados. No nosso exemplo, a quantidade de dados foi 20. A raiz de 20 é igual a 4,472. Devemos arredondar para 5. Histogramas e polígono de frequência O histograma e o polígono de frequência são alguns dos meios de representar os dados recolhidos. Estes são os gráficos de melhor visualização de dados, que serão melhor abordados agora. HISTOGRAMAS · Um histograma é uma representação das distribuições de frequências através de uma forma gráfica, no formato de colunas ou de barras retangulares, de um conjunto de dados já divididos em classes. · A base de cada retângulo irá representar uma classe · e a altura de cada retângulo irá representar a frequência absoluta ou quantidade com o valor de sua respectiva classe, que ocorre no conjunto de dados. · É de suma importância ressaltar que esse tipo de gráfico é uma ferramenta primordial para análises rápidas de dados em uma pesquisa. · Exemplo de HISTROGRAMA · Na elaboração de um histograma, devemos ficar atentos ao seguinte: · Os dados devem ser agrupados por classes; · No eixo horizontal são representados os intervalos de classe; · No eixo vertical são representadas as frequências de classe; · As barras são desenhadas verticalmente e não há qualquer espaço entre elas; · A área de cada uma das barras é proporcional à respectiva frequência. POLÍGONOS DE FREQUÊNCIAS Os polígonos de frequências são usados, normalmente, para comparar duas distribuições de dados semelhantes. Para construirmos um polígono de frequência, primeiramente devemos construir o histograma, onde vamos achar o ponto médio do lado superior dos retângulos e uni-los. Atenção: para que a área do polígono de frequências seja igual à somatória das áreas dos retângulos do histograma, parte-se do extremo esquerdo do polígono (ponto B) com o ponto médio (A) do dado anterior, de frequência nula, e procede-se do mesmo modo para o extremo direito do polígono. FREQUÊNCIA ACUMULADA E RELATIVA Em estatística, a frequência absoluta corresponde ao nome dado ao número de vezes que um valor aparece em um determinado conjunto de dados. A frequência acumulada é diferente: ela representa a soma de todas as frequências até o ponto atual no conjunto de dadoS. CLASSIFICANDO UM CONJUNTO DE DADOS 1º Vamos iniciar fazendo um rol de todos os dados coletados, colocando todos esses dados em ordem crescente. Exemplo: o conjunto de dados representam a quantidade de livros lidos por 8 alunos no decorrer do ano de 2017. Depois de classificar os valores, ele ficará da seguinte maneira: 3, 3, 5, 6, 6, 6, 8. 2º Calcule a frequência absoluta de cada valor. A frequência absoluta é a que representa quantas vezes ele aparece em seu rol (não confundir frequência absoluta com frequência acumulada). Coloque no início da primeira coluna uma descrição para o que esse termo representa. Agora, escreva “frequência” no topo da segunda coluna. Complete a tabela com cada dado correspondente. Exemplo: escreva “número de livros” no alto da primeira coluna e “frequência” no topo da segunda coluna. Na linha seguinte, escreva o primeiro valor sob “número de livros”: 3. Veja quantos 3 existem nos dados. Já que há dois 3, escreva 2 abaixo de “frequência”, na mesma linha. Esse procedimento deve ser repetido para cada valor, até o final da tabela. 3 ] F = 2 5 ] F = 1 6 ] F = 3 8 ] F = 1 3º Calcule a frequência acumulada do valor inicial. Essa frequência acumulada nos aponta a quantidade de vezes que aparece esse mesmo valor (ou um valor menor). Comece sempre com o valor menor dos dados. Se por acaso não tivermos valores menores, a solução sempre será igual a frequência acumulada do mesmo valor. Exemplo: o nosso valor mais baixo é 3. A quantidade de livros lidos foram 3 que é igual a 2. Ninguém leu menos do que isso, deste modo a frequência acumulada será 3. Coloque esse valor na primeira linha da tabela: 3 ] F = 2 | CF = 2 4º Calcule a frequência acumulada do valor seguinte. Acabamos de achar quantas vezes os menores aparecem. Para calcularmos a frequência acumulada desse valor,precisamos somar sua frequência absoluta ao total, ou seja, pegue a última frequência acumulada que você encontrou e some com a frequência absoluta do respectivo valor. Isso se repete pelos demais valores! Exemplo: 3 ] F = 2 | CF = 2 5 ] F = 1 | CF = 2 + 1 = 3 6 ] F = 3 | CF = 3 + 3 = 6 8 ] F = 1 | CF = 6 + 1 = 7 5º Faça uma conferência de seu trabalho. Quando finalizar, você terá somado o número de vezes que cada valor apareceu. A frequência acumulada final deve ser exatamente igual ao número total de pontos de valores em seu total de dados. Há dois modos de conferir o que foi feito: Some todas as frequências individuais: 2 + 1 + 3 + 1 = 7, que é a nossa frequência acumulada. Calcule a quantidade de pontos de dados. Como nosso rol era 3, 3, 5, 6, 6, 6, 8, temos 7 itens, sendo esse valor nossa frequência acumulada. Frequência relativa A frequência relativa é o quociente (divisão) da frequência absoluta da variável e o número de vezes que ela aparece. Deste modo, chamamos de frequência relativa de certa classe, calculando a frequência dessa classe através da soma das frequências das demais classes. REPRESENTAÇÃO GRÁFICA A representação gráfica nos permite uma visão e conclusão mais rápida de nossa pesquisa.
Compartilhar