Baixe o app para aproveitar ainda mais
Prévia do material em texto
*Censo – forma de coleta de dados em que a pesquisa é realizada com todos os elementos da população. Fonte: Barbetta, Reis e Bornia (2004). *Amostragem – forma de coleta de dados em que apenas uma pequena parte, considerada representativa, da população é pesquisada. Os resultados podem ser, então, generalizados, usualmente através de métodos estatísticos apropriados, para toda a população. Fonte: Barbetta (2006). *População – é o conjunto de medidas da(s) característica(s) de interesse em todos os elementos que a(s) apresenta(m). Fonte: Andrade e Ogliari (2007). *Amostra – um subconjunto finito e representativo da população. Amostragem Amostragem é a subdivisão da Estatística que reúne os métodos necessários para coletar adequadamente amostras representativas e suficientes para que os resultados obtidos possam ser generalizados para a população de interesse. A pressuposição básica é que todas as etapas prévias do planejamento da pesquisa (veja na Unidade 1) já foram cumpridas e que o administrador agora precisa decidir se coletará os dados por censo* ou por amostragem*. O censo consiste simplesmente em estudar todos os elementos da população*, e a amostragem pesquisa apenas uma pequena parte dela, suposta representativa do todo. Para realizar um estudo por amostragem, de maneira que seus resultados sejam válidos e possam ser generalizados para a população, algumas técnicas precisam ser empregadas. A essência deste processo é mostrada na Figura 7: “A moda é o número que mais se repete em um conjunto; a mediana é o número que fica no centro do conjunto, caso seus elementos estejam organizados em ordem crescente ou decrescente. A média é a soma de todos os números de uma lista dividida pela quantidade de números que foi somada” Moda A moda, é o valor em que a frequência dos seus dados é maior. Então para encontrar a moda desse conjunto poderíamos fazer uma tabela de frequência e ver qual é o número mais frequente: Tabela de frequências Dessa forma, sabemos que a moda desse conjunto seria o cinco, porque o cinco é o número mais frequente. Média A média, é o resultado da soma de todos os valores dividido pela quantidade de entradas do nosso conjunto de dados, ou seja, se somarmos todos os nossos valores e dividirmos pela quantidade teremos a média. Cálculo da média Mediana Já mediana, é o valor que divide o nosso conjunto de dados em duas metades. Para encontrar nossa mediana precisamos primeiro ordenar nossos dados: Conjunto de dados ordenado e a mediana em vermelho Como nosso dataset tem uma quantidade ímpar de números, a mediana será o valor 7. Caso nosso dataset tivesse uma quantidade par de entradas, a mediana seria a média dos dois valores mais ao centro: Conjunto de dados com quantidade par Cálculo da mediana para o conjunto de dados com quantidade par Então, é importante lembrar de conferir a quantidade de entradas para calcular a mediana. Variância A variância é determinada pela média dos quadrados das diferenças entre cada uma das observações e a média aritmética da amostra. O cálculo é feito com base na seguinte fórmula: Sendo, V: variância xi: valor observado MA: média aritmética da amostra n: número de dados observados Exemplo Considerando as idades das crianças das duas festas indicadas anteriormente, vamos calcular a variância desses conjuntos de dados. Festa A Dados: 1 ano, 2 anos, 2 anos, 12 anos, 12 anos e 13 anos Média: Variância: Festa B Dados: 5 anos, 6 anos, 7 anos, 7 anos, 8 anos e 9 anos Média: Variância: Observe que apesar da média ser igual, o valor da variância é bem diferente, ou seja, os dados do primeiro conjunto são bem mais heterogêneos Desvio Padrão O desvio padrão é definido como a raiz quadrada da variância. Desta forma, a unidade de medida do desvio padrão será a mesma da unidade de medida dos dados, o que não acontece com a variância. Assim, o desvio padrão é encontrado fazendo-se: Quando todos os valores de uma amostra são iguais, o desvio padrão é igual a 0. Sendo que, quanto mais próximo de 0, menor é a dispersão dos dados. Exemplo Considerando ainda o exemplo anterior, vamos calcular o desvio padrão para as duas situações: Agora, sabemos que a variação das idades do primeiro grupo em relação a média é de aproximadamente 5 anos, enquanto que a do segundo grupo é de apenas 1 ano. Coeficiente de Variação Para encontrar o coeficiente de variação, devemos multiplicar o desvio padrão por 100 e dividir o resultado pela média. Essa medida é expressa em porcentagem. O coeficiente de variação é utilizado quando precisamos comparar variáveis que apresentam médias diferentes. Como o desvio padrão representa o quanto os dados estão dispersos em relação a uma média, ao comparar amostras com médias diferentes, a sua utilização pode gerar erros de interpretação. Desta forma, ao confrontar dois conjuntos de dados, o mais homogêneo será aquele que apresentar menor coeficiente de variação. Exemplo Um professor aplicou uma prova para duas turmas e calculou a média e o desvio padrão das notas obtidas. Os valores encontrados estão na tabela abaixo. Desvio Padrão Média Turma 1 2,6 6,2 Turma 2 3,0 8,5 Com base nesses valores, determine o coeficiente de variação de cada turma e indique a turma mais homogênea. Solução Calculando o coeficiente de variação de cada turma, temos: Desta forma, a turma mais homogênea é a turma 2, apesar de apresentar maior desvio padrão.
Compartilhar