Baixe o app para aproveitar ainda mais
Prévia do material em texto
Introdução A estatística é um conjunto de técnicas (metodologias) que se preocupa com a coleta, organização, análise e interpretação de dados, ou seja, é um conjunto de métodos de obtenção e utilização de informação para auxiliar a tomada de decisão em uma situação prática envolvendo incerteza. O ramo da estatística que lida com a organização, o resumo e apresentação dos dados é denominado de estatística descritiva. Classificação de variáveis Os dados coletados na investigação científica podem ser classificados como qualitativos e quantitativos. ▪ Qualitativos As variáveis que apresentam como possíveis realizações uma qualidade (ou atributo) do indivíduo pesquisado são denominados de variáveis qualitativas. Exemplos: sexo; estado civil; cor da flor de uma espécie que pode ser branca, violeta e vermelha; altura de plantas, que podem assumir as classificações – baixa, média e alta. As variáveis qualitativas, por sua vez, podem ser classificadas como: 1. Nominais: não existe nenhuma ordenação nas suas possíveis realizações. Ou seja, nenhum está acima do outro, não tem essa ordem crescente. Exemplos: sexo, estado civil, cor da flor de uma espécie de planta que pode ser branca, violeta e vermelho. 2. Ordinais: os seus possíveis resultados podem ser ordenados por algum critério. Ou seja, um vai estar acima do outro, existe essa ordem crescente. Exemplos: altura de planta, que pode assumir as classificações – baixa, média e alta; grau de instrução – ensino fundamental, médio, graduação, mestrado e doutorado. ▪ Quantitativo As variáveis que apresentam as possíveis realizações como números resultantes de uma contagem ou mensuração são denominadas de variáveis quantitativas. Exemplos: número de filhos; salário; idade; peso. As variáveis quantitativas, por sua vez, podem ser classificadas como: 1. Discretas: as possíveis realizações formam um conjunto finito ou enumerável de números, o qual é resultado, geralmente, de contagem. Exemplo: número de filhos, número de leitões com peso abaixo de um valor considerado limite entre uma categoria normal e anormal, número de circuitos defeituosos. 2. Contínuas: os possíveis valores formam um intervalo de números reais resultantes, em geral, de mensuração. Exemplos: peso de animais, volume de árvores e peso de matéria sexa ou de matéria verde de uma leguminosa. Conceitos básicos Fenômeno estatístico: qualquer evento que se pretende analisar cujo estudo seja possível a aplicação de um método estatístico. População: conjunto de indivíduos com características em comum – moram na mesma cidade; residem no mesmo bairro; mesmo gosto musical. Amostra: é um conjunto não vazio da população, excetuando-se a população. Na prática poderia colocar como uma parte da população com uma característica em comum. Isso porque pode não ter condições de consultar toda a população. Amostragem: é o processo de obtenção (coleta) de amostras de uma população. Tem toda uma metodologia para isso, não pode escolher quem acha que poderia fazer parte, tem todo um processo. Parâmetro: são valores singulares que existem na população e que servem para caracterizar a própria população. Exemplos: média, desvio padrão, proporção. Estimativa: é um valor aproximado de parâmetro populacional. Inferência estatística: é uma área dentro da estatística que vai fornecer as respostas que se deseja sobre a população. Ou seja, é o processo por meio do qual procuramos tomar decisões sobre uma população a partir de uma amostra. Variável: característica através da qual é realizada a descrição de uma população. Amostra aleatória: para validade das conclusões que são feitas a respeito da população, e em razão das inúmeras maneiras existentes de se extraírem as amostras de uma população, é necessário retirá-lo de uma maneira aleatória. Para amostrar da população aleatoriamente é necessário que cada membro da população tenha a probabilidade conhecida e que os elementos sejam independentemente selecionados. Em outras palavras, além de cada indivíduo possuir chance não nula de pertencer à amostra, a seleção de um deles, de forma alguma, irá influenciar a seleção do outro. Tabelas – distribuição de frequências ▪ Coleta, organização e apresentação de dados. Caso: se quiséssemos saber a altura média do estudante de uma escola com 500 alunos, não seria necessário perguntar a cada um deles a altura que possuem, porque resolveríamos o problema escolhendo aleatoriamente (todos possuem a mesma chance de serem escolhidos) uma parcela (amostra) destes alunos. Pesquisando, por exemplo, 40 alunos, teríamos um panorama de qual a estatura média de todos os 500 alunos, usando, por exemplo, para isto, 8% destes. Dados brutos: São dados coletados que não foram numericamente organizados. ROL: É um arranjo de dados numéricos brutos em ordem crescente ou decrescente de grandeza. Ou seja, está organizando os dados que, anteriormente, estava desorganizado. Amplitude total: Representado com “AT”. É a diferença entre o maior e o menor valor observados. Ex.: AT = 173 (maior valor) - 150 (menor valor) = 23 cm. É a diferença entre os dois valores. Número ou quantidade de observações: Representado com “n”. Refere-se a quantidade de dados que foram colhidos para a composição da amostra. Ex.: o número de observações é 40, ou seja, n = 40. Quantidade de elementos da população é representado por “N”. No presente exemplo, o N é 500. Distribuições de frequência: Utilizaremos distribuições de frequência quando tivermos uma grande quantidade de dados brutos. Distribuiremos estes dados em classes ou categorias e determinaremos a frequência de classe, que é o número de indivíduos pertencentes a cada uma das classes. Um arranjo tabular dos dados por classes, juntamente com as frequências correspondentes, é denominado de distribuição de frequência ou tabela de frequência. ▪ Elementos de uma distribuição de frequência Número de classes (k): para encontrarmos o número de classes, podemos utilizar os critérios abaixo: OBS: o k é sempre um número entre 5 a 20 classes. Exemplo: o número de classes é dado por . Como o resultado não é exato, arredonda o mesmo para o inteiro mais próximo, ou seja, 6. Portanto, k = 6. Limites de classes (inferior e superior): são os menores ou maiores valores que pertencem às diferentes classes. Para montarmos a tabela 3, é conveniente usar o menor valor observado como limite da 1ª classe ou como ponto médio da primeira classe. Intervalo de classe (h): é a diferença entre os limites superior e inferior. Este é encontrado pela razão entre a amplitude total (AT) e o número de classes (k). Exemplo 01: o intervalo de classe é dado por . Portanto, as 6 classes encontradas terão intervalo de 4 centímetros. Exemplo 02: a distribuição de frequência ficaria, até o presente momento, desta maneira: Hipótese tabular básica: consistem em supor que todos os dados de uma classe são representados pelo ponto médio desta classe, ou seja, admite- se que todas as observações relativas a um determinado intervalo de classe coincidem com seu ponto médio. Frequência absoluta (fi): é o número de observações correspondente a uma classe. Frequência relativa (fr): é a frequência de uma classe dividida pela somatória de todas as classes, ou seja, pelo número total de observações (n). Geralmente ela é expressa em porcentagem. Frequência acumulada (F): é a frequência total de todos os valores inferiores ao limite superior de um dado intervalo de classe. Frequência acumulada relativa (Fr): é a frequência acumulada dividida pela frequência total.
Compartilhar