Baixe o app para aproveitar ainda mais
Prévia do material em texto
Aula 1 Áreas da Estatística: - Descritiva - Inferência Estatística (ou indutiva) - Probabilidade • Unidades experimentais: É da onde a gente coleta as informações (coleta os dados), não necessariamente a gente vai tá trabalhando com pessoas. • População: É o conjunto total de unidades experimentais que tem determinada característica que se deseja estudar. Unidades experimentais (ou unidades de observação) População Amostra - Finita - Infinita Amostra é uma parte da população quando não se consegue trabalhar com todas unidades experimentais dessa população, então, a gente retira algumas unidades experimentais para fazer o estudo estatístico. → Estudos provenientes da população, as informações numéricas são chamadas de parâmetros. → Estudos provenientes da amostra, as informações numéricas são chamadas de estatísticas. - Estatística Descritiva: Pode ser feita tanto de dados populacionais quanto de dados amostrais. Variável: É uma “característica” de uma unidade experimental. - Qualitativa (não numérica) - Quantitativa (numérica) Nominal (não segue uma ordem) Variável Qualitativa Ordinal (possui uma ordem) Discreta (valores inteiros) Variável Quantitativa Contínua (dados provenientes de medidas) * Técnicas que mais utilizadas para coleta de dados: Amostragem - Probabilística (aleatória) - Não Probabilística (não aleatória) Amostragem Probabilística: • aleatória simples • sistemática • estratificada (em estratos) Amostragem não Probabilística: É uma amostragem a esmo ou sem norma ou uma amostragem intencional Aula 2 Distribuição de Frequências: São tabelas. Com as informações em mãos, nós organizamos essas informações através de uma distribuição de frequências. (tabelas) Rol: É uma sequencia ordenada do conjunto de dados brutos. Variável Frequência (absoluta) Frequência Relativa (%) Total Nº de elementos em estudos 100 F.R. (%) = x 100 Variável Frequência Frequência Relativa (%) Fa (acumulada) Fra Total Nº de elementos em estudos 100 Fa = é a soma de cada frequência com as anteriores. A frequência acumulada é necessária no cálculo das medidas separatrizes e no gr´fico ogiva. Fra = x 100 Intervalos de classes Quando se trabalha com um conjunto de dados que apresenta um grande número de valores diferentes, é conveniente construir classes ou faixas de valores e contar o número de ocorrências em cada faixa. amplitude lim inferior lim superior • Para encontrar o número de classes: k √ n k → nº de classes n → nº de observações Obs.: k não deve ser inferior a 5 e maior que 25. 5 › k ‹ 25 • Para encontrar o tamanho da classe: (qual a amplitude) h Amplitude da classe é a diferença entre o valor máximo e o mínimo dos dados, dividido pelo número de classes ( k ). Aula 3 Medidas Estatísticas Média aritmética - Medidas de Posição Central Moda Mediana - Medidas de Dispersão Amplitude total Desvio-Padrão Variância Coeficiente de variação MÉDIA x = n → nº de dados, observações em estudo (quantidade de elementos) Mas quando os dados estão dispostos numa tabela a gente pode calcular a média acrescentando uma coluna auxiliar. Para calcular a média por meio dos dados organizados numa tabela (distribuição de frequências): Variável Frequência Frequência Relativa (%) xi x fi x f Total Nº de elementos em estudos 100 média (x) = soma de xi • fi . soma da Frequência x → variável f → Frequência MODA É a resposta que aparece com maior frequência no conjunto de dados. Também pode ser encontrada quando a variável em estudo for qualitativa. MEDIANA Quando há um valor muito discrepante, a mediana representa melhor um conjunto de dados. A mediana não é influenciada por valores extremos. Tem que ordenar os dados do menor para o maior valor (rol). A mediana é o valor que divide o conjunto de dados em duas partes exatamente iguais. • p/ n ímpar: Md = x • p/ n par: Md = Xn / 2 + X n+1 / 2 2 Aula 4 Medidas de Ordenamento ( ou separatriz) • Quartis • Decis • Percentis Não são afetadas por valores extremos. QUARTIS Divide a distribuição ordenada em quatro partes iguais. 25 % 25 % 25 % 25 % Q1 Q2 Q3 Q2 é a própria mediana. Fórmula: Qnq = x[] X é o valor, é a posição que está o quartil. (Q1, Q2 ou Q3) nq é o número do quartil que se quer encontrar (1,2 ou 3) n é o nº de elementos em estudo. (tamanho da amostra) Q é o quartil que se deseja obter DERCIS Dnd = x[] PERCENTIS Pnp = x[] Aula 5 Medidas de Dispersão Só podem ser calculadas para variáveis quantitativas. * Amplitude total * Desvio-Padrão * Variância * Coeficiente de variação AMPLITUDE TOTAL É a diferença entre o valor máximo com o valor mínimo do conjunto de dados. R → Amplitude total R = X (MÁXIMO) - X (MÍNIMO) A amplitude não é uma medida muito utilizada, pois só leva em conta dois valores de todo o conjunto de dados e é muito influenciada por valores extremos. DESVIO-PADRÃO É a raiz quadrada da variância. Para ficar com a mesma unidade do conjunto de dados originais. S → desvio-padrão Propriedades do Desvio-Padrão: • Quando a gente soma ou subtrai uma constante qualquer de todos os valores de um conjunto de dados, a gente vai obter um novo conjunto de dados. O Desvio-Padrão que se obtém desse novo conjunto de dados é igual ao Desvio-Padrão do conjunto de dados anterior. S y = S xYi = Xi ± c → • Multiplicando-se ou Dividindo S y = c x S xYi = Xi x c → c x Sx Então, Yi = Xi ÷ c → Sx Então, Sy = Sx c c Isso só vale se você fizer para todos os elementos do conjunto de dados VARIÂNCIA É o valor do Desvio-Padrão elevado ao quadrado. COEFICIENTE DE VARIAÇÃO CV = x 100 Variável (Xi) Frequência (fi) Xi x fi Xi2 x fi Aula 6 Gráficos Última aula da estatística descritiva. Tipos de Gráficos: - em linhas - barras ou colunas, setores ou pizza. (Diagramas de área) - Gráficos para tabelas de intervalos de classes (histograma e polígono de frequências) Diagrama de Pareto → Quando construímos o gráfico em barras para variáveis qualitativas e as barras são arranjadas em ordem decrescente de altura, a partir da esquerda para direita, com o atributo que ocorre com maior frequência aparecendo em primeiro lugar, denominamos este gráfico de barras de Diagrama de Pareto. É uma das sete ferramentas da qualidade. Falhas na elaboração de gráficos: - Gráfico sucata - Ausência de base relativa. - Eixo vertical comprimido. - Ausência do ponto zero. Aula 7 Inferência Estatística As técnicas mais importantes e utilizadas da Inferência Estatística são: - Estimação - Teste de hipóteses A inferência estatística é um conjunto de técnicas muito utilizadas em problemas práticos do dia-a-dia. Conceitos básicos: • Parâmetro → população µ ou • Estimador → amostra µ ou • Estimativa ou estatística • Erro amostral • Erro não amostral Estimativa: - Pontual - Intervalo de confiança (ou estimativa intervalar) * Estimativa pontual: Umúnico valor é usado para estimar um parâmetro populacional. A média amostral é a melhor estimativa pontual da média populacional. Ou seja, a estimativa pontual é a média amostral. É a soma de todas as observações ÷ quantidade de observações. = ∑ Obs.: Letra grega 𝜇 (mi) é um parâmetro para a média populacional. A letra grega é sempre população. 𝜇 é a média populacional = média amostral * Intervalo de confiança: É uma faixa (ou intervalo) de valores usada para estimar o verdadeiro valor de um parâmetro populacional. Permite julgar um possível erro que a gente pode tá cometendo. Distribuição amostral Teorema do limite central σMa = → Para uma população infinitamente grande e uma amostragem com reposição. σ → é o desvio - padrão Fator de correção: x √N – n N - 1 Usa esse fator de correção para populações finitas e amostragem sem reposição. Ou seja, tamanho amostral n for maior que 5% do tamanho N da população finita. n › 0,05 Erro padrão nada mais é do que a raiz da variância do estimador. Aula 8 Distribuição Normal É uma distribuição de probabilidade em estatística. É a distribuição contínua de probabilidade mais importante em estatística. Quais são os elementos necessários para a construção de um intervalo de confiança. Como se constrói um intervalo de confiança. Para se construir um intervalo de confiança a gente precisa de uma quantidade que vem de uma distribuição normal. A quantidade de um intervalo de confiança vem de uma tabela de distribuição normal. O gráfico da distribuição normal é chamado de curva normal, que é uma distribuição em forma de sino. Na distribuição normal pode ter qualquer valor para a média, mas o desvio-padrão sempre é positivo. O mínimo do desvio-padrão é zero. A abertura da curva está diretamente relacionada ao desvio-padrão, que é a variabilidade. Quanto maior o desvio-padrão mais aberta é a curva. Quanto menor o desvio-padrão mais fechada vai tá a curva. Então a curva da distribuição normal depende diretamente da média e do desvio-padrão. Média µ e desvio-padrão σ Intervalo de confiança Para levar em conta a variabilidade da média, a gente constrói intervalos de confiança. Variabilidade está associada ao desvio-padrão e a variância. Variância = Desvio-padrão = σ → σ é o desvio padrão populacional √n S → S é o desvio padrão amostral √n Para construir um intervalo de confiança: [ x + t . ; x - t . ] t é o valor tabelado x é a média Aula 9 Variável aleatória: é uma variável que tem um único valor numérico, determinado pelo acaso, para cada resultado de algum experimento. Normalmente indicada por letra maiúscula do alfabeto (X, Y, Z, W). Está associada a um experimento. Distribuição de Probabilidade É uma tabela, como na estatística descritiva. Cálculo de probabilidades de uma variável aleatória contínua: A gente tem que fazer uma transformação na variável. A gente tem uma variável original X, e a gente transforma essa variável numa outra variável Z, com µ = 0 e σ = 1. Z = X - µ σ X → variável original Z → variável µ = 0 σ = 1 Com essa transformação a gente consegue usar aquela tabela do intervalo de confiança, para encontrar as probabilidades. Então, uma variável aleatória que tem µ = 0 e σ = 1, é uma Distribuição Normal Padrão. Uma vez que cada distribuição normal pode ser transformada em uma distribuição normal padrão, pode-se usar escores z e a curva normal padrão para obter áreas (e portanto probabilidades) sobre qualquer curva normal.
Compartilhar