Baixe o app para aproveitar ainda mais
Prévia do material em texto
Aula 1 - Conceitos introdutórios Estatística é a ciência que estuda quantitativamente os fenômenos naturais ou sociais, cuja avaliação está baseada em métodos científicos de coleta, organização, apresentação e analise de dados. · Estatística Descritiva: que se preocupa com a organização e descrição dos dados experimentais. · Estatística Indutiva: (Estatística Inferencial), que cuida da sua analise e interpretação, ou seja, tirar conclusões sobre populações com base nos resultados observados em amostras extraídas dessas populações. · Estatística Probabilística: representa o estudo de planejar jogadas ou estratégias de jogos de azar, bem como o risco e o acaso em eventos futuros. População é o conjunto de elementos sobre o qual se faz alguns estudos ou Inferência Estatística, a qual pode ser finita ou infinita. Uma população é infinita se a quantidade de unidades de observação é ilimitada, ou a sua composição é tal que as unidades da população não podem ser contadas. Variável é uma atribuição de um número a cada característica da unidade de observação, ou seja, é uma função matemática definida na população. Quando uma característica ou variável é não numérica, denomina-se Variável Qualitativa ou Atributo. · Variável qualitativa – sexo; religião; naturalidade; cor dos olhos; faixa etária. (nestes casos é expressa em categorias, exemplo masculino e feminino; católica, judaica e protestante; etc.) · Variável quantitativa – duração de uma bateria de celular; quantidade de notas de uma moeda. Podem ser discretas (assumem valores determinados e resultam de contagem, por exemplo quantidade de sabores de refresco) ou continuas (depende de algum fator, exemplo duração de uma bateria de celular) Amostra é um subconjunto, necessariamente finito, uma parte selecionada das observações abrangidas pela população, através da qual se faz um estudo ou inferência sobre as características da população. A amostra é constituída por n unidades de observação e que deve ter as mesmas características da população. Essa coleta recebe o nome de amostragem que envolve pelo menos dois passos: · Escolhas das unidades · Registros das observações A amostragem pode ser sem reposição e com reposição; na amostragem sem reposição, normalmente utilizada nos trabalhos estatísticos, as unidades são selecionadas apenas uma vez na amostragem com reposição, seleciona-se as unidades mais de uma vez. Exemplo de Amostragem sem Reposição Pesquisa eleitoral: as pessoas devem ser ouvidas apenas uma vez, porque, em uma eleição, o voto é individual. Exemplo de Amostragem com Reposição Fila de banco: a mesma pessoa pode ser observada duas ou mais vezes, a cada vez que retorna ao banco. Tipos de amostragem: Amostragem Sistemática é quando a retirada das unidades de observação é feita periodicamente, sendo o intervalo de seleção calculado, para uma população finita, por meio da divisão do tamanho da população pelo tamanho da amostra a ser selecionada. Exemplo de Amostra Sistemática Deseja-se retirar uma amostra de n = 10 unidades de observação de uma população de tamanho N = 874. O intervalo de seleção é, então, 874:10 = 87,4 = 87. Desse modo, vão-se contando as unidades de observação e escolhem-se aquelas que estiverem nas seguintes posições: 87; 174; 261; 348; 435; 522; 609; 696; 783; 870. Amostragem aleatória simples é quando o processo de retirada de uma amostra de uma população na qual cada unidade tem a mesma chance (ou oportunidade) de ser retirada denomina-se amostragem aleatória simples. O processo de amostragem aleatória simples exige que se atribuam números consecutivos as unidades da população e proceda-se a um sorteio, colocando-se todos os números em um recipiente, por exemplo, e retirando um número, situação na qual cada unidade de observação tem a mesma chance de ser selecionada. Técnicas de amostragem: Amostra casual simples é composta por elementos, retirados ao acaso, da população. Então, todo elemento da população tem igual probabilidade de ser escolhido para a amostra. Exemplo: efetuar um sorteio, com fichas numeradas, de zero a nove. Amostra Sistemática é quando os elementos são escolhidos não por acaso, mas por um sistema. Exemplo: no Lugar do sorteio, chamar todo o elemento com um número terminado em determinado dígito. Amostra Estratificada é composta por elementos provenientes de todos os estratos da população. Devem ser obtidas amostras estratificadas sempre que a população for constituída por diferentes estratos. Por exemplo, se as pessoas que moram nos vários bairros de uma cidade são diferentes, cada bairro é um estrato. Amostra de conveniência é formada por elementos que o pesquisador reuniu simplesmente porque dispunha deles. São comuns na área de saúde, onde se fazem pesquisas com pacientes de uma só clinica ou de um só hospital. Aula 02 – Tipos de Dados Dados brutos: dados desorganizados que não foram preparados para análise ROL: lista ordenada, crescente ou decrescente, de uma série estatística. Freqüência Simples Absoluta (fi): é o número de repetições de um valor individual ou de uma classe de valores da variável. Freqüência Simples Relativa (fri ou fri%): representa a proporção de observações de um valor individual ou de uma classe, em relação ao número total de observações: fri= fi/n Freqüência Absoluta Acumulada (Fi): é a soma da freqüência simples absoluta da classe ou do valor com as freqüências simples absolutas das classes ou dos valores anteriores. Freqüência Relativa Acumulada (Fri ou Fri%): Apresentaremos duas maneiras de calcular: a) acumulando as freqüências simples relativas de acordo com a definição de freqüências acumuladas b) calculando as freqüências relativas diretamente a partir das freqüências absolutas, de acordo com a definição de freqüências relativas: FRI =Fi/n Exemplo: 1. Determina-se o menor e o maior valor para o conjunto: Valor mínimo: 5,1 Valor máximo: 14,9 2. Definir o limite inferior da primeira classe (Li) que deve ser igual ou ligeiramente inferior ao menor valor das observações: LI: 5,1 3. Definir o limite superior da última classe (Ls) que deve ser igual ou ligeiramente superior ao maior valor das observações: LS:15 4. Definir o número de classes (K), que será calculado usando K (ou n)= . Obrigatoriamente deve estar compreendido entre 5 a 20. K: 8,94, aproximadamente, 8 5. Conhecido o número de classes define-se a amplitude de cada classe, A=: A: 1,23 6. Com o conhecimento da amplitude de cada classe, define-se os limites para cada classe (inferior e superior), onde limite Inferior será 5,1 e o limite superior será 15 + 1,23. Aula 3 - Medidas de Posição Central MÉDIA ARITMETICA Uma média aritmética pode ser Simples, Ponderada ou Agrupada em Classe. · Simples · Ponderada: Se os valores X1, X2, ..., Xn ocorrem com frequências f1 e f2, ..., fn, então: · Agrupada: Seja Xi o ponto médio da i-ésima classe, então: MODA Pode-se definir como moda o valor mais frequente, quando comparada sua frequência com a dos valores contíguos de um conjunto ordenado. · Unimodal: um único valor mais frequente · Amodal: nenhum valor mais frequente · Bimodal: dois valores mais frequentes Formula para dados agrupados: MEDIANA É o valor que divide a distribuição em duas partes iguais. Sua fórmula é: Exercícios: Media = (65+68+70+75+80+80+82+85+88+90+90+95+98+100+100)/15 = 84,4 Moda = 80; 90; 100 Mediana = 65, 68, 70, 75, 80, 80, 82, 85, 88, 90, 90, 95, 98, 100, 100 Media: Moda: Ponto médio da classe de maior frequência, portanto é 85. Mediana: Possuindo 80 dados, a mediana é o 40º dado, que cai 8ª classe. Essa classe tem 10 elementos; 70 +(40 – 35). () = 70 + 5 = 75 Aula 4 - Medidas de Ordenamento e Forma Na análise da distribuição de uma variável, há grande interesse de determinarmos qual o valor que divide a distribuição em duas partes iguais, quatro partes iguais, dez partes iguais e cem partes iguais. A estes valores (separatrizes) chamaremos respectivamente de: Quartis: Dividem a distribuição em quatro partes iguais. Sua fórmula é: Qnq = X ( nqn / 4 + ½) Decis: Dividem a distribuiçãoordenada em dez partes iguais. Sua fórmula é: Qnq = X ( nqn / 10 + ½) Percentis: Os percentis dividem a distribuição ordenada em cem partes iguais. Eles podem ser obtidos por meio de uma equação similar à usada para a obtenção dos quartis e dos decis. Para dados agrupados, utilizamos o centil para todos os casos (adaptando o quartil e o decil para o centil) C nx = Li + ( (nx * n – Faant)/ Fi ) * h Onde: n = quantidade da amostra nx = 1, 2, .....98,99 Li = limite inferior da classe encontrada h = amplitude do intervalo Faant = frequência acumulada anterior à da classe Ci fi = frequência absoluta da classe encontrada – Ci Aula 5 - Medidas de dispersão DESVIO PADRÃO Formula: Propriedades: · Somando-se ou subtraindo-se uma constante a cada elemento de um conjunto de números, o desvio padrão não se altera. · Multiplicando-se ou dividindo-se cada elemento de um conjunto de números por uma constante, o desvio padrão fica multiplicado ou dividido pela constante. VARIÂNCIA É a medida de dispersão que é o quadrado do desvio padrão, ou se preferir, o desvio padrão é a raiz quadrada da variância. COEFICIENTE DE VARIAÇÃO Corresponde à relação entre o desvio padrão sobre a média. Aula 6 – Gráficos Para a elaboração de um gráfico devem ser considerado os seguintes itens: a) Um título geral indicando a situação estudada, época e local; b) escalas e as respectivas unidades de medida; c) convenções adotadas; d) fonte de informação assinalando de onde foram retirados os valores. Os gráficos podem ser classificados de várias maneiras: · Quanto à forma: · Diagramas: gráficos geométricos dispostos em duas dimensões. · Cartogramas: ilustrações relativas a cartas geométricas. · Estereogramas: gráficos volumétricos com três dimensões. · Quanto ao uso: · Gráficos de Informação: destinados ao público em geral, sendo apresentados de forma completa e clara. · Gráficos de Análise: tabelas de informação técnica e qualitativa. Tipos de gráficos: · Histogramas: É formado por um conjunto de retângulos justapostos, de tal forma que a área de cada retângulo seja proporcional à frequência da classe que ele representa. Os retângulos terão como base o eixo das abscissas, cuja largura será igual a amplitude do intervalo de classe. Diagrama: Apresenta as frequências sob a forma de colunas verticais ou de barras.São empregados para representar frequência de dados categóricos ou nominais. · Gráfico de Pareto: Representa as frequências simples ou relativas das classes ou dos valores analisados, de forma ordenada, geralmente da classe de maior frequência para a de menor frequência. É considerado uma ferramenta para a Qualidade Total, no campo da gestão de empresas. · Gráfico de Ogiva: Representa as frequências geralmente mostradas no histograma. · Gráfico de Boxplot: Representa a dispersão dos dados, revelando a mediana e os quartis (que são medidas de posição). Assim, é possível verificar a posição central do conjunto ordenado dos dados, denominado mediana, e as subdivisões das séries ordenadas, denominadas quartis. · Gráfico de Setores: representa as frequências relativas ou simples sobre a forma de setores de círculo. Também é denominado “Gráfico de Pizza”. · Gráfico de dispersão: Mostra a relação gráfica existente entre duas variáveis numéricas, como custos e vendas. · Pictograma: Construído a partir de figuras ou conjuntos de figuras representativas da intensidade ou das modalidades do fenômeno. Falhas na elaboração de gráficos: · Gráfico sucata · Ausência de Base Relativa · Eixo Vertical Comprimido · Ausência do Ponto Zero Aula 7 - Distribuições de Amostragem Zentgraf (2007) aponta que os métodos de amostragem podem apresentar alguns problemas em sua aplicação quando: · A população for muito pequena; · Os dados da população apresentarem volatilidade alta; · Houver casos de necessidade de previsão absoluta; · Os dados da população já estiverem disponíveis. Em uma pesquisa, buscamos uma amostra que seja representativa da população analisada. Porém, uma média amostral quase nunca será a mesma de uma média populacional, assim como o desvio padrão. ERRO PADRÃO: é calculada pela divisão do desvio padrão da população pela raiz quadrada do tamanho da amostra. Vejamos: FATOR DE CORREÇÃO DE POPULAÇÃO: em casos de uma nova amostragem ser feita em uma população finita sem reposição, os resultados novamente se distorceriam. A media e desvio padrão da população sem a amostra retirada se alteraria. Aula 8: Intervalos de Confiança Distribuição da Curva Normal Características da distribuição normal: · A variável pode assumir qualquer valor real; · O gráfico da distribuição normal é uma curva em forma de sino, simétrica em torno da média; · A área total sob a curva vale 1, porque corresponde à probabilidade de a variável aleatória assumir qualquer valor real; · Como a curva é simétrica em torno da média, os valores maiores e os menores do que a média ocorrem com igual probabilidade; · A configuração da curva é dada por dois parâmetros: a média e a variância. Mudando a média, muda a posição da distribuição; mudando a variância, muda a dispersão da distribuição. Os modelos de aplicação do Intervalo de Confiança são baseados na premissa de que a distribuição normal pode ser usada com os seguintes dados: sempre a amostra deve ser igual/superior a 30; quando for menor do que 30, o desvio padrão é conhecido. Aula 9: Distribuição Normal Denomina-se distribuição normal reduzida a distribuição normal de média zero e variância. As probabilidades associadas à distribuição normal reduzida são facilmente obtidas em tabelas (Área sob a curva normal padronizada compreendida entre os valores 0 e Z). Fórmula: X => µ => média τ => desvio padrão a) Z = (18 – 16)/1 Z = 2 Tabela => 0,4772 ou 47,42% b) 0,5 – 0,4772 => 0,0228 ou 2,28% a) Z = (7,5 – 6,5)/1 Z = 1 Tabela = 0,3413 ou 34,13% 0,5 – 0,3413 = 0,1587 ou 15,87% b) Z = (7,0 – 6,5)/1 Z = 0,5 Tabela = 0,1915 ou 19,15% 0,5 – 0,1915 = 0.3085 ou 30,85% c) Z = (8,0 – 6,5)/1 Z = 1,5 Tabela = 0,4332 ou 43,32% 0,5 – 0,4332 = 0,0668 ou 6,68% d) Z = (5,0 – 6,5)/1 Z = -1,5 Tabela = 0,4332 ou 43,32% 0,5 + 0,4332 = 0,9332 ou 93,32% Aula 10: Teste de Hipóteses Teste de Hipóteses é um método utilizado para observarmos se determinados dados são compatíveis ou não com alguma hipótese levantada. Pode ser feito através de duas formas: · Testes paramétricos · Testes não paramétricos O uso tanto dos testes paramétricos como dos não paramétricos está condicionado à dimensão da amostra e à respectiva distribuição da variável em estudo. Testes paramétricos são baseados em parâmetros da amostra, por exemplo, média e desvio padrão. Os testes de hipóteses são sempre constituídos por duas hipóteses, a hipótese nula H0 e a hipótese alternativa H1. · Hipótese existente, ou hipótese a ser testada – H0, que sempre alega a igualdade de um determinado parâmetro. · Hipótese alternativa – H1, que sempre alega a desigualdade de um determinado parâmetro. Para a realização dos testes de hipóteses, temos que obedecer às seguintes etapas: · Formulação do Teste de Hipótese: Hipótese Nula (H0) e Alternativa (H1). · Escolha de Distribuição Normal Adequada. · Selecionar o nível de significância e região crítica do teste. · Estabelecer Regra de Decisão. · Selecionar a amostra, calcular a Estatística de teste e interpretar seus resultados. Bilateral ≠ (divide área por 2) Unilateral a esquerda < Unilateral a direita > Testes não paramétricos: Os testes não paramétricos envolvem casos em que não podemos supor características da população de onde a amostra foi extraída, como por exemplo, comportamento de distribuição normal. Conheça os principais testes não paramétricos. · Teste do Qui-Quadrado: Utilizado na análise de frequências, no caso de análise de uma característica da amostra. · Teste do Qui-Quadrado para Independência ou Associação: Utilizado na análise de frequências, no caso de análise de duas características daamostra. · Teste dos Sinais: Utilizado em casos emparelhados, ou seja, submetido a duas medidas. · Teste de Wilcoxon: Analisa os dados emparelhados considerando também as magnitudes encontradas. · Teste de Mann Whitney: Analisa se dois grupos originam-se de populações com médias diferentes. · Teste da Mediana: Análise de grupos que originam-se de populações com medianas diferentes. · Teste de Kruskal-Wallis: Análise de grupos que originam-se de populações com médias diferentes.
Compartilhar