Baixe o app para aproveitar ainda mais
Prévia do material em texto
ESTATÍSTICA: · Estatística descritiva ou dedutiva: · Objetivo: descrever fatos relacionados a determinado grupo ou população, SEM pretender tirar conclusões de caráter mais genérico. · Conjunto de técnicas destinadas a síntese de dados numéricos. · Está em cargo da coleta, a organização e a descrição dos dados · Seu objetivo é apresentar, de forma resumida, um conjunto de observações. · Estatística inferencial ou indutiva: · A análise e a interpretação dos dados ficam a cargo da estatística inferencial · A partir dela são tomadas decisões sobre uma determinada população · Permite testar hipóteses a respeito de uma determinada população de interesse · População: conjunto universo de todos os elementos, com uma característica em comum. · Parâmetro: é uma medida numérica que descreve alguma característica de uma população. → está ligado a população · Amostra: qualquer subconjunto de uma população → precisa ter representatividade da população · Estimador / Estimativa: uma estatística numérica que descreve alguma característica de uma amostra. → está ligado a amostra POPULAÇÃO AMOSTRA PARÂMETRO ESTIMADOR Conjunto de todos os elementos Subconjunto de uma população Medida numérica de uma população Medida numérica de uma amostra PROCESSOS ESTATÍSTICOS: Censo e Estimação · Censo: · É a avaliação DIRETA de um parâmetro, através de dados obtidos de uma população. · Características: É caro, lento, quase sempre desatualizado, admite erro processual zero e a confiabilidade é 100% · Estimação: · É a avaliação INDIRETA de um parâmetro, com base em um estimador obtido por meio de uma amostra. · Características: é barato, é rápido, admite erro processual positivo, a confiabilidade é menos que 100% · DADOS ESTATÍSTICOS: · Coletados através de um processo de seleção aleatória · Se forem coletados de maneira inadequada → induzem ao erro e tornam-se inúteis · CLASSIFICAÇÕES: · Quanto a organização: · Dados brutos: obtidos diretamente da observação → não estão numericamente organizados · Rol: são numericamente organizados, de forma crescente ou decrescente · Quanto ao tipo: · Dados quantitativos: possuem características numéricas → os dados serão chamados de VARIÁVEIS. Podem ser classificados em: · Discretos: dados que possuem variáveis que assumem determinados números inteiros. Ex. quantidade de alunos em um curso · Contínuos: dados que possuem variáveis que podem assumir qualquer valor em intervalo de números. Ex.: altura, peso, salário. · Dados qualitativos: possuem características não-numéricas → os dados serão chamados de ATRIBUTOS. Podem ser classificados em: · Dados nominais: são dados categóricos, que consistem em nomes ou rótulos. Não podem ser hierarquizados (tal como do maior para o menor ou vice versa) Ex.: sexo (masculino ou feminino), sondagem (sim, não, indeciso). OBS: Para serem processados esteticamente, são atribuídos valores numéricos a tais atributos. · Dados ordinais: são dados que dependem de uma avaliação subjetiva. A principal diferença dos nominais é que esses apresentam uma ordem de categoria (podem ser “hierarquizados”). Ex.: “alto, baixo”; “máximo, mínimo”; “satisfeito, insatisfeito, extremamente insatisfeito”; “números de RG” · TÉCNICAS DE AMOSTRAGEM: · São métodos para escolhas das amostras dentro das populações · Tipos de amostras: · NÃO PROBABILÍSTICA: · Não garante que todos os elementos possuam a mesma probabilidade de serem escolhidos · São os mais comuns, pois a aleatoriedade é mais custosa. Porém a não causalidade cria um viés na pesquisa e pode afetar o resultado · Ex.: Escolha de um número de 1 a 1000. Caso seja perguntado para alguém da área da saúde, a probabilidade dessa pessoa escolher um número pequeno é maior que a dela escolher um número grande. Logo, os elementos não possuem a mesma probabilidade para serem escolhidos. Tipos de técnica: · Por julgamento · Por quórum · PROBABILÍSTICA: · Os elementos da população possuem a mesma probabilidade de serem escolhidos. · Ex.: Números do sorteio da loteria. As bolas estão todas no mesmo globo e todos possuem a mesma chance de serem escolhidas. Tipos de técnicas: · Simples · Sistematizada · Estratificada · Por conglomerados · Tipos: · Amostragem aleatória simples (AAS): · Escolha aleatória sem qualquer organização ou critério · Todos os elementos tem a mesma probabilidade de ocorrer · Ex.: Escolha das bolas no sorteio da loteria, qualquer um dos números pode sair e não há nenhum critério para essa escolha. · Amostragem aleatória sistemática (AASist): · É criado um critério de escolha, porém há aleatoriedade · É a que possui menor custo, a mais rápida e a que possui maior praticidade · Apenas o primeiro elemento da amostra é escolhido aleatoriamente, os outros seguem o mesmo padrão de escolha do primeiro. · Ex.: Sorteio da loteria → no 1º sorteio serão escolhidos números de 1 a 10, no 2º sorteio números de 11 a 20... · Observe que o 1º sorteio foi criado um critério de escolha aleatório e que os próximos sorteios irão obedecer e o mesmo padrão, criando, assim, um SISTEMA de escolha · Amostragem Aleatória Estratificada (AAE): · São escolhidos determinados extratos (gênero, cor, time que torce...). · Os estratos devem ser reunidos com características em comum, de modo que sejam mais homogêneos que a população inteira · É bem mais cara, pois é precisa fazer um estuda preliminar de toda população para, assim, conhece-la e fazer a divisão dos estratos · Se divide em: · Simples: não há necessidade de manter a proporção · Proporcional: há a necessidade de manter a proporção · Perfeita: são descartados elementos que não possuem interesse no assunto · Amostragem Aleatória por Conglomerados (AAC): · Divide-se a população em grupos, porém bem menores que os estratos. · Por exemplo, na pesquisa de altura média em Recife, uma forma estratificada seria dividir em bairros de acordo com a classe social. Por conglomerados seria fazer a divisão em pequenos quarteirões. · Ex.: Brasília possuem 200 quadras, em vez de pesquisar em todas, 1º são escolhidas as quadras que serão entrevistadas (escolha dos conglomerados) para depois fazer a escolha aleatória dos elementos · É uma técnica simples de se fazer, porém apresenta resultados menos precisos · OBSERVAÇÃO: · Amostragem Estratificada X Amostragem por Conglomerados · Estratificada: a população (por exemplo de uma escola) é dividida em estratos (alunos do 3º, 4º e 7º ano) e são escolhidos alguns elementos dentro de TODOS os estratos através de amostragem aleatória simples. · Por conglomerados: a população é dividida em conglomerados e escolhe-se APENAS UM deles para ser a amostragem, ou seja, é a única técnica em que a unidade amostral é o próprio conglomerado. · Tamanho mínimo de uma amostra: n = n → tamanho da amostra N → população No → = e → erro em % Ex.: Total de elementos = 220 Erro tolerável = 5% n = ≈ 141, 9 = 142 (na amostragem sempre arredonda para mais, não importa o valor) No = = 400 ‘ · Distribuição de frequência: · Representação por meio de tabelas dos dados estatísticos, discretos ou contínuos. · Objetivo: resumir grande conjunto de dados · Finalidade: facilitar a construção de gráficos, bem como a compreensão sobre a natureza dos dados · Frequência simples absoluta (Fi): é o número de vezes que um elemento figura no conjunto de dados. · Ex.: Dados → 20 alunos do curso e a quantidade de disciplinas que eles estão estudando→ X: {4, 8, 8, 6, 6, 8, 5, 5, 6, 7, 7, 7, 6, 6, 7, 5, 5, 7, 5, 5} Nº DE DISCIPLINAS (Xi) FREQUÊNCIA ABSOLUTA (Fi) 4 1 5 6 6 5 7 5 8 3 TOTAL n = ∑ fi = 20 · Frequência Relativa (Fr): é a razão entre a frequência absoluta e no número total (n) de elementos da série. Fr = → → Fr = ou Nº DE DISCIPLINAS (Xi) FREQUÊNCIA ABSOLUTA (Fi) FREQUÊNCIA RELATIVA (Fr) 4 1 1/20 = 0,05 = 5% 5 6 6/20 = 0,3 = 30% 6 5 5/20 = 0,25 = 25% 7 5 5/20 = 0,25 = 25% 8 3 3/20 = 0,15 = 15% TOTAL n = ∑ fi = 20 20/20 = 1 = 100% · Frequência acumulada (Fac): é o somatório da frequência simples da variável com asfrequências simples dos elementos que o antecedem. Fac = Fi + Fi (anterior) Nº DE DISCIPLINAS (Xi) FREQUÊNCIA ABSOLUTA (Fi) FREQUÊNCIA RELATIVA (Fr) FREQUÊNCIA ACUMULADA (Fac) 4 1 1/20 = 0,05 = 5% 1 5 6 6/20 = 0,3 = 30% 7 6 5 5/20 = 0,25 = 25% 12 7 5 5/20 = 0,25 = 25% 17 8 3 3/20 = 0,15 = 15% 20 TOTAL n = ∑ fi = 20 20/20 = 1 = 100% · Amplitude AMOSTRAL (A): é a diferença entre o maior e o menor valor da amostra. A = N máxima – N mínimo A = 8 – 4 → A = 4. · Representação de dados EM CLASSE: · Representação dos dados em forma de intervalos de classes. · Regra: usado principalmente em dados contínuos. · Exceção: podem ser aplicados a dados discretos, quando se tratar de várias amostras · Ex.: Peso de jovens de um bairro Os que pesam 50kg entram nesse intervalo e os que pesam 55kg não entram 55 50 65 60 60 55 Limite inferior Limite superior · Método para determinar o número de classes (a quantidade de intervalos): K = → onde, “n” é o tamanho da amostra · Amplitude da CLASSE (intervalo): A = L superior – L inferior Ex.: Nº de bibliotecas de 20 bairros 90 66 78 82 77 60 64 90 87 85 67 91 82 70 81 80 69 78 90 67 Quantas classes terá o gráfico de distribuição de frequência? Qual o tamanho da amplitude das classes? A amostral = N máximo – N mínimo A amostral = 91 – 60 = 31 K = ≈ 4 classes A classe = ≈ 8 (em cada classe terão aproximadamente 8 elementos) · Ponto médio da classe (Pm): · É a média aritmética entre o limite superior e o inferior Pm = · SIMBOLOGIA: POPULAÇÃO AMOSTRA Média µ Variância σ2 S2 Desvio Padrão Σ S Proporção P p · Medidas descritivas: · Medidas de posição: · Tendência central: média, moda e mediana · Separatriz: quartis, decis, porcentis · Dispersão: variância, desvio padrão, coeficiente de variação · Assimetria e curtose · MEDIDAS DE POSIÇÃO: · Tendência central: média (), moda (Mo), mediana (Me). · Média aritmética: · Sofre influência dos valores extremos · Pode ser chamada de valor de esperado · Sozinha, ela não é suficiente para a tomada de decisões → NÃO representa a realidade · É importante para calcular o somatório: ∑X = x n, onde X é somatório dos elementos · Ex. → X: {x1, x2, x3, x4} = · PROPRIEDADES: · A soma algébrica dos desvios em relação a média é zero. d = (x1 - ) + (x2 - ) + (x3 - Ex.: X: {1, 2, 3} Me = = 2 d = (1 – 2) + (2 – 2) + (3 – 1) d = 0 · Somando-se, subtraindo-se, dividindo-se ou multiplicando-se uma constante a todos os valores de uma variável, a média do conjunto fica aumentada ou diminuída dessa constante.+3 Ex.: X: {4, 5, 6} Me = = 5 · A média aritmética é atraída pelos valores extremos. Ex.: X: {2, 4, 6, 8,10} → = 6 Se for acrescentado o elemento zero a essas variáveis, a média tende a se aproximar do número zero X: {0, 2, 4, 6, 8, 10} → = 5,6 Se for acrescentado o número 12, a média tende a se aproximar do 12 X: {2, 4, 6, 8, 10} → = 6,4 · A média e o desvio padrão possuem a mesma unidade · Média ponderada: · Em alguns casos surgem elementos que possuem pesos maiores que outros, daí há a necessidade dessa média · Ex.: Nota na prova Peso da matéria 7 1 8 2 9 3 = = 10 · Mediana: · OBSERVAÇÃO: Para calcular a mediana os elementos sempre precisam estar EM ROL, nunca podem estar como dados brutos. · Não sofre influência dos extremos · Número de elementos é ÍMPAR: X: {1, 2, 3, 4, 5} → Me = = = 3ª posição · Número de elementos é PAR: X: {1, 2, 3, 4, 5, 6} 1º passo: Me = = = 3ª posição 2º passo: = = 3,5 · Moda: · É o elemento com maior frequência · Nem sempre irá existir → distribuição amodal · Amodal → X: {1, 2, 3, 4, 5} · Modal → X: {1, 2, 2, 2, 3, 4, 5} → Mo = 2 · Bimodal → X: {1, 2, 2, 3, 3, 4, 5} → Mo = 2 e Mo’ = 3 · Multimodal → X: {1, 2, 2, 3, 3, 4, 4, 5, 5, 6} · OBSERVAÇÃO: dependendo do tipo de variável, a moda pode ser considerada a média daquela distribuição. Ex.: variáveis qualitativas · Média aritmética, moda e mediana de VALORES CONTÍNUOS (AGRUPADOS): Ex.: Altura (m) Fi 1,5 I─ 1,6 3 1,6 I─ 1,7 4 1,7 I─ 1,8 5 1,8 I─ 1,9 5 1,9 I─ 1,9 3 Qual o valor da média de alturas? Me = , onde Pm → ponto médio Pm = Pm1 = = 1,55 Altura (m) Fi Pm 1,5 I─ 1,6 3 1,55 1,6 I─ 1,7 4 1,65 1,7 I─ 1,8 5 1,75 1,8 I─ 1,9 5 1,85 1,9 I─ 1,9 3 1,95 Média = Média = 1,755 m Qual a mediana dessas alturas?OBESERVAÇÃO: Os valores sempre precisam estar agrupados em Rol para calcular a mediana Altura (m) Fi Facumulada 1,5 I─ 1,6 3 3 1,6 I─ 1,7 4 7 1,7 I─ 1,8 5 12 1,8 I─ 1,9 5 17 1,9 I─ 1,9 3 20 N = 20 1º passo: Encontrar a classe mediana CLmed = = 20/2 = 10 A 1ª classe vai da primeira pessoa até a terceira A 2ª classe vai da quarta pessoa até a sétima A 3ª classe vai da oitava pessoa até a décima segunda → essa é a classe média CLmed = 1,7 I─ 1,8 2º passo: Interpolação linearMd CLmed = 1,7 I─ 1,8Pm Fac da mediana = 7 I─ 12 Md = = = Md = 1,76m · Separatriz: quartis, decis e percentis · O conjunto de dados precisa estar em Rol. · Quartis:Q1 Q2 Q3 25% 25% 25% 25% Q3 – Q1 = Intervalo interquartílico · Decis: Q9 Q8 Q7 Q6 Q5 Q4 Q3 Q2 Q1 · Percentis: P90 P80 P70 P60 P50 P40 P30 P20 P10 100% 90% 80% 70% 60% 50% 40% 30% 20% 10% · Dispersão: · Variância (S2): S² = → quando for variância amostral o denominador é (n-1) Ex.: Suponha que X seja uma variável aleatória com valor Esperado 10 e variância 25. Para que a variável dada por Y = p – qx, com p e q positivos, tenha valor esperado igual a 0 e variância 625, quais os valores de p e q? X → média = 10 / variância = 25 Y → média = 0 / variância = 625 Y = p – qx Média de Y = p – q x Média de X → trocando os valos de X e Y pelas suas respectivas médias, a equação fica inalteradaNa multiplicação ou divisão a variância fica multiplicada ou dividida pelo quadrado do número 0 = p – q x 10A soma e a subtração não influenciam a variância e nem o desvio padrão P = 10q Y = p – qx Variância de Y = p – q x Variância de X → trocando os valores de X e Y por suas respectivas variâncias, a equação fica inalterada Variância de Y = q² x Variância de x 25 = q² x 625 Q = 5 P = 10q → P = 55 OBS: Variância é igual a média dos quadrados divido pelo quadrado das médias X Probabilidade de x 0 0,4 1 0,2 2 0,1 3 0,3 Calcule a média e a variância: X x P(x) X² x P(X) 0 0 0,2 0,2 0,2 0,4 0,9 2,7 Média E(x) = ∑ X x P(X) = 1,3 Média dos quadrados E(x²) = ∑ X² x P(X) = 3,3 Variância = Média dos quadrados E(x²) – Quadrado da média [E(x)]² Var = E(x²) – [E(x)]² Var = 3,3 – 1,69 = 1,61 · Desvio padrão (S): S= Desvio padrão = · Propriedades: · Quando somarmos ou subtrairmos uma constante aos valores de uma variável, o desvio padrão e a variância ficam inalterados · Quando multiplicarmos ou dividirmos todos os valores de uma variável por uma constante, o desvio padrão fica multiplicado ou dividido por essa constante e a variância multiplicado ou dividido pelo quadrado da constante · Coeficiente de variação (Cv): Cv = · Amplitude (A): · Assimetria e Curtose: · Assimetria: · Corresponde a distribuição dos dados, que podem ser: · Simétrica: quando existe uma exata repartição de valores em torno do ponto central, ou seja, a média, a mediana e a moda são iguais. · Assimétrica à direita (positiva): > Me > Mo · Assimétrica à esquerda (negativa): < Me < Mo · Curtose: · Mesocúrtica: curva normal → K = 0,263 · Leptocúrtica: curva levantada → K < 0,263 · Platicúrtica: curva achatada → K > 0,263 K = · DISTRIBUIÇÃO EXPONENCIAL: · F(x) = α + e-αx E = 2,7 Variância de x = Desvio padrão de x = Média de x = Variância = Desvio padrão A média de x é o inverso de α. Ex.: α = 2 → Média de x = · DISTRIBUIÇÃO NORMAL: · Padronização: Z= · Distribuição binominal: Média = n x P P(k) = C(n,k) x Pk x (1-P)n-k · Distribuição de Poisson: P(x) = · COVARIÂNCIA E CORRELAÇÃO: · Covariância: Cov(x,y) = P(xy) – Px x Py E(xy) → média dos produtos Ex x Ey → produtos da média · PROPRIEDADES:· Se os valores da variável y tendem a crescer quando os valores de x crescem, então Cov(x,y) > 0 (POSITIVA) · Se os valores da variável y tendem a diminuir quando os valores de x crescem, então Cov(x,y) < 0 (NEGATIVA) · A covariância entre x e y é igual a covariância entre y e x · A Cov(x,x) = var(x) · A covariância entre uma variável e uma constante é igual a zero → cov(x,k) = 0 · Cov(kx,y) = cov(x,ky) = k x cov(x,y) · Correlação: ρ(x,y) = σ = desvio padrão · PROPRIEDADES: · Variáveis aleatórias independentes: · X e y são independentes: P(xy) = Px x Py Cov(x,y) = 0 ρ(x,y) = 0 · PROBABILIDADE: · P(AUB) = P(A) + P(B) – P(A∩B) · P(A) + P() = 1 · → é chamado de complementar, é o que falta para o todo. · Ex.: P(A) = 1/3 → P() = 2/3 · P(AUB) U P() = 1 · P() = 1 – P(AUB) · P(A/B) → probabilidade do evento A acontecer sabendo que o B aconteceu → probabilidade condicional · P(A/B) = · Eventos mutuamente excludentes: são eventos que não podem acontecer juntos, o valor da interseção é zero → P(A∩B) = 0 · Eventos independentes: · P(A∩B) = P(A) x P(B) · P(A/B) = P(A) · Interseção máxima e mínima: Ex.: P(A) = 0,4 P(B) = 0,9 Interseção máxima = a menor probabilidade (situação em que o P(A) estaria inteiramente dentro do P(B)) = 0,4 = 40% Interseção mínima = P(A) + P(B) = 130 → a interseção mínima é o valor que passa dos 100%, logo é igual a 30%
Compartilhar