Baixe o app para aproveitar ainda mais
Prévia do material em texto
Resenha Cap.5 e 6 Estatística para Ciências Humanas - Jack Levin, James Alan Fox, David R. Forde Regras de probabilidade e curva normal O que é distribuição normal? Uma distribuição estatística é uma função que define uma curva, e a área sob essa curva determina a probabilidade de ocorrer o evento por ela correlacionado. E o que é distribuição normal? É a mais importante dentre as distribuições estatísticas. É uma curva simétrica em torno do seu ponto médio, apresentando assim seu famoso formato de sino. A curva de distribuição normal representa o comportamento de diversos processos nas empresas e muitos fenômenos comuns, como por exemplo, altura ou peso de uma população, a pressão sanguínea de um grupo de pessoas, o tempo que um grupo de estudantes gasta para realizar uma prova. A distribuição normal pode ser usada para aproximar distribuições discretas de probabilidade, como por exemplo a distribuição binomial. Além disso, a distribuição normal serve também como base para a inferência estatística clássica. Nela, a média, mediana e moda dos dados possuem o mesmo valor. A Determinação das Distribuições de Probabilidade As decisões gerenciais, geralmente, necessitam de estimativas dos valores das variáveis envolvidas. Quando se dispõe de dados passados relacionados a essas variáveis, podem ser usadas certas técnicas estatísticas, como por exemplo a análise de regressão, para a estimativa de seus comportamentos futuros. Entretanto, em muitos casos ou os dados passados não estão disponíveis ou apresentam muita deficiência. Nesses casos, o dirigente necessita elaborar estimativas subjetivas que refletem suas expectativas quanto ao comportamento futuro dessas variáveis. As estimativas subjetivas podem ser obtidas a partir da experiência do próprio dirigente ou de um grupo de especialistas. Obtidas as informações relativas às probabilidades subjetivas por parte de um grupo de especialistas é possível efetuar o tratamento desses dados de forma a se poder trabalhar com estimativas que poderão ser formuladas em três níveis, a saber: A estimativa otimista, estimativa mais provável e estimativa pessimista. A estimativa mais provável corresponde à média das opiniões dos especialistas. A Curva normal como uma distribuição de probabilidade A mais importante distribuição de probabilidade contínua em todo o domínio da estatística é a distribuição normal. O gráfico, chamado de curva normal, é a curva em forma de sino (Fig. 1) que aproximadamente descreve muitos fenômenos que ocorrem na natureza, indústria e pesquisa. Distribuição Normal ou Curva Normal Distribuição normal é provavelmente uma das mais importantes e largamente usadas das distribuições contínuas. Ela é conhecida como uma variável aleatória normal, e sua distribuição de probabilidade é chamada de distribuição normal. O que segue são características da distribuição normal: Características da Distribuição Normal: Ela tem a forma de um sino e é simétrica ao redor da sua média. Ela se aproxima do eixo, ela se estende indefinidamente em qualquer direção a partir da média. Ela é uma distribuição contínua. Ela é uma família de curvas, cada par único de média e desvio padrão define uma distribuição normal diferente. Assim, a distribuição normal é completamente descrita por dois parâmetros: média e desvio padrão. Ela é unimodal, os valores acumulam-se somente no centro da curva. O modelo e a realidade da curva normal: O escore padronizado, também chamado de escore z, representa o número de desvios padrão pelo qual um valor x dista da média para mais ou para menos. Obtém-se esse valor através das fórmulas: Amostra 𝑧 = 𝑥 − 𝑥 𝑠 Onde: 𝑠 é o desvio-padrão amostral; 𝑥 é cada valor observado na amostra; 𝑥 é a média amostral; ou População 𝑧 = 𝑥 − 𝜇 𝜎 Onde: 𝜎 é o desvio-padrão populacional; 𝑥 é cada valor observado na população; 𝜇 é a média populacional; Amostras e Populações Método de amostragem Ao realizar uma pesquisa, é quase sempre impossível estudar toda a população que está interessado. Por exemplo, se você estivesse estudando opiniões políticas entre estudantes universitários no seu país, seria quase impossível fazer um levantamento com cada estudante universitário. Se você fosse fazer um levantamento de toda a população, seria extremamente demorado e caro. Assim sendo, os pesquisadores utilizam amostras como meio para coletar dados. Uma amostra é um subconjunto da população em estudo. Ela representa a população maior e é usada para fazer inferências sobre essa população. É uma técnica de pesquisa amplamente utilizada nas ciências sociais como uma forma de reunir informações sobre uma população, sem ter que medi-la em sua totalidade. Existem vários tipos e formas de selecionar a amostra de uma população, do simples ao complexo. O que é amostra probabilística? Para que pesquisas de mercado, sejam efetivas é preciso que um público específico seja selecionado. Nesta seleção é possível que haja interferência ou não do entrevistador, assim nasce as amostras probabilísticas e não probabilísticas. Amostra probabilística é a qual todos os indivíduos do universo têm uma chance igual de responder a pesquisa, ou seja, probabilidade fixa e maior que zero. Esse método busca a imparcialidade do entrevistador na busca de seus entrevistados. Temos como exemplo as pesquisas feitas em domicílios que são aleatoriamente selecionados, não deixando a escolha nas mãos do entrevistador. Para que seja efetiva, se tem como pré-requisito da amostra probabilística, uma listagem de todos os indivíduos do universo a ser pesquisado. Em alguns tipos de pesquisa pode ser fácil obter essa lista, como uma lista de contatos de em uma empresa a partir da coleta de dados no ato da compra ou cadastros de clientes de um hotel ou clube. Porém, pode se tornar difícil obter esses dados em algumas situações, como por exemplo, uma lista atualizada de todos os eleitores de uma região. O que é amostra não probabilística? Muitas vezes não é possível obter uma lista de o universo a ser pesquisa. Esse é o caso por exemplo de todos os habitantes de uma cidade, ou dos consumidores de um determinado produto. São em situações como essas, que percebemos que se torna quase impossível obter um método 100% probabilístico, por não dispor de uma lista completa e atualizada da população em estudo. Assim, a amostra não probabilística é aquela em que a coleta é baseada em critérios definidos previamente, em que nem todos o universo tem a mesma chance de ser entrevistado, mas que no final o trabalho de campo o resultado seja representativo e passível de extrapolação. Um exemplo de aplicação de uma amostra não probabilística são as pesquisas eleitorais. Neste tipo de levantamento, o procedimento mais comum é uma amostragem por cotas, em que as entrevistas são baseadas em um perfil já conhecido da população. Tipos de amostragem probabilística e não-probabilísticas Probabilísticas Amostra Aleatória simples Amostra Sistemática Amostra Estratificada Amostra por Conglomerado Amostragem aleatória simples A amostra aleatória simples é um dos métodos de amostra probabilística mais utilizados. Nessa forma de amostragem, os indivíduos de uma população têm uma chance igual ou maior que zero de serem selecionados para a compor a amostra. Ela é chamada de amostra aleatória simples pois, a seleção de elementos é feita em forma de sorteio, dessa forma, não há critério ou filtro no processo de amostragem. Amostragem sistemática A amostra sistemática, assim como a amostra aleatória simples, é um método de amostra probabilística que seleciona indivíduos dentro de uma população já determinada. Contudo, há um fator matemático de seleção que as diferencia. Na amostra sistemática os elementos do universo a ser pesquisado são divididos em grupos numericamente iguais, assim, após essa segmentação é definidoum “ponto de partida”, de modo a estabelecer um número que se repetirá, em sequência, dentro de todos os grupos determinados, até que toda a amostragem seja selecionada. Amostragem estratificada A amostra estratificada é uma técnica de amostra probabilística que é realizada em duas etapas. Esse tipo de amostragem separa a população em grupos e subgrupos, buscando assim, uma amostra mais representativa. Para realizar uma amostra estratificada apenas dois passos são necessários. Primeiro, deve-se dividir a população em grupos distintos. Esses grupos devem ser segmentados com características da população que auxiliem o tema estudado, podendo ser idade, sexo, trabalho, nível de escolaridade, entre outros. Depois de distribuir a população nesses grupos, são utilizadas outras formas para eleger os entrevistados dentro de cada grupo, podendo adotar critérios aleatórios ou não. Assim, para selecionar uma amostra de forma não enviesada podemos utilizar a amostra aleatória simples ou sistemática. Amostragem por conglomerados Diferente das amostras probabilísticas anteriormente apresentadas, que selecionam primeiro o indivíduo, a amostra por conglomerados tem como fase inicial a seleção de um grupo (cidade ou estado em um país) para compor a amostragem. Distribuição amostral de médias A distribuição das médias amostrais representa a população de todas as possíveis médias oriundas de uma amostra de tamanho nn de variável aleatória. É a distribuição de probabilidades de uma medida estatística baseada em uma amostra aleatória. Distribuições amostrais são importantes porque fornecem uma grande simplificação, usada para inferência estatística. Mais especificamente, elas permitem considerações analíticas serem baseadas na distribuição amostral de uma estatística, em vez de na distribuição conjunta. O conceito de distribuição de probabilidade de uma variável aleatória será agora utilizado para caracterizar a distribuição dos diversos valores de uma variável em uma população. Ao retirar uma amostra aleatória de uma população consideraremos cada valor da amostra como um valor de uma variável aleatória cuja distribuição de probabilidade é a mesma da população no instante da retirada desse elemento para a amostra. Em consequência do fato de os valores de amostra serem aleatórios, decorre que qualquer quantidade calculada em função dos elementos da amostra também será uma variável aleatória. Erro padrão de média É uma medida de variação de uma média amostral em relação à média da população. Sendo assim, é uma medida que ajuda a verificar a confiabilidade da média amostral calculada. Para obter uma estimativa do erro padrão, basta dividir o desvio padrão pela raiz quadrada do tamanho amostral. Intervalo de confiança Um intervalo de confiança é uma amplitude de valores, derivados de estatísticas de amostras, que têm a probabilidade de conter o valor de um parâmetro populacional desconhecido. Devido à sua natureza aleatória, é improvável que duas amostras de uma determinada população irá render intervalos de confiança idênticos. Mas, é possível repetir sua amostra várias vezes, uma determinada porcentagem dos intervalos de confiança resultantes conteria o parâmetro populacional desconhecido. No intervalo de confiança para indicar a incerteza ou imprecisão acerca do tamanho do efeito calculado usando a amostra de estudo para estimar o verdadeiro tamanho do efeito na população de origem. Calcular o intervalo de confiança é uma estratégia que leva em conta o erro amostral: o tamanho do efeito e seu intervalo de confiança representam valores para a população de origem, e quanto mais estreito é o intervalo de confiança, maior é a certeza de que a estimativa baseada na população de estudo representa o verdadeiro tamanho do efeito na população de origem. Erro amostral: é a diferença entre o resultado amostral e o verdadeiro resultado populacional; tais erros resultam de flutuações amostrais aleatórias. Os erros amostrais ocorrem única e exclusivamente em função do número de elementos da amostra e do processo de seleção desses elementos. Estimativa de Proporções Quando os estudos em que o objetivo seja mais descritivo, como estimar uma proporção, o motivo de se calcular o tamanho da amostra é garantir uma determinada precisão na estimativa que será obtida. Por exemplo, ao estimarmos com 95% de confiança a prevalência de uma doença, será obtido um intervalo centralizado na estimativa pontual desta prevalência obtida na amostra com uma determinada margem de erro. Para este nível de confiança, supondo que tenhamos encontrado uma proporção de 0,30 (percentual de 30%), em uma amostra de 25 indivíduos, teremos uma margem de erro de 18 pontos percentuais. Já em uma amostra com 323 indivíduos, a margem de erro, em torno da mesma proporção de 0,30, será reduzida para 0,05 (ou 5 pontos percentuais). Portanto, a determinação do tamanho de uma amostra depende de quatro fatores: Proporção esperada Nível de confiança nos resultados Erro máximo de estimação Tamanho da população: número total de pessoas que compõem a população de interesse. Rogério PROCÓPIO da Cunha
Compartilhar