Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 PROBABILIDADE E ESTATÍSTICA Olá pessoal! Durante este módulo A 2015, observamos que é extremamente difícil definir estatística, e, tendo em vista que o seu domínio é muito amplo, o número de definições que encontramos é grande. Segundo Castanheira (2010), o dicionarista Aurélio Buarque de Holanda Ferreira definiu-a como uma parte da matemática, ou seja, é uma metodologia desenvolvida para coleta, classificação, a apresentação, a análise e a interpretação de dados quantitativos e a utilização desses dados para tomada de decisões. No estudo da estatística, é normal encontrarmos diversos termos específicos dessa área e eles devem ser de conhecimento dos profissionais de hoje. Por isto há necessidade de conhecermos alguns termos como População e Amostra, então vejam: População: é o conjunto de elementos que desejamos observar para obtermos determinados dados. Amostra: é o subconjunto de elementos retirados da população que estamos observando para obtermos determinados dados. Desta forma,quando estamos preparando uma pesquisa, devemos considerar o tipo de população que essa pesquisa abrangerá. Temos a população finita e a população infinita, ou seja: População finita: é quando sabemos exatamente o tamanho dela, por exemplo, vamos pesquisar a altura dos alunos de uma sala de aula com 50 alunos ou vamos pesquisar a variação de idade dos sócios do clube X etc. População infinita: é quando a população tem um número infinito de elementos ou é difícil de ser quantificada, por exemplo, a quantidade de rosas amarelas que florescem no outono no Brasil, ou a quantidade peixes X no oceano Atlântico etc. É comum o estatístico defrontar-se com a situação de dispor de tantos dados que se torna difícil absorver completamente a informação que está procurando investigar (CASTANHEIRA, 2008). Para isto, foi dividido em Estatística descritiva ou dedutiva, que é o tipo de estatística que tem por objetivo descrever e analisar determinada população sem, com isso, pretender tirar conclusões de caráter mais genérico. É a parte da estatística referente à coleta e à tabulação dos dados. Outro ramo da estatística aplicada é a Estatística Indutiva ou Inferência Estatística, que é quando admitirmos que os resultados obtidos na análise dos dados de uma amostra são válidos para toda a população da qual aquela amostra foi retirada. Consiste em obtermos e generalizarmos conclusões. Um estudo estatístico completo compreende oito fases distintas para que se chegue ao resultado final, ou seja: 2 1. Definição do problema; 2. Delimitação do problema; 3. Planejamento para obtenção dos dados; 4. Coletar os dados; 5. Apuração dos dados; 6. Apresentação dos dados; 7. Análise dos dados; 8. Interpretação dos dados. Uma vez concluída a coleta de dados e também a ordenação dos mesmos, devemos apresentá-las de tal forma que o leitor consiga identificar, rapidamente, uma série de informações. Para tal processo, a estatística costuma utilizar-se de duas ferramentas: tabelas e gráficos. Para as tabelas, a sua estrutura é constituída de: 1. Cabeçalho; 2. Corpo e 3. Rodapé. Outra definição que devemos compreender é sobre Classes ou Intervalos, que é quando o número de resultados obtidos em uma pesquisa é demasiadamente grande, sendo necessário agruparmos esses resultados em faixas de valores, denominados classes ou intervalos. Dentro da Estatística, encontramos o termo “Séries Estatísticas”, denominação dada a uma tabela na qual existe um critério distinto que a especifica e a diferencia. Existem cinco tipos de tabelas de Séries Estatísticas, cada uma tem particularidades que as definem e as diferenciam das outras. 1. Temporais (cronológica, evolutiva ou histórica) é quando esse tipo de série tem como característica a variação do tempo (época), enquanto o local (fator geográfico) e o fato (fenômeno) permanecem fixos. ANO EXPORTAÇÕES (em US$ 1.000.000,00) 2008 344 2009 434 2010 667 2011 892 2012 1.465 Fonte: Estatística Aplicada a todos os níveis, adaptado. Podemos observar na tabela que as Séries Temporais (cronológicas, evolutivas ou históricas) têm como característica a variação do tempo (época), enquanto o local (fator geográfico) e o fato (fenômeno) permanecem fixos. 3 2. Geográficas Região Quantidade de microempresas Norte 8.879 Sul 23.986 Sudeste 45.901 Centro oeste 7.987 Nordeste 16.439 Fonte: IBGE, Censo Demográfico 2000, adaptado. Séries Estatísticas geográficas – sua característica é a variação do local de ocorrência (fator geográfico), enquanto tempo (a época) e o fato (o fenômeno) permanecem fixos. 3. Específicas: esse tipo de série é caracterizado pela variação do fato (variação do fenômeno), enquanto local e o tempo são constantes. Cursos ofertados Número de candidatos Logística 5.980 Recursos humanos 3.120 Gestão ambiental 2.331 Saúde ocupacional 1.567 Gestão da produção 6.025 Fonte: Estatística Aplicada a todos os níveis, adaptado. Séries Estatísticas específicas – sua característica é a variação do fato (variação do fenômeno), enquanto local e o tempo são constantes. 4. Conjugadas: esse tipo de série, também conhecida como série mista, é caracterizada pela existência da combinação entre as séries temporais, geográficas e específicas. 5. De distribuição de frequência. Sabemos que uma característica que observamos em uma pesquisa e que pode assumir diferentes valores é chamada de variável. As variáreis são classificadas em: 1. Qualitativas: A variável qualitativa é a que descreve qualidades, categorias ou atributos que normalmente não podem ser expressos em valores numéricos. Variável qualitativa nominal – permite somente a classificação dos dados. Ex.: sexo, cor da pele, origem, ramo de atividade de uma empresa etc. 4 Variável qualitativa ordinal – permite que se estabeleça uma ordem nos seus resultados. Ex.: grau de instrução, status social, classificação em um concurso, classe social, ordem de chegada etc. 2. Quantitativas: a variável quantitativa é expressa por meio de valores numéricos e pode relacionar todos os possíveis valores que ela pode assumir. Exemplo: número de peças defeituosas, quantidade de máquinas disponíveis, volume de água em reservatórios, altura dos empregados, temperatura ambiente etc. Após a realização de uma pesquisa, uma série de etapas é realizada, desde a tabulação dos dados (normalmente em tabelas) até a sua análise e suas conclusões. Dependendo do tipo de tabela gerada, podemos precisar fazer o cálculo da Mediana desses dados. A mediana de um conjunto de dados é o valor que ocupa a posição central desses dados, desde que estejam colocados em ordem crescente ou decrescente, ou seja, em um rol. Caso a quantidade de dados seja par, o valor da mediana será a média aritmética dos dois valores que estão no centro da série. Veja o Exemplo 1 a seguir e o passo a passo: 10 - 7 - 12 - 6 - 10 - 9 1º. Passo colocar em ordem crescente: 6 – 7 – 9 – 10 – 10 - 12 2º. Passo é verificar se a quantidade de dados é par ou impar, nesse caso é par então a mediana é a média aritmética dos dois valores centrais da série, ou seja: Md= (9+ 10)/2 Md = 9,5 Exemplo 2 9 - 6 - 5 - 4 - 8 - 9 - 10 - 4 - 7 - 8 - 5 - 6 - 10 Seguindo o mesmo raciocínio temos: 1º. Passo colocar em ordem crescente: 4 - 4 – 5 – 5 - 6 – 6 - 7 – 8 - 8 – 9 - 9 – 10 – 10 5 2º. Passo é verificar se a quantidade de dados é par ou impar, nesse caso é impar então a mediana é o valor central da série,ou seja: Md= 7 Exemplo 3 4, 7, 3, 9, 6, 15, 4, 7, 8, 10, 5, 3, 1 1º. Passo colocar em ordem crescente: 1, 3, 3, 4, 4, 5, 6, 7, 7, 8, 9, 10, 15 2º. Passo é verificar se a quantidade de dados é par ou impar, nesse caso é impar então a mediana é o valor central da série, ou seja: Md= 6 Exemplo 4 Neste caso, foi dado uma tabela que deverá ser analisada, veja que são os resultados de uma pesquisa feita em uma sala de aula, em relação à altura dos alunos, obtivemos os dados agrupados na tabela 1. Podemos então calcular a altura Mediana (Md) desses alunos da seguinte forma: ALTURA DOS ALUNOS FREQUÊNCIA 163 cm 3 165 cm 4 167 cm 8 169 cm 5 171 cm 5 173 cm 7 175 cm 5 177 cm 3 Fonte: Estatística Aplicada a todos os níveis, adaptado. 1º Verificar a quantidade de dados (n = ?). Para isso, fazer a frequência acumulada e verá que é 40, portanto, n = 40 “par”. 2º Como é par, a Mediana (Md) será a média dos dois elementos centrais. 3º Os elementos centrais são: os 20º e 21º , em que o 20º tem 169 cm e o 21º 171 cm. 4º Calcular a média entre eles: (169 + 171) / 2 = 170 cm, essa é a Md. 6 Continuando com nosso estudo de estatística, podemos observar que um valor muito usado nos cálculos é a Moda (Mo) de uma amostra ou população. A Moda (Mo) é o valor dos resultados de uma pesquisa que acontecem com a maior frequência. Agora vamos observar na tabela qual é o valor modal e como foi encontrado. ALTURA DOS PILOTOS FREQUÊNCIA 167 cm 10 168 cm 12 169 cm 13 170 cm 15 171 cm 9 Fonte: Estatística Aplicada a todos os níveis, adaptado. O valor modal (Mo) é 170 cm, pois, para se determinar o valor modal de uma distribuição sem agrupamento, deve-se observar qual variável tem a maior frequência. Outro termo utilizado é a variância, que é a média aritmética dos quadrados dos desvios. Falando em desvio, observemos o conjunto de números inteiros abaixo, e vamos determinar o desvio médio desses valores em relação à média. Exemplo 5 8, 4, 6, 9, 10, 5 Dm = [∑|X - média aritmética|x f]/n X= (8 + 4 + 6 + 9 + 10 + 5)/6 X = 42/6 X = 7 Xi Xi - X I Xi – X I 4 4 – 7 = - 3 3 5 5 – 7 = -2 2 6 6 – 7 = - 1 1 8 8 – 7 = 1 1 9 9 – 7 = 2 2 10 10 – 7 = 3 3 ∑ 0 12 Dm = 12/6 → Dm = 2 7 Exemplo 6 Para o conjunto de números inteiros, vamos então calcular a variância do conjunto, supondo que esses valores correspondam a uma amostra. 8, 4, 6, 9, 10, 5 S2 = [∑(X - média aritmética)2 x f]/(n – 1) X= (8 + 4 + 6 + 9 + 10 + 5)/6 X = 42/6 X = 7 Xi Xi - X S2 4 4 – 7 = - 3 9 5 5 – 7 = -2 4 6 6 – 7 = - 1 1 8 8 – 7 = 1 1 9 9 – 7 = 2 4 10 10 – 7 = 3 9 ∑ 0 28 S2 = 28/6-1 = 28/5 S2 = 5,6 Exemplo 7 Para o conjunto de números inteiros, vamos calcular o desvio padrão do conjunto, supondo que esses valores correspondam a uma amostra. 8, 4, 6, 9, 10, 5 S = desvio padrão “é igual a raiz quadrada da variância”. S2 = [∑(X - média aritmética)2 x f]/(n – 1) X= (8 + 4 + 6 + 9 + 10 + 5)/6 X = 42/6 8 X = 7 Xi Xi - X S2 4 4 – 7 = - 3 9 5 5 – 7 = -2 4 6 6 – 7 = - 1 1 8 8 – 7 = 1 1 9 9 – 7 = 2 4 10 10 – 7 = 3 9 ∑ 0 28 S2 = 28/6-1 = 28/5 S2 = 5,6 S = desvio padrão “é igual a raiz quadrada da variância”. S = √ S2 S = 2,36 Exemplo 8 Em uma distribuição de frequências, verificou-se que a mediana é igual a 15,40, a média é igual a 16,00 e o desvio padrão é igual a 6,00. Iremos então calcular segundo coeficiente de assimetria de Pearson, com duas casas depois da vírgula. As = 3 x (Média aritmética – Md) / S, ou seja, As= 3 . (média – mediana)/desvio padrão As = 3 (16 – 15,4) / 6 As = 3 (0,6) / 6 As = 1,8 / 6 As = 0,30 9 Exemplo 9 Em 100 lances de uma moeda honesta, qual a média esperada de caras obtidas e qual o desvio padrão do experimento? Média = 100 (1/2) = 50 S2 = 100 (1/2) . (1/2) = 25 S = 5 “Os fenômenos estudados em estatística são fenômenos cujo resultado, mesmo em condições normais de experimentação, variam de uma observação para outra, dificultando dessa maneira a previsão de um resultado futuro.” (Castanheira, 2010). Ainda, de acordo com (Castanheira, 2010) Historicamente, a teoria da probabilidade começou com o estudo dos jogos de azar, como a roleta e as cartas. Hoje, suas aplicações são inúmeras. Exemplo 10 Uma bola é retirada ao acaso de uma urna que contém 6 bolas vermelhas, 8 bolas pretas e 4 bolas verdes. Desta forma será necessário demonstrar o cálculo da probabilidade dela não ser preta. Vejamos: A bola retirada não pode ser preta; logo, poderá ser vermelha ou verde. Então: P (Vermelha ou Verde) = P (Vermelha) + P (Verde) P (Vermelha ou Verde) = 6/18 + 4/18 P (Vermelha ou Verde) = 10/18 Exemplo 11 Cálculo de Probabilidade: Qual a probabilidade de obtermos o total de seis (6) pontos na jogada de dois (2) dados honestos? S = {36 resultados possíveis} A = {a soma dos dois dados é igual a 6} A = {(1, 5), (2, 4), (3, 3), (4, 2), (5, 1)} P(A) = 5/36 Outras definições que necessitados compreender são: dados brutos, rol e frequência. 10 1 Dados brutos: são as relações dos resultados obtidos em uma pesquisa e que foram transcritos aleatoriamente, ou seja, fora de qualquer ordem. 2 Rol: é a relação dos resultados obtidos em uma pesquisa e que foram colocados em ordem numérica, crescente ou decrescente. 3 Frequência: é o número de vezes que um mesmo resultado acontece durante uma pesquisa. Exemplo 12 Para calcular a média das idades representadas na distribuição de frequências da tabela abaixo, podemos resolvê-las da seguinte forma: Idade Frequência 4 4 5 6 6 6 7 4 Média = 4 .4 + 5 . 6 + 6 . 6 + 7 . 4 / 20 Média = 16 + 30 + 36 + 28 / 20 Média = 110 / 20 = 5,5 Exemplo 13 Para calcularmos o desvio médio do seguinte conjunto de números, podemos resolvê-los desta forma: 4, 6, 8, 9, 10 e 11. Inicialmente devemos calcular a média aritmética dos valores dados: Média = 4 + 6 + 8 + 9 + 10 + 11 / 6 Média = 8 Em seguida: 4 4 – 8 = - 4 4 6 6 – 8 = - 2 2 8 8 – 8 = 0 0 9 9 – 8 = 1 1 10 10 – 8 = 2 2 11 11 – 8 = 3 3 ∑ 0 12 11 Desvio médio = 12 / 6 = 2 Há várias definições como já foi comentado, e uma delas é a hipótese, esta pode ser nula ou alternativa. Nisto há algo que necessitamos saber, ou seja, a diferença entre hipótese nula (H0) de hipótese alternativa (H1). Hipótese nula: é a hipótese que será testada, ou seja, é a informação a respeito do valor do parâmetro que desejamos avaliar. Hipótese alternativa: é a hipótese que afirma que a hipótese nula é falsa, ou seja, é a afirmação a respeito do valor do parâmetro que aceitaremos como verdadeiro, caso a hipótese nula seja rejeitada. A média correspondente ao centro de gravidade dos dados; a variância e o desvio padrão medem a variabilidade; mas a distribuição dos pontos sobre um eixo ainda tem outras características, que podem ser medidas – uma delas á a assimetria. Estas medidas de assimetria, também são denominadas de medidas de enviesamento, indicam o grau de deformação de uma curva de frequência. Uma distribuição de frequências ideal seria aquela em que a curva resultante simétrica, o que dificilmente acontece na prática. Observe as figuras abaixo conforme o tipo de distribuição que será representada graficamente. Distribuição simétrica Distribuição assimétrica negativa. Distribuição assimétricapositiva. Diante de um conjunto de dados e desejando efetuar uma análise criteriosa, notamos algumas características para tomada de decisão. Entre elas estão as medidas de posição, as medidas de dispersão e as medidas de assimetria. Entretanto entre elas temos outra ferramenta estatística denominada de medidas de curtose. Estas podem ser: 1 Distribuição normal, damos o nome de curva mesocúrtica; 2 Distribuição alongada, damos o nome de curva leptocúrtica; 3 Distribuição achatada, damos o nome de curva platicúrtica. Bons Estudos Prof. Emerson Seixas
Compartilhar