Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 2 1. Modelos Discretos de Distribuições de Probabilidades 1.1. Lei binomial da probabilidade - Ensaios de Bernoulli Consideremos um experimento que consiste em uma seqüência de ensaios ou tentativas independentes, isto é, ensaios nos quais a probabilidade de um resultado em cada ensaio não depende dos resultados ocorridos nos ensaios anteriores, nem dos resultados nos ensaios posteriores. Em cada ensaio, podem ocorrer apenas dois resultados, um deles que chamaremos de sucesso (S) e outro que chamaremos de fracasso (F). À probabilidade de ocorrer sucesso em cada ensaio chamaremos de p; a probabilidade de fracasso chamaremos de q, de tal modo que q=1–p . Tal tipo de experimento recebe o nome de ensaio de Bernoulli . Exemplos de ensaio de Bernoulli 1) Uma moeda é lançada 5 vezes. Cada lançamento é um ensaio, em que dois resultados podem ocorrer: cara ou coroa. Chamemos de sucesso o evento sair uma cara e de fracasso o evento sair uma coroa . Em cada ensaio, p=0,5 e q=0,5. 2) Uma urna contém 4 bolas vermelhas e 6 brancas. Uma bola é extraída, observada sua cor e reposta na urna; este procedimento é repetido 8 vezes. Cada extração é um ensaio, em que dois resultados podem ocorrer: bola vermelha ou bola branca. Chamemos de sucesso o evento sair bola vermelha . Conseqüentemente, fracasso corresponde ao evento sair bola branca . Neste caso, 10 4 p = e 10 6 q = . 1.2. Distribuição Binomial Antes de apresentarmos a fórmula e suposições da distribuição Binomial de probabilidades, vamos analisar um exemplo e deduzir a fórmula a partir dele. Exemplo 1: uma prova consta de 10 testes com 5 alternativas cada um, sendo apenas uma delas correta. Um aluno que nada sabe a respeito da matéria avaliada, “chuta” uma resposta para cada teste. Qual é a probabilidade dele acertar exatamente 6 testes? A probabilidade de acertar um teste aleatoriamente é 2,0 5 1 = . Logo, a de errar esse teste é de 8,0 5 4 5 1 1 ==− . 3 Vamos considerar uma situação bastante específica: o aluno acerta os testes de 1 à 6 e erra os testes de 7 à 10. A probabilidade de isso acontecer é obtida utilizando–se o Princípio Fundamental da Contagem: 0,2 . 0,2 . 0,2 . 0,2 . 0,2 . 0,2 . 0,8 . 0,8 . 0,8 . 0,8 = = (0,2)6 . (0,8)4 ≅ 0,000026 ou 0,0026%. Porém, essa é apenas uma situação de acertos / erros possível. O número total de maneiras que esse aluno pode acertar 6 testes de um total de 10 testes é calculada utilizando–se combinação (visto que a ordem dos acertos NÃO importa): 210 )!610!.(6 !10 C 6,10 =− = maneiras. Para cada uma dessas 210 formas, temos uma probabilidade de acerto igual a calculada anteriormente. Logo, a probabilidade de esse aluno acertar 6 testes qualquer é: 210 . (0,2)6 . (0,8)4 ≅ 0,0055 ou 0,55%. Vamos definir a variável aleatória X que representa sucesso como sendo: X: número de testes que o aluno acerta (sucesso). Associada a X, temos a probabilidade de sucesso p=0,2 e, conseqüentemente, a probabilidade de fracasso q=1–0,2=0,8 (probabilidade de errar o teste). Lembrando que = 6 10 C 6,10 , podemos escrever que a probabilidade do aluno acertar 6 testes é: P(X=6) = 6 10 . (0,2)6 . (0,8)4 Generalizando, se em cada uma das n repetições de Ensaios de Bernoulli a probabilidade de ocorrer um evento definido como sucesso é sempre p, a probabilidade de que esse evento ocorra em apenas k das n repetições é dada por: knk )p1.(p. k n )kX(P −− == 4 Resumindo: um experimento binomial deve satisfazer os seguintes critérios: 1) O experimento é repetido n vezes , onde cada tentativa é independente das demais. 2) Há apenas dois resultados possíveis em cada tentativa: um de interesse, associado à variável X, chamado de sucesso e o seu complementar que é o fracasso . 3) A probabilidade de sucesso será denotada por p e é a mesma em cada tentativa (entenda Ensaio de Bernoulli). Logo, a probabilidade de fracasso será denotada por q = 1 – p. Observações importantes: é comum àqueles que estão iniciando os estudos da distribuição Binomial acharem que a variável definida como sucesso precisa ser algo “bom”. Porém, isso não está correto. A variável X, ou seja, o sucesso, deverá ser algo que nos interesse. Por exemplo, poderíamos definir como sucesso: – alunos reprovados em determinado ano; – número de óbitos em uma UTI; – número de fumantes presentes em uma reunião; – acertar um alvo num torneio de tiro; – entrevistados serem do sexo masculino; – sair cara no lançamento de uma moeda; – sair face 5 ou 6 no lançamento de um dado. Ou seja, a variável sucesso pode ser ou pode não ser algo bo m! Às vezes, pode ser algo imparcial, como face de uma moeda ou dado, ou sexo de uma pessoa. Exemplo 2: para entender melhor a fórmula, vamos recapitular o cálculo de probabilidades com base em um exemplo. Responda rapidamente a pergunta: um casal deseja ter 4 filhos, 2 homens e 2 mulheres. Supondo que a probabilidade de nascimento de um homem (H) ou uma mulher (M) seja a mesma, qual a probabilidade de tal fato acontecer? Muitas pessoas respondem 50%. Se você foi uma delas, a pergunta seguinte possivelmente será “por quê? Não é???”. A resposta é não! O que mostra que muitas vezes a intuição nos engana, enfatizando a importância da probabilidade (veja, por exemplo, o caso de um médico obstetra ou um laboratório que muitas vezes precisa conhecer cálculos de probabilidades como este). Faremos, inicialmente, um método mais trabalhoso, mas que certamente convencerá o leitor de que tal probabilidade não é 50%. Depois, faremos o cálculo utilizando um modelo probabilístico. Listemos todas as possibilidades de nascimentos: 5 HHHH HHHM HHMH HMHH MHHH HHMM HMHM MHHM HMMH MHMH MMHH HMMM MHMM MMHM MMMH MMMM Das 16 possibilidades listadas, note que em 6 delas ocorrem o nascimento de 2 homens e 2 mulheres. Logo, a probabilidade disso ocorrer é: 37,5% ou 375,0 16 6 P == . Ou seja, a probabilidade é inferior a 50%, mais precisamente, vale 37,5%, o que contradiz a intuição da maioria das pessoas. Uma outra forma de resolver esse mesmo problema é utilizando a Binomial. Agora, para resolvermos essa situação apresentada através da Binomial, vamos determinar que nosso interesse seja o número de homens que nascem. Essa ocorrência será chamada de sucesso. Assim: X: número de homens que nascem (sucesso) Logo, nascer mulher indicaria fracasso. Não é nenhum tipo de preconceito, mas sim, uma questão Estatística. Poderíamos, sem problemas, ter trocado homem por mulher e vice-versa. A probabilidade de sucesso é a probabilidade de em um nascimento qualquer ocorrer um homem, ou seja, 5,0 2 1 p == . Temos interesse que, em 4 nascimentos, 2 sejam homens e 2 sejam mulheres. Como chamamos de sucesso nascer homem, temos interesse no nascimento de 2 6 homens ou, em linguagem matemática, X=2. Logo, o valor de k é 2 (basta comparar a fórmula X=k com o que acabamos de escrever X=2). Obtemos, portanto: 375,0 8 3 4 1 . 4 1 .6 2 1 1. 2 1 . 2 4 )2X(P 242 === − == − , que é o mesmo valor obtido utilizando o método anterior. Cabe ressaltar que a fórmula apresentada não tem caráter místico algum. É possível fazer a sua dedução e, para isso, basta utilizarmos a lógica desenvolvida no método anterior. Vejamos: Suponhamos 4 caixas numeradas, e que iremos colocar em cada uma delas um cartão que possui uma letra H ou um cartão que possui uma letra M. Suponhamos que temos um par de cartões “mestre” que serão utilizados na escolha de uma das letras e que tenhamos uma outra pilha de cartões que serão colocados nas caixas. Inicialmente, escolheremos duas delas para colocarmos um cartão que possui a letra H. O número de maneiras que podemos fazer tal escolha não depende da ordem,ou seja, escolher a caixa 1 e 3 é indiferente de escolher a 3 e 1, visto que colocaremos cartas iguais dentro de cada uma delas. Utilizamos a combinação: 6 2 4 C 2,4 = = Logo, há 6 maneiras de se fazer tal escolha. Fixemos uma das escolhas, como por exemplo, H nas caixas 1 e 3. Nas caixas 2 e 4 colocaremos cartas com a letra M. A probabilidade de tal fato ocorrer pode ser expressa através do princípio multiplicativo. A probabilidade de ocorrer cada H é de 0,5 (pois sorteamos as letras a partir dos cartões-mestre) e de ocorrer M também é 0,5. Assim, a probabilidade de sortearmos H na primeira vez, M na segunda, H na terceira e M na quarta é dada por 1 2 3 4 H H M H Cartões mestre 7 0,5.0,5.0,5.0,5 = (0,5)4 = 0,0625. Como tal fato (2 H e 2 M) pode ocorrer de 6 maneiras diferentes temos que a probabilidade final fica P = 6 . 0,0625 = 0,375. Note que 0,5 = 1 – 0,5 = 1 – p. O raciocínio aqui desenvolvido é o mesmo que se faz para deduzir a fórmula da Distribuição Binomial. Exemplo 3: uma urna tem 4 bolas vermelhas (V) e 6 brancas (B). Uma bola é extraída, observada sua cor e reposta na urna. O experimento é repetido 5 vezes. Qual a probabilidade de observarmos exatamente 3 vezes bola vermelha? Inicialmente, vamos definir a variável aleatória de interesse: X: número de bolas vermelhas observadas (sucesso ). Logo, a probabilidade de sucesso será p=4/10=0,4. Utilizando a fórmula apresentada, em que n=5 (número de retiradas) e k=3 (número de bolas vermelhas que temos interesse em observar), temos: 2304,06,0.4,0. 3 5 )4,01.(4,0. 3 5 )3X(P 23353 = =− == − ou 23,04%. Exemplo 4: numa cidade, 10% das pessoas possuem carro de marca A. Se 30 pessoas são selecionadas ao acaso, com reposição, qual a probabilidade de exatamente 5 pessoas possuírem carro de marca A? Definindo X: número de pessoas que possuem o carro da marca A (sucesso), temos associada uma probabilidade de sucesso p=0,10. Sendo n=30 e k=5, temos: 1023,09,0.1,0. 5 30 )1,01.(1,0. 5 30 )5X(P 2555305 ≅ =− == − ou 10,23%. Exemplo 5: admite–se que uma válvula eletrônica, instalada em determinado circuito, tenha probabilidade 0,3 de funcionar mais de 600 horas. Analisando–se 10 válvulas, qual será a probabilidade de que, entre elas, pelo menos 3 continuem funcionando após 600 horas? 8 Seja X: número de válvulas que permanecem funcionando após 600 horas. Temos que a probabilidade de sucesso é p=0,3. Perceba que estamos realizando 10 Ensaios de Bernoulli (n=10). Logo, queremos calcular: P(X≥3) = P(X=3) + P(X=4) + P(X=5) + ... + P(X=9) + P(X=10). Note que teríamos que calcular cada uma das probabilidades envolvidas nessa soma utilizando a fórmula apresentada, ou seja, teríamos que aplicar a fórmula 8 vezes para, em seguida, somar todos os resultados. Neste caso, vamos utilizar uma propriedade, já vista, de eventos complementares: P(X≥3) = 1 – P(X<3) = = 1 – [ P(X=0) + P(X=1) + P(X=2)] = = − +− +− − −−− 210211010100 )3,01.(3,0. 2 10 )3,01.(3,0. 1 10 )3,01.(3,0. 0 10 1 = = + + − 8291100 7,0.3,0. 2 10 7,0.3,0. 1 10 7,0.3,0. 0 10 1 = = 1 – 0,3828 = 0,6172 ou 61,72%. Exemplo 6: em uma grande pesquisa com 6000 respondentes, determinou–se que 1500 dos entrevistados assistiam determinado programa de TV. Se 20 pessoas são escolhidas ao acaso, qual a probabilidade de que ao menos 19 assistam a esse programa? Definindo a variável aleatória que indica sucesso: X: número de pessoas que assistem ao programa. Perceba que a probabilidade de sucesso (p) pode ser calculada a partir do enunciado: 25,0 6000 1500 p == . Logo, queremos calcular: P(X≥19) = P(X=19) + P(X=20) = = 020119 75,0.25,0. 20 20 75,0.25,0. 19 20 + = ≅ 5,5.10–11, ou seja, a probabilidade de 19 ou 20 pessoas assistirem ao programa é muito pequena, quase zero, visto que vale 0,0000000055%. 9 Exemplo 7: vamos supor o lançamento de uma moeda honesta (ou seja, P(cara)=P(coroa)=0,5). Suponhamos que você faça uma aposta com um amigo seu: ganha aquele que obtiver mais caras (no seu caso) ou coroas (no caso dele) em 7 lançamentos. A probabilidade de você ganhar ocorre quando saírem 4 ou 5 ou 6 ou 7 caras. Utilizando o modelo Binomial onde: X: número de caras (sucesso) n = 7 lançamentos k = 4,5,6,7 p = 0,5 temos: P(ganhar) = P(X=4) + P(X=5) + P(X=6) + P(X=7) = 5,0 2 1 .1 2 1 .7 2 1 .21 2 1 .35 2 1 1 2 1 7 7 2 1 1 2 1 6 7 2 1 1 2 1 5 7 2 1 1 2 1 4 7 7777 777676575474 = + + + = = − + − + − + − = −−−− Resultado interessante, não? Ou seja, ao invés de fazer essa aposta, poderiam ter feito a tradicional aposta de cara x coroa. Exemplo 8: Suponhamos a mesma situação do exemplo anterior, mas agora, você pega, sem seu amigo perceber, uma moeda viciada em que a probabilidade de ocorrer uma cara é de 0,75 ou 4 3 . Neste caso, p=0,75 e a probabilidade de você ganhar é: P(ganhar) = P(X=4) + P(X=5) + P(X=6) + P(X=7) = 9294,0 4 3 1 4 3 7 7 4 3 1 4 3 6 7 4 3 1 4 3 5 7 4 3 1 4 3 4 7 777676575474 ≅ − + − + − + − = −−−− ou 92,94%. Logo, é muito provável que você ganhe a aposta usando essa moeda viciada. Exemplo 9: Overbooking é prática realizada na aviação do mundo todo. Consiste na empresa aérea vender mais bilhetes do que o disponível no vôo com base na média de desistência dos vôos anteriores. Uma empresa aérea possui um avião com capacidade para 100 lugares. Se para um certo vôo essa empresa vendeu 103 passagens e, admitindo que a probabilidade de um passageiro não 10 comparecer para embarque é de 1%, qual a probabilidade de algum passageiro não conseguir embarcar? Este é um problema clássico resolvido utilizando a Binomial. Aqui, é muito comum haver uma certa confusão na elaboração do que é o sucesso bem como do que se deseja calcular. Assim, vamos definir: X: número de passageiros que comparecem ao embarque (sucesso). Neste caso, p=0,99. Temos, ainda, que n=103, visto que cada um dos 103 passageiros pode comparecer ao embarque (sucesso) ou não comparecer (fracasso). Queremos calcular a probabilidade de que algum passageiro não consiga embarcar, ou seja, de que compareçam ao embarque mais de 100 passageiros: P(X>100) = P(X=101) + P(X=102) + P(X=103) = = 010311022101 01,0.99,0. 103 103 01,0.99,0. 102 103 01,0.99,0. 101 103 + + = = 010311022101 01,0.99,0.101,0.99,0.10301,0.99,0.5253 ++ = = 0,9150 ou 91,50%. Espantoso? Pois é, a probabilidade de haver problemas devido ao excesso de passageiros para esse vôo é bastante elevada e igual a 91,5%. 1.3. Exercícios 1) Uma moeda é lançada 6 vezes. Qual a probabilidade de observarmos exatamente duas caras? 2) Um dado é lançado 5 vezes. Qual a probabilidade de que o “4” apareça exatamente 3 vezes? 3) Uma pessoa tem probabilidade 0,2 de acertar num alvo toda vez que atira. Supondo que as vezes que ela atira são ensaios independentes, qual a probabilidade de ela acertar no alvo exatamente 4 vezes, se ela dá 8 tiros? 4) A probabilidade de que um homem de 45 anos sobreviva mais 20 anos é 0,6. De um grupo de 5 homens com 45 anos, qual a probabilidade de que exatamente 4 cheguem aos 65 anos? 5) Uma moeda é lançada 6 vezes. Qual a probabilidade deobservarmos ao menos uma cara? 6) Um time de futebol tem probabilidade p = 0,6 de vencer todas as vezes que joga. Se disputar 5 partidas, qual a probabilidade de que vença ao menos uma? 11 7) Uma prova consta de 5 testes com 4 alternativas casa um, sendo apenas uma delas correta. Um aluno que nada sabe a respeito da matéria da prova, “chuta” uma resposta para cada teste. Qual é a probabilidade desse aluno: a) acertar os 5 testes? b) acertar apenas 4 testes? c) acertar apenas 3 testes? d) acertar apenas 2 testes? e) acertar apenas 1 teste? f) errar todos os testes propostos? g) qual o resultado mais provável obtido pelo aluno? 8) Foi realizada uma pesquisa com 500 pessoas para verificar se assistiam determinado programa de televisão. Duzentas pessoas afirmaram assistir. Se, a partir da população, retirarmos 8 indivíduos, qual é a probabilidade de que no máximo 6 assistam o programa? 9) Um aluno tem o domínio de 70% do conteúdo que será cobrado em uma prova. Sabendo–se que essa prova é composta por 10 questões, qual a probabilidade de ele acertar, ao menos, 7 questões para ser aprovado? 10) Em uma UTI, em média 5% dos bebês que nascem prematuros não sobrevivem. Se, atualmente, há 40 bebês prematuros, qual a probabilidade de que no máximo 5% dos bebês não sobrevivam? 11) Em 320 famílias com quatro crianças cada uma, quantas famílias seria esperado que tivessem: a) nenhuma menina? b) três meninos? c) quatro meninos? 12) Um time X tem 3 2 de probabilidade de vitória sempre que joga. Se X jogar cinco partidas, calcule a probabilidade de: a) X vencer exatamente três partidas; b) X vencer ao menos uma partida; c) X vencer mais da metade das partidas. 13) A probabilidade de um atirador acertar o alvo é 3 1 . Se ele atirar seis vezes, qual a probabilidade de: a) acertar exatamente dois tiros? b) não acertar o alvo? 14) Se 5% das lâmpadas de certa marca são defeituosas, ache a probabilidade de que, numa amostra de 100 lâmpadas, escolhidas ao acaso, tenhamos: 12 a) nenhuma defeituosa; b) três defeituosas; c) mais do que uma boa. Respostas 1) 0,2344 2) 0,03215 3) 0,4588 4) 0,2592 5) 0,98439 6) 0,9898 7) a) 1/1024 b) 15/1024 c) 90/1024 d) 470/1024 e) 405/1024 f) 243/1024 g) O resultado mais provável é que o aluno acerte apenas 1 teste. 8) 0,9915 9) 0,6496 10) 0,6767 11) a) 20 b) 80 c) 20 12) a) 80/243 b) 242/243 c) 64/81 13) a) 80/243 b) 64/729 14) a) (0,95)100 b) 3 100 (0,05)3.(0,95)97 c) 1–(0,05)100 – 100.(0,95).(0,05)99 13 1.4. Distribuição Geométrica Muitas situações reais podem ser repetidas até atingir–se o sucesso. Um candidato pode prestar uma prova de vestibular até ser aprovado, ou você pode digitar um número de telefone várias vezes até conseguir completar a ligação. Situações como essas podem ser representadas por uma distribuição Geométrica. Uma distribuição pode ser considerada Geométrica se satisfizer as seguintes condições: 1) Uma tentativa (correspondente a um Ensaio de Bernoulli) é repetida até que o sucesso ocorra, ou seja, ocorrem k–1 fracassos até que ocorra o primeiro sucesso na k–ésima tentativa. 2) As tentativas são independentes umas das outras. 3) A probabilidade de sucesso p é constante em todos os Ensaios de Bernoulli. Logo, a probabilidade de que ocorra sucesso na tentativa k é: P(X=k) = p.(1–p)k–1 com k=1,2,3,4... Ou seja, ocorrem k–1 fracassos com probabilidade 1–p até que ocorra um sucesso na tentativa k com probabilidade p . Exemplo 1: uma linha de produção está sendo analisada para efeito de controle da qualidade das peças produzidas. Tendo em vista o alto padrão requerido, a produção é interrompida para regulagem toda vez que uma peça defeituosa é observada. Se 0,01 é a probabilidade da peça ser defeituosa, determine a probabilidade de ocorrer uma peça defeituosa na 1ª peça produzida, na 2ª, na 5ª, na 10ª, na 20ª e na 40ª. Vamos admitir que cada peça tem a mesma probabilidade de ser defeituosa, independentemente da qualidade das demais. Sendo a ocorrência de peça defeituosa um sucesso, podemos aplicar o modelo Geométrico. Definindo a variável aleatória com distribuição geométrica X: número total de peças observadas até que ocorra a primeira defeituosa, podemos escrever nosso modelo: P(X=k) = 0,01 . 0,99k–1 Assim, podemos aplicar nosso modelo para calcular as probabilidades pedidas: P(X=1) = 0,01 . 0,990 = 0,01 P(X=2) = 0,01 . 0,991 = 0,0099 P(X=5) = 0,01 . 0,994 = 0,0096 14 P(X=10) = 0,01 . 0,999 = 0,0091 P(X=20) = 0,01 . 0,9919 = 0,0083 P(X=40) = 0,01 . 0,9939 = 0,0068 Exemplo 2: por experiência, você sabe que a probabilidade de que você fará uma venda em qualquer telefone dado é 0,23. Encontre a probabilidade de que sua primeira venda ocorra na quarta ou na quinta ligação. X: número da primeira ligação em que ocorre a venda (sucesso). P(X=4) = 0,23 . 0,773 ≅ 0,105003 P(X=5) = 0,23 . 0,774 ≅ 0,080852 Logo, a probabilidade desejada é: P(venda na 4ª ou 5ª ligação) = P(X=4) + P(X=5) = 0,105003 + 0,080852 ≅ 0,186. Embora um sucesso possa, teoricamente, nunca ocorrer, a distribuição geométrica é uma distribuição de probabilidade discreta porque os valores de x podem ser listados – 1,2,3.... Perceba que conforme x se torna maior, P(X=x) se aproxima de zero. Por exemplo: P(X=50) = 0,23 . 0,7749 ≅ 0,0000006306. Observação: o desvio padrão é calculado como sendo a raiz quadrada da variância, assim como já estudamos anteriormente. 1.5. Exercícios 1) Considere uma variável aleatória X com distribuição Geométrica com parâmetro p=0,4. Calcule: a) P(X = 4). b) P(3 ≤ X < 5). c) P(X ≥ 2). 2) Uma moeda equilibrada é lançada sucessivamente, de modo independente, até que ocorra a primeira cara. Seja X a variável aleatória que conta o número de lançamentos anteriores à ocorrência de cara. Determine: a) P(X ≤ 2). b) P(X > 1). c) P(3 < X ≤ 5). 15 3) Suponha que a probabilidade de que você faça uma venda durante qualquer um dos telefonemas feitos é 0,19. Encontre a probabilidade de que você: a) faça sua primeira venda durante a quinta ligação; b) faça sua primeira venda durante a primeira, segunda ou terceira ligação; c) não faça uma venda durante as três primeiras ligações. 4) Um produtor de vidro descobre que 1 em cada 500 itens de vidro está torcido. Encontre a probabilidade de: a) o primeiro item de vidro torcido ser o décimo item produzido; b) o primeiro item de vidro torcido ser o segundo ou terceiro item produzido; c) nenhum dos dez primeiros itens de vidro estar imperfeito. Respostas 1) a) 0,0864 b) 0,2304 c) 0,6000 2) a) 0,875 b) 0,250 c) 0,047 3) a) 0,082 b) 0,469 c) 0,531 4) a) 0,002 b) 0,006 c) 0,980 16 2. Introdução à Estatística 1. O que é Estatística? Toda pesquisa ou trabalho científico, nas mais variadas áreas, como sociologia, saúde, psicologia, etc., de um modo bem geral, em alguma fase de seu desenvolvimento, se depara com situações que envolvem uma grande quantidade de dados relevantes ao objeto de estudo. Esses dados têm que ser trabalhados e transformados em informações, para que possam ser comparados com outros resultados, ou ainda para julgar sua adequação a alguma teoria. Para isto se recorre a técnicas desenvolvidas com a finalidade de auxiliar a análise dessas informações. A utilização dessas técnicas, destinadas à análise de situações complexas ou não, tem aumentado e faz parte do nosso cotidiano. Jornais, revistas técnicas artigos, etc., publicam freqüentemente tabelas, gráficos, porcentagens e outros dispositivos destinados a complementar a apresentação de um fato ou justificar um argumento. A ciência que se dedica a esse trabalho é a Estatística . Estatística : é o conjunto de técnicas que permite,de forma sistemática, coletar, organizar, descrever, analisar e interpretar dados oriundos de estudos ou experimentos, realizados em qualquer área do conhecimento. No passado, tratar uma grande massa de números era tarefa custosa e cansativa, que exigia horas de trabalho. Recentemente, no entanto, grande quantidade de informações pode ser analisada rapidamente com um computador pessoal e programas adequados. Desta forma, o computador contribui, positivamente, na difusão e uso de métodos estatísticos. Por outro lado, o computador possibilita uma automação que pode levar um indivíduo sem preparo específico a utilizar técnicas inadequadas para resolver um dado problema. Assim, é necessário a compreensão dos conceitos básicos da Estatística, bem como as suposições necessárias para o seu uso de forma criteriosa. Quando se aborda uma problemática envolvendo métodos estatísticos, deve-se planejar a experiência que nos vai permitir recolher os dados, de modo que, posteriormente, se possa extrair o máximo de informações relevantes para o problema em estudo, ou seja, para a população de onde os dados provêm. Quando de posse dos dados, procura-se agrupá-los e reduzi-los sob forma de amostra. Seguidamente o objetivo do estudo estatístico pode ser o de estimar uma quantidade ou testar uma hipótese. Utilizamos então técnicas estatísticas convenientes que vão permitir tirar conclusões acerca da população, baseando-se numa pequena amostra, dando-nos ainda uma medida do erro cometido. 2. Estatística Descritiva e Estatística Indutiva Numa análise estatística distinguem-se essencialmente duas fases: 1ª Fase - Estatística Descritiva - Procura-se descrever e resumir dados, afim de que se possam tirar conclusões a respeito das características de interesse. 17 Exemplos de características de interesse: idade, sexo, peso. Exemplos de técnicas descritivas: gráficos, tabelas, de freqüência, parâmetros associados às freqüências. 2ª Fase - Estatística Indutiva (Inferência) - Conhecidas certas propriedades (obtidas a partir de uma análise descritiva de uma amostra), expressas por meio de proposições, imaginam-se proposições mais gerais (extrapolação), que exprimam conclusões para toda a população. No entanto, ao contrário das proposições deduzidas, não podemos dizer se são falsas ou verdadeiras, já que foram verificadas sobre um conjunto restrito de indivíduos, e, portanto não são falsas, mas não foram verificadas para todos os indivíduos da População, pelo que também não podemos afirmar que são verdadeiras. Existe, assim, certo grau de incerteza. Para que a inferência seja válida, é necessária uma boa amostragem, livre de erros, tais como falta de determinação correta da população, falta de aleatoriedade e erro no dimensionamento da amostra. Para se estudar essa incerteza, oriunda das proposições mais gerais, recorremos à teoria matemática das Probabilidades . 3. Parâmetros x Estatísticas • Parâmetros : são medidas populacionais quando se investiga a população em sua totalidade, neste caso é impossível fazer inferências, pois toda a população foi investigada. 18 • Estatísticas ou Estimadores : são medidas obtidas da amostra, torna-se possível neste caso utilizarmos inferências para que possamos fazer conclusões sobre a população. 4. Planejamento de Experimentos Os estudos que utilizam métodos estatísticos vão desde os que são concebidos e executados, dando resultados confiáveis, aos que são concebidos deficientemente e mal executados, levando a conclusões enganosas e sem qualquer valor real. Eis alguns pontos importantes para o planejamento de um estudo capaz de produzir resultados válidos: 1. Identificar com precisão a questão a ser respondida e definir com clareza a população de interesse. 2. Estabelecer um plano para coleta de dados. Esse plano deve descrever detalhadamente a realização de um estudo observacional ou de experimento e deve ser elaborado cuidadosamente, de modo que os dados coletados representem efetivamente a população em questão. 3. Coletar os dados. Devemos ser extremamente cautelosos, para minimizar os erros que podem resultar de uma coleta tendenciosa de dados. 4. Analisar os dados e tirar conclusões. Identificar também possíveis fontes de erros. Os estudos que requerem métodos estatísticos decorrem tipicamente de duas fontes comuns: estudos observacionais e experimentais. Estudo observacional – verificamos e medimos características específicas, mas não tentamos manipular ou modificar os elementos a serem estudados. Ex: plebiscito sobre porte de arma de fogo. Estudo experimental – aplicamos determinado tratamento e passamos então a observar seus efeitos sobre os elementos as serem pesquisados. Ex: tratamento médico a um determinado grupo de pacientes a fim de determinar sua eficiência na cura. 5. População e Amostra Qualquer estudo científico enfrenta o dilema de estudo da população ou da amostra. Obviamente tería-se uma precisão muito superior se fosse analisado o grupo inteiro, a população, do que uma pequena parcela representativa, denominada amostra. Observa- se que é impraticável na grande maioria dos casos, estudar a população em virtude de distâncias, custo, tempo, logística, entre outros motivos. A alternativa praticada nestes casos é o trabalho com uma amostra confiável. População (N ): Conjunto de todos os elementos relativos a um determinado fenômeno que possuem pelo menos uma característica em comum, a população é o conjunto Universo. 19 Amostra (n) : É um subconjunto da população. A amostra deve ser selecionada seguindo certas regras e deve ser representativa, de modo que ela represente todas as características da população como se fosse uma fotografia desta. 6. Pesquisa Estatística É qualquer informação retirada de uma população ou amostra, podendo ser através de Censo ou Amostragem. 6.1 – Recenseamento (Censo) : é a contagem oficial e periódica dos indivíduos de um País, ou parte de um País. Ele abrange, no entanto, um leque mais vasto de situações. Assim, pode-se definir recenseamento do seguinte modo: “estudo científico de um universo de pessoas, instituições ou objetos físicos com o propósito de adquirir conhecimentos, observando todos os seus elementos, e fazer juízos quantitativos acerca de características importantes desse universo”. Amostragem : é o processo que procura extrair da população elementos que através de cálculos probabilísticos ou não, consigam prover dados inferências da população-alvo. Este processo deve seguir um método criterioso e adequado. Tipos de amostragem Não Probabilística Acidental ou conveniência Intencional Quotas ou proporcional Desproporcional Probabilística Aleatória Simples Aleatória Estratificada Tipos de Amostragem Conglomerado 6.2 - Não Probabilística A escolha de um método não probabilístico, via de regra, sempre encontrará desvantagem frente ao método probabilístico. No entanto, em alguns casos, se faz necessário a opção por este método. Fonseca (1996), alerta que não há formas de se generalizar os resultados obtidos na amostra para o todo da população quando se opta por este método de amostragem. Isto porque os elementos da amostra não têm a mesma probabilidade de serem escolhidos e, por isso, não é possível fazer inferências sobre a população. 20 - Acidental ou conveniência Indicada para estudos exploratórios. Freqüentemente utilizados em supermercados para testar produtos. - Intencional O entrevistador dirige-se a um grupo em específico para saber sua opinião. Por exemplo, quando, de um estudo sobre automóveis, o pesquisador procura apenas oficinas. - Quotas ou proporcional Na realidade, trata-se de uma variação da amostragem intencional. Necessita-se ter um prévio conhecimento da população e sua proporcionalidade. Por exemplo, deseja-se entrevistarapenas indivíduos da classe A, que representa 12% da população. Esta será a quota para o trabalho. - Desproporcional Muito utilizada quando a escolha da amostra for desproporcional à população. Atribui-se pesos para os dados, e assim obtêm-se resultados ponderados representativos para o estudo. Exemplo: Em um mercado de telefones celulares, considerando uma fatia de mercado meramente ilustrativa, obtiveram-se os resultados conforme descritos a seguir: Elementos da Amostra Marcas Participação no mercado n % Nokia 60% 50 25% Ericson 20% 50 25% Gradiente 15% 50 25% Philips 5% 50 25% Total 100% 200 100% Objetivando obtermos os pesos a serem atribuídos a cada marca de telefone celular, para uma análise conjunta de todas as marcas no exemplo acima, obtemos os seguintes coeficientes: Marcas Pesos Nokia 2,4 Ericson 0,8 Gradiente 0,6 Philips 0,2 Total 4,0 21 6.3 - Probabilística Para que se possam realizar inferências sobre a população, é necessário que se trabalhe com amostragem probabilística. É o método que garante segurança quando se investiga alguma hipótese. Normalmente os indivíduos investigados possuem a mesma probabilidade de ser selecionado na amostra. - Aleatória Simples ou Casual Simples É o mais utilizado processo de amostragem. Prático e eficaz confere precisão ao processo de amostragem. Normalmente utiliza-se uma tabela de números aleatórios e nomeiam-se os indivíduos, sorteando-se um por um até completar a amostra calculada. Exemplo: Queremos escolher 10 alunos de 90 alunos de uma sala. Escrevemos números de 1 a 90 em um papel e sorteamos 10 números. Uma maneira de substituir os papéis é utilizar uma tabela de números aleatórios, que podem ser encontradas em livros de Estatística. - Sistemática Em um grande número de exemplos, o pesquisador depara-se com a população ordenada. Exemplos: 1. No caso de uma linha de produção, podemos, a cada dez itens produzidos, retirar um para pertencer a uma amostra de produção diária. Neste caso estaríamos fixando o valor da amostra em 10% da população (amostragem probabilística aleatória simples) 2. Quando se trabalha com sorteio de quadras de casas, por exemplo, há uma regra crescente para os números das casas. Em casos como este, divide-se a população pela amostra e obtém-se um coeficiente (y). A primeira casa será a de número um x escolhido aleatoriamente, a segunda será a de número x + y; a terceira será a de número x + 2y, a quarta será x + 3y e assim sucessivamente (amostragem probabilística aleatória sistemática). Observe, se a rua contém 900 casas e desejamos obter uma amostra de 50 casas: • dividimos 900 por 50 obtendo o coeficiente y = 18 (900 : 50 = 18); • em seguida escolhemos por sorteio casual um número de 1 a 18 (inclusive), para indicar o número da primeira casa (x), • o segundo número será x + 18; o terceiro será x + 2.18; o quarto será x + 3.18, e assim sucessivamente. Se o número sorteado (x) for o número 4 (par), tomaríamos, pelo lado direito da rua o 4º prédio, o 22º, o 40º etc., até voltarmos ao início da rua, pelo lado esquerdo. 3. Uma clínica possui 200 pacientes (cada um cadastrado com valores de 1 a 200). Desej- ase sortear uma amostra de tamanho 10. 22 Inicialmente, calculamos o tamanho do “passo” a ser dado na hora de coletar a amostra: 200 : 10 = 20 (é o nosso “passo”) Agora, sorteamos um número entre 1 e o nosso “passo”, no caso, 20. Suponhamos ter sorteado o número 5. A partir desse valor, somamos o “passo” obtendo os números dos elementos de nossa amostra: 5, 25, 45, 65, 85, 105, 125, 145, 165, 185. – Aleatória Estratificada Quando se deseja guardar uma proporcionalidade na população heterogênea, estratifica- se cada subpopulação por intermédio de critérios como classe social, renda, idade, sexo, entre outros. Esse tipo de amostragem é útil quando pode-se construir um sistema de referências, mas sabe-se de antemão que existe uma grande variabilidade entre os grupos e uma pequena variabilidade dentro de cada grupo. Com o objetivo de eliminar a variabilidade entre os grupos, convém utilizar este sistema de amostragem. A cada grupo damos o nome de estrato. Depois, retiramos de cada estrato uma amostra casual simples. Exemplo: Suponha que dos 90 alunos de uma sala, 54 são homens e 36 sejam mulheres. Vamos obter 10% da população para a amostra proporcional estratificada. Então vamos dividir nossa população em dois estratos: homens e mulheres. Destes dois estratos vamos obter 10% de cada um. Assim temos: Sexo População 10% Amostra M 54 5,4 5 F 36 3,6 4 Total 90 9 9 – Conglomerado Muitas vezes a construção do sistema de referência é impossível. Nesta modalidade de amostragem, divide-se a área da população em seções (ou conglomerados): em seguida sorteia-se algumas dessas seções e, finalmente são estudados todos os elementos das seções escolhidas. Exemplo: queremos estudar a população que habita uma favela, mas não temos meios de conseguir uma relação completa dos habitantes. Porém, temos a relação completa dos barracos que compõem a favela. Barraco é uma unidade de amostragem maior, que engloba um certo número de indivíduos. Logo, podemos escolher uma amostra casual simples de barracos e estudarmos todos os indivíduos que moram nos barracos sorteados. Ao conjunto de indivíduos que moram em um barraco damos o nome de conglomerado. 23 7. Dado x Variável Dados estatísticos : é qualquer característica que possa ser observada ou medida de alguma maneira. As matérias-primas da estatística são os dados observáveis. Variável : é o que se deseja observar para se tirar algum tipo de conclusão. Geralmente as variáveis para estudo são selecionadas por processos de amostragem. Os símbolos utilizados para representá-las são letras maiúsculas do alfabeto, tais como X, Y, Z,... que podem assumir qualquer valor de um conjunto de dados. Para podermos decidir como organizar os dados é preciso saber com que tipo de variáveis estamos trabalhando. Os tipos de variáveis são: - quantitativas que podem ser discretas ou contínuas; - qualitativas que podem ser ordinais ou nominais. As variáveis quantitativas discretas assumem valores pontuais. Por exemplo, a idade das pessoas em anos. Neste caso, a idade representa valores bem definidos como 20, 21, 22, 23 anos. As variáreis quantitativas contínuas assumem valores dentro de um intervalo. Por exemplo, podemos considerar a massa das pessoas em gramas. É claro que uma pessoa pode ter 60 235 gramas ou 60 236 gramas. Caberia a pergunta: não seria uma variável discreta? Neste caso, temos um conjunto muito grande de valores que essa variável pode assumir tornando-a contínua. As variáveis qualitativas ordinais são aquelas que atribuem qualidades de modo que possam ser ordenadas de maneira hierárquica. Por exemplo, o grau de escolaridade: analfabeto, 1° grau incompleto, 1° grau completo, 2 ° grau incompleto e assim por diante. Por fim, as variáveis qualitativas nominais são aquelas que atribuem qualidade mas que não é possível fazer uma ordenação. Por exemplo, matéria do colégio que mais gostava: Matemática, Física, Biologia, História... É importante ressaltar que não existem regras fixas para se dizer que uma variável é discreta ou contínua. Muitas vezes, podemos dar tanto um tratamento contínuo à variável idade quanto um tratamento discreto. Tal decisão depende do que se quer analisar e da quantidade de dados envolvida. Por exemplo: se estivermos fazendo uma pesquisa numa variáveis quantitativas qualitativas discretas contínuas ordinais nominais 24 festa e encontramos jovens de 18 a 25 anos, podemos considerar a variável idade como discreta, ou seja, podemos contar exatamente quantas pessoas há com 18, 19, 20, 21, 22, 23, 24 e 25 anos. Porém, imaginemos que numa outra festa, com 1000 convidados, encontrássemos pessoas de 3 à80 anos. É claro que poderíamos contar o número de indivíduos com 3,4,5,6,..., 79 e 80 anos. Porém, muitas vezes, nosso interesse está em analisar algumas faixas etárias. Por exemplo: de 3 a 18 anos de 18 a 25 anos de 25 a 35 anos de 35 a 50 anos de 50 a 80 anos Nesse caso, a variável idade passa a receber um tratamento contínuo. Assim, é preciso tomarmos muito cuidado com o fato de que algumas pessoas defendem que a variável IDADE é discreta. Dependendo do tratamento dado a ela, podemos transformá-la de discreta para contínua. Vejamos um outro caso: suponhamos um fabricante de tintas, que produz tintas coloridas fazendo o uso da tinta branca+pigmentos. Suponhamos, ainda, que ele trabalhe com as seguintes cores: branco, amarelo, vermelho, azul e preto. Aparentemente, a variável COR é qualitativa nominal. Porém, esse fabricante afirma que o pigmento amarelo é mais barato que o vermelho e que para se produzir tinta azul se usa muito corante (e mais corante ainda para tinta preta). Isso faz com que os custo sejam elevados para a tinta preta e reduzidos para a branca. Neste caso, podemos estabelecer uma ordem crescente para os custos: 1°) branco 2°) amarelo 3°) vermelho 4°) azul 5°) preto Percebemos que foi estabelecida uma ordem. Assim, a variável COR é, agora, qualitativa ordinal. Questionário Para efeitos de análise, foi passado um questionário para uma amostra de 30 ouvintes de uma determinada palestra. Pediu-se para que respondessem com a maior exatidão possível. Um modelo do questionário é mostrado a seguir. 25 É importante destacar alguns pontos importantes a respeito do questionário: � Deve-se ter muito cuidado na elaboração das questões para que não gerem ambigüidades quanto à interpretação nem problemas de respostas diferentes que não possibilitem uma análise posterior. � O resultado de um questionário nem sempre corresponde à realidade, visto que a pessoa pode não saber ao certo sua altura ou fazer muito tempo que não se pesa. � Alguns cuidados especiais devem ser tomados na elaboração de questões “abertas”, ou seja, que não são do tipo teste, para que as respostas sejam padronizadas. Por exemplo, se não for especificado, uma pessoa pode responder que a sua altura é de 172 cm e outra de 1,72 m. Ou ainda, o que seria muito pior pois alteraria o resultado da pesquisa, é no caso de perguntar o número de irmãos: uma pessoa pode ter 4 irmãos vivos e 1 que faleceu. Qual valor ela deveria colocar no questionário: 4 ou 5? Daí a necessidade da especificação. � Vale a pena, também, ficar atento a perguntas do tipo: “você gosta de carros brancos? ( ) sim ( ) não”. Aparentemente não há nenhum problema nessa pergunta, porém, uma análise mais cuidadosa faria perceber que o entrevistado poderia responder “não, não gosto de carros brancos, prefiro os vermelhos” como poderia responder “não, não gosto de carros, prefiro motos”. Porém, essa diferença de respostas não seria detectada com a pergunta (ambígua) acima. Neste caso, devemos reformular tal pergunta ou fazer outras confirmatórias. Embora isso não seja tratado neste texto, alertamos quanto ao fato na hora de elaborar e responder um questionário. Questionário Procure responder às questões com a maior exatidão possível. Não deixe questões em branco! 1) Sexo: ( ) masculino ( ) feminino 2) Idade (em anos): _____ 3) Altura (em metros): ________ m 4) Peso (em quilos): ______ kg 5) Número de irmãos (vivos): _____ 6) Fuma atualmente? ( ) SIM ( ) NÃO 7) Qual a sua tolerância quanto à fumaça do cigarro? ( ) Muito tolerante ( ) Pouco tolerante ( ) Indiferente 8) Número de horas médias por semana que pratica exercícios e atividades físicas (academia, andar, correr, alongamento, esportes, etc): ______ horas 9) Qualidade da programação atual da Rede Globo: ( ) Boa ( ) Regular ( ) Péssima ( ) Não sabe 26 O resultado de tal questionário em uma amostra de tamanho 30 é mostrado na tabela a seguir. As variáveis em questão são: Sexo – masculino (M) ou feminino (F) Idade – em anos Altura – em metros Peso – em quilos Irmãos – número de irmãos vivos Fuma – é fumante (SIM) ou não é fumante (NÃO) Tolerância – nível de tolerância à fumaça do cigarro: muito tolerante (M), pouco tolerante (P) ou indiferente (I) Exercícios – número médio de horas que pratica atividades físicas por semana Qualidade – qualidade da programação atual da Rede Globo: boa (B), regular (R), péssima (P) ou não sabe (N) A partir da tabela a seguir, onde estão representados os dados brutos (ou seja, aqueles obtidos a partir do questionário), percebemos que há uma certa dificuldade de, por exemplo, dizer se a maioria das pessoas é muito ou pouco tolerante ao fumo, ou quanto ao número médio de horas que as pessoas praticam atividades físicas. Tal dificuldade já se apresenta com um pequeno conjunto de dados (apenas 30 entrevistados). Para conjuntos maiores, diria que é praticamente impossível tirar alguma conclusão apenas observando os dados brutos. Daí a necessidade de reorganizarmos os dados em tabelas e gráficos. A organização em tabelas deve ser a mais simples possível, evitando-se utilizar tabelas muito incrementadas ou coloridas. A forma como esses dados serão organizados também pode variar, de acordo com os interesses e do que se quer analisar. Assim, daremos aqui, alguns exemplos de organização e tipos de gráficos. Aliás, quanto aos gráficos, nem sempre há um gráfico correto e outro errado. Para representar um conjunto de dados, muitas vezes é possível usar mais de um tipo de gráfico. O melhor é aquele que mais enfatiza o resultado que você deseja apresentar, ou seja, que dá maior destaque às informações que você julga importantes. Observação Sexo Idade Altura Peso Irmãos Fuma Tolerância Exercícios Qualidade 1 F 17 1,60 60 0 SIM I 0 B 2 F 18 1,69 55 2 SIM I 0 R 3 M 18 1,85 73 1 NÃO M 5 R 4 M 23 1,85 80 0 NÃO M 4 P 5 F 19 1,55 50 0 SIM I 2 B 6 M 19 1,76 60 2 NÃO M 2 P 7 F 20 1,64 47 1 NÃO P 3 B 8 F 18 1,62 58 1 SIM I 2 N 9 F 18 1,64 58 3 NÃO P 10 R 10 F 17 1,72 70 0 NÃO M 8 B 11 F 18 1,66 54 2 NÃO P 5 B 12 F 18 1,70 58 0 NÃO I 2 R 13 F 21 1,65 63 1 SIM P 1 R 14 M 18 1,90 85 2 NÃO P 0 B 27 15 M 18 1,65 70 2 NÃO P 0 R 16 M 19 1,70 70 1 NÃO I 3 P 17 M 20 1,75 68 3 SIM I 2 N 18 M 22 1,78 65 4 NÃO P 3 R 19 M 24 1,79 72 1 NÃO M 5 B 20 M 23 1,84 81 5 NÃO P 5 B 21 F 18 1,64 54 2 NÃO I 10 B 22 F 19 1,70 59 1 NÃO P 6 B 23 F 21 1,78 60 0 NÃO M 2 R 24 F 24 1,69 62 1 NÃO I 1 R 25 F 21 1,72 70 2 NÃO P 7 P 26 F 19 1,74 65 4 NÃO P 7 B 27 M 18 1,75 70 1 NÃO P 6 P 28 F 20 1,67 54 1 NÃO M 5 R 29 M 20 1,81 76 3 NÃO P 7 B 30 M 24 1,79 65 0 NÃO P 12 B Baseado na classificação de variáveis que apresentamos, podemos dizer que são: SEXO – nominal IDADE – discreta ALTURA – contínua (pois assume uma grande variedade de valores, embora possamos considerá-la discreta) PESO – discreta IRMÃOS – discreta FUMA – nominal TOLERÂNCIA – nominal EXERCÍCIOS – discreta QUALIDADE – ordinal 28 RESUMO As variáveis podem ser classificadas dos seguintes modos: 1) Qualitativas (ou atributos): São características de uma população que não podem ser medidas, sendo classificadas em nominais ou ordinais. - Nominal : são utilizados símbolos, ou números, para representar determinado tipo de dados, mostrando, assim, a qual grupo ou categoria eles pertencem, como sexo, nacionalidade, etc. - Ordinal : quando uma classificação for dividida em categorias ordenadas em graus convencionados, havendo uma relação entre as categorias do tipo “maior do que”, “menor do que”, “igual a”, primeiro, segundo, terceiro e, assim, sucessivamente. 2) Quantitativas: São características populacionais que podem ser quantificadas,sendo classificadas em discretas e contínuas. - Discretas : são aquelas variáveis que podem assumir somente valores inteiros num conjunto de valores. É gerada pelo processo de contagem, como o número de veículos que passa em um posto de gasolina, o número de estudantes nesta sala de aula. - Contínuas : são aquelas variáveis que podem assumir um valor dentro de um intervalo de valores. É gerada pelo processo de medição. Neste caso serve como exemplo o volume de água em um reservatório ou o peso de um pacote de cereal. 8. Arredondamento de números Uma questão importante a ser compreendida por todos os estudantes de Estatística é quanto ao arredondamento. Raramente um cálculo realizado será exato. O mais comum é que os resultados obtidos tenham várias casas decimais. O primeiro ponto a ser discutido é: “quantas casas decimais eu devo utilizar?” Não há uma regra deficinida para isto. O que vale, aqui, é utilizar a coerência e o bom senso . Por exemplo, suponhamos que estamos trabalhando o cálculo de valores monetários, em reais. O que faz mais sentido neste caso é trabalharmos com 2 casas após a vírgula, visto que a terceira casa após a vírgula não faz sentido, ou seja, R$ 3,451 impossibilita, na prática, o pagamento de R$ 0,001. Neste caso, o melhor é utilizarmos R$ 3,45. Um outro exemplo: se estivermos trabalhando com medidas efetuadas com a régua, podemos utilizar até 2 casas após a vírgula, ou seja, faz sentido apresentarmos um resultado do tipo 5,43 cm, visto que estaríamos dizendo que a medida obtida tem 5 centímetros, 4 milímetros e 3 décimos de milímetro (este valor indicaria a incerteza da medida). Porém, não vamos discutir nesta apostila incertezas e erros quando utilizamos instrumentos de precisão. 29 Um segundo ponto a ser notado é a respeito de qual regra de arredondamento devemos utilizar. Existem várias maneiras de fazermos o arredondamento de um número, porém, vamos utilizar o método tradicional de arredondamento que nos diz: quando a casa decimal seguinte àquela que vamos arredondar for 0, 1, 2, 3 ou 4, esta casa decimal permanece como está. Se a casa decimal seguinte for 5, 6, 7, 8 ou 9, somamos 1 à casa decimal a ser arredondada. Vejamos alguns exemplos. 1) Arredondar 23,4581 para 3 casas decimais. Note que a quarta casa é 1 (menor que 5) . Logo, a casa a ser arredondada, que é o número 8, permanece igual. Assim, após o arredondamento, temos o número 23,458. 2) Arredondar 3,276 para duas casas decimais. Verificamos que a terceira casa é 6 (maior ou igual a 5). Logo, devemos somar 1 à segunda casa decimal. Após o arredondamento o número fica 3,28. 3) Arredondar 12,49999 para 1 casa decimal. Como o número da segunda casa decimal é maior ou igual a 5, adicionamos 1 unidade ao valor a ser arredondado, ou seja, 4+1=5. Logo, o número após o arredondamento fica 12,5. 4) Arredondar para 2 casas decimais o número 35,89076. Como na terceira casa temos o zero, mantemos o valor da segunda casa, ou seja, o número após arredondamento fica 35,89. 5) Arredondar para 2 casas decimais o número 0,39601. Como na terceira casa decimal temos um valor superior a 5, devemos somar 1 unidade ao valor da segunda casa. Note, porém, que na segunda casa decimal temos o número 9. Pensemos, então, no número 39 (1ª + 2ª decimais). Somando 1 a esse número, teremos 40. Logo, o número arredondado fica 0,40. 9. Exercícios 1) Classifique em verdadeiro ou falso as seguintes informações: a) Estatística é um conjunto de técnicas destinadas a organizar um conjunto de dados. b) Sempre que estivermos trabalhando com números, deveremos utilizar a Inferência Estatística. c) A Estatística Descritiva fornece uma maneira adequada de tratar um conjunto de valores, numéricos ou não, com a finalidade de conhecermos o fenômeno de interesse. d) Qualquer amostra representa, de forma adequada, uma população. e) As técnicas estatísticas não são adequadas para casos que envolvem experimentos destrutivos como, por exemplo, queima de equipamentos, destruição de corpos de provas, etc. 2) Um pesquisador está interessado em fazer um levantamento sobre alguns aspectos socioeconômicos dos empregados da Companhia MK. Escolha 4 variáveis a serem pesquisadas identificando se são qualitativas ou quantitativas. 3) Classifique as variáveis em qualitativas (nominais/ordinais) ou quantitativas (discretas/ contínuas). a) cor dos cabelos dos alunos de uma escola. 30 b) número de filhos de casais residentes em uma determinada rua. c) o ponto obtido em cada jogada de um dado. d) naturalidade das pessoas que vivem na cidade de São Paulo. e) escolaridade dos funcionários de uma empresa. 4) Diga quais das variáveis são discretas e quais são contínuas: salários, sexo dos filhos, número de peças defeituosas produzidas por uma máquina, altura de pessoas, grau de instrução, número de filhos, peso. 5) Uma marca de vinho branco importada é vendida na maior parte dos supermercados do país. Desejando saber o preço médio de venda, o distribuidor deseja usar uma amostragem aleatória com 45 pontos de venda. Especifique um plano de amostragem que pode ser utilizado. 6) Suponha que se tenha uma tabela com a relação das 400 maiores empresas do país, no ano de 2005, por volume de vendas, listadas em ordem alfabética. Desejando uma amostra aleatória de 40 elementos. Qual o tipo de amostragem que pode-se utilizar? 7) Classifique o tipo de amostragem utilizada em cada caso: a) Em uma sala de aula composta por 60 alunos arrumados em 6 fileiras de 10 alunos cada, toma-se uma amostra de 10 alunos jogando-se um dado e escolhendo os alunos da fileira correspondente ao resultado da jogada. b) Em uma sala de aula composta por 60 alunos, toma-se uma amostra de 10 alunos escolhendo-se um valor qualquer na lista de chamada e selecionando os 10 alunos a partir daquele número. Se chegar ao fim da lista antes de completar 10 alunos, volta-se ao início da lista, até completar 10 alunos. 8) Complete a tabela a seguir arredondando os números dados para a quantidade de casas decimais indicadas: Número Arred. Para 1 casa Arred. Para 2 casas Arred. Para 3 casas 0,215664 23,45977 15,0246 22,4502 3,1195 2,951009 5,6987 2,10243 8,145501 0,00924 9) O diretor de uma escola, na qual estão matriculados 280 meninos e 320 meninas, desejoso de conhecer as condições de vida extra-escolar de seus alunos e não dispondo de tempo para entrevistar todas as famílias, resolve fazer um levantamento por amostragem, em 10% dessa clientela. Obtenha, para esse diretor, os elementos componentes da amostra. 31 10) Em uma escola existem 250 alunos, distribuídos conforme quadro. Obtenha uma amostra proporcional estratificada de 40 alunos. Séries Número de alunos AMOSTRA 1a 35 2a 32 3a 30 4a 28 5a 35 6a 32 7a 31 8a 27 Total 250 40 11) Uma cidade X apresenta o seguinte quadro relativo às suas escolas de Ensino Fundamental. Obtenha uma amostra proporcional estratificada de 120 estudantes. Número de estudantes AMOSTRA Escolas Masculino Feminino Masc. Fem. A 80 95 B 102 120 C 110 92 D 134 228 E 150 130 F 300 290 Total 876 955 12) Classifique as variáveis em qualitativas (nominal ou ordinal) ou quantitativas (discreta ou contínua): a) número de ações negociadas na bolsa; b) número de filhos de um certo casal; c) comprimento dos pregos produzidos por uma máquina; d) número de volumes na biblioteca da UNIBAN; e) salário dos funcionários de uma empresa; f) cor predominante da parede externa de sua casa; g) grau de escolaridade; h) número de horas dormidas na última noite; i) tipo de comida preferido; j) cargo dos funcionários de uma empresa. 32 13) Em um local de exame da FUVEST existem 150 funcionários, distribuídos segundo seus cargos conforme tabela. Obtenha uma amostraproporcional estratificada de 30 funcionários. Cargo Número de funcionários Amostra Coordenadores 4 Fiscais da coordenação 15 Fiscais de sala 96 Auxiliares de Fiscais 24 Apoio 11 Total 14) Uma escola apresenta a seguinte distribuição de alunos para o ensino fundamental (EF) e ensino médio (EM): Número de estudantes AMOSTRA Série Masculino Feminino Masc. Fem. EF – 5ª 65 50 EF – 6ª 58 48 EF – 7ª 86 78 EF – 8ª 95 78 EM – 1º 150 100 EM – 2º 140 90 EM – 3º 106 56 Total Obtenha uma amostra proporcional estratificada de 130 estudantes. 15) Uma população encontra-se em três estratos, com tamanhos, respectivamente, n1 = 40, n2 = 100 e n3 = 60. Sabendo que, ao ser realizada uma amostragem estratificada proporcional, nove elementos da amostra foram retirados do 3o estrato, determine o número total de elementos da amostra. 16) A tabela abaixo mostra a performance de 6 montadoras de automóveis em um determinado mês do ano de 2005. Sabendo-se que foram retiradas amostras estratificadas proporcionais, complete a tabela: Montadora de automóveis Quantidade de veículos produzidos Amostra Estratificada Proporcional A 7200 B 238 C 5100 D E 6900 483 F 182 TOTAL 2065 33 17) Um fabricante de computadores produz 8700 máquinas por mês. O departamento de qualidade necessita de uma amostra sistemática de 30 peças para teste. Sabendo que a 1ª máquina selecionada foi a nº 12, então as próximas 4 máquinas foram respectivamente: (considere que todas as máquinas estão numeradas de 0001 a 8700) (Justifique a resposta). a) 24, 36, 48, 60 b) 42, 72, 102, 132 c) 302, 592, 882, 1172 d) 290, 580, 870, 1160 18) A produção diária de uma indústria é de 450 peças. Uma amostra sistemática de tamanho 30 será extraída de uma produção, começando pela peça de número 10. Assinale a alternativa correspondente aos números das cinco primeiros peças: (justifique a resposta) a) 10 – 25 – 40 – 55 – 70 b) 10 – 15 – 20 – 25 – 30 c) 10 – 12 – 14 – 16 – 18 d) 10 – 20 – 30 – 40 – 50 Respostas 1) a) V b) F c) V d) F e) F 2) resposta pessoal 3) a) nominal b) discreta c) discreta d) nominal e) ordinal 4) continua, nominal, discreta, contínua, ordinal, discreta, contínua. 5) Proporcional 6) Sistemática 7) a) conglomerado b) sistemática 8) Número Arred. Para 1 casa Arred. Para 2 casas Arred . Para 3 casas 0,215664 0,2 0,22 0,216 23,45977 23,5 23,46 23,460 15,0246 15,0 15,02 15,025 22,4502 22,5 22,45 22,450 3,1195 3,1 3,12 3,120 2,951009 3,0 2,95 2,951 5,6987 5,7 5,70 5,699 2,10243 2,1 2,10 2,102 8,145501 8,1 8,15 8,146 0,00924 0,0 0,01 0,009 9) 28 homens e 32 mulheres 10) Séries Número de alunos AMOSTRA 1a 35 6 2a 32 5 3a 30 5 4a 28 4 5a 35 6 6a 32 5 7a 31 5 8a 27 4 Total 250 40 34 11) Número de estudantes AMOSTRA Escolas Masculino Feminino Masc. Fem. A 80 95 5 6 B 102 120 7 8 C 110 92 7 6 D 134 228 9 15 E 150 130 10 9 F 300 290 19 19 Total 876 955 57 63 12) a) discreta b) discreta c) contínua d) discreta e) contínua f) nominal g) ordinal h) discreta i) nominal j) ordinal 13) Cargo Número de funcionários Amostra Coordenadores 4 1 Fiscais da coordenação 15 3 Fiscais de sala 96 19 Auxiliares de Fiscais 24 5 Apoio 11 2 Total 150 30 14) Número de estudantes AMOSTRA Série Masculino Feminino Masc. Fem. EF – 5ª 65 50 7 5 EF – 6ª 58 48 6 5 EF – 7ª 86 78 9 8 EF – 8ª 95 78 10 8 EM – 1º 150 100 17 12 EM – 2º 140 90 15 10 EM – 3º 106 56 12 6 Total 700 500 76 54 15) 6+15+9 = 30 16) Montadora de automóveis Quantidade de veículos produzidos Amostra Estratificada Proporcional A 7200 504 B 3400 238 C 5100 357 D 4300 301 E 6900 483 F 2600 182 TOTAL 29500 2065 17) C 18) A 35 3. Organização de Dados Dado um conjunto de dados, como “tratar” os valores, numéricos ou não, a fim de extrair informações a respeito de uma ou mais características de interesse? Basicamente, faz-se uso de tabelas de freqüências e gráficos, notando que tais procedimentos devem levar em conta a natureza dos dados, pois para cada tipo de variável existem técnicas apropriadas para resumir essas informações. Veremos alguns procedimentos que podem ser utilizados para organizar e descrever um conjunto de dados seja em uma população ou uma amostra. 1. Representação tabular Consiste em dispor os dados em linhas e colunas distribuídas de modo ordenado. A elaboração de tabelas obedece à Resolução no 886, de 26 de outubro de 1966, do Conselho Nacional de Estatística. As normas de apresentação são editadas pela Fundação Brasileira de Geografia e Estatística (IBGE). 1.1 Representação esquemática � Título � Cabeçalho � Corpo � Rodapé 1.2 Elementos de uma tabela � Título: O título deve responder as seguintes questões: - O que? (Assunto a ser representado (Fato)); - Onde? (O lugar onde ocorreu o fenômeno (local)); - Quando? (A época em que se verificou o fenômeno (tempo)). � Cabeçalho: parte da tabela na qual é designada a natureza do conteúdo de cada coluna. � Corpo: parte da tabela composta por linhas e colunas. � Linhas: parte do corpo que contém uma seqüência horizontal de informações. � Colunas: parte do corpo que contém uma seqüência vertical de informações. � Coluna Indicadora: coluna que contém as discriminações correspondentes aos valores distribuídos pelas colunas numéricas. � Casa ou célula: parte da tabela formada pelo cruzamento de uma linha com uma coluna. 36 � Rodapé: É o espaço aproveitado em seguida ao fecho da tabela, onde são colocadas as notas de natureza informativa (fonte, notas e chamadas). � Fonte: refere-se à entidade que organizou ou forneceu os dados expostos. � Notas e Chamadas: são esclarecimentos contidos na tabela (nota -conceituação geral; chamada -esclarecer minúcias em relação a uma célula). 2. Tabela Primitiva – Rol – Classes 2.1 Tabela primitiva : conjunto de informações disponíveis dos dados da maneira que foram coletados inicialmente. Exemplo: Em uma amostra de latas de óleo de cozinha, foram constatados os seguintes volumes em mililitros: 980, 990, 1.000, 970, 980, 1.000, 1.010, 950, 970, 940, 1.020, 1.010, 920, 990, 950, 900, 1.000, 950, 970 e 1.010. A seqüência 980, 990, 1.000, 970, 980, 1.000, 1.010, 950, 970, 940, 1.020, 1.010, 920, 990, 950, 900, 1.000, 950, 970 e 1.010, apresentada desta forma está na forma primitiva . 2.2 Rol : tabela obtida após a organização dos dados. No exemplo, apresentando os dados em rol temos: 900, 920, 940, 950, 950, 950, 970, 970, 970, 980, 980, 990, 990, 1.000, 1.000, 1.000, 1.010, 1.010, 1.010 e 1.020. 2.3 Classe : é um intervalo de variação da variável. No exemplo anterior podemos separar os elementos da amostra em róis disjuntos (sem elementos comuns). I. 900, 920 II. 940 III. 950, 950, 950 IV. 970, 970, 970, 980, 980 V. 990, 990, 1.000, 1.000, 1.000 VI. 1.010, 1.010, 1.010, 1.020 Podemos formar as seguintes classes com os elementos dessa amostra: o intervalo [900, 940[ , que contém o rol I o intervalo [940, 950[ , que contém o rol II o intervalo [950, 970[ , que contém o rol III o intervalo [970, 990[ , que contém o rol IV o intervalo [990, 1.010[ , que contém o rol V o intervalo [1.010, 1.020] , que contém o rol VI 2.4 Amplitude da classe : é a diferença entre o maior e o menor extremo de uma classe, nessa ordem. Por exemplo, a amplitude da classe [900, 940[ é dada por 940 – 900, ou seja, é 40. 37 2.5 Notas 1. Os extremos de cada classe não precisam ser, necessariamente, elementos da amostra; mas, se forem, deve-se tomar cuidado de não permitir que um mesmo elemento pertença a duas classes simultaneamente. Por isso, no exemplo anterior, com exceçãodo último intervalo, consideramos os demais abertos à direita. 2. É conveniente que, ao considerar duas classes consecutivas, o extremo à direita (aberto) da primeira coincida com o extremo à esquerda (fechado) da segunda. 3. Freqüências 3.1 Freqüências simples ou absolutas (f i) - é o número de vezes que a variável estatística se repete. São valores que realmente representam o número de dados de cada classe. ∑ = nfi � nº de elementos da amostra 3.2 Freqüências relativas (fr i) – São os valores das razões (quociente) entre as freqüências simples e a freqüência total multiplicada por 100 para que os dados sejam apresentados em porcentagem: 100. ∑ = fi fi fri 3.3 Freqüência Acumulada Simples (F i) – valores obtidos adicionando a cada freqüência absoluta os valores das freqüências anteriores. Fi = f1 + f2 + …+fk ou Fi = ∑ fi (i = 1, 2,…, k) 3.4 Freqüência Acumulada Relativa (Fr i) – É a freqüência acumulada da classe, dividida pela freqüência total da distribuição: Fri = ∑ fi Fi 38 Exemplos a. Consideremos o quadro seguinte que mostra as notas de Estatística dos alunos de uma classe. Número 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 Nota 5,0 4,0 6,0 8,0 3,0 5,0 7,0 6,0 8,0 4,0 6,0 9,0 7,0 5,0 7,0 5,0 6,0 8,0 7,0 9,0 4,0 6,0 6,0 8,0 7,0 •••• população estatística: grupo dos 25 alunos •••• unidade estatística: cada aluno desse classe •••• variável estatística: notas da prova de Estatística Os dados apresentados na tabela acima estão na forma primitiva. Colocando-os em rol temos: 3, 4, 4, 4, 5, 5, 5, 5, 6, 6, 6, 6, 6, 6, 7, 7, 7, 7, 7, 8, 8, 8, 8, 9, 9. A partir desses conhecimentos, elaboramos a seguinte tabela: i Notas(x i) Nº de alunos(f i) Fi fr i Fr i 1 3,0 1 1 4% 4% 2 4,0 3 4 12% 16% 3 5,0 4 8 16% 32% 4 6,0 6 14 24% 56% 5 7,0 5 19 20% 76% 6 8,0 4 23 16% 92% 7 9,0 2 25 8% 100% Observando a tabela podemos fazer algumas observações, tais como: ���� 8 alunos não tiveram nota superior a 5,0. ���� 84% dos alunos obtiveram nota igual ou superior a 5,0. b. A tabela de distribuição de freqüências abaixo representa a altura de 40 jovens. i classes f i fr i Fi Fr i 1 150 l─ 154 4 10,00% 4 10% 2 154 l─ 158 9 22,50% 13 32,50% 3 158 l─ 162 11 27,50% 24 60% 4 162 l─ 166 8 20,00% 32 80% 5 166 l─ 170 5 12,50% 37 92,50% 6 170 l─ 174 3 7,50% 40 100% O conhecimento dos vários tipos de freqüências ajuda-nos a responder a muitas questões, tais como: � Quantos alunos têm estatura entre 154cm e 158cm? 39 � Qual a porcentagem de alunos cujas estaturas são inferiores a 154 cm? � Quantos alunos têm estatura abaixo de 162 cm? � Qual a freqüência relativa da 5ª classe? � Qual a porcentagem de alunos com estatura inferior a 170cm? 4. Distribuição de Freqüência A tabela de dados brutos pode não ser prática para responder às questões de interesse, portanto, a partir da tabela de dados brutos, podemos construir uma nova tabela com as informações resumidas, para cada variável. Essa tabela é denominada de tabela de freqüência (ou distribuição de freqüência) e, como o nome indica, conterá os valores de variável e suas respectivas contagens. Uma distribuição de freqüência pode ser classificada em discreta e intervalar. 4.1 Distribuição de Freqüência Discreta : utilizada no caso de variáveis qualitativas ou quantitativas discretas na qual o número de observações está relacionado com um ponto real (um valor numérico correspondente à quantidade de ocorrências). Exemplo : Tabela de freqüência, para a variável Idade, de um grupo de 50 pessoas. Idade fi fri 17 9 0,18 18 22 0,44 19 7 0,14 20 4 0,08 21 3 0,06 22 0 0 23 2 0,04 24 1 0,02 25 2 0,04 total 50 1 4.2 Distribuição de Freqüências Intervalar: utilizada no caso de variáveis quantitativas contínuas. Já no caso das variáveis contínuas, seus valores podem ser qualquer número real num certo intervalo. Esses valores podem apresentar uma variação grande no intervalo em que foram medidos, principalmente se trabalharmos com casas decimais. O procedimento mais comum nestes casos é construir classes ou faixas de valores e contar o número de ocorrências em cada faixa. Exemplo : Tabela de freqüência, para a variável Peso, de um grupo de 50 pessoas. 40 Peso fi fri 40,0 l─ 50,0 8 0,16 50,0 l─ 60,0 22 0,44 60,0 l─ 70,0 8 0,16 70,0 l─ 80,0 6 0,12 80,0 l─ 90,0 5 0,10 90,0 l─ 100,0 1 0,02 total 50 1 Nota : convém notar que, quando estivermos trabalhando com variáveis quantitativas discretas mas o conjunto de possíveis valores é muito grande, o caminho adequado é tratar a variável como se fosse contínua e criar faixas para representar seus valores. Regras para elaboração de uma distribuição de freqü ência intervalar: 1. Determina-se o menor número (limite inferior da primeira classe - Li ) e o maior número (limite superior da última classe - Ls ) das observações. 2. Determina-se a amplitude total (H) fazendo a diferença entre o limite superior e o limite inferior (H = Ls – Li) 3. Definir o número de classes (K), que será calculado utilizando a regra de Sturges K = 1 + 3,3 . log n (nº total de dados). 4. Conhecido o número de classes define-se a amplitude do intervalo de cada classe (h), dividindo-se a amplitude total (H) pelo número de classes (k): h = k H ���� A amplitude do intervalo de classe deve ser constante em toda distribuição de freqüências intervalar. 5. Com o conhecimento da amplitude de cada classe, definem-se os limites para cada classe (inferior e superior) Notas : 1. Na distribuição de freqüência, os intervalos parciais deverão ser apresentados de maneira a evitar dúvidas quanto à classe a que permanece determinado elemento. 2. O tipo de intervalo mais usado é do tipo fechado a esquerda e aberto a direita, representado pelo símbolo: |––. Exemplo : Altura em centímetros de 160 alunos do Curso de Administração da UFSM – 1990: 41 Altura (cm) Xi fi 150 |--158 18 158 |--166 25 166 |--174 20 174 |--182 52 182 |--190 30 190 |--198 15 Total 160 Fonte: Departamento de Estatística (1990) Exemplo : 5,1 5,3 5,3 5,6 5,8 5,9 6 6,1 6,2 6,2 6,3 6,3 6,3 6,4 6,4 6,4 6,5 6,5 6,6 6,7 6,7 6,8 6,8 6,9 6,9 7 7,1 7,1 7,2 7,2 7,3 7,4 7,5 7,5 7,6 7,6 7,6 7,7 7,7 7,8 7,8 7,9 7,9 8 8 8,1 8,2 8,3 8,4 8,5 8,5 8,6 8,7 8,8 8,9 8,9 9 9,1 9,2 9,4 9,4 9,5 9,5 9,6 9,8 9 9 10 10,2 10,2 10,4 10,6 10,8 10,9 11,2 11,5 11,8 12,3 12,7 14,9 Utilizando as regras para elaboração de uma distribuição de freqüências, temos: 1. Valor mínimo ⇒ Li = 5,1 e Valor máximo ⇒ Ls = 14,9 2. Amplitude total ⇒ H = Ls – Li ⇒ H = 14,9 – 5,1 = 9,8 3. Número de classes ⇒ k = 1 + 3,3 . log n ⇒ k = 1 + 3,3 . log 80 ⇒ k = 7,28 4. Amplitude do intervalo de cada classe ⇒ h = 28,7 8,9 = 1,34 4,1≅ 5.Com o conhecimento da amplitude de cada classe, define-se os limites para cada classe (inferior e superior) Intervalo de Classe Freqüência Absoluta Freqüência Acumulada Freqüência Relativa Absoluta 5,1 |-- 6,5 16 16 20,00% 6,5 |-- 7,9 25 41 31,25% 7,9 |-- 9,3 18 59 22,50% 9,3 |-- 10,7 13 72 16,25% 10,7 |-- 12,1 5 77 6,25% 12,1 |-- 13,5 2 79 2,50% 13,5 |--| 14,9 1 80 1,25% 80 ----- 100% 42 5. Exercícios 1. A massa (em quilogramas) de 20 trabalhadores de uma empresa com 100 funcionários está registrada a seguir: 52 73 80 65 50 70 80 65 70 77 82 91 52 68 86 70 80. Com base nos dados obtidos, responda: a) Qual a população e a unidade estatística dessa pesquisa?b) Qual é a sua amostra? c) Qual é a variável nessa pesquisa? Ela é discreta ou contínua? d) Que freqüências absolutas têm os valores 65 kg, 75 kg, 80 kg e 90 kg? 2. Em uma escola, o conceito de cada bimestre é representado por letras: A, B, C, D e E. Em um determinado bimestre, os conceitos, em Ciências, dos alunos de uma determinada série foram os seguintes: CIÊNCIAS Número 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Conceito B A C C D C D A A C E D D C B C B C C B Nessas condições, elabore um quadro de distribuição de freqüências absolutas e freqüências absolutas acumuladas. 3. A cantina de uma escola selecionou 50 alunos ao acaso e verificou o número de vezes por semana que eles compravam lanche., obtendo os seguintes resultados: 0; 2; 2; 4; 3; 2; 2; 1; 1; 2; 1; 1; 0; 1; 1 ; 1; 1; 1; 1; 2; 2; 2; 3; 2; 2; 2; 0; 2; 2; 1; 1; 0; 2; 0; 2; 2; 2; 2; 2; 2; 2; 2; 2; 2; 2; 2; 1; 2; 5; 4. a) Construa uma tabela de distribuição de freqüências absolutas e freqüências absolutas acumuladas com esses dados. b) Quantos alunos compram pelo menos 2 lanches por semana? 4. Numa pesquisa de opinião pública com 800 telespectadores sobre o programa de televisão de sua preferência, obteve-se a seguinte tabela de freqüências absolutas: PROGRAMA NÚMERO DE DE TV TELESPECTADORES Novelas 360 Esportes 128 Filmes 80 Noticiários 32 Shows 200 Construa um quadro com distribuição de freqüências relativas. 5. Um dado foi jogado 20 vezes. Em cada jogada foram obtidos os seguintes pontos: 1, 5, 6, 5, 2, 2, 2, 4, 6, 5, 2, 3, 3, 1, 6, 6, 5, 5, 4, 2. 43 a) Elabore um quadro com distribuição de freqüências absolutas, freqüências absolutas acumuladas, freqüências relativas e freqüências relativas acumuladas. b) Quantas vezes o número 3 foi obtido no dado? c) Quantas vezes o número obtido no dado foi menor que 5? d) Qual o índice, em porcentagem, em que o número 6 foi obtido no dado? e) Qual o índice, em porcentagem, em que números maiores que 4 foram obtidos? 6. Veja os principais motivos alegados por 30 000 devedores, pesquisados em uma região metropolitana, ao justificar atrasos do crediário ou cheques sem fundo. Quais as freqüências absolutas para cada tipo devedor? 7. A tabela abaixo apresenta as vendas de determinado aparelho elétrico, durante um mês, por uma firma comercial. Apresente os resultados numa distribuição de freqüência discreta. 14 12 11 13 14 13 12 14 13 14 11 12 12 14 10 13 15 11 15 13 16 17 14 14 8. Considerando as notas de um teste de inteligência aplicado a 100 alunos, apresentar os resultados numa distribuição de freqüência absoluta e relativa. 64 78 66 82 74 103 78 86 103 87 73 95 82 89 73 92 85 80 81 90 78 86 78 101 85 98 75 73 90 86 86 84 86 76 76 83 103 86 84 85 76 80 92 102 73 87 70 85 79 93 82 90 83 81 85 72 81 96 81 85 68 96 86 70 72 74 84 99 81 89 71 73 63 105 74 98 78 78 83 96 95 94 88 62 91 83 98 93 83 76 94 75 67 95 108 98 71 92 72 73 44 9. Os salários de 20 funcionários de uma certa empresa estão listados no rol: 525, 579, 580, 599, 606, 613, 700, 780, 890, 900, 1100, 1150, 1200, 1300, 1300, 1330, 1450 ,1500, 1500, 1500. a) Complete a tabela: R$ Freq. absoluta Freq. acumulada Freq. Relativa absoluta Ponto médio 500 l─ 700 700 l─ 900 900 l─ 1100 1100 l─ 1300 1300 l─l 1500 total Baseado na tabela, responda: b) Qual a amplitude total? c) Qual a amplitude de classe? d) Qual o limite inferior da segunda classe? e) Qual o limite superior da terceira classe? f) Quantos funcionários ganham pelo menos R$ 1100,00? g) Qual a porcentagem de funcionários que ganha no máximo R$ 900,00? 10. A tabela abaixo apresenta uma distribuição de freqüência das áreas de 400 lotes: 1. ÁREAS(m²) 2. Nº de LOTES 3. 300 l─ 400 4. 14 5. 400 l─ 500 6. 46 7. 500 l─ 600 8. 58 9. 600 l─ 700 10. 76 11. 700 l─ 800 12. 68 13. 800 l─ 900 14. 62 15. 900 l─ 1000 16. 48 17. 1000 l─ 1100 18. 22 19. 1100 l─ 1200 20. 6 Com referência a essa tabela, determine: a) A amplitude total. b) O limite superior da quinta classe. c) O limite inferior da oitava classe. d) O ponto médio da sétima classe (xi). e) A amplitude do intervalo da segunda classe. f) A freqüência da quarta classe. g) A freqüência relativa da sexta classe. h) A freqüência acumulada da quinta classe. i) O número de lotes cuja área não atinge 700m². j) O número de lotes cuja área atinge e ultrapassa 800m². k) A porcentagem dos lotes cuja área não atinge 600m². l) A classe do 72º lote. m) Até que classe estão incluídos 60% dos lotes. 45 n) A porcentagem dos lotes cuja área é de 500 m2, no mínimo, mas inferior a 1000 m2. o) A porcentagem dos lotes cuja área seja maior ou igual a 900 m2. 11. Complete a tabela de freqüência abaixo. i Estaturas(cm ) f i x i fr i Fi Fr i 1 1150 | 154 4 152 2 154150 =+ %10100.1,0 40 4 == 4 10% 2 1154 | 158 9 13 32,5% 3 1158 | 162 11 4 1162 | 166 8 5 1166 | 170 5 6 1170 | 174 3 ∑= 40 ∑= %100 12. Foi realizada uma entrevista com 30 pessoas a respeito do número de irmãos que elas possuíam. Os resultados são apresentados no ROL: 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 3, 3, 3, 3, 4, 4, 4, 5. a) Construa uma tabela com as freqüências absolutas, freqüências absolutas acumuladas e freqüências relativas. b) Quantas pessoas possuem pelo menos 2 irmãos? c) Qual a porcentagem de pessoas que possui no máximo 1 irmão? d) Quantas pessoas tem menos que 3 irmãos? 13. Os pesos de 40 alunos de uma classe estão descritos abaixo: 69 57 72 54 93 68 72 58 64 62 65 76 60 49 74 59 66 83 70 45 60 81 71 67 63 64 53 73 81 50 67 68 53 75 65 58 80 60 63 53 Pede-se: a) Dispor os dados em um rol; b) Construir uma distribuição de freqüência do tipo contínua utilizando a fórmula de Sturges. Dado log 40 = 1,60. 14. No quadro a seguir estão registradas as massas, em quilograma, de 50 pessoas que freqüentam uma academia de ginástica. 72 81 57 64 87 90 74 69 77 73 80 96 55 58 88 92 47 60 68 80 77 76 59 57 83 81 90 68 65 74 91 97 86 82 73 64 69 71 88 94 77 72 81 91 49 75 52 50 63 70 46 Faça uma tabela de distribuição de freqüências contendo: freqüências absolutas, os pontos médios dos intervalos e as freqüências relativas. 15. Conhecidas as notas de 50 alunos, obtenha uma distribuição de freqüência com intervalos de classes iguais a 10 considerando o limite inferior da tabela igual a 30. 84 68 33 52 47 73 68 61 73 77 74 71 81 91 65 55 57 35 85 88 59 80 41 50 53 65 76 85 73 60 67 41 78 56 94 35 45 55 64 74 65 94 66 48 39 69 89 98 42 54 Determine: a) a freqüência relativa b) a freqüência acumulada c) a freqüência acumulada relativa d) o intervalo de maior freqüência e) o limite inferior da 5a classe f) a amplitude total da distribuição g) quantas classes contém pelo menos 15% das observações? h) quantos alunos obtiveram nota menor que 50? i) quanto alunos obtiveram nota maior ou igual a 70? j) qual a porcentagem de alunos que obtiveram nota maior ou igual a 40 e menor que 60?
Compartilhar