Baixe o app para aproveitar ainda mais
Prévia do material em texto
Estatística População População não se restringe a seres humanos, ela é definida exatamente a partir dos objetivos da pesquisa. Coleta e Organização de Dados para Pesquisa Métodos de coleta: · Amostragem: Pesquisas por Amostragem – pesquisa em que apenas uma amostra da população é investigada. *Amostra: Subconjunto da população. · Censo: Pesquisa censitária – pesquisa em que toda a população é investigada de 10 em 10 anos. Variáveis Qualitativas Variável que descreve uma característica dos elementos de uma população. Variáveis Nominais Ex.: Sexo, Estado Civil. Variáveis Ordinais Ex.: Escolaridade (1°, 2°, 3° grau), mês (Jan, Fev, Mar... Dez). Distribuições de Frequência Frequência Simples Absoluta (Fi) e Relativa (Fr) Sexo Frequência Simples Absoluta Relativa Masculino 270 0,54 Feminino 230 0,46 Total 500 1,00 Estado Civil Frequência Simples Absoluta Relativa % Solteiro 125 25 Casado 280 56 Divorciado 85 17 Viúvo 10 2 Total 500 100 Arredondamento de Números Menor ou igual a 4 – o algarismo é inalterado. Maior ou igual a 5 – o algarismo é acrescido de 1. Gráficos As distribuições de frequências para dados qualitativos também podem ser ilustradas graficamente através de gráficos de colunas ou gráficos de setores (pizza). Variáveis Quantitativas Variável que mensura uma característica dos elementos de uma população. Variáveis Discretas – Números naturais ou inteiros (contagem). Ex.: N° de filhos, dependentes; idade, faixa etária. Número de Dependentes Frequência Simples Absoluta Relativa % 0 120 24 1 95 19 2 90 18 3 95 19 4 35 7 5 30 6 6 20 4 7 15 3 Total 500 100 Frequência Acumulada Número de Dependentes Frequência Acumulada Absoluta Relativa % 0 120 24 1 215 43 2 305 61 3 400 80 4 435 87 5 465 93 6 485 97 7 500 100 Frequências Agrupadas Quando a variável assume muitos valores diferentes, fica inviável a construção de uma tabela de distribuição de frequências com uma linha para cada valor. Nesse caso, pode-se agrupar valores próximos em intervalos e construir uma tabela de distribuição de frequências com intervalos de classe. Faixa Etária Frequência Simples Frequência Acumulada Absoluta Relativa % Absoluta Relativa % 19-23 1 0,2 1 0,2 24-28 23 4,6 24 4,8 29-33 103 20,6 127 25,4 34-38 246 49,2 373 74,6 39-43 52 10,4 425 85 44-48 50 10 475 95 49-53 25 5 500 100 Total 500 100 Variáveis Contínuas – Números reais (medição). Ex.: Peso, altura, tempo, idade. A amplitude de um conjunto de dados, representada por ∆total, é definida como a diferença entre os valores máximo e mínimo: ∆total = VMáx − VMín = xn – x1 Ex.: Suponha que, entre os 500 funcionários da nossa empresa, o menor salário seja 2.800 e o maior salário seja de 12.400. Para agrupar os dados em cinco classes, devemos fazer o seguinte: ∆total = VMáx − VMín = 12.400−2.800 = 9.600 Próximo múltiplo de 5 = 9.605 Comprimento de classe = = 1.921 Os limites de classe, então, são: 2.800 2.800+1.921 = 4.721 4.721+1.921 = 6.642 6.642+1.921 = 8.563 8.563+1.921 = 10.484 10.484−1.921 = 12.405 e as classes podem ser definidas como [2.800,4.721) (2.800 incluído; 4.721 excluído) [4.721,6.642) (4.721 incluído; 6.642 excluído) [6.642,8.563) (6.642 incluído; 8.563 excluído) [8.563,10.484) (8.563 incluído; 10.484 excluído) [10.484,12.405) (10.484 incluído; 12.405 excluído) Classe de Salário Frequência Simples Frequência Acumulada Absoluta Relativa % Absoluta Relativa % [3200,4021) 4 26,67 4 26,67 [4021,4842) 2 13,33 6 40 [4842,5663) 2 13,33 8 53,33 [5663,6484) 3 20 11 73,33 [6484,7305) 4 26,67 15 100 Total 15 100 Histogramas de Frequência O histograma e o polígono de frequências são gráficos usados para representar uma distribuição de frequências simples de uma variável quantitativa contínua. Como as classes têm o mesmo comprimento, o histograma, nesse caso, pode ser construído de tal modo que as alturas dos retângulos sejam iguais às frequências das classes. Dessa forma, as áreas serão proporcionais (e não iguais) as frequências. A área de cada retângulo é igual à frequência relativa da classe e a altura de cada classe é calculada usando-se a expressão que dá a área de um retângulo. Por exemplo, para a classe [3200,4021), a frequência (área) é = 0,266667 e a base do retângulo (comprimento de classe) é 3200 - 4021 = 821. Logo, a altura h do retângulo correspondente é: h = = 0,000325 O resultado dessa divisão é denominado densidade, uma vez que dá a concentração em cada classe por unidade da variável. Em ambos os gráficos, a forma dos retângulos é a mesma; o que muda é a escala no eixo vertical. Polígonos de Frequência Um polígono de frequências é um gráfico de linha que se obtém unindo por uma poligonal os pontos correspondentes às frequências das diversas classes, centradas nos respectivos pontos médios. Mais precisamente, são plotados os pontos com coordenadas (ponto médio, frequência simples). Para obter as interseções da poligonal com o eixo, cria-se em cada extremo uma classe com frequência nula. Diagrama de Ramos e Folhas É mostrado o 1° dígito apenas uma vez para cada linha, à esquerda e separado dos outros dígitos por uma linha vertical. Ex.: Idade de 23 funcionários – 27, 31, 45, 52, 33, 34, 29, 27, 35, 38, 50, 48, 29, 30, 32, 29, 42, 41, 40, 42, 28, 36, 48. 2 3 4 5 7 7 8 9 9 9 0 1 2 3 4 5 6 8 0 1 2 2 5 8 8 0 2 Gráficos de Linhas O gráfico de linhas é usado principalmente para representar observações feitas ao longo do tempo, isto é, observações de uma serie de tempo. Ex.: Consumo de refrigerante (em milhões de litros) 1986-2005. Medidas de Posição ou Tendência Central Média Aritmética Simples · Série sem números repetidos = = = · Série com números repetidos = , onde n = ΣF Moda (x*) A moda de uma distribuição ou conjunto de dados, representado por x*, é o valor que mais se repete, ou seja, o valor mais frequente. Mediana (Me) Ex.: Temos 15 observações – n =15. Onde n é o conjunto das observações ordenadas, de modo que x1 ≤ x2 ≤ ... xn. 1ª observação (x1), 2ª observação (x1), ..., 15ª observação (x15). · n ímpar: Me = · n par: Me = Me = = x8 Média Aritmética Ponderada p = Exercício Classe de Renda Ponto Médio Frequência Simples Frequência Acumulada Absoluta Relativa % Absoluta Relativa % [3200,4021) 3610,5 4 26,67 4 26,67 [4021,4842) 4431,5 2 13,33 6 40 [4842,5663) 5252,5 2 13,33 8 53,33 [5663,6484) 6073,5 3 20 11 73,33 [6484,7305) 6894,5 4 26,67 15 100 Total 15 100 Média aritmética simples 1 = = 3610,5 2 = = 4431,5 ... 3610,5 – 4 ocorrências, 4431,5 – 2 ocorrências ... Média dos dados agrupados = = 5307,2333 Ou = 3610,5 x 0,2667 + 4431,5 x 0,1333 + 5252,5 x 0,1333 + 6073,5 x 0,20 + 6894,5 x 0,2667 = 5307,260 Moda: x* = 3610,5 e x* = 6894,5 (bimodal) Mediana: Nas 2 primeiras classes somam-se 40% e nas 3 primeiras 53,33%. A mediana é algum ponto da classe mediana 4842├ 5663 e abaixo desse ponto temos que ter 50%. 50% - 40% = 10% para completar a distribuição. A1 = 10% = 0,10 = (Me – 4842) x h Am = 13,33% = 0,1333 = (5663 – 4842) x h = 10,00 3,33 ← → 5457,904 A1 Me = 5457,904 Ou = Me = 5457,904 Classe de Renda Ponto Médio Frequência Simples Frequência Acumulada Absoluta Relativa % Absoluta Relativa % 0 ├ 5 2,5 5 6,25 5 6,25 5 ├ 10 7,5 15 18,75 20 25 10 ├ 15 12,5 22 27,5 42 52,5 15 ├ 20 17,5 18 22,5 60 75 20 ├ 25 22,5 12 15 72 90 25 ├ 30 27,5 8 10 80 100 Total 80 100 Média Aritmética Simples 1 = = 2,5 ; 2 = = 7,5; ...; 6 = = 27,5 Média dos dados agrupados = 2,5x0,0625 + 7,5x0,1875 + 12,5x0,275 + 17,5x0,225 + 22,5x0,15 + 27,5x0,10 = 15,0625 Mediana: A1 = 25% = 0,25 = (Me – 10) x h Am = 27,5 = 0,275 = (15 – 10) x h = → Me= 14,545 Desvio em torno da média di = xi - Desvio Médio Absoluto DMA = = Variância σ2 = = Desvio Padrão σ = Coeficiente de Variação CV = Coeficiente de Assimetria e = Separatriz · Quartil (Qi)Q1 Q2 Q3 25% 75% · 1° Quartil (Q1): 25% - 75% Q1 Q2 Q3 50% 50% · 2° Quartil (Q2): 50% - 50% Q1 Q2 Q3 25% 75% · 3° Quartil (Q3): 75% - 25% Qi = Intervalo Interquartil: IQ = Q3 – Q1 Operações com Eventos Aleatórios Interseção ↔ e Exclusão União ↔ ou Complementar ↔ Diferença A – B = ↔ e B – A = Permutação Pn = n x (n-1) x (n-2) x ... x 2 x 1 = n! Arranjo Simples Combinações Simples Exercícios xi ni 12 9 13 19 16 22 17 12 18 8 Total 70 Obtenha a variância a. 3,45 b. 4,90 c. 5,48 d. 5,21 e. 4,27 = = = 15,07 σ2 = =4,27 Considere o diagrama de ramos e folhas abaixo, variando de 2,10 até 9,50. 2 10 10 30 47 47 4 10 25 25 30 30 35 5 10 14 26 26 26 85 93 6 15 9 05 05 12 50 50 Obtenha a média. a. 5,30 b. 5,81 c. 4,75 d. 6,17 e. 5,54 = = 5,30 Considere o diagrama de ramos e folhas abaixo, variando de 3,13 até 9,27. 3 13 13 30 62 62 5 13 25 25 30 35 48 7 19 20 53 53 53 85 95 95 8 15 9 05 05 27 Obtenha a mediana: a. 7,19 b. 7,53 c. 5,48 d. 6,34 e. 7,95 n = 23 (ímpar) Me = = x12 = 7,19 Dada a tabela de distribuição de frequências de dados agrupados: Classes Frequência Absoluta Frequência Relativa% Frequência Acumulada% 01 a 06 3 2,4590163934426 2,4590163934426 06 a 11 15 12,295081967213 14,754098360656 11 a 16 50 40,983606557377 55,737704918033 16 a 21 33 27,049180327869 82,786885245902 21 a 26 18 14,754098360656 97,540983606557 26 a 31 3 2,4590163934426 100 Total 122 100 Obtenha a mediana: a. 13,42 b. 15,65 c. 15,30 d. 16,92 e. 18,17 50% - 14,754098360656% = 35,24590164% A1 = 0,3524590164 = (Me – 11) x h Am = 0,40983606557377 = (16-11) x h → 0,40983606557377 Me – 4,508196721 = 1,762295082 → Me = 15,30 Quantos são os anagramas da palavra PERNAMBUCO em que as consoantes estão sempre juntas? a. 86.400 b. 3.628.798 c. 720 d. 120.960 e. 4.320 10 letras → 6 consoantes + 4 vogais= assim as consoantes podem alterar de posição 4x. _E_A_U_O_ 5!x6! = (5x4x3x2x1) x (6x5x4x3x2x1) = 86.400 Considere o diagrama de ramos e folhas baixo, variando de 1,19 até 8,30. 1 19 19 30 32 32 4 19 25 25 30 30 35 5 10 14 14 65 85 85 92 6 15 8 05 05 12 30 30 Obtenha a amplitude total dos dados: a. 7,73 b. 7,34 c. 7,42 d. 7,11 e. 6,43 Δtoital = 8,30 – 1,19 = 7,11 Considere o diagrama de ramos e folha abaixo, variando de 3,17 até 9,26. 3 17 17 30 26 26 5 17 25 25 30 35 35 68 7 12 20 53 53 53 85 95 95 8 15 9 05 05 26 Obtenha os quartis Q1 e Q3. a. 5,25 e 7,95 b. 5,17 e 7,85 c. 5,21 e 7,90 d. 5,17 e 7,90 e. 5,21 e 7,85 Q1= = 6,25 → (5,17+5,25)/2 = 5,21 Q3= = 18,75 → (7,85+7,95)/2 = 7,90 Quantos são os anagramas da palavra PERNAMBUCO em que a expressão BOCA aparece? a. 4.320 b. 5.040 c. 720 d. 3.628.776 e. 24 10 letras → 6 letras + 4 letras = _P_E_R_N_M_U_ . Assim boca pode alterar 7 posições. 7! = 5.040 Quantos são os anagramas da palavra PERNAMBUCO em que a expressão COR não aparece? a. 3.628.798 b. 40.320 c. 4.320 d. 3.588.480 e. 3.628.800 10 letras → 10! = 3.628.800 7 letras + 3 letras = _P_E_N_A_M_B_U_ 8! = 40.320 3.628.800 – 40.320 = 3.588.480 Quantos são os anagramas da palavra PERNAMBUCO que começam com a letra P e termina em vogal? a. 362.880 b. 161.280 c. 40.320 d. 3.628.798 e. 4.320 Começar com P → P________E → 8! = 40.320 P________A → 8! = 40.320 P________U → 8! = 40.320 P________O → 8! = 40.320 161.280 Considere o conjunto de dados a seguir: 45 45 56 56 56 56 63 63 63 63 63 78 78 78 80 80 80 80 95 95 Determine o Coeficiente de Assimetria: a. 0,243 b. 0,241 c. 0,266 d. 0,395 e. 0,556 = = 68,65 = 63 σ2 = = 204,2275 σ = = 14,29 e = = 0,395 Considere o conjunto de dados a seguir: 2 2 7 7 7 7 13 13 13 13 13 20 20 20 23 23 23 23 27 27 Determine o Coeficiente de Variação: a. 0,353 b. 0,518 c. 0,616 d. 0,644 e. 0,705 = = 15,15 σ2 = = 61,9275 σ = = 7,85 CV = = 0,518 A probabilidade de um jogador de tênis vencer uma partida é 0,2. Sabendo que ele irá jogar 7 partidas no próximo mês, determine a probabilidade de ele vencer apenas uma das 7 partidas. a. 0,554543 b. 0,471819 c. 0,635476 d. 0,521825 e. 0,367002 1 chance de vencer e 6 de perder 0,2 vencer e 0,8 perder P(x=1) = P(x=1) = 7 x 0,2 x 0,262 P(x=1) = 0,36700 Das Usinas X, Y e Z são respectivamente 14%, 28% e 58% das peças produzidas por uma dada indústria. Os lotes delas oriundos têm 1,9%, 2,6% e 5,4% de peças defeituosas, respectivamente. Uma peça desta indústria é selecionada aleatoriamente. Sabendo que esta peça é defeituosa, determine a probabilidade de ela ter sido produzida pela Usina Z. a. 0,8470 b. 0,7433 c. 0,8589 d. 0,8048 e. 0,7591 A probabilidade de um indivíduo de classe X comprar um carro é 0,15, de um indivíduo de classe Y comprar um carro é 0,3 e de um indivíduo de classe Z comprar um carro é 0,55. A probabilidade de um indivíduo de classe X comprar um carro da marca A é 0,07, de um indivíduo de classe Y comprar um carro da marca A é 0,02 e de um indivíduo de classe Z comprar um carro da marca A é 0,06. Em um dia que um carro seja vendido, qual a probabilidade que ele não seja da marca A? a. 0,0495 b. 0,5285 c. 0,7775 d. 0,8405 e. 0,9505 Sindivíduo = {X, Y, Z} n = 3 A probabilidade de um jogador de tênis vencer uma partida é 0,4. Sabendo que ele irá jogar 9 partidas no próximo mês, determine a probabilidade de ele vencer no máximo uma partida. a. 0,075115 b. 0,258086 c. 0,070544 d. 0,339017 e. 0,175359 Em uma cidade do interior circulam dois jornais A e B. Uma pesquisa sobre qual jornal os cidadãos leem resultou na seguinte tabela com o total de leitores por faixa etária: Qual jornal você lê? A B (A e B) Total Menos de 16 anos 6 3 8 17 Entre 16 e 21 anos 18 7 17 42 Entre 22 e 30 anos 14 13 8 35 Entre 31 e 45 anos 9 18 17 44 Mais de 45 anos 14 1 6 21 Total 61 42 56 159 Assuma que um cidadão qualquer desta cidade seja consultado aleatoriamente. Qual a probabilidade de ele ler o jornal A, dado que tem mais de 45 anos? a. 0,088 b. 0,230 c. 0,667 d. 0,132 e. 0,384 Seja X uma variável aleatória com Distribuição Binomial de probabilidades com parâmetros n-6 e p-03, Determine VAR(X). a. 1,40 b. 1,47 c. 1,37 d. 1,26 e. 1,24 Seja X uma variável aleatória discreta tal que sua distribuição de probabilidades seja: X 2 6 8 12 13 p(x) 0,3 0,2 0,2 0,1 0,2 Determine E(X²): a. 69,4 b. 68,0 c. 71,7 d. 68,6 e. 71,1 Seja X uma variável aleatória discreta tal que sua distribuição de probabilidades seja: X 1 5 8 10 14 p(x) 0,1 0,2 0,2 0,1 0,4 Determine P(5<X<14): a. 0,6 b. 0,5 c. 0,4 d. 0,3 e. 0,9 Em uma cidade do interior circulam dois jornais A e B. Uma pesquisa sobre qual jornal os cidadãos leem resultou na seguinte tabela com o total de leitores por faixa etária: Qual jornal você lê? A B (A e B) Total Menos de 16 anos 18 12 18 48 Entre 16 e 21 anos 12 11 15 38 Entre 22 e 30 anos 12 2 15 29 Entre 31 e 45 anos 3 8 15 26 Mais de 45 anos 8 16 8 32 Total 53 49 71 173 Assuma que um cidadão qualquer desta cidade seja consultado aleatoriamente. Qual a probabilidade de ele ter entre 22 e 45 anos? a. 0,069 b. 0,318 c. 0,168 d. 0,150 e. 0,087 A probabilidade de um jogador de tênis vencer uma partida é 0,5. Sabendo que ele irá jogar 6 partidas no próximo mês, determine a probabilidade de ele vencer todas as 6 partidas. a. 0,120438 b. 0,284100 c. 0,015625 d. 0,170449 e. 0,203167 Em uma cidade do interior circulam dois jornais A e B. Uma pesquisa sobre qual jornal os cidadãos leem resultou na seguinte tabela com o total de leitores por faixa etária: Qual jornal você lê? A B (A e B) Total Menos de 16 anos 177 9 33 Entre 16 e 21 anos 12 2 5 19 Entre 22 e 30 anos 10 19 12 41 Entre 31 e 45 anos 10 13 17 40 Mais de 45 anos 4 13 6 23 Total 53 54 49 156 Assuma que um cidadão qualquer desta cidade seja consultado aleatoriamente. Qual a probabilidade de ele ser leito do jornal A ou ter entre 16 e 21 anos? a. 0,077 b. 0,385 c. 0,122 d. 0,340 e. 0,462 Em uma cidade do interior circulam dois jornais A e B. Uma pesquisa sobre qual jornal os cidadãos leem resultou na seguinte tabela com o total de leitores por faixa etária: Qual jornal você lê? A B (A e B) Total Menos de 16 anos 15 2 16 33 Entre 16 e 21 anos 6 18 5 29 Entre 22 e 30 anos 14 14 5 33 Entre 31 e 45 anos 14 20 4 38 Mais de 45 anos 15 1 9 25 Total 64 55 39 158 Assuma que um cidadão qualquer desta cidade seja consultado aleatoriamente. Qual a probabilidade de ele ter ser leitor do jornal B e ter entre 31 e 45 anos? a. 0,589 b. 0,241 c. 0,127 d. 0,462 e. 0,348 Seja X uma variável aleatória discreta tal que sua distribuição de probabilidades seja: X 2 5 8 11 13 p(x) 0,1 0,3 0,1 0,2 0,3 Determine E(X): a. 9,7 b. 9,5 c. 6,9 d. 8,6 e. 9,1 A probabilidade de um jogador de tênis vencer uma partida é 0,6. Sabendo que ele irá jogar 8 partidas no próximo mês, determine a probabilidade de ele vencer pelo menos uma partida. a. 0,999345 b. 0,730872 c. 0,894528 d. 0,994774 e. 0,811803 Seja X uma variável aleatória discreta tal que sua distribuição de probabilidades seja: X 3 5 9 10 p(x) 0,4 0,3 0,2 0,1 Determine VAR(X): a. 5,95 b. 7,05 c. 7,55 d. 8,35 e. 8,85
Compartilhar