Baixe o app para aproveitar ainda mais
Prévia do material em texto
Unidade I ESTATÍSTICA Profa. Alessandra Teixeira Estatística Interpretar processos em que há variabilidade. “Estatísticas” indica qualquer coleção de dados quantitativos, ou, ainda, ramo da matemática que trata da coleta, da análise, da interpretação e da apresentação de massa de dados numéricos. “Estatística” é um conjunto de métodos e processos quantitativos que serve para estudar e medir os fenômenos coletivos. Áreas da estatística Estatística descritiva: descreve e analisa determinada população, utilizando métodos numéricos e gráficos, para se determinarem padrões, em um conjunto de dados e, assim, apresentar a informação. Estatística inferencial: conjunto de métodos para a tomada de decisões, nas situações em que há incerteza, variações ou outras generalizações acerca de um conjunto maior de dados. Classificação dos dados Dados Qualitativos Quantitativos Discretos Contínuos Classificação dos dados Estado Civil Grau de Instrução Nº filhos Salário (x. min) Idade (anos-meses) Casado Ensino Médio 2 19,40 32 10 Solteiro Ensino Superior *** 4,00 23 03 Solteiro Ensino Fundamental *** 10,53 25 08 Casado Ensino Médio 1 4,56 48 11 Solteiro Ensino Fundamental *** 16,22 31 05 Fonte: da autora Elementos da estatística População. Amostra. Formas iniciais de tratamento de dados A tabela mostra uma pesquisa sobre o número de filhos por funcionário de uma certa empresa: Dados brutos Rol 0 2 1 2 3 5 2 0 2 1 2 0 0 1 1 2 3 3 1 2 0 0 0 0 1 1 1 1 1 2 2 2 2 2 2 2 3 3 3 5 Distribuição de frequências Organiza os dados de acordo com as ocorrências dos diferentes resultados observados. Apresentada em tabela ou gráfico. Tabela: apresenta de forma resumida um conjunto de dados. Tabelas de Frequência. Tabelas de Frequência Relativas. Tabelas de Frequência Acumuladas. Tabelas Título Coluna Indicadora Cabeçalho Rodapé Distribuição de frequências Gráficos: são usados para visualizar facilmente a natureza da distribuição dos dados. Um gráfico é uma figura constituída a partir de uma tabela, pois é quase sempre possível locar um dado tabulado num gráfico. Colunas Barras Linhas Setores Dispersão Histograma Polígono de frequência Etc. Gráfico em colunas Fonte: https://emilioparme.wordpress.com/2012/08/15/utilizando-o- google-charts-parte-2-multiplas-series-e-graficos-combinados/ Gráfico em barras Fonte: https://www.tecmundo.com.br/excel/1745-saiba-qual-tipo-de- grafico-representa-melhor-os-seus-dados-no-excel-2007.htm Gráfico em linhas Fonte: https://www.tecmundo.com.br/excel/1745-saiba-qual-tipo-de-grafico- representa-melhor-os-seus-dados-no-excel-2007.htm Gráfico em setores Total __________360º Parte___________ xº Fonte: http://portaldoprofessor.mec.gov.br/fichaTecnicaAula.html?aula=23097 Diagrama de dispersão Fonte: http://wikiciencias.casadasciencias.org/wiki/index.php/Diagrama_ou_gr%C3%A1fico_de_dispers%C3%A3o Histograma Fonte: da autora 0 2 4 6 8 10 12 148. 152. 156. 160. 164. 168. 172. 176. Número de alunos estatura Estatura de 40 alunos Polígono de frequência 0 2 4 6 8 10 12 148. 152. 156. 160. 164. 168. 172. 176. Nú me ro de al un os Estatura Estatura de 40 alunos Fonte: da autora Interatividade São dados os seguintes experimentos: I. Lançar uma moeda cinco vezes e observar o número de caras. II. Numa linha de produção, observar dez itens, tomados ao acaso, e verificar quantos estão defeituosos. III. Verificar o tempo que internautas ficam em site de reportagem. IV. Em uma realização de projeto, verificar a porcentagem do término do projeto após 6 meses. Quais dos itens acima terão eventos classificados como variáveis aleatórias discretas? a) I e II. b) I e IV. c) II e IV. d) III. e) I, II, III e IV. Resposta São dados os seguintes experimentos: I. Lançar uma moeda cinco vezes e observar o número de caras. II. Numa linha de produção, observar dez itens, tomados ao acaso, e verificar quantos estão defeituosos. III. Verificar o tempo que internautas ficam em site de reportagem. IV. Em uma realização de projeto, verificar a porcentagem do término do projeto após 6 meses. Quais dos itens acima terão eventos classificados como variáveis aleatórias discretas? a) I e II. b) I e IV. c) II e IV. d) III. e) I, II, III e IV. Distribuição de Frequência – faixa etária de crianças Dificulta estabelecer em torno de qual valor tendem a se concentrar as idades das crianças, ou, ainda, as que se encontram acima ou abaixo de determinada idade. Dados brutos: 6 10 9 14 7 4 8 11 12 5 9 13 9 10 8 6 7 14 11 6 12 11 15 13 12 11 4 10 7 13 10 9 8 12 13 7 Faixa etária de crianças Organizar os dados em rol 4 6 8 10 11 13 4 7 8 10 12 13 4 7 8 10 12 13 5 7 9 10 12 14 6 7 9 11 12 14 6 8 9 11 13 15 Faixa etária de crianças Tabela de frequência Idade Frequência 4 3 5 1 6 3 7 4 8 4 9 3 10 4 11 3 12 4 13 4 14 2 15 1 Idade Frequência 4 6 4 6 8 7 810 7 1012 7 1214 8 1416 3 Idade Frequência 4 6 4 6 8 7 810 7 1012 7 1214 8 1416 3 4 6 8 10 11 13 4 7 8 10 12 13 4 7 8 10 12 13 5 7 9 10 12 14 6 7 9 11 12 14 6 8 9 11 13 15 Faixa etária de crianças Tabela de frequência Limites de classe (4 6) Amplitude de um intervalo de classe hi = Li – li Faixa etária de crianças Ponto médio de uma classe Ponto médio de uma classe (xi) Xi = (Ii + Li)/2 x1 = (4 + 6)/2 = 5. Idade xi Frequência 4 6 5 4 6 8 7 7 810 9 7 1012 11 7 1214 13 8 1416 15 3 Idade xi Fi Fr Fa 4 6 5 4 (4/36)*100 = 11% 4 6 8 7 7 19% 11 810 9 7 19% 18 1012 11 7 19% 25 1214 13 8 22% 33 1416 15 3 8% 36 Total 36 98% ~ 100% 36 Faixa etária de crianças Frequências Mais um exemplo – estatura Construção da tabela de frequência Suponhamos termos feito uma coleta de dados relativos às estaturas de 40 alunos, que compõem uma amostra dos alunos de uma faculdade, resultando a seguinte tabela de valores: Tabela – Dados Brutos Estaturas de 40 alunos da faculdade a 166 160 161 150 162 160 165 167 164 160 162 168 161 163 156 173 160 155 164 168 155 152 163 160 155 155 169 151 170 164 154 161 156 172 153 157 156 158 158 161 Estatura Construção da tabela de frequência Tabela – Rol Estaturas de 40 alunos da faculdade a 150 154 155 157 160 161 162 164 166 169 151 155 156 158 160 161 162 164 167 170 152 155 156 158 160 161 163 164 168 172 153 155 156 160 160 161 163 165 168 173 Rol Decidir o número de classes da tabela de frequência. Regra de Sturges: i = 1 + 3,3*log n = i = 1 + 3,3*log 40 = 6,27 Regra do Quadrado: = 6,32 40 Estatura Construção da tabela de frequência 150 154 155 157 160 161 162 164 166 169 151 155 156 158 160 161 162 164 167 170 152 155 156 158 160 161 163 164 168 172 153 155 156 160 160 161 163 165 168 173 Determinar a amplitude de classe, dividindo a amplitude pelo número de classes. Amplitude de variação: 173 – 150 = 23 cm. 23 / 6 = 3,83 (arredondar o resultado para mais) Classes Estatura Frequência 1 150 154 4 2 154 158 9 3 158 162 11 Estatura Construção da tabela de frequência Estatura xi fi fr fa 150 154 152 4 0,10 ou 10% 4 154 158 156 9 0,225 ou 22,5% 13 158 162 160 11 0,275 ou 27,5% 24162 166 164 8 0,20 ou 20% 32 166 170 168 5 0,125 ou 12,5% 37 170 174 172 3 0,075 ou 7,5% 40 Total 40 1 ou 100% 40 Medidas de tendência central Como podemos descrever estes dados? Como podemos resumir estes dados? Média. Mediana. Moda. 0 2 4 6 8 10 12 148. 152. 156. 160. 164. 168. 172. 176. Nú me ro de al un os Estatura Estatura de 40 alunos Estatura Xi Fi 150 154 152 4 154 158 156 9 158 162 160 11 162 166 164 8 166 170 168 5 170 174 172 3 Total 40 Média É a soma dos valores de todas as observações dividida pelo número de observações envolvidas. Vantagem: leva em conta todos os valores no seu cálculo. Número de filhos – média 0 0 0 0 1 1 1 1 1 2 2 2 2 2 2 2 3 3 3 5 Nº de filhos fi 0 4 1 5 2 7 3 3 4 0 5 1 Total 20 Média ponderada Um aluno fez um teste (peso 1) e duas provas (peso 2), tirando 8 no teste, 5 na primeira prova e 6 na segunda prova. A sua média (ponderada) será: Se o teste e a prova tivessem o mesmo peso (e não importa qual o valor do peso, importa apenas a relação entre os pesos), a média seria, aproximadamente, 6,33. Interatividade Em um levantamento realizado em maio, com os 134 funcionários da empresa XK, em relação a variável expressa em unidades monetárias (u.m.), obteve-se a tabela abaixo. Determine a média. a) 3 salários. b) 4 salários. c) 5 salários. d) 6 salários. e) 7 salários. Salário Nº de funcionários 3 32 5 34 7 40 9 28 d) 6 salários Média Salário Nº de funcionários Xifi 3 32 3x32 = 96 5 34 5x34 = 170 7 40 7x40 = 280 9 28 9x28 = 252 saláriosx 95,5 134 798 134 25228017096 Resposta Mediana (Md) Divide uma série ordenada de dados em duas partes iguais. Ocupa a posição central. Não é afetada por valores extremos. A amostra pode ter número ímpar de elementos ou número par de elementos. Calcular a posição da mediana com a fórmula a seguir: Posição mediana = (n + 1)/2. Mediana – nº ímpar de elementos Um conjunto de dados indica o salário de funcionários de uma empresa xi = {6, 9, 3, 5, 2, 9, 5, 5, 8, 7, 1, 7, 2}, em que n = 13. Rol - {1, 2, 2, 3, 5, 5, 5, 6, 7, 7, 8, 9, 9} Posição mediana = (n+1)/2 Posição mediana = (13+1)/2 = 7 (indica a posição) Então Md = 5 Mediana – nº par de elementos Exemplo: número de filhos Posição mediana = (20 + 1) / 2 = 10,5 Então: Md = (2 + 2)/2 = 2 filhos 0 0 0 0 1 1 1 1 1 2 2 2 2 2 2 2 3 3 3 5 Moda (Mo) Um conjunto de dados ao dado que ocorre com maior frequência. A moda não é afetada por valores extremos. É utilizada para fins descritivos apenas, uma vez que é, dentre as medidas de tendência, a mais variável de amostra para amostra. Uma moda: unimodal. Duas modas: bimodal. Mais de duas modas: multimodal. Nenhuma moda: amodal. Número de filhos – moda Mo = 2 filhos (unimodal). 0 0 0 0 1 1 1 1 1 2 2 2 2 2 2 2 3 3 3 5 Nº de filhos fi 0 4 1 5 2 7 3 3 4 0 5 1 Total 20 Medidas de dispersão Medidas que mostram a dispersão dos dados em torno da tendência central. A variação se refere a quanto os valores podem diferir entre si e pode ser medida por números específicos. Os números relativamente próximos uns dos outros têm baixas medidas de variação, enquanto os valores mais dispersos têm maior medida de variação. 0 2 4 6 8 10 12 148. 152. 156. 160. 164. 168. 172. 176. Nú me ro de al un os Estatura Estatura de 40 alunos Medidas de dispersão Amplitude Amplitude Total = Valor máximo – Valor mínimo Variância Desvio padrão Coeficiente de variação 100 x s CV Amplitude – número de filhos Amplitude Total = Valor máximo – Valor mínimo Amplitude Total = 5 – 0 = 5 Nº de filhos fi 0 4 1 5 2 7 3 3 4 0 5 1 Total 20 Variância – número de filhos 0 0 0 0 1 1 1 1 1 2 2 2 2 2 2 2 3 3 3 5 𝑠² = (𝑥𝑖 − 𝑥 )² 𝑛 𝑥 = 1,65 𝑠² = 0 − 1,65 2 + 0 − 1,65 2 + ⋯ + 3 − 1,65 2 + (5 − 1,65)² 20 𝑠² = −1,65 2 + −1,65 2 + ⋯ + 1,35² + 3,35² 20 𝑠² = 2,7225 + 2,7225 + ⋯ + 1,8225 + 11,2225 20 𝑠² = 30,55 20 𝑠² = 1,5275 𝑓𝑖𝑙ℎ𝑜𝑠² Número de filhos Variância (s²) Nº de filhos fi 0 4 (-1,65)² = 2,72 2,724 = 10,88 1 5 (-0,65)² = 0,42 0,425 = 2,10 2 7 0,35² = 0,12 0,12 7 = 0,84 3 3 1,35² = 1,82 1,82 3 = 5,46 4 0 2,35² = 5,52 5,52 0 = 0 5 1 3,35² = 11,22 11,22 1 = 11,22 Total 20 = 30,50 𝑠² = (𝑥𝑖 − 𝑥 )² ∙ 𝑓𝑖 𝑛 𝑠² = 30,50 20 = 1,525 𝑓𝑖𝑙ℎ𝑜𝑠² (𝒙𝒊 − 𝒙 )² (𝒙𝒊 − 𝒙 )² ∙ 𝒇𝒊 Número de filhos – desvio padrão (s) 𝑠² = 1,525 𝑓𝑖𝑙ℎ𝑜𝑠² 𝑠 = 1,525 𝑠 = 1,23 𝑓𝑖𝑙ℎ𝑜𝑠 Interatividade Dada a tabela do número de erros de impressão da primeira página de um jornal durante 50 dias, assinale a alternativa correta. a) O tamanho da amostra é igual a 52. b) A média é igual a 10,5 erros. c) O desvio padrão é igual a 17,3 erros. d) O desvio padrão é igual a 4,2 erros. e) A variância é igual a 4 erros². Erros fi xi . fi (xi – x)² * fi 7 11 7 x 11 = 77 (7 – 12,7)² x 11 = 357,4 11 14 11 x 14 = 154 (11 – 12,7)² x 14 = 40,5 15 14 15 x 14 = 210 (15 – 12,7)² x 14 = 74,1 19 9 19 x 9 =171 (19 – 12.7)² x 9 = 357,2 48 = 612 = 829,2 Resposta a) O tamanho da amostra é igual a 52. b) A média é igual a 10,5 erros. c) O desvio padrão é igual a 17,3 erros. d) O desvio padrão é igual a 4,2 erros. e) A variância é igual a 4 erros². Erros xi fi xi . fi (xi – x)² * fi 5 9 7 11 7 x 11 = 77 (7 – 12,7)² x 11 = 357,4 9 13 11 14 11 x 14 = 154 (11 – 12,7)² x 14 = 40,5 13 17 15 14 15 x 14 = 210 (15 – 12,7)² x 14 = 74,1 17 21 19 9 19 x 9 =171 (19 – 12.7)² x 9 = 357,2 Total 48 = 612 = 829,2 Coeficiente de variação (CV) O coeficiente de variação é a razão entre o desvio padrão e a média. O resultado é multiplicado por 100, para que o coeficiente de variação seja dado em porcentagem. O coeficiente de variação mede a dispersão em relação à média, comparando dois conjuntos de dados diferentes. 100 x s CV Coeficiente de variação Idade Estatura 100 x s CV 100 65,1 23,1 CV %55,74CV 100 161 57,5 CV %46,3CV Exemplo Considere uma população de 40 profissionais liberais que foram questionados sobre o número de revistas e/ou jornais que eles são assinantes. Obteve-se os seguintes dados: 2 0 4 3 1 2 3 0 2 1 3 1 2 4 4 0 3 2 1 3 2 1 3 0 2 3 2 1 2 3 4 1 2 2 1 3 3 0 2 0 Exemplo Rol Nº de publicações Nº de profissionais 0 6 1 8 2 12 3 10 4 4 0 0 0 0 0 0 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3 4 4 4 4 Exemplo – gráfico 0 2 4 6 8 10 12 14 1 2 3 4 5 Nº de pr of iss ion ais Nº de publicações Nº de assinantes 0 1 2 3 4 Fonte: da autora Exemplo – média e moda Média = 1,95 publicação Moda Mo = 2 publicações Nº de publicações Nº de profissionais xi.fi 0 6 0x6 = 0 1 8 1x8 = 8 2 12 2x12 = 24 3 10 3x10 = 30 4 4 4x4 = 16 Total 40 (xifi) = 78 95,1 40 78 40 16302480 x Exemplo – mediana Mediana Posição: (40 + 1)/2 = 20,5 Então: Md = (2 + 2)/2 = 2 publicações 0 0 0 0 0 0 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3 4 4 4 4 Exemplo – amplitude Amplitude Total = Valor máximo – Valor mínimo AmplitudeTotal = 4 – 0 = 4 Nº de publicações Nº de profissionais 0 6 1 8 2 12 3 10 4 4 Exemplo – variância Sabendo que a média é 1,95 publicações Nº de publicações Nº de profissionais (xi – x)².fi 0 6 (0 – 1,95)² 6 = 22,82 1 8 (1 – 1,95)² 8 = 7,22 2 12 (2 – 1,95)² 12 = 0,03 3 10 (3 – 1,95)² 10 = 11,03 4 4 (4 – 1,95)² 4 = 16,81 Total 40 = 57,91 ²45,1 40 91,57 ² 2 publicação n xx s Exemplo – desvio padrão Sabendo que a média é 1,95 publicações Nº de publicações Nº de profissionais (xi – x)².fi 0 6 (0 – 1,95)² 6 = 22,82 1 8 (1 – 1,95)² 8 = 7,22 2 12 (2 – 1,95)² 12 = 0,03 3 10 (3 – 1,95)² 10 = 11,03 4 4 (4 – 1,95)² 4 = 16,81 Total 40 = 57,91 publicaçãos 20,145,1 Exemplo – coeficiente de variação Um CV igual a 61,54% indica que a dispersão dos dados em relação à média é muito grande, ou seja, a dispersão relativa é alta. %54,61100 95,1 2,1 CV Interatividade É dada uma tabela de uma amostra das notas dos alunos da disciplina de estatística. I. A amostra tem 5 alunos. II. A média da nota é igual a 3. III. A moda da nota é igual a 6,5. IV. A variância não pode ser usada como parâmetro para medir a variabilidade dos dados. Assinale a alternativa com as afirmações incorretas. a) I. b) II. c) III e IV. d) I, II e IV. e) I, II, III e IV. Nota Alunos 6,3 2 8,4 3 5,3 2 9,5 3 6,5 5 Resposta d) I, II e IV (alternativas incorretas). I. A amostra tem 5 alunos. II. A média da nota é igual a 3. III. A moda da nota é igual a 6,5. IV. A variância não pode ser usada como parâmetro para medir a variabilidade dos dados. Nota Alunos xifi 6,3 2 12,6 8,4 3 25,2 5,3 2 10,6 9,5 3 28,5 6,5 5 32,5 Total 15 109,4 3,7 15 4,109 x ATÉ A PRÓXIMA! Unidade II ESTATÍSTICA Profa. Alessandra Teixeira Probabilidade Para fazer inferência estatística usam-se técnicas que exigem o conhecimento de probabilidade. A teoria das probabilidades busca estimar as chances de ocorrer um determinado acontecimento. Antes de ativar uma usina nuclear, devemos analisar a probabilidade de uma detonação acidental. Antes de aumentar o limite de velocidade em nossas rodovias, devemos procurar estimar a probabilidade do aumento em acidentes fatais. Experimentos, espaço amostral e eventos Experimentos: resultado no lançamento de um dado; hábito de fumar de um estudante sorteado em sala de aula; tipo sanguíneo de um habitante escolhido ao acaso. Espaço amostral: lançamento de um dado: = {1, 2, 3, 4, 5, 6}; exame de sangue (tipo sanguíneo): = {A, B, AB, O}; hábito de fumar: = {Fumante, Não fumante}; tempo de duração de uma lâmpada: = {t: t 0}. Eventos: alguns eventos de um dado: A: sair face par A = {2, 4, 6} B: sair face maior que 3 B = {4, 5, 6} Probabilidade – exemplo Medida da incerteza associada aos resultados do experimento aleatório. Em um vestibular, uma questão típica de múltipla escolha tem 5 respostas possíveis. Respondendo à questão aleatoriamente, qual é a probabilidade de sua resposta estar errada? )( )( )( Sn An AP 8,0 5 4 )_( erradarespostaP Probabilidade – mais dois exemplos Imagine que um dado foi jogado. Qual é a probabilidade de ter ocorrido 5? No lançamento de um dado perfeito, qual é a probabilidade de sair um número maior do que 4? 𝑃 5 = 1 6 = 0,1667 𝑜𝑢 16,67% 𝑃 4 = 2 6 = 1 3 = 0,3333 𝑜𝑢 33,33% Probabilidade – outro exemplo Determine a probabilidade de que um casal com três filhos tenha exatamente 2 meninos. 1º 2º 3º H H H H M M M M H H M M H H M M H M H M H M H M 𝑃 2 𝑚𝑒𝑛𝑖𝑛𝑜𝑠 = 3 8 = 0,375 Probabilidade condicional – exemplo Selecione um aluno ao acaso e defina os eventos: a) O aluno selecionado é do sexo masculino, dado que cursa o Cursão – P(HC) = 15/19 = 0,7895 ou 78,95%; b) A disciplina selecionada é estatística, dado que é homem – P(EH) = 16/31 = 0,516. Homens (H) Mulheres (M) Total Cursão (C) 15 4 19 Estatística (E) 16 15 31 Física (F) 6 0 6 Outros (O) 4 2 6 Total 41 21 62 Regra da multiplicação – eventos dependentes Se os eventos A e B são dependentes, temos que: P(A e B) = P(A B) = P(A) . P(B/A) Uma urna contém duas bolas brancas e uma vermelha. Retiram-se duas bolas da urna ao acaso, uma seguida da outra e sem que a primeira tenha sido recolocada. Qual é a probabilidade de as duas serem brancas? Regra da multiplicação – eventos dependentes A probabilidade da primeira bola ser branca é: 2/3 = 0,6667 ou 66,67%. A probabilidade da segunda bola ser branca: ½ = 0,5 ou 50%. Para obter a probabilidade das duas bolas retiradas serem brancas, faz-se o produto: P(2 bolas brancas) = 2/3 * 1/2 = 2/6 = 1/3 = 0,3333 ou 33,33%. Interatividade Com referência à tabela, admita que todas as escolhas envolvam os 2.000 indivíduos. Se uma pessoa é selecionada aleatoriamente, qual é a probabilidade de ela ter sido vítima de um estranho, dado que foi escolhida uma vítima de furto? a) P(estranho / furto) = 0,75. b) P(estranho / furto) = 0,559. c) P(estranho / furto) = 0,2525. d) P(estranho / furto) = 0,5087. e) P(estranho / furto) = 0,1739. Homicídio Furto Assalto Total Estranho Conhecido ou parente Ignorado 12 39 18 379 106 20 727 642 57 1118 787 95 Totais 69 505 1429 2000 Resposta Com referência à tabela, admita que todas as escolhas envolvam os 2.000 indivíduos. Se uma pessoa é selecionada aleatoriamente, qual é a probabilidade de ela ter sido vítima de um estranho, dado que foi escolhida uma vítima de furto? a) P(estranho / furto) = 0,75. P(estranho / furto) = 379 / 505 = 0,75 Homicídio Furto Assalto Total Estranho Conhecido ou parente Ignorado 12 39 18 379 106 20 727 642 57 1118 787 95 Totais 69 505 1429 2000 Eventos independentes – exemplo Lançando dois dados, qual é a probabilidade de obtermos 1 no primeiro dado e um número par no segundo dado? Solução: Probabilidade de sair 1 = 1/6 Probabilidade de sair número par = 3/6 = 1/2 P = 1 x 1 = 1 6 2 12 Eventos independentes – exemplo Imagine que um dado e uma moeda são jogados ao mesmo tempo. Qual a probabilidade de ocorrer cara na moeda sabendo que ocorreu face 6 no dado? P(sair cara na moeda, sabendo que ocorreu 6 no dado) = ½ = 0,5. Dado Moeda Cara Coroa 1 Cara; 1 Coroa; 1 2 Cara; 2 Coroa; 2 3 Cara; 3 Coroa; 3 4 Cara; 4 Coroa; 4 5 Cara; 5 Coroa; 5 6 Cara; 6 Coroa; 6 Regra da multiplicação – eventos independentes P(A e B) = P(A B) = P(A) . P(B) Palavra-chave: E Uma moeda será jogada duas vezes. Qual é a probabilidade de ocorrer cara nas duas jogadas? Probabilidade de ocorrer cara na primeira jogada é ½ = 0,5 ou 50%. Probabilidade de ocorrer cara na segunda jogada é: ½ = 0,5 ou 50%. Para obter a probabilidade de ocorrer cara nas duas jogadas, faz-se o produto: ½ . ½ = ¼ = 0,25 ou 25%. Eventos mutuamente excludentes – definição Dois eventos são mutuamente exclusivos quando a realização de um exclui a realização do outro. Por exemplo, no lançamento de uma moeda, o evento tirar cara e o tirar coroa são mutuamente exclusivos, pois, se um deles for realizado, o outro não será. A probabilidade de que um ou outro evento se realize é dada por: P = P1 + P2 Em que:P1 e P2 são os eventos mutuamente exclusivos (também chamados de eventos soma). Regra da adição – exemplo com eventos mutuamente excludentes P(A ou B) = P(A B) = P(A) + P(B) Palavra-chave: OU Suponha que uma urna contém duas bolas brancas, uma azul e uma vermelha. Retira-se uma bola da urna ao acaso. Qual a probabilidade de ter saído bola colorida, isto é, azul ou vermelha? A probabilidade de sair bola azul é ¼ = 0,25 ou 25%. A probabilidade de sair bola vermelha é ¼ = 0,25 ou 25%. Então a probabilidade de sair bola colorida é ¼ + ¼ = 2/4 = ½ = 0,5 ou 50%. Regra da adição – eventos não excludentes P(A ou B) = P(A B) = P(A) + P(B) – P(A B) Imagine uma carta ser retirada ao acaso de um baralho. Qual é a probabilidade de sair uma carta de espadas ou um ás? Um baralho tem 52 cartas. 13 são de espadas e 4 são ases. P(sair uma carta de espadas ou um ás) é: 13/52 + 4 /52 (Resposta errada). P(sair uma carta de espadas ou um ás) é: 13/52 + 4/52 – 1/52 = 16/52 = 4/13 = 0,3077 ou 30,77% (Resposta correta). Exemplos de probabilidade Em uma caixa existem dez bolinhas idênticas, numeradas de 1 a 10. Qual a probabilidade de que, ao se retirar uma bolinha, ela seja múltiplo de 2 ou de 5? Solução: S = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10} n(S) = 10 E = {2, 4, 5, 6, 8,10} n(E) = 6 P = 6 = 3 = 0,6 10 5 Exemplos de probabilidade Lançando um dado, qual é a probabilidade de tirar 3 ou 5 na face superior? Solução: (Eventos mutuamente exclusivos) Sair número 3: P = 1 6 Sair número 5: P = 1 6 P = 1 + 1 = 2:2 = 1 6 6 6:2 3 Exemplos de probabilidade Uma caixa contém 20 canetas iguais, das quais 7 são defeituosas, e outra caixa contém 12, das quais 4 são defeituosas. Uma caneta é retirada aleatoriamente de cada caixa. Determine as probabilidades de que ambas não sejam defeituosas. Solução: (Eventos independentes) Caixa A: 20 canetas, em que 7 são defeituosas e 13 são perfeitas. Caixa B: 12 canetas, em que 4 são defeituosas e 8 são perfeitas. P = 13 x 8 = 104 = 0,43 20 12 240 Interatividade Considere uma urna que contém 7 bolas brancas, 2 bolas vermelhas e 5 bolas pretas. Determine a probabilidade de se retirar, ao acaso, uma bola preta. a) 5/14 b) 7/5 c) 2/5 d) 2/7 e) 5/2 Resposta Considere uma urna que contém 7 bolas brancas, 2 bolas vermelhas e 5 bolas pretas. Determine a probabilidade de se retirar, ao acaso, uma bola preta. Solução: Alternativa a) Total de bolas pretas: 5 Total de bolas na urna: 7 + 2 + 5 = 14 P = 5/14 Distribuição normal de probabilidades – exemplo Os comprimentos das peças produzidas por certa máquina apresentaram as seguintes medidas estatísticas: média = 2,00 cm e desvio-padrão = 0,04 cm. Qual é a probabilidade de uma peça retirada aleatoriamente do lote analisado ter comprimento entre 2,00 cm e 2,0508 cm? Solução: z = x – x = 2,00 – 2,00 = 0 S 0,04 z = 2,0508 – 2,00 = 0,0508 = 1,27 0,04 0,04 Distribuição normal de probabilidades – exemplo Verificando na tabela, temos que a probabilidade é dada por: P = 0,3980 = 39,80% z 0 1 2 3 4 5 6 7 8 9 0,0 0,1 0,2 0,3 ... 1,2 0,3980 ... Distribuição normal de probabilidades – exemplo A duração de um certo componente tem média igual a 850 dias e um desvio-padrão de 40 dias. Sabendo que a duração é normalmente distribuída, calcule a probabilidade desse componente durar entre 800 dias e 950 dias. Solução: Vamos calcular separadamente: entre 800 e 850 dias z = (800 – 850)/40 = – 1,25 entre 850 dias e 950 dias z = (950 – 850)/40 = 2,5 Distribuição normal de probabilidades – exemplo Verificando na tabela: Entre 0 e – 1,25 = entre 0 e 1,25 P1 = 0,3944 Entre 0 e 2,5 P2 = 0,4938 P1 + P2 = 0,8882 Fonte: livro-texto Correlação linear Em Estatística, a correlação é um parâmetro que indica o grau de correspondência entre duas variáveis (neste estudo, simbolizadas por x e y). Exemplos: salário de um trabalhador X escolaridade do trabalhador; quantidade de livros que uma pessoa já leu X escolaridade; horas de estudo X nota na prova; temperatura de um forno X tempo de cozimento no forno. Correlação linear A correlação pode ser: Positiva: dada pela relação direta entre as variáveis (se a variável x aumentar, a variável y também aumentará, e vice-versa). Exemplo: horas de estudo x nota na prova. Negativa: dada pela relação inversa entre as variáveis (se a variável x aumentar, a variável y tenderá a diminuir, e vice-versa). Exemplo: velocidade do carro x tempo da viagem. Interatividade Encontre, na tabela normal de probabilidades, a probabilidade de encontrar uma variável padrão entre 0 e 1,47. a) 0 b) 0,4292 c) 0,1258 d) 1,4752 e) 1,47 Resposta Encontre, na tabela normal de probabilidades, a probabilidade de encontrar uma variável padrão entre 0 e 1,47. Solução: Alternativa b) . . . . . . 7 . . 1,4 0,4292 P = 0,4292 Correlação linear – diagrama de dispersão Considere os dados apresentados abaixo que representam o número de anos que a pessoa estudou (xi) e número de livros que a pessoa já leu (yi). xi 3 5 7 9 10 14 16 yi 1 2 3 5 7 10 13 Construa o diagrama de dispersão equivalente. Correlação linear – diagrama de dispersão Solução: xi 3 5 7 9 10 14 16 yi 1 2 3 5 7 10 13 Diagrama de Dispersão 14 12 10 8 6 4 2 0 yi 0 2 4 6 8 10 12 14 16 18 xi Fonte: livro-texto Correlação linear – Coeficiente de correlação de Pearson Fórmula: Os possíveis valores de r variam de –1 a 1, em que: r = –1,00: correlação negativa perfeita. r = 0: correlação inexistente. r = 1: correlação positiva perfeita. 2 2 2 2 . . – . [ . – ( ) ].[ . – ( ) ] n xi yi xi yi r n xi xi n yi yi Correlação linear – exemplo Abaixo estão apresentados os dados referentes ao número de anos que a pessoa estudou (xi) e número de livros que a pessoa já leu (yi). xi 3 5 7 9 10 14 16 yi 1 2 3 5 7 10 13 Calcule o coeficiente de correlação de Pearson e interprete-o. Correlação linear – exemplo Solução: xi yi xi.yi xi2 yi2 3 1 3 9 1 5 2 10 25 4 7 3 21 49 9 9 5 45 81 25 10 7 70 100 49 14 10 140 196 100 16 13 208 256 169 64 41 497 716 357 Correlação linear – exemplos Interatividade Foi realizada uma pesquisa sobre a relação entre as horas de estudo e a nota da prova e verificou-se que o coeficiente de correlação é igual a 0,98. Interprete-o. a) A correlação entre essas duas variáveis é positiva forte, ou seja, quanto maior o número de horas de estudo, maior a nota. b) A correlação entre essas duas variáveis é positiva forte, ou seja, quanto maior o número de horas de estudo, menor a nota. c) Correlação pouco significativa. d) A correlação entre essas duas variáveis é negativa. e) Sem correlação. Resposta Foi realizada uma pesquisa sobre a relação entre as horas de estudo e a nota da prova e verificou-se que o coeficiente de correlação é igual a 0,98. Interprete-o. Solução: Alternativa a) A correlação entreessas duas variáveis é positiva forte, ou seja, quanto maior o número de horas de estudo, maior a nota. ATÉ A PRÓXIMA!
Compartilhar