Baixe o app para aproveitar ainda mais
Prévia do material em texto
Unidade IV ESTATÍSTICA Profa. Cristiane Aragão Noções de teoria de conjuntos Conjunto – qualquer coleção de objetos (em matemática: elementos). Elementos pertencem a uma mesma classe (têm algo em comum, uma característica comum). Exemplos: conjuntos de números, pessoas, alunos, letras etc. Os conjuntos são representados por uma letra maiúscula e os seus elementos são apresentados entre chaves {...}. Exemplos: A = {0, 2, 4, 6, 8, 10}. B = {a, e, i, o, u} – conjunto das vogais. Um elemento pode pertencer (∈) ou não (∉) a um conjunto: 𝟎 ∈ 𝑨, 𝐢 ∈ 𝑩, 𝐞 ∉ 𝑨, 𝟖 ∉ 𝑩. Conjunto vazio, subconjuntos e diagramas de Venn Conjunto vazio: sem elementos. Notação: F = { } ou F = ∅. Subconjuntos: quando todos os elementos do conjunto A também pertencem ao conjunto B, dizemos que A é um subconjunto de B. Exemplo: B = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10}. A = {1, 3, 5, 7, 9}. Diagrama de Venn: figura utilizada para representar um conjunto (facilita a visualização dos conjuntos e dos subconjuntos). Exemplo: o diagrama de Venn do conjunto A = {0, 2, 4, 6, 8} é A 0 2 4 6 8 Operações com conjuntos – diferença Diferença: (por exemplo, A = {0, 1, 2, 3} e B = {3, 4, 5, 6}). B – A = {4, 5, 6}. Operações com conjuntos – diferença Por exemplo, para A = {0, 1, 2, 3} e B = {3, 4, 5, 6}. A – B = {0, 1, 2}. Operações com conjuntos – interseção (elementos que pertencem a A e a B) Por exemplo, para A = {0, 1, 2, 3} e B = {3, 4, 5, 6}. 𝑨 ∩ 𝑩 = {𝟑}. Operações com conjuntos – união (elementos que pertencem a A ou a B) Por exemplo, para A = {0, 1, 2, 3} e B = {3, 4, 5, 6}. 𝑨 ∪ 𝑩 = {𝟎,𝟏,𝟐,𝟑,𝟒,𝟓,𝟔} (o 3 aparece apenas uma vez). Conjuntos disjuntos Conjuntos com elementos comuns Se os conjuntos não possuem elementos comuns, eles são disjuntos. Por exemplo, A = {2, 4, 6, 8} e B = {1, 3, 5, 7}. Nesse caso, a união de A com B será um conjunto com 8 elementos 𝑨 ∪ 𝑩 = 𝟏,𝟐,𝟑,𝟒,𝟓,𝟔,𝟕,𝟖 , ou seja, o número de elementos de 𝑨 ∪ 𝑩 será: 𝒏𝑨∪𝑩 = 𝒏𝑨 + 𝒏𝑩. Se os conjuntos possuem elementos comuns, precisamos descontar os elementos repetidos. Por exemplo, para A = {0, 2, 4} e B = {0, 1, 3}, a união será 𝑨 ∪ 𝑩 = 𝟎,𝟏,𝟐,𝟑,𝟒 . Então, 𝒏𝑨∪𝑩 = 𝒏𝑨 + 𝒏𝑩 − 𝒏𝑨∩𝑩 (princípio aditivo). Diagrama de Venn com os elementos A = {0, 2, 4, 6} e B = {0, 1, 2, 3}. Conjunto universo ou universo – reúne todos os elementos considerados no problema. Diagrama de Venn com os elementos (3 conjuntos) Exemplo 1 Diagrama de Venn – número grande de elementos A construção e a leitura do diagrama perdem a função prática (excesso de elementos – difícil visualização). Muitas vezes, é suficiente indicar o número de elementos em cada região do diagrama, sem inserir cada um deles no gráfico. Por exemplo, no cálculo de probabilidades basta saber a quantidade de elementos. Vamos rever o diagrama de Venn do exemplo 1, indicando apenas a quantidade de dados em cada região, ou seja, vamos fazer o diagrama com contagem dos elementos. Diagrama de Venn com contagem de elementos Diagrama de Venn – aplicação Uma pesquisa realizada com estudantes de EAD verificou que 100 alunos possuem e-mail do Gmail, 80 do Hotmail, 20 alunos possuem Gmail e Hotmail e 40 alunos não possuem nenhum dos dois. Quantos estudantes participaram da pesquisa? Qual a probabilidade de um aluno possuir os dois e-mails (Gmail e Hotmail)? Para resolver o exercício, vamos construir o diagrama de Venn correspondente. Primeiro passo: colocar o número de estudantes que possuem os dois e-mails (elementos comuns). A partir daí, completamos as outras regiões. Aplicação – pesquisa sobre e-mails 100 – Gmail (G), 80 – Hotmail (H), 20 – comuns, 40 – nenhum dos dois Número de participantes: 80 + 20 + 60 +40 = 200. Probabilidade P(G e H) = 𝟐𝟎 𝟐𝟎𝟎 = 0,1 ou 10%. Diagrama de Venn – aplicação com 3 conjuntos Uma pesquisa realizada com estudantes de EAD verificou que 170 alunos possuem e-mail do Gmail (G), 150 do Hotmail (H), 160 do Yahoo (Y), 40 alunos possuem os três (G, H e Y), 50 possuem G e H, 50 possuem G e Y, 60 possuem Y e H. Finalmente, 40 alunos não possuem nenhum dos três. Quantos estudantes participaram da pesquisa? Qual a probabilidade de um aluno possuir os três e-mails (Gmail, Hotmail e Yahoo)? Para resolver o exercício, vamos construir o diagrama de Venn correspondente. Primeiro passo: colocar o número de estudantes que possuem os três e-mails (elementos comuns). A partir daí, completamos as outras regiões. Aplicação – pesquisa sobre e-mails (2) 170 – G, 150 – H, 160 – Y, 40 – G, H e Y, 50 – G e H, 50 – G e Y, 60 – Y e H, 40 alunos nenhum dos três Total: 110 + 10 + 10 + 40 + 20 + 80 + 90 + 40 = 400. Probabilidade P(G, H e Y) = 𝟒𝟎 𝟒𝟎𝟎 = 0,1 ou 10%. Interatividade Uma pesquisa feita com universitários constatou que 110 alunos acessam as redes sociais por meio do computador, 130 estudantes utilizam seus smartphones com esse propósito, 50 alunos utilizam computador e smartphone e 10 alunos não utilizam nenhum dos dois. Quantos universitários participaram da pesquisa? Qual a probabilidade de um aluno utilizar apenas o smartphone para acessar as redes sociais? a) 200 e 0,3. b) 200 e 0,4. c) 200 e 0,25. d) 300 e 0,3. e) 300 e 0,4. Propriedades das probabilidades Eventos complementares – os eventos E e E’ (“E linha”) são complementares quando o evento E’ engloba todos os resultados possíveis em um espaço amostral que não fazem parte do evento E. Quando os eventos são complementares: P(E) + P(E’) = 1 ou P(E) + P(não E) = 1. Chamando P(E) = p (probabilidade de ocorrência ou sucesso) e P(não E) = q (probabilidade de não ocorrência ou insucesso): p + q = 1 ou seja, q = 1 – p. Exemplo: Lançamento de um dado – probabilidade de dar um número ≥ 5 é p = 2/6 (E = {5, 6}). A probabilidade de não dar um número ≥ 5 (ou seja, dar um número < 5) é q = 1 - 𝟐 𝟔 = 𝟒 𝟔 . (E’ = {1, 2, 3, 4}). Regra da adição – P(A ou B) Probabilidade de que ocorra o evento A ou o evento B, P(A ou B), é dada por: P(A ou B) = P(A) + P(B) – P(A e B). Se A e B são eventos mutuamente exclusivos, isto é, não podem ocorrer ao mesmo tempo, P(A e B) = 0. Nesse caso: P(A ou B) = P(A) + P(B). mutuamente exclusivos não mutuamente exclusivos Regra da adição – aplicação (pesquisa sobre e-mails) 100 – Gmail (G), 80 – Hotmail (H), 20 – comuns, 40 – nenhum dos dois. Total: 200 participantes (já visto) Qual é a probabilidade de um estudante ter e-mail do Gmail ou do Hotmail? Eventos não são mutuamente exclusivos (há elementos comuns). Então, P(G ou H) = P(G) + P(H) – P(G e H) P(G ou H) = 𝟏𝟎𝟎 𝟐𝟎𝟎 + 𝟖𝟎 𝟐𝟎𝟎 − 𝟐𝟎 𝟐𝟎𝟎 = 𝟏𝟔𝟎 𝟐𝟎𝟎 , ou seja, P(G ou H) = 0,8. Como sabemos o número de alunos: P(G ou H) = 𝟐𝟎𝟎−𝟒𝟎 𝟐𝟎𝟎 = 𝟏𝟔𝟎 𝟐𝟎𝟎 . Porém: precisamos utilizar essa propriedade quando temos apenas as probabilidades (sem o número total). Regra da multiplicação – P(A e B) A probabilidade de que dois eventos A e B ocorram (em sequência) é: P(A e B)= P(A).P(B|A) com P(A)>0 e P(B|A) é a probabilidade condicional (probabilidade do evento B ocorrer, dado que A já ocorreu). Para calcular P(B|A), procedemoscomo se os resultados pertencentes ao evento A formassem um novo espaço amostral, ou seja, precisamos levar em conta apenas os resultados do evento B que fazem parte do evento A. Quando A e B são eventos independentes, a ocorrência do evento A não afeta a probabilidade do evento B. Ou seja, quando A e B são independentes P(B|A) = P(B). Nesse caso, P(A e B) = P(A).P(B). Regra da multiplicação – aplicação A biblioteca de um campus da UNIP constatou que apenas um aluno a cada 10 estudantes retira um livro emprestado para seus estudos. Verificou também que 60% dos estudantes que consultam a biblioteca são mulheres. Qual a probabilidade de um estudante que utiliza a biblioteca seja homem e retire um livro? Os eventos são independentes. P(H) = 1 – P(M), então, P(H) = 1 – 0,6, ou seja, P(H) = 0,4 P(1 livro) = 1/10 ou P(1 livro) = 0,1. Probabilidade de que seja homem e retire um livro: P(H e 1 livro) = P(H).P(1 livro). Portanto, P(H e 1 livro) = 0,4*0,1 P(H e 1 livro) = 0,04 ou 4%. Análise combinatória Princípio Fundamental da Contagem Análise combinatória – realiza a contagem do número de eventos em um dado acontecimento. Estuda o número de possibilidades, modos, maneiras de uma dada situação ocorrer. Princípio da multiplicação ou Princípio Fundamental da Contagem: Se um evento é composto de k etapas sucessivas e independentes umas das outras, sendo 𝒏𝒊 o número de modos da etapa i acontecer, o número de maneiras do evento acontecer é dado por 𝒏𝟏.𝒏𝟐.𝒏𝟑.𝒏𝟒. … .𝒏𝒌. Exemplo: senha de acesso Uma senha de acesso a um cofre consiste em uma letra e três dígitos. Quantas senhas podemos formar? 4 etapas – posições: ____ ____ ____ ____ Letra nº nº nº 26 letras (de A a Z, incluindo K, Y e W) nº: de 0 a 9 (10 possibilidades) Usando o Princípio Fundamental da Contagem: 26 . 10 . 10 . 10 = 26.000 Permutações Agrupamentos em que todos os elementos de um conjunto são utilizados e em que a ordem é importante, ou seja, mudando um elemento de posição, temos um novo agrupamento. Exemplo: anagramas. Um anagrama de uma palavra é qualquer ordenação de suas letras. Quantos anagramas tem a palavra livro? Temos cinco letras, sem repetição. Cada uma delas ocupará uma das cinco posições do anagrama. Na primeira, temos cinco opções (l, i, v, r, o). Uma vez escolhida a primeira letra, restam 4 para a segunda posição. Do mesmo modo, tendo escolhido a letra da segunda posição, sobram 3 para a terceira posição, 2 para a quarta posição e 1 para a quinta. Permutações – fatorial de um número Ou seja, ____ ____ ____ ____ ____ 5 4 3 2 1 𝑷𝟓 = 𝟓.𝟒.𝟑.𝟐.𝟏 = 𝟏𝟐𝟎. Fatorial de um número (inteiro e positivo) – indicado por um ponto de exclamação após o número: n! = n.(n - 1).(n - 2).(n - 3). ... .1. Exemplo anterior: 5! = 5.4.3.2.1 = 120. 4! = 4.3.2.1 = 24. 0! = 1 (a partir das propriedades). Assim, o número de permutações é 𝑷𝒏 = 𝒏!. Para permutações com repetições: 𝑷𝒏𝒂,𝒃,𝒄… = 𝒏!𝒂!𝒃!𝒄!…. Arranjos Agrupamentos em que alguns elementos do conjunto são utilizados e em que a ordem é importante. Dez ciclistas participam de uma corrida. De quantas maneiras eles podem terminar em primeiro, segundo ou terceiro lugar? ____ ____ ____ 10 9 8 10.9.8 = 720 maneiras. Número de arranjos: 𝑨𝒏,𝒑 = 𝒏!𝒏−𝒑 !, sendo n o número total de elementos e p o número de posições do agrupamento. Para o exemplo dado: 𝑨𝟏𝟎,𝟑 = 𝟏𝟎!𝟏𝟎−𝟑 ! ⇒ 𝑨𝟏𝟎,𝟑 = 𝟏𝟎.𝟗.𝟖.𝟕!𝟕! 𝑨𝟏𝟎,𝟑 = 𝟏𝟎.𝟗.𝟖 ⇒ 𝑨𝟏𝟎,𝟑 = 𝟕𝟐𝟎. Combinações Agrupamentos em que alguns elementos do conjunto são utilizados e em que a ordem não é importante. Número de combinações: 𝑪𝒏,𝒑 = 𝒏!𝒑! 𝒏−𝒑 !. Uma turma de ADS possui 20 alunos. Quantos grupos de 5 alunos podemos formar para o PIM? A ordem não é importante, portanto, temos combinações. 𝑪𝟐𝟎,𝟓 = 𝟐𝟎!𝟓! 𝟐𝟎−𝟓 ! ⇒ 𝑪𝟐𝟎,𝟓 = 𝟐𝟎!𝟓!𝟏𝟓! ⇒ 𝑪𝟐𝟎,𝟓 = 𝟐𝟎.𝟏𝟗.𝟏𝟖.𝟏𝟕.𝟏𝟔.𝟏𝟓!𝟓!𝟏𝟓! 𝑪𝟐𝟎,𝟓 = 𝟐𝟎.𝟏𝟗.𝟏𝟖.𝟏𝟕.𝟏𝟔𝟓.𝟒.𝟑.𝟐.𝟏 ⇒ 𝑪𝟐𝟎,𝟓 = 𝟏𝟓.𝟓𝟎𝟒 grupos. Interatividade Uma senha de acesso a um cofre consiste em uma letra (de A a Z, incluindo K, Y e W) e três dígitos distintos. Quantas senhas podemos formar? a) 18.720. b) 26.000. c) 23.000. d) 16.560. e) 78. Distribuições de probabilidade Variáveis aleatórias Distribuições de probabilidade – modelos estatísticos – descrever como as probabilidades se distribuem, podendo estar associadas a cada valor da variável aleatória ou a intervalos de valores (universo ou espaço amostral – conjunto de todos os resultados possíveis do experimento). Distribuição de probabilidades – modelo probabilístico apresentado em termos de uma variável aleatória. A variável x é aleatória quando é determinada pelo acaso (experimentos aleatórios). Exemplos: números sorteados, lançamento de moeda, número de acessos a um site etc. A variável aleatória pode ser discreta ou contínua. Variável aleatória discreta – conseguimos enumerar todos os seus possíveis resultados (número finito). Exemplo: número de mensagens na caixa de entrada de e-mail. Variáveis aleatórias – tipos de distribuições Variável aleatória contínua – não conseguimos enumerar os seus possíveis resultados (número incontável – conjunto infinito). Exemplo: perda de peso durante uma dieta alimentar. Quando a variável aleatória é discreta, a distribuição de probabilidades também será discreta (probabilidades associadas a cada um dos valores possíveis). Há vários tipos de distribuições discretas, estudaremos apenas a distribuição binomial. Quando a variável aleatória é contínua, a distribuição de probabilidades também será contínua (probabilidades associadas aos intervalos possíveis). Veremos, neste curso, a distribuição normal. Distribuição binomial Utilizamos a distribuição binomial quando a variável aleatória é discreta e o experimento possui as seguintes características: é repetido n vezes (há n eventos); os eventos são independentes entre si (a ocorrência de um não altera a probabilidade do outro); há somente dois resultados possíveis e complementares para cada evento: sucesso (ou sim) e insucesso (ou não/fracasso/falha); Para um evento: P(sucesso) = p, P(insucesso) = q p + q = 1, logo, q = 1 – p; a probabilidade p é a mesma para cada evento; a variável aleatória x = número de sucessos nos n eventos. Distribuição binomial Fórmula geral de probabilidade binomial: 𝑷 𝒙 = 𝒏! 𝒙! 𝒏−𝒙 ! .𝒑𝒙.𝒒𝒏−𝒙, sendo 𝑪𝒏,𝒙 = 𝒏!𝒙! 𝒏−𝒙 !, o número de combinações (a ordem não importa). 𝑪𝒏,𝒙 também pode ser representado pelo binômio de Newton (daí o nome da distribuição): 𝒏 𝒙 = 𝒏! 𝒙! 𝒏 − 𝒙 ! . Substituindo q = 1 - p, temos: 𝑷 𝒙 = 𝒏 𝒙 .𝒑𝒙. (𝟏 − 𝒑)𝒏−𝒙. Média: 𝒙� = 𝒏.𝒑; desvio padrão: 𝝈 = 𝒏.𝒑.𝒒. Distribuição binomial – aplicação Uma equipe de TI verificou que 10% dos 10 computadores de uma empresa apresentam problemas recorrentes. Qual é a média dos computadores com problemas? Qual é a probabilidade de não haver computadores com problemas acima da média? n = 10, p = 0,1, portanto, 𝒙� = 𝒏.𝒑 ⇒ 𝒙� = 𝟏𝟎.𝟎,𝟏 ⇒ 𝒙� = 𝟏. p = 0,1 (sucesso), logo, q = 1 – p será q = 1 – 0,1, ou seja, q = 0,9 (insucesso). Para que não haja computadores com problemas acima da média (𝒙� = 𝟏), x pode ser 0 ou 1, ou seja, precisamos calcular P(0) e P(1), usando𝑷 𝒙 = 𝒏𝒙 .𝒑𝒙. (𝟏 − 𝒑)𝒏−𝒙 e somar as probabilidades obtidas. Distribuição binomial – aplicação (continuação) n = 10; p = 0,1; q = 0,9. 𝑷 𝒙 = 𝒏! 𝒙! 𝒏−𝒙 ! .𝒑𝒙.𝒒𝒏−𝒙 ⇒ 𝑷 𝒙 = 𝟏𝟎!𝒙! 𝟏𝟎−𝒙 !𝟎,𝟏𝒙.𝟎,𝟗𝟏𝟎−𝒙. 𝑷 𝟎 = 𝟏𝟎! 𝟎! 𝟏𝟎−𝟎 ! .𝟎,𝟏𝟎.𝟎,𝟗𝟏𝟎−𝟎 ⇒ 𝑷 𝟎 = 𝟎,𝟗𝟏𝟎 = 𝟎,𝟑𝟒𝟖𝟕. 𝑷 𝟏 = 𝟏𝟎! 𝟏! 𝟏𝟎−𝟏 ! .𝟎,𝟏𝟏.𝟎,𝟗𝟏𝟎−𝟏 ⇒ 𝑷 𝟏 = 𝟎,𝟗𝟗 = 𝟎,𝟑𝟖𝟕𝟒. P(0) + P(1) = 0,3487 + 0,3874 = 0,7361 ou, aproximadamente, 74% de probabilidade do número de computadores com problema não ser maior do que a média (𝒙� = 𝟏). Ou seja, há uma probabilidade de quase 26% de haver um número de computadores com problema maior do que a média. Distribuição de probabilidade binomial – gráfico (alto grau de segurança: máximo de 3 computadores) 0 0,05 0,1 0,15 0,2 0,25 0,3 0,35 0,4 0,45 0 1 2 3 4 5 6 7 8 9 10 P( x) Número de computadores com problemas (x) Distribuição de probabilidades Distribuição de probabilidades Distribuição uniforme de probabilidades Para um número n muito grande, podemos aproximar a distribuição binomial (variável discreta) por uma distribuição normal (variável contínua). f(x) é uma função contínua de probabilidade para a variável aleatória contínua X se: a área total sob f(x) é igual a 1; 𝒇 𝒙 ≥ 𝟎, para todo 𝒙 ∈ (−∞,∞). Para calcular a probabilidade de X estar em um dado intervalo, precisamos calcular a área sob a função de probabilidade. Quando a distribuição de probabilidades é uniforme, todos os valores têm a mesma probabilidade de ocorrer. Distribuição uniforme – gráfico Área = 0,25 . 4 = 1 (base*altura do retângulo). Distribuição normal de probabilidades (distribuição gaussiana) Uma das mais importantes em Estatística. Variável aleatória contínua (intervalos de valores). Propriedades: a distribuição depende somente da média (𝒙�) e do desvio- padrão (σ). A média indica a posição central da curva e é o valor mais provável, o desvio-padrão indica como a distribuição varia; curva chamada normal, tem forma de sino e é simétrica em torno da média; área total sob a curva é igual a 1; conforme a curva se distancia da média, ela se aproxima cada vez mais do eixo x, mas nunca o toca. Distribuição normal 𝒙� = ∑ 𝒙𝒊 𝑵 ; 𝝈𝟐 = ∑(𝒙−𝒙�)𝟐 𝑵 ; 𝝈 = 𝝈𝟐𝟐 . A função de probabilidade normal (função densidade) é dada por 𝒇 𝒙 = 𝟏 𝝈 𝟐𝟐 𝒆−(𝒙−𝒙�)𝟐𝟐𝝈𝟐 . Distribuição normal padrão (𝒛 = 𝟎 quando 𝐱 = 𝒙�, e σ = 1): utiliza a variável z dada por 𝒛 = 𝒙−𝒙� 𝝈 (indica o número de desvios-padrão de um valor a partir da média). Substituindo em f(x): 𝒇 𝒛 = 𝟏 𝟐𝟐 𝒆 −𝒛𝟐 𝟐 . Distribuição normal padrão – gráfico (curva gaussiana) Interatividade Analise as seguintes afirmações feitas sobre a distribuição normal de probabilidades: I. É uma distribuição discreta, pois a variável aleatória é discreta. II. Para obter a probabilidade, é necessário calcular um binômio de Newton. III. Depende somente da média e do desvio-padrão. IV. O desvio-padrão indica a posição central da curva e a média indica como a distribuição varia. V. A curva é chamada de normal, tem forma de sino e é simétrica em torno da média. Interatividade Estão corretas: a) I, II e III. b) III, IV e V. c) III e V. d) I e II. e) I e V. Distribuição normal padrão (ou padronizada) Utilizar o valor z e a tabela normal padrão (dá a área sob a gaussiana em função do valor de z) para obter a área da curva no intervalo de interesse. A probabilidade corresponde à área obtida. Observação: a tabela a seguir apresenta a área da curva normal reduzida de 0 a z (ou seja, a área correspondente ao intervalo entre 0 e o valor de z obtido). Tabela da distribuição normal reduzida de 0 a z Z 0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359 0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753 0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141 0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517 0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879 0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224 0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549 0,7 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852 0,8 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133 0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389 1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621 1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830 1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015 1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177 1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319 1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441 1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545 1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633 1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706 1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767 Tabela (continuação) 2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817 2,1 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857 2,2 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890 2,3 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916 2,4 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936 2,5 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952 2,6 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964 2,7 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974 2,8 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4980 0,4981 2,9 0,4981 0,4982 0,4982 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986 3,0 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,4990 3,1 0,4990 0,4991 0,4991 0,4991 0,4992 0,4992 0,4992 0,4992 0,4993 0,4993 3,2 0,4993 0,4993 0,4994 0,4994 0,4994 0,4994 0,4994 0,4995 0,4995 0,4995 3,3 0,4995 0,4995 0,4995 0,4996 0,4996 0,4996 0,4996 0,4996 0,4996 0,4997 3,4 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4998 3,5 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 3,6 0,4998 0,4998 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 3,7 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 3,8 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 3,9 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,0050 Exemplo – troca de celular entre 1 ano e 1 ano e meio Exemplo: Uma pesquisa feita com os estudantes de EAD revelou que, em média, um estudante troca seu celular a cada 1 ano e meio, com desvio-padrão de 0,5. Qual a probabilidade de que um aluno troque seu celular entre um ano e um ano e meio de uso? 𝒛 = 𝒙−𝒙� 𝝈 , com 𝒙� = 𝟏,𝟓 e 𝝈 = 𝟎,𝟓. Para os valores 𝒙𝟏 = 𝟏 e 𝒙𝟐 = 𝟏,𝟓 temos, respectivamente, 𝒛𝟏 = 𝟏−𝟏,𝟓𝟎,𝟓 ⇒ 𝒛𝟏 = −𝟏 e 𝒛𝟐 = 𝟏,𝟓−𝟏,𝟓𝟎,𝟓 ⇒ 𝒛𝟐 = 𝟎. O gráfico a seguir indica os dois valores de z na gaussiana. Gaussiana do exemplo – troca de celular entre 1 ano e 1 ano e meio (𝒛𝟏 = −𝟏 e 𝒛𝟐 = 𝟎) Por simetria, a área entre z = -1 e z = 0 é igual à área entre z = 0 e z = 1. Utilizando a tabela vista anteriormente, obtemos a área para z = 1: A(1,0) = 0,3413. Para z = 0, A(0) = 0. A área é 0,3413 e a probabilidade é P = 0,3413. Inferência e estimação – definições úteis População – é o conjunto com todos os elementos estudados pelo pesquisador. Amostra – é um conjunto formado por uma parte da população e é estudado para se conhecer características da população. Precisa representar bem a população. População finita (número limitado de elementos) ou infinita (número ilimitado de elementos). Censo – estudo realizado com a população. Vantagem: precisão. Desvantagens: custos e tempo (geralmente). Amostragem – estudo realizado com uma amostra da população. Vantagens: custos e tempo, variedade e profundidade das informações coletadas em relação ao censo, testes destrutivos, testes de novos tratamentos na medicina. Técnicas de amostragem Amostras probabilísticas – os elementos são escolhidos de maneira aleatória (sorteio). Estudos econômicos e sociais. Amostras não probabilísticas (não aleatórias) – elementos escolhidos intencionalmente. Estudos médicos. Técnicas probabilísticas: Amostragem aleatória simples – sortear os elementos aleatoriamente (mesma probabilidade). Amostragem estratificada – leva em conta diferenças entre os estratos, mantendo proporções presentes na população também na amostra que a representa. Técnicas não probabilísticas: Amostragem acidental – exemplo: pesquisas de opinião (rua). Amostragem intencional – critérios preestabelecidos. Distribuições amostrais Distribuição amostral – conjunto completo com todas as amostras possíveis para um dado número de elementos. A média da distribuição amostral (𝝁𝒙�) é igual à média da população (𝝁), ou seja, 𝝁𝒙� = 𝝁. Quando o número de dados é muito grande, a distribuição dos valores das médias das amostras aproxima-se da curva normal e a distribuição fica em torno da média populacional. O desvio-padrão das médias é dado por 𝝈𝒙� = 𝝈𝒏 o que significa que quanto maior a dispersão na população, maior será o desvio-padrão das médias. Por outro lado, quanto maior for a amostra, menor será 𝝈𝒙�. Estimação Como estimar a confiabilidade de valores obtidos por meio de uma amostragem? Exemplo: média. (média obtida) – (média para a população) = erro, ou seja, 𝒙� − 𝝁 = 𝒆 ⇒ 𝝁 = 𝒙� − 𝒆. O erro estimado é 𝒆 = 𝒛.𝝈 𝒏 e z é a grandeza que usamos para determinar áreas sob a curva gaussiana (distribuição normal padrão). Antes, a partir do valor encontrado para z, encontrávamos a área correspondente com o auxílio da tabela, agora, escolhemos a probabilidade (a área) e obtemos o valor de z associado. Intervalos de confiança Tendo encontrado z, substituímos seu valor na expressão do erro 𝒆 = 𝒛.𝝈 𝒏 e, então, encontramos o intervalo. Aplicação: Uma pesquisa verificou que os funcionários de uma empresa levam, em média, 2h para ir de casa para o trabalho, com desvio-padrão de 0,5h, a partir de uma amostra com n = 100. O erro é dado por e = 0,05*z. A tabela a seguir apresenta os resultados. Confiança z e Intervalo 90% 1,65 0,0825 1,9175 a 2,0825 95% 1,96 0,0980 1,9020 a 2,0980 99% 2,58 0,1290 1,8710 a 2,1290 Interatividade Uma pesquisa sobre e-mails constatou que cada usuário recebe, em média, 20 mensagens de spam por dia, com desvio-padrão de 5, a partir de uma amostra com n = 100. Podemos afirmar que: a) O erro é dado por 𝒆 = 𝒛 𝟐⁄ e quanto maior a confiança, menor será o seu valor. b) O erro é dado por 𝒆 = 𝟐 ∗ 𝒛 e quanto maior a confiança, maior será o seu valor. c) O erro é dado por 𝒆 = 𝟐 ∗ 𝒛 e quanto maior a confiança, menor será o seu valor. d) O erro é dado por 𝒆 = 𝒛 𝟐⁄ e quanto maior a confiança, maior será o seu valor. e) Nenhuma das alternativas anteriores. ATÉ A PRÓXIMA! Slide Number 1 Noções de teoria de conjuntos Conjunto vazio, subconjuntos e diagramas de Venn Operações com conjuntos – diferença Operações com conjuntos – diferença Operações com conjuntos – interseção�(elementos que pertencem a A e a B) Operações com conjuntos – união�(elementos que pertencem a A ou a B) Conjuntos disjuntos�Conjuntos com elementos comuns Diagrama de Venn com os elementos Diagrama de Venn com os elementos (3 conjuntos)�Exemplo 1 Diagrama de Venn – número grande de elementos Diagrama de Venn com contagem de elementos Diagrama de Venn – aplicação �Aplicação – pesquisa sobre e-mails�100 – Gmail (G), 80 – Hotmail (H), 20 – comuns, 40 – nenhum dos dois� Diagrama de Venn – aplicação com 3 conjuntos Aplicação – pesquisa sobre e-mails (2)�170 – G, 150 – H, 160 – Y, 40 – G, H e Y, 50 – G e H, 50 – G e Y, 60 – Y e H, 40 alunos nenhum dos três Interatividade Resposta Propriedades das probabilidades Regra da adição – P(A ou B) Regra da adição – aplicação (pesquisa sobre e-mails)�100 – Gmail (G), 80 – Hotmail (H), 20 – comuns, 40 – nenhum dos dois. Total: 200 participantes (já visto) Regra da multiplicação – P(A e B) Regra da multiplicação – aplicação Análise combinatória�Princípio Fundamental da Contagem Exemplo: senha de acesso Permutações Permutações – fatorial de um número Arranjos Combinações Interatividade Resposta Distribuições de probabilidade�Variáveis aleatórias Variáveis aleatórias – tipos de distribuições Distribuição binomial Distribuição binomial Distribuição binomial – aplicação Distribuição binomial – aplicação (continuação) Distribuição de probabilidade binomial – gráfico�(alto grau de segurança: máximo de 3 computadores) Distribuição uniforme de probabilidades Distribuição uniforme – gráfico Distribuição normal de probabilidades�(distribuição gaussiana) Distribuição normal Distribuição normal padrão – gráfico (curva gaussiana) Interatividade Interatividade Resposta Resposta Distribuição normal padrão (ou padronizada) Tabela da distribuição normal reduzida de 0 a z Tabela (continuação) Exemplo – troca de celular entre 1 ano e 1 ano e meio Gaussiana do exemplo – troca de celular entre 1 ano e 1 ano e meio ( 𝒛 𝟏 =−𝟏 e 𝒛 𝟐 =𝟎) Inferência e estimação – definições úteis Técnicas de amostragem Distribuições amostrais Estimação Intervalos de confiança Interatividade Resposta Slide Number 60
Compartilhar