Baixe o app para aproveitar ainda mais
Prévia do material em texto
Introdução a Bioestatística Roteiro de aula ● Estatística - é a ciência que tem por objetivo coletar dados, tabular, analisar e interpretar informações e delas extrair conclusões válidas para a tomar decisões. ● Estatística descritiva- ramo da estatística que aplica várias técnicas (baseada na matemática) para descrever e sumarizar um conjunto de dados. ● Estatística inferencial- aplica várias técnicas (baseada na matemática), a partir de uma amostra, para tirar conclusões sobre uma população. ● Bioestatística - aplicação da estatística nos campos relacionados a Saúde, Biologia, Biotecnologia, entre outros. ● População-conjunto de quaisquer elementos (valores, pessoas, objetos, etc... .). ● Amostra- é um subconjunto de uma população. ● Amostra aleatória- os elementos da população são escolhidos de tal forma que cada um deles tenha igual chance de fazer parte da amostra. ● Amostra Aleatória Simples de n elementos – escolhe-se, de maneira que toda a amostra de tamanho n possível tenha a mesma chance de ser escolhida. ● Média aritmética, variância e desvio padrão. Ex: 1,2, e 3; 𝑁𝑜𝑡𝑎çã𝑜: 𝑁 = 3 (𝑃𝑜𝑝𝑢𝑙𝑎çã𝑜); 𝑛 = 3 (𝐴𝑚𝑜𝑠𝑡𝑟𝑎) Média: ∑ 𝑋𝑖 3 𝑖=1 𝑁 = 𝑋1+𝑋2+𝑋3 𝑁 = 1+2+3 3 = 2 (População); Média: ∑ 𝑋𝑖 3 𝑖=1 𝑛 = 𝑋1+𝑋2+𝑋3 𝑛 = 1+2+3 3 = 2 (Amostra). Variância: média das distâncias de cada valor da série em relação à média do grupo. Variância: ∑ (𝑋𝑖−2) 23 𝑖=1 𝑁 = (1−2)2+(2−2)2+(3−2)2 3 = 0,67; Desvio padrão: √ ∑ (𝑋𝑖−µ) 23 𝑖=1 𝑁 = √0,67=0,82. Notação Variância populacional: 𝜎2 = ∑ (𝑋𝑖−µ) 2𝑁 𝑖=1 𝑁 = ∑ 𝑋𝑖 2𝑁 𝑖=1 𝑁 − µ2; Variância Amostral: 𝑆2 = ∑ (𝑋𝑖−�̅�) 2𝑛 𝑖=1 𝑛−1 = ∑ 𝑋𝑖 2− (∑ 𝑋𝑖 𝑛 𝑖=1 ) 2 𝑛 𝑛 𝑖=1 𝑛−1 . Desvio padrão: raiz quadrada da variância. Desvio Padrão Populacional: 𝜎 = √ ∑ (𝑋𝑖−µ) 2𝑁 𝑖=1 𝑁 = √ ∑ 𝑋𝑖 2𝑁 𝑖=1 𝑁 − µ2; Desvio Padrão Amostral: 𝑆 = √ ∑ (𝑋𝑖−�̅�) 2𝑛 𝑖=1 𝑛−1 = √∑ 𝑋𝑖2− (∑ 𝑋𝑖 𝑛 𝑖=1 ) 2 𝑛 𝑛 𝑖=1 𝑛−1 . Exercício de interpretação 1: Interpretar os resultados da pressão arterial sistólica e diastólica de 2 de dois grupos de atletas (A e B) após uma mesma prova de esforço. A: médias 12/8 e variâncias: 0,005/0,004 B: médias 12/8 e variâncias: 17,08/ 15,09 Exercício 2: Determinar o peso médio, a variância e o desvio padrão de uma amostra aleatória de 10 recém-nascidos, em uma maternidade. Pesos em quilogramas, como mostrado a seguir: 3,95 3,30 4,40 3,78 3,45 3,88 4,36 3,85 3,75 4,18 Média: ∑ 𝑋𝑖 𝑁 𝑖 𝑛 = 𝑋1+𝑋2+𝑋3+𝑋4+𝑋5+𝑋6+𝑋7+𝑋8+𝑋9+𝑋10 𝑛 = 3,95+3,30+4,40+3,78+3,45+3,88+4,36+3,85+3,75+4,18 10 = 3,89 𝑆2 = ∑ (𝑋𝑖−�̅�) 2𝑛 𝑖=1 𝑛−1 = ∑ 𝑋𝑖 2− (∑ 𝑋𝑖 𝑛 𝑖=1 ) 2 𝑛 𝑛 𝑖=1 𝑛−1 = 152,46− (38,90)2 10 9 = 0,13 S=√ ∑ (𝑋𝑖−�̅�) 2𝑛 𝑖=1 𝑛−1 = √∑ 𝑋𝑖 2− (∑ 𝑋𝑖 𝑛 𝑖=1 ) 2 𝑛 𝑛 𝑖=1 𝑛−1 = √ 152,46− (38,90)2 10 9 = 0,36 Usando o BioEstat: Abrir BioEstat ►Planilha (Dados ►inserir os dados por coluna usando o ponto no lugar da vírgula-marcar dados) ► clicar em Estatísticas ►clicar em Estatística Descritiva ►clicar em Dados Quantitativos ►Abre quadro (Seleção de amostra para estatísticas Descritivas-Colunas disponíveis 1 #1) ►clicar em >> ►clicar em Executar Estatística (abre quadro com as Estatísticas) ►Editar ►Copiar resultados. - 1 - Tamanho da amostra = 10 Mínimo 3.3000 Máximo 4.4000 Amplitude Total 1.1000 Mediana 3.8650 Primeiro Quartil (25%) 3.7575 Terceiro Quartil (75%) 4.1225 Desvio Interquartílico 0.3650 Média Aritmética 3.8900 Variância 0.1271 Desvio Padrão 0.3565 Erro Padrão 0.1127 Coeficiente de Variação 9.16% Assimetria (g1) -0.1031 Curtose (g2) -0.5189 Média Harmônica = 3.8601 N (média harmônica) = 10 Média Geométrica = 3.8751 N (média geométrica) = 10 Variância (geom.) = 1.0037 Desvio Padrão (geom.) = 1.0970 Exercício 3: Dado o seguinte conjunto de tempos de reação (em segundos) de seis indivíduos a um estímulo, 4 2 3 3 6 3. Calcular a média, mediana, moda, a variância e o desvio padrão. ●Estudo observacional- verificamos e medimos características específicas, não tentamos modificar os elementos a serem estudados. Ex 1: Local da floresta onde os pássaros se alimentam. Estação do ano Árvores Arbusto Chão Total Primavera 30 20 9 59 Outono 13 22 26 61 Total 43 42 35 120 Perguntas: Dado que estamos na primavera, qual a proporção dos que se alimentam no chão? Dado que os pássaros se alimentam no arbusto, qual a proporção na primavera? ●Estudo experimental- aplicamos determinado tratamento e passamos, então a observar seus efeitos sobre a variável dos elementos a serem estudados. Ex2: Comparação da eficácia de 4 variedades (tratamentos) de um medicamento A B C D 31 24 59 54 23 19 74 46 22 42 43 61 45 33 42 37 49 33 57 52 Perguntas: Neste caso, quais são as unidades amostrais? Quais seriam algumas variáveis de interesse? ● Tipos de variáveis Qualitativa (classificação- categorica) Quantitativa (númerica) Nominal: sexo, estado civil, tipo sanguíneo, etc... . Discreta: número de pessoas doentes, número de filhos, nºde pessoas que usam ortodôntico, etc... . Ordinal: nível de escolaridade, intensidade do exercício físico, estágio de uma doença, etc.. . Contínua: peso de uma pessoa, estatura, idade, etc,... . ● Tabulação e gráficos. Variável qualitativa: Distribuição do sexo com relação ao habito de fumar Sexo Fumantes Não fumantes Ex-fumantes Total Masculino 60 (60%) 40 (40%) 50 (50%) 150 (50%) Feminino 40 (40%) 60 (60%) 50 (50%) 150 (50%) .Total 100 100 100 300 Tipo de gráficos: colunas, barras e setores. Perguntas: Considerando o grupo Masculino, qual o percentual de não fumantes? Qual o percentual de fumantes do sexo Feminino? Exercício 1: Construir gráficos para representar a tabela de dupla entrada acima. Variável quantitativa discreta: Nº de filhos por família em 25 domicílios de certa localidade Nº de Filhos Frequência (ni) fi 0 1 0,04 1 4 0,16 2 10 0,40 3 6 0,24 4 2 0,08 5 2 0,08 Total 25 1,00 Exercício 2: Construir o gráfico em barras. Sugestão: Use o Bioestat. Variável quantitativa contínua: Distribuição de frequência das alturas, expressas, em centímetros, de 30 atletas do sexo masculino de uma Universidade. Classe(cm) xi ni fi Fi% Ni Fi Fi% 162 a 167 164,5 4 0,13 13 4 0,13 13 167 a 172 169,5 9 0,30 30 13 0,43 43 172 a 177 174,5 8 0,27 27 21 0,70 70 177 a 182 179,5 6 0,20 20 27 0,90 90 182 a 187 185,5 3 0,10 10 30 1,00 100 Total - 30 1,00 100 - - - ● xi é o ponto médio da i-ésima classe; é a média dos pontos extremos da classe; ● n é quantidade total de observações; ● ni é a quantidade de observações, ou frequência, da i-ésima classe ( que se supõe concentrada no respectivo ponto médio); ● fi é a frequência relativa da classe, obtida dividindo-se ni por n; ● Ni é a frequência acumulada até a i-ésima classe, e indica a quantidade de observações inferiores ao limite superior da classe; é obtida somando-se os valores das frequências observadas; ● Fi é a frequência relativa acumulada, obtida dividindo-se Ni pelo total de observações. Histograma e polígono de frequência: é um conjunto de retângulos com bases sobre um eixo dividido de acordo com os tamanhos de classe, centros nos pontos médios Exercício 3: Construir o Histograma das alturas em centímetros. 168 172 170 181 169 173 164 175 182 177 176 173 170 186 183 170 168 166 169 180 175 164 181 179 172 169 174 171 178 166 (ordenar os dados). Procedimento: Calcular a amplitude total: diferença entre o maior e o menor valor; dividi-la pelo nº de classes (neste caso, escolher entre 5 e 10 classes); o valor encontrado será o comprimento da classe, o qual deverá ser somado ao limite inferior dasérie para construção da 1ª classe, e assim por diante. Então, a 1ª classe se inicia no limite inferior até o valor encontrado após a soma acima, exclusive. Sugiro, também, a construção deste histograma pelo Bioestat: clicar em gráficos e histograma. Usando o BioEstat: Abrir BioEstat ►Planilha (Dados ►inserir os dados por coluna-marcar dados) ► clicar em Gráficos ►clicar em Histograma ► Seleção de amostras para gráfico Histograma ( colunas disponíveis=1) ► clicar >> ► clicar em Executar Estatística (os dados estão distribuídos em intervalos de classe ►Não) ►Aparece um quadro: Especificação das classes preencha e clique em confirmar ) ►Histograma aparece ► clicar em Editar ►Copiar (metafile). Polígono de frequência ● Medidas de posição associadas a variáveis quantitativas e gráfico Box Plot. Percentis- divide uma série de dados em 100 grupos (1% cada grupo). Posição (ordem) do percentil (K) de ordem 𝐿 = ( 𝐾 100 ) × 𝑛 + 0,5 Ex: 1 2 3 4 5 𝐾 = 50►L = ( 50 100 ) × 5 + 0,5 = 3(3º 𝑣𝑎𝑙𝑜𝑟 𝑑𝑎 𝑠é𝑟𝑖𝑒 𝑜𝑟𝑑𝑒𝑛𝑎𝑑𝑎)►𝑃50 = 3(𝑝𝑒𝑟𝑐𝑒𝑛𝑡𝑖𝑙 𝑑𝑒 𝑜𝑟𝑑𝑒𝑚 50 = 𝑚𝑒𝑑𝑖𝑎𝑛𝑎); 𝑑𝑎í 𝑃25 = 1,75 𝑒 𝑃75 = 4,25. OBS: 𝑃25 = 1º 𝑄𝑢𝑎𝑟𝑡𝑖𝑙; 𝑃50 = 2º 𝑄𝑢𝑎𝑟𝑡𝑖𝑙 = 𝑚𝑒𝑑𝑖𝑎𝑛𝑎; 𝑃75 = 3º 𝑄𝑢𝑎𝑟𝑡𝑖𝑙 Limites de discrepância: Inferior(I) e superior(S) I=𝑃25 − 1,5(𝑃75 − 𝑃25); 𝑆 = 𝑃75 + 1,5(𝑃75 − 𝑃25). Valores discrepantes, atípicos ou outliers podem ser ou não as observações: < 𝑃25 − 1,5(𝑃75 − 𝑃25) = 𝐼; > 𝑃75 + 1,5(𝑃75 − 𝑃25) = 𝑆 25% 25% 25% 25% 1ºQ md=µ 3ºQ ● Diagrama em caixas (Box Plot): para construir, consideramos um retângulo em que estão representados a mediana e os quartis. A partir do retângulo, para cima, segue uma linha até o ponto mais remoto que não exceda 𝑆 = 𝑃75 + 1,5(𝑃75 − 𝑃25), 𝑐ℎ𝑎𝑚𝑎𝑑𝑜 𝑙𝑖𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 𝑑𝑒 𝑑𝑖𝑠𝑐𝑒𝑝â𝑛𝑐𝑖𝑎. De modo similar, da parte inferior do retângulo, para baixo, segue uma linha até o ponto mais remoto que não seja menor do que I=𝑃25 − 1,5(𝑃75 − 𝑃25), 𝑐ℎ𝑎𝑚𝑎𝑑𝑜 𝑙𝑖𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 𝑑𝑒 𝑑𝑖𝑠𝑐𝑟𝑒𝑝â𝑛𝑐𝑖𝑎 . As observações de discrepâncias que estiverem acima do limite superior ou abaixo do limite inferior serão chamadas pontos exteriores ( podem ser ou não chamados de valores discrepantes, atípicos ou outliers). O box plot dá uma ideia da posição, dispersão assimetria, caudas e dados discrepantes. Ex 1: 1 2 3 4 5 Abrir BioEstat ►Planilha (Dados ►inserir os dados por coluna-marcar dados) ►clicar em Gráficos ►clicar em Box-Plot: mediana e quartis ou média e desvios ►Seleção de amostras para gráfico Box-Plot (colunas disponíveis=1) ►clicar >> ►clicar em Executar Estatística ► Gráfico Box-Plot aparece ►clicar em Editar ►Copiar (metafile). Para revelar tendências centrais, dispersão, tipo de distribuição e a presença de outliers (valores extremos). Exercício 1: a) Usando o Box Plot comparar a eficácia das 4 variedades (tratamentos) do Ex 2. b) Calcular a variância entre médias (MSR) e a variância total (MSE). Calcula F=MSR/MSE. Comentar: Exercício 2: Refazer o Box Plot acima a) usando como referência a média e o desvio padrão. Assimetria: �̅� < 𝑚𝑒𝑑𝑖𝑎𝑛𝑎 < 𝑚𝑜𝑑𝑎► 𝑎𝑠𝑠𝑖𝑚𝑒𝑡𝑟𝑖𝑎 𝑛𝑒𝑔𝑎𝑡𝑖𝑣𝑎 �̅� = 𝑚𝑒𝑑𝑖𝑎𝑛𝑎 = 𝑚𝑜𝑑𝑎 ►𝑠𝑖𝑚é𝑡𝑟𝑖𝑐𝑎 𝑚𝑜𝑑𝑎 < 𝑚𝑒𝑑𝑖𝑎𝑛𝑎 < �̅�► 𝑎𝑠𝑠𝑖𝑚𝑒𝑡𝑟𝑖𝑐𝑎 𝑝𝑜𝑠𝑖𝑡𝑖𝑣𝑎 assimétrica negativa simétrica assimétrica positiva ● Índice de assimetria de Pearson. 𝐼 = 3(�̅� − 𝑚𝑒𝑑𝑖𝑎𝑛𝑎) 𝑠 . 𝑆𝑒 𝐼 ≥ 1,00 𝑜𝑢 𝐼 ≤ 1,00, 𝑜𝑠 𝑑𝑎𝑑𝑜𝑠 𝑝𝑜𝑑𝑒𝑚 𝑠𝑒𝑟 𝑐𝑜𝑛𝑠𝑖𝑑𝑒𝑟𝑎𝑑𝑜𝑠 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐𝑎𝑚𝑒𝑛𝑡𝑒 𝑎𝑠𝑠𝑖𝑚é𝑡𝑟𝑖𝑐𝑜𝑠, 𝑝𝑜𝑠𝑖𝑡𝑖𝑣𝑎𝑚𝑒𝑛𝑡𝑒 𝑒 𝑛𝑒𝑔𝑎𝑡𝑖𝑣𝑎𝑚𝑒𝑛𝑡𝑒, 𝑟𝑒𝑠𝑝𝑒𝑐𝑡𝑖𝑣𝑎𝑚𝑒𝑛𝑡𝑒. Aproximadamente simétrica Exercício 3: Calcular o Índice de assimetria de Pearson dos dados do Exercício 4, abaixo. ● Gráfico ramo – e – folhas Exercício 1: A ingestão diária média, per capita, em gramas, de proteínas para 33 países desenvolvidos é: 81 94 116 108 74 79 101 87 93 105 109 93 106 103 100 93 100 78 101 101 95 90 94 90 91 92 100 87 89 90 89 86 85 Solução: Para fazer o ramo- e- folhas, começamos com uma linha vertical ou horizontal com a seguinte escala: Divide-se cada valor por 10 (10 gramas por classe) a partir de 74g. O ramo será a parte inteira e as folhas a fracionária (Boxplot: abrir planilha, clicar em: gráficos, caule e folhas,>>; marcar: Unidade; 2 linhas e exibir diagrama. CAULE FOLHA Escores = 33 1 7 4 2 7 8 9 1 8 1 6 8 5 6 7 7 9 9 10 9 0 0 0 1 2 3 3 3 4 4 1 9 5 7 10 0 0 0 1 1 1 3 4 10 5 6 8 9 0 11 1 11 6 Exercício 2: Construir o box plot e a representação Ramo e Folhas para o experimento, abaixo. Suponhamos um experimento para decidir sobre a eficácia de 2 tipos de medicamento A e B em relação a taxa de hemoglobina (padronizada).Cada um aplicado a 18 e 21 pacientes, respectivamente. Adubo A Adubo B 45 60 54 57 55 58 62 55 70 50 52 59 38 48 64 59 55 56 55 56 55 61 52 53 54 59 48 57 57 50 65 55 60 55 58 54 - - - 59 51 56 Somatório: Mostrar: ∑ (𝑥𝑖 − 𝑦𝑖) 𝑛 𝑖=1 = ∑ 𝑥𝑖 𝑛 𝑖=1 − ∑ 𝑦𝑖 𝑛 𝑖=1 Aplicar: X =( 3,4,1,4,3,3,2) é o número de brotos por cepa de eucalipto; Y=( 10,1 11,1 10,7 13,1 14,5, 13,5 12,5) é a altura das cepas. (3-10,1)+(4-11,1)+ ... . +(2-12,5)= -65,50 (3+4+... .+3+2) – (10,1+11,1+... .13,5+ 12,5)=20-85,50=-65,5. ● Coeficiente de variação (CV): expresso em porcentagem, para descrever o desvio padrão em relação a média; permite comparar a variabilidade de conjunto de dados com diferentes unidades de medida. 𝑠 �̅� × 100 ou 𝜎 µ × 100 Exercício 1: QIs de 2 escolas: A (45 62 38 55 54 65⇒�̅� = 53,17 𝑒 𝑠 = 9,30 ⇒ 𝐶𝑉 = 0,17) e B (57 50 59 61 57 55⇒�̅� = 56,50 𝑒 𝑠 = 3,45 ⇒ 𝐶𝑉 = 0,06). 𝐶𝑜𝑛𝑐𝑙𝑢𝑠ã𝑜: 𝐸𝑠𝑐𝑜𝑙𝑎 𝐵 > 𝑚é𝑑𝑖𝑎 é 𝑚𝑎𝑖𝑠 𝑒𝑠𝑡á𝑣𝑒𝑙. Exercício 2: Em cinco testes de resistência, uma pessoa obteve �̅� = 63,2 𝑒 𝑠 = 3,1. Outra pessoa teve �̅� = 78,5 𝑒 𝑠 = 5,5. Qual dos dois é mais consistente? Coeficiente de Correlação (variável quantitativa) Introdução: • Existem situações nas quais há interesse em estudar o comportamento conjunto de uma ou mais variáveis; • Em muitos casos, a explicação de um fenômeno de interesse pode estar associada a outros fatores (variáveis) que contribuem de algum modo para a ocorrência deste fenômeno. • O comportamento conjunto de duas variáveis quantitativas pode ser observado por meio do gráfico de dispersão. Tipo de correlação: negativa, nula e positiva r é o coeficiente de correlação de Pearson, −𝟏 ≤ 𝒓 ≤ 𝟏 Diagramas de dispersão Perfeita negativa: r=-1 Correlação nula r=0 Perfeita positiva r=1 Exemplo X=(1 2 3 4 5); Y=(1 2 4 5 8) Quadro de cálculo r= ∑ 𝑥𝑦− ∑ 𝑥 ∑ 𝑦 𝑛 √(∑ 𝑥2− (∑ 𝑥)2 𝑛 )(∑ 𝑦2− (∑ 𝑦)2 𝑛 ) = 77− 15𝑥20 5 √(55− 152 5 )(110− 202 5 ) = 0,98 X Y 𝑥2 𝑦2 xy 1 1 1 1 1 2 2 4 4 4 3 4 9 16 12 4 5 16 25 20 5 8 25 64 40 Total 20 55 110 77 Usando o BioEstat: Abrir BioEstat ►Planilha (Dados ►inserir os dados por coluna) ►Coluna da esquerda (Y) e Coluna da direita X (sempre marcar as colunas) ►clicar em Estatísticas ►clicar em Correlação ►Clicar em coef.De Correlação de Pearson ►Abre quadro: Seleção de amostras para Teste de Correlação Linear ►clicar em >> ► clicar em Executar Estatística ►Abre quadro: Teste de Correlação linear ►clicar em Editar ►Copiar Resultados: Colunas 1 e 2 n (pares) = 5 r (Pearson) = 0.9815 IC 95% = 0.74 a 1.00 IC 99% = 0.47 a 1.00 R2 = 0.9633 t = 8.8780 GL = 3 (p) = 0.0030 Poder 0.05 = 0.9515 Poder 0.01 = 0.8361 Continuando: Clicar em Gráfico (abre quadro) ►Editar ►Copiar (metafile) Diagrama de dispersão Exercício 1: Calcular o coeficiente de correlação de Pearson Idade(X) Escore de Gesell (Y) 15 95 26 71 10 83 9 91 15 102 20 87 18 93 11 100 8 104 20 94 7 113 9 96 10 83 11 84 11 102 10 100 12 105 42 57 17 121 11 86 10 100 Teste de Gessell- Instrumento de avaliação do desenvolvimento infantil (a medida que aumenta a idade diminui a falta de habilidade mental) r= ∑ 𝑥𝑦− ∑ 𝑥 ∑ 𝑦 𝑛 √(∑ 𝑥2− (∑ 𝑥)2 𝑛 )(∑ 𝑦2− (∑ 𝑦)2 𝑛 ) = 26864− 302𝑥1967 21 √(5606− 3022 21 )(188155− 19672 𝑛 ) = −0,64 Mede a grau de associação entre as duas variáveis Coeficiente de determinação: 𝑟2 = −0,642 = 0,41 ou 41% Em percentual especifica o quanto X explica da variação de Y Exercício 2: Elaborar o diagrama de dispersão, calcular r e 𝑟2 . Interpretar os resultados. Pressão sistólica (P.S) e idade de 15 participantes de pesquisa. Idade P.S 39 144 47 220 45 138 47 145 65 162 46 142 67 170 42 124 67 158 56 154 64 162 56 150 59 140 34 110 42 128 Exercício 3: Abaixo é apresentado um quadro que associa o número de vistos concedidos por vinte países no ano de 2011 e a entrada de turistas nestes países. Elaborar o diagrama de dispersão, calcular r e 𝑟2 . Interpretar os resultados. Número de vistos concedidos (em milhões) Entradas no País (em milhões) 575 95 525 85 200 20 455 71 360 52 350 50 125 5 425 65 150 10 500 80 300 400 125 5 260 32 290 38 350 50 575 95 475 75 375 55 600 100 225 25 Coeficiente de contingência (variável qualitativa) Em estatística, quando estudamos medidas de associação para variáveis qualitativas podemos associar variáveis com o objetivo de saber se existe um relacionamento entre suas características. Esse estudo, chamado de Análise Bidimensional. Ex: Sintomas(grau) de ansiedade Sexo Sintomas Masculino Feminino Total Sim 𝑂11=50 𝐸11= 50 𝑂12=50 100 Não 𝑂21=50 𝑂22=50 100 Total 100 100 200 𝑙 = 2; 𝑐 = 2 𝑂𝑖𝑗= frequência observada. Ex: 𝑂11=50 𝐸𝑖𝑗= frequência esperada calculada na hipótese de independência entre as variáveis. 𝑖 = 1,2, … . 𝑙; 𝑗 = 1,2, … . 𝑐; 𝑛 = 𝑡𝑎𝑚𝑎𝑛ℎ𝑜 𝑑𝑎 𝑎𝑚𝑜𝑠𝑡𝑟𝑎 Então: 𝐸𝑖𝑗 = 𝑡𝑜𝑡𝑎𝑙 𝑑𝑎 𝑙𝑖𝑛ℎ𝑎 𝑖×𝑡𝑜𝑡𝑎𝑙 𝑑𝑎 𝑐𝑜𝑙𝑢𝑛𝑎 𝑗 𝑛 ⇒ 𝐸11= 100×100 200 =50 OBS: A frequência esperada na hipótese de independência, no Ex acima, é igual a frequência observada. Conclusão sobre as variáveis: Para medir o grau de dependência usaremos o Coeficiente de Contingência 𝐶 de Pearson. 𝐶 = √ 𝜒2 𝜒2+𝑛 , onde: n é o tamanho de observações da amostra; 𝐶 é um número entre 0 e 1 (0 ≤ 𝐶 < 1). Se próximo de zero decidimos pela independência das variáveis; 𝜒2é 𝑜 𝑄𝑢𝑖 − 𝑞𝑢𝑎𝑑𝑟𝑎𝑑𝑜. 𝜒2 = ∑ ∑ ( (𝑂𝑖𝑗 − 𝐸𝑖𝑗) 2 𝐸𝑖𝑗 ) 𝑙 1=1 𝑐 𝑗=1 (𝑂𝑖𝑗 − 𝐸𝑖𝑗) 2 é 𝑢𝑚𝑎 𝑚𝑒𝑑𝑖𝑑𝑎 𝑑𝑒 𝑑𝑖𝑠𝑡â𝑛𝑐𝑖𝑎 𝑒𝑛𝑡𝑟𝑒 𝑎𝑠 𝑓𝑟𝑒𝑞𝑢ê𝑛𝑐𝑖𝑎𝑠 Coeficiente de contingência corrigido: 𝐶∗ = 𝐶 √ 𝑡−1 𝑡 , 𝑜𝑛𝑑𝑒 𝑡 é 𝑜 𝑚í𝑛𝑖𝑚𝑜 𝑒𝑛𝑡𝑟𝑒 𝑙 𝑒 𝑐. Para o Exemplo acima temos: 𝜒2 = (𝑂11 − 𝐸11) 2 𝐸11 + (𝑂12 − 𝐸12) 2 𝐸12 + (𝑂21 − 𝐸21) 2 𝐸21 + (𝑂22 − 𝐸22) 2 𝐸22 = 0 𝜒2 = (50 − 50)2 50 + (50 − 50)2 50 + (50 − 50)2 50 + (50 − 50)2 50 = 0 𝐶 = √ 𝜒2 𝜒2 + 𝑛 = √ 0 0 + 200 = 0 Conclusão: As variáveis são independentes, ou seja, o grau de ansiedade não depende do sexo. Exercício 1: Calcule e interprete o coeficiente de contingência 𝐶 em relação ao peso e o sexo de 600 pessoas que praticam atividade física. Os dados estão no quadro abaixo: 𝐸11 = 170 × 300 600 = 85; 𝐸12 = 170 × 300 600 = 85; 𝐸21 = 250 × 300 600 ; 𝐸22 = 250 × 300 600 = 125; 𝐸31 = 180 × 300 600 = 90; 𝐸32 = 90. 𝜒2 = (80 − 85)2 85 + (90 − 85)2 85 + (120 − 125)2 125 + (130 − 125)2 125 . + (100 − 90)2 90 + (80 − 90)2 90 = 3,20; 𝐶 = √ 3,20 3,20 + 600 = 0,07; 𝐶𝑜𝑛𝑐𝑙𝑢𝑠ã𝑜: 𝑣𝑎𝑟𝑖á𝑣𝑒𝑖𝑠 𝑖𝑛𝑑𝑒𝑝𝑒𝑛𝑑𝑒𝑛𝑡𝑒𝑠. O peso das pessoas que praticam atividade física não depende do sexo Usando o BioEstat: Abrir BioEstat ►Planilha (Dados ►inserir os dados por coluna) ►sempre marcar as colunas ►clicar em Estatísticas ►clicar em Correlação ►Clicar em coef. de Contingência C ►Abre quadro: Seleção de amostras para Teste de Contingência C ►clicar em >> ► clicar em Executar estatística ►Abre quadro: Teste de Contingência C ►clicar em Editar ►Copiar Resultados. Resultados: 80 120 100 90 130 80 Peso Feminino Masculino Total Acima 80 85 90 85 170 Normal 120 125 130 125 250 Abaixo 100 90 80 90 180 Total 300 300 600 Resultados: Tabela de Contingência = 3 x 2 Qui-quadrado = 3.2105 Coef. de Contingência C = 0.0730 Graus de liberdade = 2 (p) = 0.2008 Exercício 2: Foi feito um estudo multicêntrico para testar o efeito de um anti- hipertensivo sobre a probabilidade de derrame recorrente. Um pesquisador suspeita de que os tratamentos coadjuvantes diferentes ministrados nos diversos centros, embora permitidos no protocolo, podem ter efeito sobre o risco de derrame recorrente. Calcule e interprete o coeficiente de contingência 𝐶. Os dados estão apresentados no quadro abaixo: Exercício 3: Calcule e interprete o coeficiente de contingência 𝐶 em relação ao sexo e o hábito de fumar. Os dados estão apresentados no quadro abaixo: Sexo Fumantes Não fumantes Ex-fumantes Total Masculino 60 40 50 150 Feminino 40 60 50 150 Total 100 100 100 300 Derrame recorrente Centro Sim Não Total A 16 179 195 B 12 70 82 C 21 78 99 D 12 54 66 Total 61 381 442 Exercício 4: Distribuição de portadores de prótese dupla segundo o grupo de renda, em salários mínimos (SM) e disfunção craniomandibular. Grupo de renda Nula Leve Moderada e severa Menos de 5 SM 19 21 10 DE 5 a 10 SM 21 24 5 Mais de 10 SM 25 21 2 Caso,𝜒2𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 > 𝜒 2 𝑡𝑒ó𝑟𝑖𝑐𝑜 = 9,49 , 𝑎𝑠 𝑣𝑎𝑟𝑖á𝑣𝑒𝑖𝑠 𝑠ã𝑜 𝑐𝑜𝑛𝑠𝑖𝑑𝑒𝑟𝑎𝑑𝑎𝑠 𝑑𝑒𝑝𝑒𝑛𝑑𝑒𝑛𝑡𝑒𝑠. Calcule e compare com o coeficiente 𝐶. Alguns conceitos de probabilidade Experimento Aleatório- apresenta mais de um resultado possível. EX 1: O nº de pessoas diagnosticados positivamente, em um município, após o teste de Covid-19 “RT-PCR” (seleção, p.ex, de 10 funcionários); EX 2: O nº de pacientes atendidos na emergência de um centro de traumatologia (máx. de 24 pacientes); EX 3: As espécies de aves que são capturadas numa rede de uma floresta nativa; EX 4: Face, voltada para cima, no lançamento de uma moeda 3 vezes. Espaço amostral (S) - conjunto dos resultados possíveis de um experimento aleatório. EX 1: S=(0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10); Disfunção craniomandibular EX4:S=(ca,ca,ca; ca,ca,co; ca,co,ca; co,ca,ca; ca,co,co; co,ca,co; co,co,ca; co,co,co). ca=cara; co=coroa Evento A,B... .) - subconjunto de um espaço amostral. EX 1: A=(2,5,9 ); EX 2: B= (0,10, 23). Obs- se o resultado é um elemento de A, dizemos que o evento A ocorre. Eventos mutuamente exclusivos ou excludentes- não podem ocorrer mesmo tempo. OBS 1: Complementar de A=�̅� ; P(.)=Probabilidade;U=união (+); ∩=interseção (×); Eventos independentes: a ocorrência de um deles não afeta a probabilidade de ocorrência do outro. Ex: Joga-se uma moeda 2 vezes. O fato de ocorrer cara no primeiro lançamento não afeta a probabilidade de ocorrer cara no segundo lançamento, continua a mesma probabilidade. A e B são complementares se P(A) + P(B) = P(S) = 1 Conceito de probabilidade - é um nº P € [0, 1], associado a ocorrência de um evento. i) 0 ≤ P(A) ≤ 1; ii) P(S)= 1; iii) Se A e B são eventos mutuamente exclusivos ou excludentes, isto é, A∩B=ɸ, então P(AUB)= P(A) + P(B). Obtenção da probabilidade: Conceito clássico- P(A)= 𝑁º 𝑑𝑒 𝑚𝑎𝑛𝑒𝑖𝑟𝑎𝑠 𝑐𝑜𝑚𝑜 𝐴 𝑝𝑜𝑑𝑒 𝑜𝑐𝑜𝑟𝑟𝑒𝑟 𝑛º 𝑑𝑒 𝑒𝑙𝑒𝑚𝑒𝑛𝑡𝑜𝑠 𝑑𝑒 𝑆 ; EX: joga-se uma moeda equilibrada, define-se A=(cara),daí S=(cara,coroa)⇒P(A)= 1 2 . Conceito frequência ou empírico- P(A)= 𝑁º 𝑑𝑒 𝑜𝑐𝑜𝑟𝑟ê𝑛𝑐𝑖𝑎𝑠 𝑑𝑒 𝐴 𝑛º 𝑑𝑒 𝑟𝑒𝑝𝑒𝑡𝑖çõ𝑒𝑠 𝑑𝑜 𝑒𝑟𝑥𝑝𝑒𝑟𝑖𝑚𝑒𝑛𝑡𝑜 ; Considerando o EX acima, joga-se a moeda várias vezes e observa-se o nº de caras, daí P(A)= 𝑛º 𝑑𝑒 𝑐𝑎𝑟𝑎𝑠 𝑛º 𝑑𝑒 𝑣𝑒𝑧𝑒𝑠 𝑞𝑢𝑒 𝑎 𝑚𝑜𝑒𝑑𝑎 𝑓𝑜𝑖 𝑗𝑜𝑔𝑎𝑑𝑎. . Lei dos grandes números- se repetimos um experimento um grande nº de vezes, a probabilidade pela frequência relativa (conceito frequência) de um evento tende para a probabilidade teórica (conceito clássico). Ex 1: Determine a probabilidade de uma pessoa escolhida aleatoriamente ser atingida por um raio este ano na região R. Solução: O espaço amostral consiste nestes dois eventos simples: A pessoa escolhida é atingida (A) ou não (B). Estes eventos não são igualmente prováveis. Porém, sabemos que em um ano recente, 10 pessoas foram atingidas por um raio nesta região. Considerando que a população da região é de 150.000 pessoas, temos que: P(A)= 10 150.000 = 0,00006666 (conceito frequencial ou empírico) Ex 2: Em um teste uma questão típica de múltipla escolha tem 5 respostas possíveis. Respondendo à questão aleatoriamente, qual é a probabilidade de sua resposta estar errada? S=( a, b, c, d, f), então P(resposta errada)= 4 5 ( conceito clássico) Exercício 1: Uma companhia de seguros estudou as causas de morte por acidente doméstico e compilou um arquivo que consistia em 160 mortes causadas por quedas, 120 mortes causadas por envenenamento e 70 causadas por fogo e queimaduras. Selecione aleatoriamente um desses casos, qual é a probabilidade de que a morte tenha sido causada por envenenamento? Exercício 2: Determine a probabilidade de que um casal com três filhos tenha exatamente 2 meninos. Suponha que as probabilidades de menino e menina sejam as mesmas, e que o sexo de uma criança não seja influenciado pelo sexo de qualquer outra. Exercício 3: Ao escolher entre diversos fornecedores de equipamentos biomédicos, um comprador deseja saber a probabilidade de um equipamento falhar durante os dois primeiros anos. Qual conceito você usaria para obter esta probabilidade? Explique. Exercício 4: Em uma pesquisa entre pessoas de um município que tomaram a 1ª a dose da vacina contra a covid 19, 1162 afirmaram que tiveram sintomas, enquanto 2648 afirmaram que não tiveram. Selecionada aleatoriamente uma dessas pessoas, determine a probabilidade de ele ou ela ter tido sintomas. Exercício 5: Uma pesquisa originou os dados amostrais do quadro a seguir: Escovadas por dia Número 1 2 3 228 672 240 Selecionado aleatoriamente um dos entrevistados, qual a probabilidade de obter alguém que escove os dentes três vezes por dia, conforme recomendam os dentistas? Exercício 6: Um casal planeja ter 3 filhos. a. Relacione os 8 resultados distintos possíveis de acordo com o sexo de cada criança. Suponha que estes resultados sejam igualmente prováveis. b. Determine a probabilidade de serem todas meninas. c. Determine a probabilidade de haver ao menos uma criança de cada sexo. d. Determine a probabilidade de exatamente 2 crianças de cada sexo. Exercício 7: Ambos os pais têm o par de genes castanho/azul da cor dos olhos, e cada um deles contribui com um gene para um filho. Suponha que se o filho tem ao menos um gene castanho, essa cor dominara e os olhos serão castanhos. a. Relacione os diferentes resultados possíveis, supondo-os igualmente prováveis. b. Qual a probabilidade de o filho ter olhos castanhos? Exercício 8: Admitindo que a probabilidade de uma criança ser menino (H) é 0,50. Determinar a probabilidade de uma família de seis filhos ter: a) Ao menos um H b) Ao menos um Mulher (M) Regra da Adição P (A ou B) = P (ocorrência de A, ou B, ou ambos) P(AUB)= P(A)+P(B) – P(A∩B) P(A∩B) P(A) P(B) Ss Definição: Os eventos A e B dizem-se mutuamente excludentes ou exclusivos se não podem ocorrer simultaneamente. P(AUB)= P(A)+P(B) P(A) P(B) AA Exercício 1: Se um dos 2072 indivíduos do quadro abaixo é escolhido aleatoriamente. Teste de Seldane Sintoma Seldane Placebo Grupo de controle Total Dor de cabeça 49 49 24 122 Não-dor de cabeça 732 616 602 1950 Total 781 665 626 2072 Determine as seguintes probabilidades: a. De ser obter alguém que fez uso de um placebo ou estava no grupo de controle. P (placebo ou controle) = 665 2072 + 626 2072 = 1291 2072 = 0,623 b. De ser obter alguém que fez uso de um placebo e estava no grupo de controle. P(Placebo e controle)= 0 2072 = 0 c. De ser obter alguém que tenha usado seldane ou estava no grupo de controle. P(seldane U grupo de controle)= P(seldane=A)+P(grupo de controle=B)- P(sedane=A ∩ grupo de controle=B)= P(AUB)= P(A)+P(B)= 781 2072 + 626 2072 = 781+626 2072 = 1407 2072 = 0679 Exercício 1: a) De ser obter alguém que tenha usado Seldane ou que não teve dor de cabeça b) Dado que o indivíduo usou Seldane, qual a probabilidade de ter tido dor de cabeça? https://www.passeidireto.com/arquivo/29450357/estatistica-aplicada-ao- turismo https://www.passeidireto.com/arquivo/29450357/estatistica-aplicada-ao-turismo https://www.passeidireto.com/arquivo/29450357/estatistica-aplicada-ao-turismo Probabilidade condicional- A BBB B P(A/B)= 𝑃(𝐴∩B) 𝑃(𝐵)>0 Ex 1:Teste de Seldane Sintoma Seldane (B) Placebo (C) Grupo de controle Total Dor de cabeça (A) 49 49 24 122 Não-dor de cabeça 732 616 602 1950 Total 781 665 626 2072 Calcular: a) P(AUB)=P(A)+P(B) - P(A∩B) = 122 2072 + 781 2072 − 49 2072 = 854 2072 = 0,412 𝑜𝑢 41,2% ; P(A/B) = 𝑃(𝐴∩𝐵) 𝑃(𝐵) = 49 781 = 0,063; P(C/A) = 𝑃(𝐶∩𝐴) 𝑃(𝐴) = 49 2072 122 2072 = 49 122 Exercício 1: Um grupo de pessoas foi classificado quanto a peso e pressão arterial de acordo com as proporções do quadro a seguir: Pressão/Peso Excesso (C) Normal (D) Deficiente (E) Total Alta (A) 100 8 2 110 Normal (B) 150 54 20 224 Total 250 62 22 334 a) Qual a probabilidade de uma pessoa escolhida ao acaso nesse grupo ter pressão alta (A), dado que tem peso Normal (D). b) Se se verifica que a pessoa escolhida tem excesso de peso (C), qual a probabilidade de ela ter também pressão alta (A)? c) Calcular: P(E/B);P(C/B); P(E/A). Eventos independentes: Sejam A e B eventos de S. Intuitivamente, A e B são independentes, daí 𝑃(𝐴/𝐵) = 𝑃(A∩B) 𝑃(𝐵) = 𝑃(𝐴) ► 𝑃(𝐴 ∩ B) = 𝑃(𝐴). 𝑃(𝐵); 𝑃(𝐵/𝐴) = 𝑃(B∩A) 𝑃(𝐴) = 𝑃(𝐵) ► 𝑃(𝐵 ∩ A) = 𝑃(𝐵). 𝑃(𝐴). Exercício 1: Uma família deseja ter 2 filhos. A probabilidade de nascer Homem ou Mulher em cada nascimento é igual 1 2 . Qual a probabilidade de nascer Homem no segundo nascimento dado que nasceu mulher no primeiro. Então temos os eventos: M=(nasceu mulher no primeiro nascimento); H (nascer homem no segundo nascimento) ►𝑃(𝐻) = 1 2 𝑒 𝑃(𝑀) = 1 2 𝑃(𝐻/𝑀) = 𝑃(H∩M) 𝑃(𝑀) = 𝑃(𝐻) = 1 2 ►𝑃(H ∩ M) = 𝑃(𝐻). 𝑃(𝑀) = 1 2 x 1 2 = 1 4 Exercício 2: Sejam A e B eventos tais que P(A)=0,2, P(B)=p e P(AUB)= 0,6. Calcular p considerando A e B: a) Mutuamente exclusivos; P(AUB)= P(A) + P(B) ⇒ 0,6 = 0,2 + p ⇒ p= 0,4 b) Independentes. P(AUB) = P(A) + P(B) - P(A).P(B) ⇒ 0,6 = 0,2 + p - 0,2p ⇒ P=0,5. Exercício 3: Uma empresa de consultoria participa de duas concorrências para realizar estudos para a produção de vacinas. A probabilidade de vencer a primeira concorrência é de 50% e de vencer a segunda é de 70%, enquanto que a probabilidade de vencer ambas concorrências é 40%. A= (vence a 1ª concorrência); B=(vence a 2ª concorrência) C=(vence ambas as concorrências). Qual a probabilidade de vencer a segunda concorrência dado que ela venceu a primeira? P(B/A) = 𝑃(B∩A) 𝑃(𝐴) = 𝑃(𝐶) 𝑃(𝐴) = 0,4 0,5 =0,8 OBS: A e B são eventos independentes se P(A∩B) = P(A). P(B) Exercício 4: Verifique a associação dos eventos CEGO (C) e SURDO (S), de acordo com as probabilidades do quadro abaixo: CEGO/SURDO 𝑆 𝑆̅ Toial 𝐶 0,0004 0,0796 0,0800 𝐶̅ 0,0046 0,9154 0,9200 Total 0,0050 0,9950 1,0000 Calcule: P(S/C); P(C/S) e conclua. Teorema de Bayes- Partição de um espaço amostral S (i=1,2,3,4) se: Ai∩Aj=Ǿ, B é um evento arbitrário. A4 B B= A1∩B U A2∩B U A3∩B U A4∩B; P(B)= P(A1∩B) + P (A2∩B) + P(A3∩B) + P(A4∩B); P(B/A1)= 𝑃(𝐴1∩𝐵) 𝑃(𝐴1) ► P(A1∩B)=P(A1).P(B/A1); P(A2∩B)=P(A2).P(B/A2); P(A3∩B)=P(A3).P(B/A3); P(A4∩B)=P(A4).P(B/A4). P(B)= P(A1).P(B/A1)+ P(A2).P(B/A2)+ P(A3).P(B/A3)+ P(A4).P(B/A4) P(A1/B)= 𝑃(𝐴1∩𝐵) 𝑃(𝐵) = P(A1).P(B/A1) ∑ P(Ai).P(B/Ai)4𝑖=1 Sejam A1, A2,............,An eventos que formam uma partição de S. Seja B contido em S. Sejam conhecidas P(Ai) e P(B/Ai), i=1,.....n. Então: 𝑃(𝐴𝑗/𝐵)= 𝑃(𝐴𝑗.𝑃(𝐵/𝐴𝑗) ∑ 𝑃(𝐴𝑛𝑖=1 𝑖).𝑃(𝐵/𝐴𝑖) j=1,......,n Exercício 1: Em uma indústria farmacêutica, 3 laboratórios L1, L2 e L3 produzem 30%, 45% e 25%, dos medicamentos, respectivamente. Sabe-se por experiências anteriores, que 2%, 3% e 2% dos A1 A3 A2 medicamentos feitos por cada laboratório estão, respectivamente, fora das especificações. Suponha que um medicamento, já acabado, seja selecionado aleatoriamente. a) Qual é a probabilidade de que tal medicamento esteja fora da especificação? b) Qual a probabilidade de que tenha sido produzido pelo laboratório L1, dado que está fora da especificação? B=FE=(o medicamento está fora da especificação); A1=L1( o medicamento é proveniente do laboratório 1), A2=L2 (idem laboratório 2), A3 = L3 (idem laboratório 3). FE FE= L1∩FE U L2∩FE U L3∩FE; P(FE)= P(L1∩FE) + P (L2∩FE) + P(L3∩FE); P(FE/L1) = 𝑃(𝐿1∩𝐹𝐸) 𝑃(𝐿1) ► P(L1∩FE)=P(L1).P(FE/L1); P(FE/L2) = 𝑃(𝐿2∩𝐹𝐸) 𝑃(𝐿2) ► P(L2∩FE)=P(L2).P(FE/L2); P(FE/L3) = 𝑃(𝐿3∩𝐹𝐸) 𝑃(𝐿3) ► P(L3∩FE)=P(L3).P(FE/L3). P(FE)= P(L1). P(FE/L1) + P(L2). P(FE/L2) + P(L3). P(FE/L3) a) P(FE)= (0,30 x 0,02 + 0,45 x 0,03 + 0,25 x 0,02) = 0,02450. b) P(L1/FE) = 𝑃(L1∩FE) 𝑃(𝐹𝐸) = 0,30× 0,02 0,02450 = 0,24490 L1 L2 L3 Exercício 2: Suponha um teste para Covid em que 95% dos que têm reagem positivamente, enquanto 3% dos que não têm reagem positivamente. Suponha ainda que 2% dos hospedes de um hotel tenham Covid. Qual a probabilidade de um doente escolhido ao acaso, e que reaja positivamente ao teste, ter de fato o mal? Reagem Ter o mal 𝐶 𝐶̅ + 0,95 0,03 - 0,05 0,97 TESTE POSITIVO (+) 𝑃(+) = 𝑃(+ ∩ C)U P(+ ∩ 𝐶 ̅) = 𝑃(𝐶)𝑃(+/𝐶) + P (𝐶 ̅)𝑃(+/ 𝐶 ̅) = (0,02) (0,95) + (0,98) (0,03) = 0,048 𝑃(𝐶/+)= 𝑃(𝐶∩+) 𝑃(+) = 0,019 0,048 = 0,396 Exercício 3: Em uma localidade, 8% dos adultos de mais de 50 anos têm diabetes. Se um médico local diagnostica corretamente 95% das pessoas que tem a doença, e diagnostica erroneamente 2% dos que não a têm, qual a probabilidade de um adulto de mais de 50 anos diagnosticado como portador da doença, ter de fato o mal? 𝑐 + ̅ + ++ 𝑐̅ ●Variável aleatória X É uma função que associa a cada, elemento de um espaço amostral um número real. EX1: Escolhe-se aleatoriamente três nascituros em uma maternidade (verificação da ocorrência do sexo). Então: S= (𝑀𝑀𝑀, 𝑀𝑀𝐹, 𝑀𝐹𝑀, 𝐹𝑀𝑀, 𝑀𝐹𝐹, 𝐹𝑀𝐹, 𝐹𝐹𝑀, 𝐹𝐹𝐹) Seja X o número o número de homens. 𝑋(𝑀𝑀𝑀) = 3; 𝑋(𝑀𝑀𝐹) = 2; 𝑋(𝑀𝐹𝑀) = 2; 𝑋(𝐹𝑀𝑀) = 2; 𝑋(𝑀𝐹𝐹) = 1; 𝑋(𝐹𝑀𝐹) = 1; 𝑋(𝐹𝐹𝑀) = 1; 𝑋(𝐹𝐹𝐹) = 0 Distribuição de probabilidade de X X 𝑋2 P(X) 0 0 1/8 1 1 3/8 2 4 3/8 3 9 1/8 Total - 1 p=1/2, n=3 E(X)= ∑ 𝑋. 𝑃(𝑋)= (0×1/8)+ (1×3/8)+ (2×3/8) +(3×1/8)=1,5 V(X)= E(𝑋2) – (𝐸(𝑋)) 2 = (0×1/8)+ (1×3/8) + (12×3/8) +(9×1/8)- (1,5)2 = 0,75 APP- Probability Distributions ● Distribuição Binomial (Variável Aleatória Discreta) e o Modelo Probabilístico Normal (Distribuição Contínua) Definições: 1- Variável Aleatória (V.A) Seja E um experimento e S o conjunto de todos os resultados possíveis associados ao experimento. Uma função X, que associe a cada elemento sS um número real, X(s) é denominada variável aleatória. Ex. Considere o experimento de se jogar uma moeda duas vezes. Consideremos, o espaço S abaixo, associado a este experimento. S=[caracara, caracoroa, coroacara, coroacoroa]; Seja X a v.a que representa o número de caras .Daí, X(caracara)=2,X(caracoroa)=X(coroacara)=1,X(coroacoroa)=0. caracara 2 caracoroa 1 coroacara 0 coroacoroa Domínio(S) R x 2- Variável Aleatória Discreta e Contínua Seja X uma variável aleatória. Se o número de valores possíveis de X (contradomínio-R x ) for finito ou infinito numerável, denominamos X de variável aleatória discreta. Suponha-se que o contradomínio de X, seja um intervalo, isto é, X possa tomar todos os valores possíveis no intervalo, então, diremos que X é uma variável aleatória contínua. Associadas as variáveis aleatórias temos as suas funções de probabilidades. 3-Distribuição Binomial (Distribuição Discreta) - As probabilidades são constantes e independentes na repetição da experiência aleatória. Considere o evento do EX1, acima: 𝑋(𝑀𝑀𝐹) = 2; 𝑋(𝑀𝐹𝑀) = 2; 𝑋(𝐹𝑀𝑀) = 2 P(X=2)= 𝐶3 2 ( 1 2 ) 2 (1 − 1 2 ) 3−2 = 3/8 ; V(X)= np(1-p); 1-p=q. P(X=x)= 𝐶𝑛 𝑥(𝑝)𝑥(1 − 𝑝)𝑛−𝑥 ; X= 0,1,…… n Exercício1: a) Em um hospital 70% dos profissionais de saúde estão com suspeita da covid-19. Seleciona-se uma amostra de 8(oito) profissionais. Elaborar a distribuição de probabilidade. Calcular o valor esperado, variância e desvio padrão. P(X=0) = 𝐶8 0 (0,70)0(1 − 0,70)8−0= 0,00007 P(X=1) = 𝐶8 1 (0,70)1(1 − 0,70)8−1 = 0,0012. Na tabela: n=8, p=0,7, x=1. Na APP: n= p= x= p(X=x) . . . 8 0,7 1 0.00122 Valor esperado= E(X)= np= 8x0,70=5,6 Variância= V(X)= np(1-p)=8× 0,70x0,30= 1,68 b) Em uma amostra de 10 profissionais de saúde, qual é a probabilidade de que pelo menos 3 profissionais estejam com suspeita da doença? Exercício 2: De acordo com uma pesquisa, um de cada quatro profissionais de saúde de um hospital são hipertensivos. Considere uma amostra de 20 profissionais. a) Calcule a probabilidade de que exatamente quatro sejam hipertensivos. 𝑝 = 1 4 = 0,25; 𝑃(𝑋 = 4) = 𝐶20 4 (0,25)4(1 − 0,25)20−4 = = 𝐶20 4 (0,25)4(0,75)16 = 0,18969 = 18,97%. APP: n= p= X= p(X=x)= b) Calcule a probabilidade de que pelo menos dois profissionais sejam hipertensivos. 𝑃(𝑋 ≥ 2) = c) Se descobrisse que exatamente 12 dos profissionais sejam hipertensivos, você duvidaria da exatidão dos resultados desse estudo? d) Calcule o número esperado de profissionais hipertensivos do hospital. 𝐸(𝑋) = 𝑛𝑝 = 20 × 0,25 = 5 Exercício 3: A probabilidade de um menino ser daltônico é de 8%. Qual é a probabilidade de serem daltônicos todos os 4 meninos que se apresentam, em determinado dia, para um exame oftalmológico? Exercício 4: Um exame é constituído de dez testes tipo certo-errado. Quantos testes acerta, em média, um aluno que nada sabe sobre a matéria do exame? Exercício 5: Suponha que determinado medicamento usado para o diagnóstico precoce da gravidez é capaz de confirmar casos positivos 20 0,25 4 0.18969 em apenas 90% das gestantes muito jovens. Isto porque, em 10%, das gestantes muito jovens, ocorre uma escamação do epitélio do útero, que é confundida com a menstruação. Nestas condições, qual é a probabilidade de 2, de 3 gestantes muito jovens que fizeram uso desse medicamento, não terem confirmado precocemente a gravidez? 4 - O Modelo Normal Seja X uma variável aleatória contínua. A função densidade de probabilidade (fdp), é uma função f, que satisfaz às seguintes condições: f(x) x,0 R x , RX dxxf 1)( Além disso ,definimos para qualquer c<d (em R x ), P(c <X< d) = d c dxxf )( ,onde P representa a probabilidade de X está compreendida no intervalo (c,d). Definição- A variável aleatória X , que tome todos os valores reais x , com parâmetros e 20 tem uma distribuição normal (ou gaussiana), se sua fdp é dada por: xxf e x , 2 1 )( 2 2 2 )( f(X) (b) Gráfico- X (c) Momentos- Pode-se demonstrar que: E(X)= ; V(X)= 2 ; f(x) quando x ; e são os pontos de inflexão de f(x); x= é o valor para o qual ocorre o máximo da função, isto é, f(x)= 2 1 ; f(x) é simétrica em torno de ,isto é, f( )= f( ), x x %;73,993%;45,952%;27,68 3;0 43 curtoseiadeassimetredemomentoCoeficient 7979,0 2 oDesviomedi A área total limitada pela curva e pelo eixo dos x é igual a 1; portanto a área sob a curva ,compreendida entre as duas coordenadas X=a e X=b, em que a<b, representa a probabilidade de X estar situado entre a e b, representada por P(a<X<b). Se X tem distribuição normal , média e variância 2 ,escrevemos: X : N( , 2 ). Quando =0 e 2 =1, temos uma normal padrão ou reduzida, e escrevemos N(0,1). Se X : N( , 2 ) então a v.a Z = X , terá uma distribuição N(0,1). Aplicando o operador E(esperança matemática) à variável Z, temos. dxxxfXE )()( E(Z)=E( X )= )()( EXE = = 00 =0 1)( 1 )()( 2 2 2 2 22 XE X EZE , isto é, Z tem média 0 e variância 1.(prova-se também a normalidade). 4.1- Tabulação da Distribuição Normal (X : N( , 2 ). P(a<X<b)= dxe xb a 2 2 2 )( 2 1 A integral não pode ser calculada exatamente, e a probabilidade acima é obtida aproximadamente por métodos numéricos. No entanto ,para cada valor de e cada valor de , teríamos que obter P(a<X<b) para diversos valores de a e b. Isto pode ser contornado reduzindo a variável X nos moldes de Z, gerando desta forma a tabela para a distribuição normal padrão N(0,1), a saber: P(a<X<b)= )()()()( abbZaPbXaP , onde representa a Função de Distribuição(fdp) da curva normal reduzida, isto é: )( 2 1 )( 2 2 zZPdxez z z )(1)( xx )(z TABELA DA DISTRIBUIÇÃO NORMAL PADRÃO z s dsezzZP 2 2 2 1 )()( Z 0 1 2 3 4 5 6 7 8 9 - 3,0 0 , 0 0 1 3 0 , 0 0 1 0 0 , 0 0 0 7 0 , 0 0 0 5 0 , 0 0 0 3 0 , 0 0 0 2 0 , 0 0 0 2 0 , 0 0 0 1 0 , 0 0 0 1 0 , 0 0 0 0 - 2,9 0 , 0 0 1 9 0 , 0 0 1 8 0 , 0 0 1 7 0 , 0 0 1 7 0 , 0 0 1 6 0 , 0 0 1 6 0 , 0 0 1 5 0 , 0 0 1 5 0 , 0 0 1 4 0 , 0 0 1 4 - 2,8 0 , 0 0 2 6 0 , 0 0 2 5 0 , 0 0 2 4 0 , 0 0 2 3 0 , 0 0 2 3 0 , 0 0 2 2 0 , 0 0 2 1 0 , 0 0 2 0 0 , 0 0 2 0 0 , 0 0 1 9 - 2,7 0 , 0 0 3 5 0 , 0 0 3 4 0 , 0 0 3 3 0 , 0 0 3 2 0 , 0 0 3 1 0 , 0 0 3 0 0 , 0 0 2 9 0 , 0 0 2 8 0 , 0 0 2 7 0 , 0 0 2 6 - 2,6 0 , 0 0 4 7 0 , 0 0 4 5 0 , 0 0 4 4 0 , 0 0 4 3 0 , 0 0 4 1 0 , 0 0 4 0 0 , 0 0 3 9 0 , 0 0 3 8 0 , 0 0 3 7 0 , 0 0 3 6 - 2,5 0 , 0 0 6 2 0 , 0 0 6 0 0 , 0 0 5 9 0 , 0 0 5 7 0 , 0 0 5 5 0 , 0 0 5 4 0 , 0 0 5 2 0 , 0 0 5 1 0 , 0 0 4 9 0 , 0 0 4 8 - 2,4 0 , 0 0 8 2 0 , 0 0 8 0 0 , 0 0 7 8 0 , 0 0 7 5 0 , 0 0 7 3 0 , 0 0 7 1 0 , 0 0 6 9 0 , 0 0 6 8 0 , 0 0 6 6 0 , 0 0 6 4 - 2,3 0 , 0 1 0 7 0 , 0 1 0 4 0 , 0 1 0 2 0 , 0 0 9 9 0 , 0 0 9 6 0 , 0 0 9 4 0 , 0 0 9 1 0 , 0 0 8 9 0 , 0 0 8 7 0 , 0 0 8 4 - 2,2 0 , 0 1 3 9 0 , 0 1 3 6 0 , 0 1 3 2 0 , 0 1 2 9 0 , 0 1 2 6 0 , 0 1 2 2 0 , 0 1 1 9 0 , 0 1 1 6 0 , 0 1 1 3 0 , 0 1 1 0 - 2,1 0 , 0 1 7 9 0 , 0 1 7 4 0 , 0 1 7 0 0 , 0 1 6 6 0 , 0 1 6 2 0 , 0 1 5 8 0 , 0 1 5 4 0 , 0 1 5 0 0 , 0 1 4 6 0 , 0 1 4 3 - 2,0 0 , 0 2 2 8 0 , 0 2 2 2 0 , 0 2 1 7 0 , 0 2 1 2 0 , 0 2 0 7 0 , 0 2 0 2 0 , 0 1 9 7 0 , 0 1 9 2 0 , 0 1 8 8 0 , 0 1 8 3 - 1,9 0 , 0 2 8 7 0 , 0 2 8 1 0 , 0 2 7 4 0 , 0 2 6 8 0 , 0 2 6 2 0 , 0 2 5 6 0 , 0 2 5 0 0 , 0 2 4 4 0 , 0 2 3 8 0 , 0 2 3 3 - 1,8 0 , 0 3 5 9 0 , 0 3 5 2 0 , 0 3 4 4 0 , 0 3 3 6 0 , 0 3 2 9 0 , 0 3 2 2 0 , 0 3 1 4 0 . 0 3 0 7 0 , 0 3 0 0 0 , 0 2 9 4 - 1,7 0 , 0 4 4 6 0 , 0 4 3 6 0 , 0 4 2 7 0 , 0 4 1 8 0 , 0 4 0 9 0 , 0 4 0 1 0 , 0 3 9 2 0 , 0 3 8 4 0 , 0 3 7 5 0 , 0 3 6 7 - 1,6 0 , 0 5 4 8 0 , 0 5 3 7 0 , 0 5 2 6 0 , 0 5 1 6 0 , 0 5 0 5 0 , 0 4 9 5 0 , 0 4 8 5 0 , 0 4 7 5 0 , 0 4 6 5 0 , 0 4 5 5 - 1,50 , 0 6 6 8 0 , 0 6 5 5 0 , 0 6 4 3 0 , 0 6 3 0 0 , 0 6 1 8 0 , 0 6 0 6 0 , 0 5 9 4 0 , 0 5 8 2 0 , 0 5 7 0 0 , 0 5 5 9 - 1,4 0 , 0 8 0 8 0 , 0 7 9 3 0 , 0 7 7 8 0 , 0 7 6 4 0 , 0 7 4 9 0 , 0 7 3 5 0 , 0 7 2 2 0 , 0 7 0 8 0 , 0 6 9 4 0 , 0 6 8 1 - 1,3 0 , 0 9 6 8 0 , 0 9 5 1 0 , 0 9 3 4 0 , 0 9 1 8 0 , 0 9 0 1 0 , 0 8 8 5 0 , 0 8 6 9 0 , 0 8 5 3 0 , 0 8 3 8 0 , 0 8 2 3 - 1,2 0 , 1 1 5 1 0 , 1 1 3 1 0 , 1 1 1 2 0 , 1 0 9 3 0 , 1 0 7 5 0 , 1 0 5 6 0 , 1 0 3 8 0 , 1 0 2 0 0 , 1 0 0 3 0 , 0 9 8 5 - 1,1 0 , 1 3 5 7 0 , 1 3 3 5 0 , 1 3 1 4 0 , 1 2 9 2 0 , 1 2 7 1 0 , 1 2 5 1 0 , 1 2 3 0 0 , 1 2 1 0 0 , 1 1 9 0 0 , 1 1 7 0 - 1,0 0 , 1 5 8 7 0 , 1 5 6 2 0 , 1 5 3 9 0 , 1 5 1 5 0 , 1 4 9 2 0 , 1 4 6 9 0 , 1 4 4 6 0 , 1 4 2 3 0 , 1 4 0 1 0 , 1 3 7 9 - 0,9 0 , 1 8 4 1 0 , 1 8 1 4 0 , 1 7 8 8 0 , 1 7 6 2 0 , 1 7 3 6 0 , 1 7 1 1 0 , 1 6 8 5 0 , 1 6 6 0 0 , 1 6 3 5 0 , 1 6 1 1 - 0,8 0 , 2 1 1 9 0 , 2 0 9 0 0 , 2 0 6 1 0 , 2 0 3 3 0 , 2 0 0 5 0 , 1 9 7 7 0 , 1 9 4 9 0 , 1 9 2 2 0 , 1 8 9 4 0 , 1 8 6 7 - 0,7 0 , 2 4 2 0 0 , 2 3 8 9 0 , 2 3 5 8 0 , 2 3 2 7 0 , 2 2 9 7 0 , 2 2 6 6 0 , 2 2 3 6 0 , 2 2 0 6 0 , 2 1 7 7 0 , 2 1 4 8 - 0,6 0 , 2 7 4 3 0 , 2 7 0 9 0 , 2 6 7 6 0 , 2 6 4 3 0 , 2 6 1 1 0 , 2 5 7 8 0 , 2 5 4 6 0 , 2 5 1 4 0 , 2 4 8 3 0 , 2 4 5 1 - 0,5 0 , 3 0 8 5 0 , 3 0 5 0 0 , 3 0 1 5 0 , 2 9 8 1 0 , 2 9 4 6 0 , 2 9 1 2 0 , 2 8 7 7 0 , 2 8 4 3 0 , 2 8 1 0 0 , 2 7 7 6 - 0,4 0 , 3 4 4 6 0 , 3 4 0 9 0 , 3 3 7 2 0 , 3 3 3 6 0 , 3 3 0 0 0 , 3 2 6 4 0 , 3 2 2 8 0 , 3 1 9 2 0 , 3 1 5 6 0 , 3 1 2 1 - 0,3 0 , 3 8 2 1 0 , 3 7 8 3 0 , 3 7 4 5 0 , 3 7 0 7 0 , 3 6 6 9 0 , 3 6 3 2 0 , 3 5 9 4 0 , 3 5 5 7 0 , 3 5 2 0 0 , 3 4 8 3 - 0,2 0 , 4 2 0 7 0 , 4 1 6 8 0 , 4 1 2 9 0 , 4 0 9 0 0 , 4 0 5 2 0 , 4 0 1 3 0 , 3 9 7 4 0 , 3 9 3 6 0 , 3 8 9 7 0 , 3 8 5 9 - 0,1 0 , 4 6 0 2 0 , 4 5 6 2 0 , 4 5 2 2 0 , 4 4 8 3 0 , 4 4 4 3 0 , 4 4 0 4 0 , 4 3 6 4 0 , 4 3 2 5 0 , 4 2 8 6 0 , 4 2 4 7 - 0,0 0 , 5 0 0 0 0 , 4 9 6 0 0 , 4 9 2 0 0 , 4 8 8 0 0 , 4 8 4 0 0 , 4 8 0 1 0 , 4 7 6 1 0 , 4 7 2 1 0 , 4 6 8 1 0 , 4 6 4 1 0,0 0 , 5 0 0 0 0 , 5 0 4 0 0 , 5 0 8 0 0 , 5 1 2 0 0 , 5 1 6 0 0 , 5 1 9 9 0 , 5 2 3 9 0 , 5 2 7 9 0 , 5 3 1 9 0 , 5 3 5 9 0,1 0 , 5 3 9 8 0 , 5 4 3 8 0 , 5 4 7 8 0 , 5 5 1 7 0 , 5 5 5 7 0 , 5 5 9 6 0 , 5 6 3 6 0 , 5 6 7 5 0 , 5 7 1 4 0 , 5 7 5 3 0,2 0 , 5 7 9 3 0 , 5 8 3 2 0 , 5 8 7 1 0 , 5 9 1 0 0 , 5 9 4 8 0 , 5 9 8 7 0 , 6 0 2 6 0 , 6 0 6 4 0 , 6 1 0 3 0 , 6 1 4 1 0,3 0 , 6 1 7 9 0 , 6 2 1 7 0 , 6 2 5 5 0 , 6 2 9 3 0 , 6 3 3 1 0 , 6 3 6 8 0 , 6 4 0 6 0 , 6 4 4 3 0 , 6 4 8 0 0 , 6 5 1 7 0,4 0 , 6 5 5 4 0 , 6 5 9 1 0 , 6 6 2 8 0 , 6 6 6 4 0 , 6 7 0 0 0 , 6 7 3 6 0 , 6 7 7 2 0 , 6 8 0 8 0 , 6 8 4 4 0 , 6 8 7 9 0,5 0 , 6 9 1 5 0 , 6 9 5 0 0 , 6 9 8 5 0 , 7 0 1 9 0 , 7 0 5 4 0 , 7 0 8 8 0 , 7 1 2 3 0 , 7 1 5 7 0 , 7 1 9 0 0 , 7 2 2 4 0,6 0 , 7 2 5 7 0 , 7 2 9 1 0 , 7 3 2 4 0 , 7 3 5 7 0 , 7 3 8 9 0 , 7 4 2 2 0 , 7 4 5 4 0 , 7 4 8 6 0 , 7 5 1 7 0 , 7 5 4 9 0,7 0 , 7 5 8 0 0 , 7 6 1 1 0 , 7 6 4 2 0 , 7 6 7 3 0 , 7 7 0 3 0 , 7 7 3 4 0 , 7 7 6 4 0 , 7 7 9 4 0 , 7 8 2 3 0 , 7 8 5 3 0,8 0 , 7 8 8 1 0 , 7 9 1 0 0 , 7 9 3 9 0 , 7 9 6 7 0 , 7 9 9 5 0 , 8 0 2 3 0 , 8 0 5 1 0 , 8 0 7 8 0 , 8 1 0 6 0 , 8 1 3 3 0,9 0 , 8 1 5 9 0 , 8 1 8 6 0 , 8 2 1 2 0 , 8 2 3 8 0 , 8 2 6 4 0 , 8 2 8 9 0 , 8 3 1 5 0 , 8 3 4 0 0 , 8 3 6 5 0 , 8 3 8 9 1,0 0 , 8 4 1 3 0 , 8 4 3 8 0 , 8 4 6 1 0 , 8 4 8 5 0 , 8 5 0 8 0 , 8 5 3 1 0 , 8 5 5 4 0 , 8 5 7 7 0 , 8 5 9 9 0 , 8 6 2 1 1,1 0 , 8 6 4 3 0 , 8 6 6 5 0 , 8 6 8 6 0 , 8 7 0 8 0 , 8 7 2 9 0 , 8 7 4 9 0 , 8 7 7 0 0 , 8 7 9 0 0 , 8 8 1 0 0 , 8 8 3 0 1,2 0 , 8 8 4 9 0 , 8 8 6 9 0 , 8 8 8 8 0 , 8 9 0 7 0 , 8 9 2 5 0 , 8 9 4 4 0 , 8 9 6 2 0 . 8 9 8 0 0 , 8 9 9 7 0 , 9 0 1 5 1,3 0 , 9 0 3 2 0 , 9 0 4 9 0 , 9 0 6 6 0 , 9 0 8 2 0 , 9 0 9 9 0 , 9 1 1 5 0 , 9 1 3 1 0 , 9 1 4 7 0 , 9 1 6 2 0 , 9 1 7 7 1,4 0 , 9 1 9 2 0 , 9 2 0 7 0 , 9 2 2 2 0 , 9 2 3 6 0 , 9 2 5 1 0 , 9 2 6 5 0 , 9 2 7 8 0 , 9 2 9 2 0 , 9 3 0 6 0 , 9 3 1 9 1,5 0 , 9 3 3 2 0 , 9 3 4 5 0 , 9 3 5 7 0 , 9 3 7 0 0 , 9 3 8 2 0 , 9 3 9 4 0 , 9 4 0 6 0 , 9 4 1 8 0 , 9 4 3 0 0 , 9 4 4 1 1,6 0 , 9 4 5 2 0 , 9 4 6 3 0 , 9 4 7 4 0 , 9 4 8 4 0 , 9 4 9 5 0 , 9 5 0 5 0 , 9 5 1 5 0 , 9 5 2 5 0 , 9 5 3 5 0 , 9 5 4 5 1,7 0 , 9 5 5 4 0 , 9 5 6 4 0 , 9 5 7 3 0 , 9 5 8 2 0 , 9 5 9 1 0 , 9 5 9 9 0 , 9 6 0 8 0 , 9 6 1 6 0 , 9 6 2 5 0 , 9 6 3 3 1,8 0 , 9 6 4 1 0 , 9 6 4 8 0 , 9 6 5 6 0 , 9 6 6 4 0 , 9 6 7 1 0 , 9 6 7 8 0 , 9 6 8 6 0 , 9 6 9 3 0 , 9 7 0 0 0 , 9 7 0 6 1,9 0 , 9 7 1 3 0 , 9 7 1 9 0 , 9 7 2 6 0 , 9 7 3 2 0 , 9 7 3 8 0 , 9 7 4 4 0 , 9 7 5 0 0 , 9 7 5 6 0 , 9 7 6 2 0 , 9 7 6 7 2,0 0 , 9 7 7 2 0 , 9 7 7 8 0 , 9 7 8 3 0 , 9 7 8 8 0 , 9 7 9 3 0 , 9 7 9 8 0 , 9 8 0 3 0 , 9 8 0 8 0 , 9 8 1 2 0 , 9 8 1 7 2,1 0 , 9 8 2 1 0 , 9 8 2 6 0 , 9 8 3 0 0 , 9 8 3 4 0 , 9 8 3 8 0 , 9 8 4 2 0 , 9 8 4 6 0 , 9 8 5 0 0 , 9 8 5 4 0 , 9 8 5 7 2,2 0 , 9 8 6 1 0 , 9 8 6 4 0 , 9 8 6 8 0 , 9 8 7 1 0 , 9 8 7 4 0 , 9 8 7 8 0 , 9 8 8 1 0 , 9 8 8 4 0 , 9 8 8 7 0 , 9 8 9 0 2,3 0 , 9 8 9 3 0 , 9 8 9 6 0 , 9 8 9 8 0 , 9 9 0 1 0 , 9 9 0 4 0 , 9 9 0 6 0 , 9 9 0 9 0 , 9 9 1 1 0 , 9 9 1 3 0 , 9 9 1 6 2,4 0 , 9 9 1 8 0 , 9 9 2 0 0 , 9 9 2 2 0 , 9 9 2 5 0 , 9 9 2 7 0 , 9 9 2 9 0 , 9 9 3 1 0 , 9 9 3 2 0 , 9 9 3 4 0 , 9 9 3 6 2,5 0 , 9 9 3 8 0 , 9 9 4 0 0 , 9 9 4 1 0 , 9 9 4 3 0 , 9 9 4 5 0 , 9 9 4 6 0 , 9 9 4 8 0 , 9 9 4 9 0 , 9 9 5 1 0 , 9 9 5 2 2,6 0 , 9 9 5 3 0 , 9 9 5 5 0 , 9 9 5 6 0 , 9 9 5 7 0 , 9 9 5 9 0 , 9 9 6 0 0 , 9 9 6 1 0 , 9 9 6 2 0 , 9 9 6 3 0 , 9 9 6 4 2,7 0 , 9 9 6 5 0 , 9 9 6 6 0 , 9 9 6 7 0 , 9 9 6 8 0 , 9 9 6 9 0 , 9 9 7 0 0 , 9 9 7 1 0 , 9 9 7 2 0 , 9 9 7 3 0 , 9 9 7 4 2,8 0 , 9 9 7 4 0 , 9 9 7 5 0 , 9 9 7 6 0 , 9 9 7 7 0 , 9 9 7 7 0 , 9 9 7 8 0 , 9 9 7 9 0 , 9 9 7 9 0 , 9 9 8 0 0 , 9 9 8 1 2,9 0 , 9 9 8 1 0 , 9 9 8 2 0 , 9 9 8 2 0 , 9 9 8 3 0 , 9 9 8 4 0 , 9 9 8 4 0 , 9 9 8 5 0 , 9 9 8 5 0 , 9 9 8 6 0 , 9 9 8 6 3,0 0 , 9 9 8 7 0 , 9 9 9 0 0 , 9 9 9 3 0 , 9 9 9 5 0 , 9 9 9 7 0 , 9 9 9 8 0 , 9 9 9 8 0 , 9 9 9 9 0 , 9 9 9 9 1 , 0 0 0 0 Exercício 2: Utilizando esta tabela encontre as seguintes probabilidades: a) P(Z > 1,96) = 1-P(Z ≤ 1,96)= 1- 0,9750=0,02500 b) P(Z < 1,96) = 0,9750 c) P(Z < - 1,96) = 0,02500 ⇒APP: µ= σ= x= p(X<x)= -0.0250 -1,96 0 d) P( -2,50 < Z < 2,50 ) = 𝑃(𝑋 < 2,5) − 𝑃(𝑋 < −2,5) = 0,9938 − 0,0062 = 09876 𝑜𝑢 98,78%. 98,78% -2,5 2,5 APP: µ= σ= X= 𝑃(𝑋 < 𝑥)= X= 𝑃(𝑋 < 𝑥)= 0 1 -1.96 0.0250 0 0 1 2,5 0,99379 -2,5 0,00621 P( -2,50 < Z < 2,50 ) = 𝑃(𝑋 < 2,5) − 𝑃(𝑋 < −2,5) = 0,99379 − 0,00621 = 0,98758 e) P( 0,50 < Z < 1,50 ) = f) P( Z < z ) = 0.75 ⇒ z = ? 0,67(tabela); 0,67449 (APP-Probaility Distribution). g) P(-z1 < Z < z1 ) = 0.75 ⇒ z1 = ? h) P( 0.27 < Z < z2 ) = 0.50 ⇒ z2 = ? Exercício 3: A média do preço das consultas das empresas médicas de um município segue uma distribuição Normal com média 23 e desvio padrão 7. Pede-se: a) Esquematize ográfico da distribuição. µ- σ=23-7=16 µ+ σ=23+7=30 16 µ=23 30 b) Qual a proporção de empresas com preço acima de 28? 𝑃(𝑋 > 28) = 1 − 𝑃(𝑋 ≤ 28) = 1 − 𝑃 ( 𝑋 − 23 7 ≤ 28 − 23 7 ) = 1 − 𝑃(𝑍 ≤ 0,71) = 1 − 0,7611 = 0,2389 ⇒ 𝐴𝑃𝑃: µ = 23 𝜎 = 7 𝑥 = 28 𝑃(𝑋 > 𝑥) = 0,23753 c) Qual a proporção de empresas com preço entre 20 e 25? d) Qual a proporção de empresas com preço entre 16 e 30cm? e) Qual a proporção de empresas com preço entre 25 e 30cm? f) Se 25% das menores empresas médicas forem cortadas, qual o preço mínimo das empresas médicas remanescentes? g) Qual a preço mínimo para uma empresa médica estar entre as 1% com maiores preços de consultas? 1%=0,01 99%=0,99 x P(X≥x)=0,01⇒P(Z≥ 𝑥−23 7 ) = 0,01 ⇒ 𝑝 (𝑍 ≤ 𝑥−23 7 ) = 0,99 ⇒ 𝑥−23 7 = 2,33 ⇒ 𝑥 = 39,31;APP:µ=23,σ=7, P(x>x)=0,01⇒x=39.284444 ●Distribuição amostral das médias e da variância Em uma amostra aleatória os elementos da população são escolhidos de tal forma que cada um deles tenha igual chance de figurar na amostra. Escolhe-se uma amostra aleatória simples de elementos, de maneira que toda a amostra de tamanho “n” possível tenha a mesma chance de ser escolhida. Ex: S=espaço amostral=conjunto de todas as amostras possíveis, p.ex,de tamanho n=4⇒ (𝑥1,𝑥23,𝑥50,𝑥5),(𝑥100,𝑥230,𝑥501, 𝑥92).......𝑘 𝑎𝑚𝑜𝑠𝑡𝑟𝑎𝑠 ⇒ �̅�1,�̅�2,............. �̅�𝑘 ⇒ nº de médias=nº de amostras possíveis. Se amostras aleatórias de tamanho n (com reposição) forem tomadas de uma população com média µ e desvio padrão σ, então a distribuição amostral de �̅�𝑛: �̅�1,�̅�2,............. �̅�𝑘 tem as seguintes propriedades: 1. 𝑬(�̅�) = µ�̅� = µ ⇒ �̅�𝒏 é um estimador não tendencioso de µ; 2. √𝑉(�̅�) = 𝜎�̅� = 𝜎 √𝑛 (𝑒𝑟𝑟𝑜 𝑝𝑎𝑑𝑟ã𝑜 𝑑𝑒 �̅�) 3. �̅�𝒏 ~𝑵 (µ; 𝜎 √𝑛 ); �̅�𝒏 ~𝑵 (µ; 𝑠 √𝑛 ) ; 𝒏 > 𝟑𝟎 OBS 1: Na medida em que o tamanho da amostra aumenta, a distribuição das médias amostrais (distribuição amostral das médias) tende para uma distribuição normal (Teorema do Limite central). OBS 2: Também, se o tamanho da amostra cresce ⇒ o desvio padrão da média 𝜎 √𝑛 ou erro amostral decresce. Exercício 1: Para a população P= (1, 2, 3) n=2 (com reposição), mostrar que 𝑬(�̅�) = µ�̅� 𝒆 √𝑉(�̅�) = 𝜎�̅� = 𝜎 √𝑛 . Amostragem sem reposição √𝑉(�̅�) = 𝜎�̅� = √ 𝑁−𝑛 𝑁−1 𝜎 √𝑛 (𝜎 𝑐𝑜𝑛ℎ𝑒𝑐𝑖𝑑𝑜) √𝑉(�̅�) = 𝜎�̅� = √ 𝑁−𝑛 𝑁 𝑆 √𝑛 (𝜎 𝑑𝑒𝑠𝑐𝑜𝑛ℎ𝑒𝑐𝑖𝑑𝑜) Se (𝑛 ≤ 5%𝑁 ) podemos usar 𝜎 √𝑛 Para n > 5%N ⇒ usa-se o fator de correção para população finita (amostragem sem reposição). Exercício 2: Mostrar que: 𝐥𝐢𝐦 𝑵→∞ 𝜎�̅� = √ 𝑁−𝑛 𝑁−1 𝜎 √𝑛 = √𝑉(�̅�) = 𝜎�̅� = 𝜎 √𝑛 Comentar: Exercício 3: Foi realizada uma pesquisa de opinião de profissionais da área de saúde dos 30 maiores hospitais de uma certa região. A pesquisa revelou que o salário anual médio de homens e mulheres, eram $168 mil e $117 mil, respectivamente. Suponha que o desvio padrão para os homens seja $ 40 mil, e para as mulheres seja $ 168 mil. a) Qual é a probabilidade de uma amostra aleatória simples de 40 mulheres, produzir uma média amostral dentro do intervalo de $10 mil em torno da média populacional, $117 mil? P( 117-10< �̅� < 117+10)=P( 107< �̅� < 127)= P( �̅� <127) - P(�̅� < 107) P( �̅� <127)- P(�̅� < 107) 107 µ= 117 127 �̅� P( 117-10< �̅� < 117+10)=P( 107< �̅� < 127)= P( �̅� <127) - P(�̅�<107)= 𝑃 ( X̅−117 168 √40 < 127−117 168 √40 ) − 𝑃 ( X̅−117 168 √40 < 107−117 168 √40 ) = 𝑃(𝑍 <0,38)-P(- 0,38)=0,6480-0,3520= 0,2960 P( �̅� <127)- P(�̅� < 107) 107 µ= 117 127 �̅� P( Z<0,38) - P(Z< −0,38) -0,38 µ=0 0,38 Z APP µ= σ= 𝜎�̅� = 𝜎 √𝑛 = 168 √40 =26,56 𝑋 ̅ = p(X<x)= 0,646 µ= σ= 𝑋 ̅ = p(X<x)= P( �̅� <127) - P(�̅�<107)= 0,64673-0,35327 =0,2940 b) Idem para 40 homens. Exercício 4: Seja X o consumo de proteína por família numa região metropolitana. Suponha que X tem média igual a 2.2 e desvio padrão igual a 1.4. Seja �̅� o número médio do consumo de proteína por família para uma amostra de n=100. a) Qual a distribuição de �̅� ? Desenhe um gráfico e explique. b) Qual a probabilidade de o consumo médio por família seja menor do que 2? c) Qual a probabilidade de o consumo médio estar acima da média mais três desvios padrões? Exercício 5: Para as mulheres na faixa etária de 18 a 24, a pressão sistólica do sangue (em mm Hg) tem distribuição normal com média de 114,8 e desvio-padrão de 13,1. a) Selecionada aleatoriamente uma mulher nessa faixa etária, determine a probabilidade de a sua pressão sistólica ser superior a 120. 117 26,56 127 0,64673 117 26,56 107 0,35327 7 b) Selecionadas aleatoriamente 12 mulheres nessa faixa etária, determine a probabilidade de a pressão sistólica média ser superior a 120. c) Dado que a parte (b) envolve uma amostra de tamanho não superior a 30, por que podemos usar o teorema central do limite? Exercício 6: As durações da gravidez têm distribuição normal com média de 268 dias e desvio de 15 dias. a) Selecionada aleatoriamente uma mulher grávida, determine a probabilidade de a duração de sua gravidez ser inferior a 260 dias. b) Se 25 mulheres escolhidas aleatoriamente são submetidas a uma dieta especial a partir do dia em que engravidam, determine a probabilidade de os prazos de duração de sua gravidez terem média inferior a 260 dias (admitindo que a dieta não produza efeito). c) Se 25 mulheres têm média realmente média inferior a 260 dias, há razão de preocupação para os supervisores médicos? ●Distribuição amostral de proporçõesSeja “p” é a proporção das unidades de uma população que possui uma certa característica (proporção de “sucessos”). EXs :a) Proporção de pessoas do sexo masculino atendidas na emergência de um hospital b) Proporção de consumidores que leem a lista dos ingredientes enumerados no rótulo de produtos c) % das residências que compram mais de $ 100 por semana em medicamentos. Considere amostras aleatórias de tamanho n⇒ 1. 𝐸(�̂�𝑛) = 𝑝 2. 𝑉𝐴𝑅(�̂�𝑛) = 𝑝(1−𝑝) 𝑛 3. Para n grande, n>30 ⇒ �̂�𝑛 enquanto variável aleatória tem distribuição aproximadamente normal, isto é: �̂�𝑛~𝑁(𝑝, 𝑝(1−𝑝) 𝑛 ) Exercício1 : Uma proporção de 37% dos visitantes de um parque para a prática de esportes favorece a cobrança de taxas de entrada. Uma amostra aleatória de 200 visitantes foi tomada: a) Qual é o parâmetro? 37% b) Qual é a estatística? (0,37)(200)=74 c) Qual é a probabilidade que em uma amostra de 200 visitantes pelo menos 40% favoreçam a cobrança de taxa? 𝑃(�̂�𝑛 ≥ 0,40) = 1 − 𝑃(�̂�𝑛 < 0,40) = 1 − 𝑃 ( �̂�𝑛−𝑝 √ (𝑝(1−𝑝)) 𝑝 < 0,40−0,37 √ (0,37)(1−0,37) 200 ) = 1 − 𝑃(𝑍 < 0,882) = 1 − 0,8106 = 0,189; APP: µ=0.37; σ=0.034; 𝑃(𝑋 > 𝑥) = 0.18879 Exercício 2: Um Instituto de pesquisa mostrou que 17% das residências investem mais de $ 100 por semana em medicamentos. Suponha que a proporção populacional (residências) seja p=0,17 e que uma amostra aleatória simples de 800 residências será selecionada a partir da população. a) Mostre a distribuição amostral de �̂�𝑛 , a proporção amostral de residências que gastam mais de $ 100 por semana em medicamentos. b) Qual a probabilidade de que a proporção amostral esteja dentro do intervalo de +- 0,02 em torno da proporção populacional? P(-0,02 ≤ �̂�𝑛 − 0,17 ≤ 0,02) = P( −0,02 √ 0,17(1−0,17) 800 ≤ �̂�𝑛−0,17 √ 0,17(1−0,17) 800 ≤ −0,02 √ 0,17(1−0,17) 800 )= P( -151≤ Z ≤ 1,51)= 0,9345 – 0,0655= 0,8690 ou 86,9%. APP: P ( 0,02 ≤ �̂�𝑛 − 0,17 ≤ 0,02) = P ( 0.15 ≤ �̂�𝑛 ≤ 0.19) µ= σ= x= p(X<x)= ⇒P(�̂�𝑛 ≤ 0.19) − (�̂�𝑛 ≤ 0.15) = 0.93396 – 0.06604= 0.86792 ou 86,79%. µ= σ= x= p(X<x)= c) Responda ao item (b) para uma amostra de 1.600 residências. 0.17 0.0132806 0.19 0.93396 0.17 0.0132806 0.15 0.06604 ●1. Estimação Intervalar (média populacional µ) Z= �̅�−µ 𝜎 √𝑛 ⇒ 𝑃 (−𝑧𝛼 2 ≤ 𝑍 ≤ 𝑧𝛼 2 ) = 1 − 𝛼⇒ 𝑃 (−𝑧𝛼 2 ≤ �̅�−µ 𝜎 √𝑛 ≤ 𝑧𝛼 2 ) = 1 − 𝛼 ⇒ 𝑃 (−𝑧𝛼 2 𝜎 √𝑛 ≤ �̅� − µ ≤ 𝑧𝛼 2 𝜎 √𝑛 ) = 1 − 𝛼 ⇒ 𝑃 (−�̅� − 𝑧𝛼 2 𝜎 √𝑛 ≤ −µ ≤ �̅� + 𝑧𝛼 2 𝜎 √𝑛 ) = 1 − 𝛼 ⇒ 𝑃 (�̅� − 𝑧𝛼 2 𝜎 √𝑛 ≤ µ ≤ �̅� + 𝑧𝛼 2 𝜎 √𝑛 ) = 1 − 𝛼 𝐼𝐶µ = (�̅� − 𝑧𝛼 2 𝜎 √𝑛 ; �̅� + 𝑧𝛼 2 𝜎 √𝑛 )⇒𝐼𝐶µ = �̅� ± 𝑧𝛼 2 𝜎 √𝑛 𝛼 = 𝑛í𝑣𝑒𝑙 𝑑𝑒 𝑠𝑖𝑔𝑖𝑓𝑖𝑐â𝑛𝑐𝑖𝑎; = 𝑣𝑎𝑙𝑜𝑟 𝑐𝑟í𝑡𝑖𝑐𝑜 𝐸 = 𝑧𝛼 2 𝜎 √𝑛 = 𝑚𝑎𝑟𝑔𝑒𝑚 𝑑𝑒 𝑒𝑟𝑟𝑜; 𝑛 = ( 𝑧𝛼 2 𝜎 𝐸 ) 2 OBS :Se 𝑛 > 30, podemos, podemos substituir σ pelo desvio padrão 𝑠. Se n≤ 30, a população deve ter distribuição normal, e devemos conhecer σ para aplicar as fórmulas acima. Para o caso de pequenas amostras e σ desconhecido (𝑛 ≤ 30) 𝑢𝑠𝑎𝑚𝑜𝑠 𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑖çã𝑜 𝑑𝑒 𝑠𝑡𝑢𝑑𝑒𝑛𝑡. Proporção populacional: 𝐼𝐶𝑝 = �̂� ± 𝑧𝛼 2 √ �̂�(1 − �̂�) 𝑛 𝐸 = 𝑧𝛼 2 √ �̂�(1 − �̂�) 𝑛 = 𝑚𝑎𝑟𝑔𝑒𝑚 𝑑𝑒 𝑒𝑟𝑟𝑜; 𝑛 = (𝑧𝛼 2 ) 2 �̂� (1 − �̂�) 𝐸2 Exercício 1: Uma amostra aleatória simples de 40 itens resultou em uma média amostral 25. O desvio padrão populacional é σ= 5. a) Qual o erro padrão da média, 𝜎�̅� = 𝜎 √𝑛 = 5 √40 = 0,79 b) Para um grau de confiança de 95%, qual é a margem de erro? 𝑧𝛼 2 𝜎 √𝑛 = 1,96(0,79) = 5,55 c) Qual o 𝐼𝐶µ? 𝐼𝐶µ = �̅� ± 𝑧𝛼 2 𝜎 √𝑛 = 25±1,96(0,79) = (25 − 1,55; 25 + 1,55) = (23,45; 26,55) 95% 0,025% -1,95996 µ= 0 1,95996 µ= σ= x= p(X<x)= Exercício 2: Em um esforço para estimar a quantia média que cada pessoa gasta com plano de saúde em um município, foram coletados dados de uma amostra de 49 indivíduos. Suponha um desvio padrão populacional de $5,00. a) Para um grau de confiança de 95%, qual é a margem de erro? E= 1,96×5 √49 = 9,80 7 = 1,40 0 1 1,95996 0,975 b) Se a média amostral é $ 24,80, qual é o intervalo de confiança de 95% para a média populacional? 𝐼𝐶µ = 28,80 ± 1,40 = (27,40; 30,20) Exercício 3: De um município, sorteou-se 31 domicílios com a finalidade de estimar o rendimento mensal domiciliar (população aprox.normal). Foram encontradas as seguintes estatísticas na amostra:�̅� = 1881,57; 𝑠 = 373,97. 𝐶alcule: a) 𝐼𝐶µ(95%)= (1881,57 − 1,96×373,97 √31 ; 1881,57 + 1,96×373,97 √31 ) = (1749,92; 2013,22); b) 𝐼𝐶µ(99%) = 1881,57± 2,58×373,97 √31 . 99% 0,5% -2,57583 µ= 0 2,57583 µ= σ= x= p(X<x)= c) Qual o tamanho da amostra necessário para estimar a renda média se o erro máximo provável (margem de erro) deve ser de 0 1 2.57583 3 0,995 121,54 da média? Considere 𝜶=5% (95% de grau de confiança). 𝑛 = ( 1,96 × 373,97 121,54 ) 2 = 36,37~37 d) Quais as margens de erro do 𝐼𝐶µ(95%); 𝐼𝐶µ(99%) ? 𝐼𝐶µ(95%) ⇒ 𝐸 = 1,96 × 373,97 √31 = 131,65 𝐼𝐶µ(99%) ⇒ 𝐸 = 2,58×373,97 √31 = 173,29 Exercício 4: Os resultados de um estudo envolvendo 2000 adultos mostraram que 1.760 dos respondentes acreditam que o futuro equilíbrio do Seguro Social é uma importante preocupação de economia da saúde. a) Qual é a estimativa pontual da proporção populacional de adultos que acreditam que o futuro equilíbrio do Seguro Social é uma importante preocupação de economia da saúde? b) Com 90% de confiança, qual é a margem de erro? c) Desenvolva um intervalo de confiança de 90% para a proporção populacional de adultos que pensam que o futuro equilíbrio do Seguro Social é uma importante preocupação de economia da saúde. d) Desenvolva um 𝐼𝐶µ(95%) para essa proporção populacional. Exercício 5: De uma população normal com 𝜎2=16 levantou-se uma amostra, obtendo-se as observações 10, 5, 10, 7. Determinar ao nível de 5% um 𝐼𝐶µ para a média da população. �̅�= 10+5+10+7 4 = 8,00; 𝑠 = √ (10−8)2+(5−8)2+(10−8)2+(7−8)2 4=1 = 2,45; 𝜎 = √16 = 4 ; E= 1,96×4 √4 = 3,92 𝐼𝐶µ = 8 ±3,92= (4,08; 11,92) Exercício 6: De acordo com um relatório empresarial, a maioria dos planos de saúde relatou lucros que superam as estimativas. Uma amostra de 162 planos mostrou que104 destas ultrapassaram as estimativas. a) Qual é a estimativa pontual da proporção dos planos de saúde que ultrapassaram as estimativas? �̂� = 104 162 = 0,642 b) Determine a margem de erro e forneça um intervalo de confiança de 95% para a proporção dos planos de saúde que ultrapassaram as estimativas. 𝐸 = 𝑧𝛼 2 √�̂�(1 − �̂�) 𝑛 = 1,96 √ 0,642(1 − 0,642) 162 = 0,074; 𝐼𝐶𝑝 = (�̂� ± 𝐸) = (0,642 ± 0,074) = (0,568; 0,716). c) Qual deve ser o tamanho da amostra se a margem de erro desejada for de 0,05? 𝑛 = (𝑧𝛼 2 ) 2 �̂� (1−�̂�) 𝐸2 = 1,962×0,642×0,358 0,052 = 353,18. 4 - O Modelo Normal E(X)= ; Se X : N(,) então a v.a Z = , terá uma distribuição N(0,1). Aplicando o operador E(esperança matemática) à variável Z, temos. E(Z)=E()= ===0 P(a<X<b)= A integral não pode ser calculada exatamente, e a probabilidade acima é obtida aproximadamente por métodos numéricos. No entanto ,para cada valor de e cada valor de , teríamos que obter P(a<X<b) para diversos valores de a e b. Isto pode ser c...
Compartilhar