Logo Passei Direto
Buscar
Material
páginas com resultados encontrados.
páginas com resultados encontrados.
left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Prévia do material em texto

<p>Introdução à Estatística</p><p>Prof. Dr. Renato Araújo</p><p>www.linkedin.com/in/renato-ara%C3%BAjo-85799049/</p><p>http://lattes.cnpq.br/7357007301267211</p><p>http://www.linkedin.com/in/renato-ara%C3%BAjo-85799049/</p><p>Acesse: www.menti.com</p><p>Digite o código: 65 86 84</p><p>5</p><p>Ou acesse o QRCode:</p><p>Leituras</p><p>O que é estatística?</p><p>Área do conhecimento que se encarrega</p><p>de coletar ou reunir dados, fornecendo</p><p>informações sobre características de grupo</p><p>de pessoas ou coisas.</p><p>O que devo entender em estatística?</p><p>•Populações e amostras;</p><p>•Parâmetro e estatísticas;</p><p>•Métodos descritivos;</p><p>•Gráficos;</p><p>•Probabilidades;</p><p>•Métodos estatísticos.</p><p>Populações e amostras</p><p>O que são?</p><p>População comum e população estatística</p><p>Pessoas comuns ou coisas; Características de pessoas ou</p><p>coisas.</p><p>Exemplo: avaliação do comportamento (população</p><p>estatística) de estudantes da UNINASSAU-MCZ (população</p><p>comum).</p><p>E se a universidade tiver mais de 5 mil alunos? –</p><p>R: AMOSTRA</p><p>Estatística</p><p>descritiva e</p><p>inferencial</p><p>Exemplos</p><p>Gráficos</p><p>Possui a capacidade de transmitir a informação</p><p>contida nos dados com muita rapidez</p><p>Tipos de gráficos:</p><p>Dispersão, Barras, Linhas, Setores (pizza)</p><p>DEFINIÇÃO DO PROBLEMA</p><p>PLANEJAMENTO DA</p><p>PESQUISA</p><p>COLETA DOS DADOS</p><p>ORGANIZAÇÃO DOS DADOS</p><p>CONCLUSÕES</p><p>ANÁLISE E INTERPRETAÇÃO</p><p>DOS DADOS</p><p>APRESENTAÇÃO DOS DADOS</p><p>FASES DO MÉTODO ESTATÍSTICO</p><p>Tipos de variáveis</p><p>Números inteiros –</p><p>quantidade finita</p><p>Números não inteiros –</p><p>quantidade infinita</p><p>Assumem classificações de</p><p>ordem – nível de escolaridade</p><p>Não assumem classificações –</p><p>tipo sanguíneo</p><p>Tabelas de frequências – dados qualitativos</p><p>Como montar?</p><p>Vamos exemplificar</p><p>Frequência Absoluta Frequência Relativa</p><p><16</p><p>16-24</p><p>24-32</p><p>32-40</p><p>> 40</p><p>A frequência absoluta é dada pelos números inteiros</p><p>(resultados da pesquisa);</p><p>A frequência relativa é dada pela porcentagem dos</p><p>resultados da frequência absoluta.</p><p>Frequência Absoluta Frequência Relativa</p><p>Solteiro(a) 1 8,333</p><p>Casado(a) 5</p><p>Viúvo(a) 2</p><p>Divorciado(a) 1</p><p>Outro(a) 3</p><p>TOTAL 12</p><p>12 --------- 100%</p><p>1 -------------- X%</p><p>12X = 100*1</p><p>X = 100/12 = 8,333</p><p>Como arredondar?</p><p>Como arredondar? ABNT 5891</p><p>Tabelas de dupla entrada</p><p>É CAPAZ DE RELACIONAR DUAS</p><p>VARIÁVEIS EM UMA TABELA</p><p>Monte tabelas de frequências para as variáveis: Estado civil, partos,</p><p>tabagismo e estado de saúde. Monte uma tabela de dupla entrada</p><p>para tabagismo e estado de saúde.</p><p>0</p><p>7</p><p>7 100</p><p>100</p><p>0 1</p><p>2</p><p>3 100</p><p>66,67</p><p>33,33</p><p>1</p><p>0 0</p><p>100</p><p>1 100</p><p>1</p><p>10</p><p>11 100</p><p>90,91</p><p>9,09</p><p>Histograma</p><p>Gráfico destinado a descrever uma variável quantitativa contínua</p><p>ROL</p><p>• Tabela ordenada (de forma crescente ou</p><p>decrescente).</p><p>• Facilita a análise e interpretação dos dados.</p><p>REGRA DA RAIZ</p><p>QUADRADA</p><p>├─</p><p>├─</p><p>OU</p><p>RELACIONADO AO INTERVALO DO</p><p>CONJUNTO DE NUMEROS</p><p>├─3 4</p><p>VALORES COMPREENDIDOS MAIORES</p><p>QUE 3 E IGUAL A 4</p><p>├─</p><p>3 4</p><p>VALORES COMPREENDIDOS IGUAL A 3</p><p>E MENOR QUE 4</p><p>REGRA DE</p><p>STURGES</p><p>k = 1 + 3,3.log n</p><p>k = total de classes</p><p>n = tamanho da amostra</p><p>EXEMPLO</p><p>De acordo com a OMS (Organização Mundial da Saúde), ruídos acima</p><p>de 50 db (decibéis) são prejudiciais ao ser humano. Insônia, dores de</p><p>cabeça, estresse e perda (parcial ou total) da audição são alguns dos</p><p>efeitos prejudiciais da “poluição sonora”. A seguir, estão os níveis de</p><p>ruído (em db) registrados em algumas áreas da cidade de São Paulo.</p><p>FONTE: http://joinville.ifsc.edu.br/~joni.fusinato/Eng%20Mec/Aulas/Aula%204%20-</p><p>%20Organiza%C3%A7%C3%A3o%20dos%20dados.pdf</p><p>EXEMPLO</p><p>Vamos exercitar? – Construa um histograma para a variável</p><p>abaixo, considerando amplitude de 0,5 g/dl</p><p>Estatística descritiva: Medidas-</p><p>resumo</p><p>Caracterizar um conjunto de dados quantitativos de</p><p>acordo com sua tendência central ou a dispersão dos</p><p>dados estudados</p><p>Idade (X) dos indivíduos participantes de nossa pesquisa</p><p>Letras maiúsculas</p><p>Letras minúsculas (x1; x2; x3;...; xn)</p><p>Número total de observações</p><p>Quantidade de observações a serem somadas</p><p>Sigma – denota soma</p><p>Medidas de tendência central x Medidas de dispersão</p><p>• Média;</p><p>• Mediana;</p><p>• Moda</p><p>• Amplitude amostral;</p><p>• Desvio médio;</p><p>• Variância;</p><p>• Desvio padrão;</p><p>• Coeficiente de variação;</p><p>Média</p><p>Obtida pela soma das observações amostrais, dividida</p><p>pelo número total de observações</p><p>Exemplo: Média dos alunos!</p><p>E se eu já possuir valores em uma tabela de</p><p>frequência?</p><p>Mediana</p><p>É o valor que mede a tendência central dos dados</p><p>observados; Em outras palavras é o número do</p><p>meio.</p><p>Duas formas!</p><p>PAR ÍMPAR</p><p>Altura de 13 mulheres</p><p>Como vou saber qual número é o do meio?</p><p>Fazer o rol</p><p>Em caso de quantidade de números</p><p>ímpares! E se for par?</p><p>E se for par?</p><p>Moda</p><p>Observação que ocorre com maior frequência.</p><p>Exemplo:</p><p>E se não houver MODA?</p><p>Vamos de exemplos?</p><p>Calcule a média, moda e mediana para os seguintes</p><p>valores:</p><p>20; 40; 30; 31; 31; 31; 40; 41; 19; 21; 39; 31; 41; 32;</p><p>51; 39; 19; 22.</p><p>Vamos de exemplos?</p><p>Calcule a média, moda e mediana para os seguintes valores:</p><p>1,97; 1,96;</p><p>1,87; 1,48;</p><p>1,86; 1,95;</p><p>1,49; 1,51;</p><p>1,78; 1,94;</p><p>1,95; 1,81;</p><p>1,89; 1,99.</p><p>Medidas de tendência central x Medidas de dispersão</p><p>• Média;</p><p>• Mediana;</p><p>• Moda</p><p>• Amplitude amostral;</p><p>• Desvio médio;</p><p>• Variância;</p><p>• Desvio padrão;</p><p>• Coeficiente de variação;</p><p>Medidas de dispersão</p><p>Medem a variabilidade dos dados</p><p>Qual é a média e a mediana em ambos os casos?</p><p>Tem como ter uma certeza sobre os dados?</p><p>CASO 1</p><p>CASO 2</p><p>Dispersão dos dados!</p><p>Amplitude amostral</p><p>Diferença entre o maior e o menor valor no</p><p>conjunto de dados</p><p>n=8</p><p>29 – 20 = 9 anos</p><p>Quanto maior a amplitude, maior a dispersão dos dados!</p><p>Entendimento de</p><p>um para relacionar</p><p>ao outro</p><p>Desvio médio</p><p>Possui algumas limitações que inviabilizam o uso nas pesquisas,</p><p>mas é fundamental para o entendimento de desvio padrão</p><p>Qual é a média? R = 50,25 anos</p><p>Medida da dispersão dos valores em relação à média – mostra</p><p>quanto cada valor está acima ou abaixo da média</p><p>𝑥 − ҧ𝑥</p><p>O que desejamos? –</p><p>Desvio médio</p><p>Somatório</p><p>= zero</p><p>Como fazer então? – Desvio em valores absolutos (ABS)</p><p>Desvio em valores absolutos (ABS)</p><p>𝑥 − ҧ𝑥</p><p>82 anos</p><p>82/8 = 10,25 anos</p><p>10,25 representa o desvio médio em relação</p><p>ao número de observações (n=8)</p><p>Não utilizada para cálculo de</p><p>dispersão – desvio padrão</p><p>Variância</p><p>• Quão longe estão do valor médio – indica a distância</p><p>dos valores em relação à média</p><p>• Quanto menor a variância, mais próximos os valores</p><p>estão próximos da média</p><p>Soma do quadrado dos desvios</p><p>Número de observações</p><p>n-1 = amostra de uma população</p><p>Exemplo: Idade de oito indivíduos (n=8)</p><p>Desvio padrão</p><p>Qual a vantagem sobre a variância? – A unidade de</p><p>medida é aquela em que se está trabalhando</p><p>“raiz quadrada da variância”</p><p>Exemplo: Idade de oito indivíduos (n=8)</p><p>=12,44 anos</p><p>Coeficiente de variação</p><p>Mede a variabilidade dos dados em relação à média</p><p>Desvio padrão</p><p>Média</p><p>GRAU DE HOMOGENEIDADE DOS DADOS</p><p>ATÉ 10% ÓTIMO</p><p>DE 10 A 20% REGULAR</p><p>DE 20 A 30% RUIM</p><p>MAIOR QUE 30% PÉSSIMO</p><p>Exemplo: Os valores a seguir referem-se à idade ao</p><p>primeiro filho (em anos) de n = 11 mulheres. Calcule</p><p>a média amostral, a mediana, o desvio padrão e o</p><p>coeficiente de variação.</p><p>22 22 28 27 22 23 25 27 16 21 31</p><p>Faz-se o rol:</p><p>16 21 22 22 22 23 25 27 27 28 31</p><p>Média: (16+21+22+22+22+23+25+27+27+28+31)/11 = 24</p><p>Mediana: 16 21 22 22 22 23 25 27 27 28 31</p><p>Desvio Padrão: Tem que se saber a variância</p><p>Variância:</p><p>= (16-24)2+(21-24)2+(22-24)2+...+(28-24)2+(31-24)2/(11-1)</p><p>= 17</p><p>Desvio Padrão: = 17 = 4,12</p><p>Coeficiente de Variação:</p><p>Desvio padrão</p><p>Média</p><p>= (4,12/24) * 100 = 17,18%</p><p>15 20 3025</p><p>Média</p><p>Mediana</p><p>Moda</p><p>Exemplo1: Os valores a seguir referem-se à idade ao</p><p>primeiro filho (em anos) de n = 11 mulheres. Calcule a</p><p>média amostral, a mediana, o desvio padrão e o</p><p>coeficiente de variação.</p><p>32 42 28 27 22 22 22 22 21 31 31</p><p>Exemplo2: Os valores a seguir referem-se à idade (em</p><p>anos) de n = 28 entrevistados. Calcule a média amostral,</p><p>a mediana, o desvio padrão e o coeficiente de variação.</p><p>18 19</p><p>19 19 19 20 22 24 28 31 31 31 31 31 40 44</p><p>45 45 45 49 51 51 55 60 66 66 66 66</p><p>VAMOS RESOLVER NO EXCEL?</p><p>Exemplo3: Calcule a média amostral, a mediana, o desvio</p><p>padrão e o coeficiente de variação para os dois casos a</p><p>seguir.</p><p>Caso 1 Caso 2</p><p>Média = 158</p><p>Mediana = 158,5</p><p>Desvio Padrão = 4,40</p><p>Coeficiente de Variação = 2,78</p><p>Média = 158</p><p>Mediana = 158,5</p><p>Desvio Padrão = 16,94</p><p>Coeficiente de Variação = 10,72</p><p>Realizando os cálculos no Excel</p><p>Realizando os cálculos no Excel</p><p>Número de observações -</p><p>=CONT.NÚM(B:B)</p><p>Média - = MÉDIA(B:B)</p><p>Realizando os cálculos no Excel</p><p>Mediana - =MED(B:B)</p><p>Moda - =@MODO.MULT(B:B)</p><p>Realizando os cálculos no Excel</p><p>Mínimo - =MÍNIMO(B:B)</p><p>Máximo - =MÁXIMO(B:B)</p><p>Realizando os cálculos no Excel</p><p>Soma - =SOMA(B:B)</p><p>Desvio Padrão -</p><p>=DESVPAD.A(B:B)</p><p>Realizando os cálculos no Excel</p><p>Variância - =VAR.A(B:B)</p><p>Coeficiente de variação -</p><p>=100*DESVPAD.A(B:B)/E3</p><p>Média</p><p>Vamos de mais exemplo?</p><p>Determine a média, moda, mediana, desvio</p><p>padrão e coeficiente de variação para o conjunto</p><p>de dados abaixo.</p><p>Outras medidas resumo importantes</p><p>Quartis: três medidas que dividem o conjunto de dados</p><p>em quatro partes iguais.</p><p>Primeiro quartil (Q1): valor que divide o conjunto em</p><p>duas partes tal que um quarto (ou 25%) dos valores é</p><p>menor ou igual a Q1 e três quartos (ou 75%) são</p><p>maiores que Q1;</p><p>Segundo quartil (Q2): igual a mediana;</p><p>Terceiro quartil (Q3): divide o conjunto em duas partes</p><p>tal que três quartos (75%) são menores ou iguais a Q3 e</p><p>um quarto (25%) maior ou igual a Q3.</p><p>Mediana? – Segundo quartil</p><p>Q2 = (48,6+48,9)/2 = 48,7</p><p>Encontrando Q1 – Mediana do primeiro conjunto de dados</p><p>Q1 = (47,4+47,7)/2 = 47,55</p><p>Encontrando Q3 – Mediana do segundo conjunto de dados</p><p>Q3 = (50,2+51,6)/2 = 50,9</p><p>Obs.: Os quartis não dividem os dados em amplitudes</p><p>iguais, mas em quatro partes com o mesmo número de</p><p>observações</p><p>45 48 5650 52</p><p>Q1 = 47,55</p><p>Q2 = 48,7</p><p>Q3 = 50,9 n = 20</p><p>E se o número de observações for</p><p>ímpar?</p><p>Vamos considerar um exemplo em que o</p><p>tamanho amostral é ímpar.</p><p>48,4 48,8 51,0 55,8 62,0</p><p>62,0 63,2 64,0 65,0 65,5</p><p>67,7 72,3 75,4 75,8 77,0</p><p>Mediana? – Segundo quartil</p><p>Q2 =64,0</p><p>Selecionar os valores amostrais menores que</p><p>64.</p><p>48,4 48,8 51,0 55,8 62,0</p><p>62,0 63,2 64,0 65,0 65,5</p><p>67,7 72,3 75,4 75,8 77,0</p><p>Primeiro quartil</p><p>Q1 =55,8</p><p>Selecionar os valores amostrais menores que 64.</p><p>48,4 48,8 51,0 55,8 62,0</p><p>62,0 63,2 64,0 65,0 65,5</p><p>67,7 72,3 75,4 75,8 77,0</p><p>Terceiro quartil</p><p>Q3 =72,3</p><p>Obs.: Os quartis não dividem os dados em</p><p>amplitudes iguais, mas em três partes com o</p><p>mesmo número de observações</p><p>48 58 7864 68</p><p>Q1 = 55,8</p><p>Q2 = 64</p><p>Q3 = 72,3 n = 15</p><p>Box plot</p><p>Também conhecido como diagrama de caixa, é um gráfico que</p><p>descreve a distribuição dos dados através dos quartis (apropriado</p><p>para descrever as variáveis quantitativas contínuas)</p><p>VERSATILIDADE DOS DADOS</p><p>INSERÇÃO DA MÉDIA E MEDIANA</p><p>COMO CONSTRUIR?</p><p>PASSO FUNDAMENTAL: SEPARAR OS QUARTIS.</p><p>45 48 5650 52</p><p>Q</p><p>1</p><p>=</p><p>4</p><p>7</p><p>,5</p><p>5</p><p>Q</p><p>2</p><p>=</p><p>4</p><p>8</p><p>,7</p><p>Q</p><p>3</p><p>=</p><p>5</p><p>0</p><p>,9</p><p>n = 20</p><p>45 48 5650 52</p><p>Q</p><p>1</p><p>=</p><p>4</p><p>7</p><p>,5</p><p>5</p><p>Q</p><p>2</p><p>=</p><p>4</p><p>8</p><p>,7</p><p>Q</p><p>3</p><p>=</p><p>5</p><p>0</p><p>,9</p><p>n = 20</p><p>45 48 5650 52</p><p>Q</p><p>1</p><p>=</p><p>4</p><p>7</p><p>,5</p><p>5</p><p>Q</p><p>2</p><p>=</p><p>4</p><p>8</p><p>,7</p><p>Q</p><p>3</p><p>=</p><p>5</p><p>0</p><p>,9</p><p>n = 20</p><p>45 48 5650 52</p><p>n = 20</p><p>45 48 5650 52</p><p>n = 20</p><p>45 48 5650 52</p><p>Q1 Mediana Q3</p><p>MáximoMínimo</p><p>Mínimo de 5 observações para que seja</p><p>desenhado um box plot.</p><p>Explicando: o primeiro</p><p>quartil encontra-se mais</p><p>próximo à mediana que o</p><p>terceiro quartil. Os dados</p><p>estão mais dispersos</p><p>acima da mediana do que</p><p>abaixo da mediana</p><p>IMPORTANTE: uma utilidade do box plot é a verificação da</p><p>presença de valores atípicos (ou outliers) em nossos</p><p>dados.</p><p>Ex: sejam os pesos de n=25 pessoas mensurados por uma</p><p>balança, DESENHE O BOX PLOT:</p><p>41,99 45,87 46,17 47,19 48,07 48,51 48,85 49,08 49,41</p><p>49,51 49,74 49,80 50,31 51,10 51,16 51,24 51,60 52,53</p><p>53,01 53,29 55,34 56,34 57,98 58,25 60,70</p><p>41,99 45,87 46,17 47,19 48,07 48,51 48,85 49,08 49,41</p><p>49,51 49,74 49,80 50,31 51,10 51,16 51,24 51,60 52,53</p><p>53,01 53,29 55,34 56,34 57,98 58,25 60,70</p><p>Q1 = 48,68; Q2 (mediana) = 50,31; Q3 = 53,15</p><p>Como calcular os valores atípicos?</p><p>1. Calcular o intervalo interquartil (k = Q3-Q1)</p><p>2. Valores atípicos:</p><p>acima de Q3 => Q3+(1,5 x k) ou</p><p>abaixo de Q1 => Q1-(1,5 x k)</p><p>k = Q3-Q1 = 53,15 – 48,68 = 4,47</p><p>Q3 + (1,5 x k) = 53,15 + (1,5 x 4,47) = 59,85</p><p>Q1 – (1,5 x k) = 48,68 – (1,5 x 4,47) = 41,98</p><p>41,99 45,87 46,17 47,19 48,07 48,51 48,85 49,08 49,41</p><p>49,51 49,74 49,80 50,31 51,10 51,16 51,24 51,60 52,53</p><p>53,01 53,29 55,34 56,34 57,98 58,25 60,70</p><p>k = Q3-Q1 = 53,15 – 48,68 = 4,47</p><p>Q3 + (1,5 x k) = 53,15 + (1,5 x 4,47) = 59,85</p><p>Q1 – (1,5 x k) = 48,68 – (1,5 x 4,47) = 41,98</p><p>Desenhe o box plot e calcule os valores atípicos</p><p>PARA CASA</p><p>Como realizar esses dados em um programa</p><p>estatístico?</p><p>Correlação</p><p>Associação entre dados quantitativos</p><p>Ex.: relação entre índice de massa corporal (IMC) e</p><p>maior frequência cardíaca</p><p>Correlação de</p><p>Pearson</p><p>Coeficiente de correlação de Pearson</p><p>X Y</p><p>(x1;y1)</p><p>(x8;y8)</p><p>Essa correlação exibe um</p><p>valor. Mas como calcular?</p><p>Somatório de cada valor de X pela média</p><p>Somatório de cada valor de Y pela média</p><p>Covariância – quanto uma variável modifica quando a</p><p>outra se modifica</p><p>Exemplo: Relação entre idade e níveis séricos de triglicérides de 26</p><p>pessoas.</p><p>Pessoas mais novas tendem a possuir níveis menores em relação à</p><p>pessoas mais velhas (COV)</p><p>Médias:</p><p>X = 51,1 anos</p><p>Y = 152,6 mg/dl</p><p>??????</p><p>??????</p><p>Covariância positiva: quando uma variável se desvia da média e a outra</p><p>se desvia na mesma direção</p><p>Covariância negativa: quando uma variável se desvia da média e a outra</p><p>se desvia na direção oposta</p><p>+ -</p><p>Correlação</p><p>Covariância entre X e Y</p><p>Desvio</p><p>padrão de X</p><p>Desvio</p><p>padrão de Y</p><p>𝑟 =</p><p>𝐶𝑂𝑉(𝑋, 𝑌)</p><p>𝑠𝑥𝑠𝑦</p><p>r pode variar de -1 até 1</p><p>r=0,59</p><p>Quanto maior o valor de r, menor a dispersão dos dados</p><p>Exemplificando – IMC versus HDL</p><p>Indivíduo IMC (X) HDL (Y)</p><p>1 33,2 42</p><p>2 24,8 43</p><p>3 33,7 44</p><p>4 28,1 46</p><p>5 29,3 47</p><p>6 27,7 48</p><p>X-Xm Y-YmIMC (X) HDL (Y)</p><p>33,2 42</p><p>24,8 43</p><p>33,7 44</p><p>28,1 46</p><p>29,3 47</p><p>27,7 48</p><p>Y1-Ym = 42 - 45 = -3</p><p>Y2-Ym = 43 – 45 = -2</p><p>Y3-Ym = 44 – 45 = -1</p><p>Y4-Ym = 46 – 45 = 1</p><p>Y5-Ym = 47 – 45 = 2</p><p>Y6-Ym = 48 – 45 = 3</p><p>X-Xm Y-Ym</p><p>3,73 -3</p><p>-4,67 -2</p><p>4,23 -1</p><p>-1,37 1</p><p>-0,17 2</p><p>-1,77 3</p><p>X1-Xm = 33,2 - 29,47 = 3,73</p><p>X2-Xm = 24,8 – 29,47 = -4,67</p><p>X3-Xm = 33,7 – 29,47 = 4,23</p><p>X4-Xm = 28,1 – 29,47 = -1,37</p><p>X5-Xm = 29,3 – 29,47 = -0,17</p><p>X6-Xm = 27,7 – 29,47 = -1,77</p><p>X-Xm Y-YmIMC (X) HDL (Y)</p><p>33,2 42</p><p>24,8 43</p><p>33,7 44</p><p>28,1 46</p><p>29,3 47</p><p>27,7 48</p><p>X-Xm Y-Ym</p><p>3,73 -3</p><p>-4,67 -2</p><p>4,23 -1</p><p>-1,37 1</p><p>-0,17 2</p><p>-1,77 3</p><p>(X-Xm)-(Y-Ym)(X-Xm)-(Y-Ym)</p><p>-11,19</p><p>9,34</p><p>-4,23</p><p>-1,37</p><p>-0,34</p><p>-5,31</p><p>(soma)</p><p>-13,10(DP em X)</p><p>3,43</p><p>(DP em Y)</p><p>2,37</p><p>(X-Xm)-(Y-Ym)</p><p>-11,19</p><p>9,34</p><p>-4,23</p><p>-1,37</p><p>-0,34</p><p>-5,31</p><p>(soma)</p><p>-13,10</p><p>(DP em X)</p><p>3,43</p><p>(DP em Y)</p><p>2,37</p><p>COV(X,Y) = (-13,10)/(6-1)</p><p>COV(X,Y) = -2,62</p><p>𝑟 =</p><p>𝐶𝑂𝑉(𝑋, 𝑌)</p><p>𝑠𝑥𝑠𝑦</p><p>r = (-2,62)/(3,43*2,37)</p><p>r = -0,32</p><p>r (coeficiente de Pearson)</p><p>-0,32</p><p>(32,2;42)</p><p>Coeficiente de Spearman</p><p>Psicólogo, que contribuiu com a estatística</p><p>Basicamente, uma correlação de Pearson calculada em pesos (rank) –</p><p>transformação previa dos dados</p><p>𝜌 = 1 −</p><p>6𝑇</p><p>𝑛(𝑛2 − 1)</p><p>𝜌 = 1 −</p><p>6𝑇</p><p>𝑛(𝑛2 − 1)</p><p>Onde: T – somatório entre o quadrado da diferença dos</p><p>pesos de R(xi) e R(yi)</p><p>[R(xi)-R(yi)]2</p><p>n – número de observações</p><p>Corrigindo o questionário</p><p>1. O desvio padrão amostral pode ser um número igual a zero?</p><p>Explique exemplificando.</p><p>R. Sim. Quando os valores das observações são iguais.</p><p>2. Os valores da densidade mineral óssea no colo do fêmur de</p><p>n = 9 mulheres são listados a seguir, em g/cm2.</p><p>0,903 0,866 0,847 0,657 1,115 0,997 0,943 0,861</p><p>1,114</p><p>Encontre a média amostral, a mediana amostral e a amplitude</p><p>dos dados.</p><p>Faz-se o rol:</p><p>0,657/ 0,847/ 0,861/ 0,866/ 0,903/ 0,943/ 0,997/ 1,115/ 1,114</p><p>Média: (0,657+0,847+0,861+0,866+0,903+0,943+0,997+1,115+1,</p><p>114)/9 = 0.92</p><p>Mediana: 0,657/ 0,847/ 0,861/ 0,866/ 0,903/ 0,943/ 0,997/ 1,115/ 1,114</p><p>Amplitude: 1,114 – 0,657 = 0,458</p><p>3. Os valores a seguir referem-se à idade do primeiro filho</p><p>(em anos) de n = 11 mulheres.</p><p>22 22 28 27 22 23 25 27 16 21 31</p><p>Encontre a média amostral, a mediana, o desvio padrão e o</p><p>coeficiente de variação.</p><p>Média:</p><p>16 21 22 22 22 23 25 27 28 27 31</p><p>Mediana:</p><p>Variância:</p><p>= (16-24)2+(21-24)2+(22-24)2+...+(28-24)2+(31-24)2/(11-1)</p><p>= 17</p><p>Faz-se o rol:</p><p>16 21 22 22 22 23 25 27 27 28 31</p><p>Média: (16+21+22+22+22+23+25+27+27+28+31)/11 = 24</p><p>Mediana: 16 21 22 22 22 23 25 27 27 28 31</p><p>Desvio Padrão: Tem que se saber a variância</p><p>Variância:</p><p>= (16-24)2+(21-24)2+(22-24)2+...+(28-24)2+(31-24)2/(11-1)</p><p>= 17</p><p>Desvio Padrão: = 17 = 4,12</p><p>Coeficiente de Variação:</p><p>Desvio padrão</p><p>Média</p><p>= (4,12/24) * 100 = 17,18%</p><p>4. Considere uma amostra de n = 6 pessoas. A média da idade dessas</p><p>pessoas é de 52,3 anos. Os valores abaixo se referem às idades de 5</p><p>pessoas dessa amostra.</p><p>47 47 55 56 50</p><p>Mesmo faltando a idade de uma pessoa, encontre o desvio padrão</p><p>amostral.</p><p>5. Qual o número mínimo de observações necessárias para a</p><p>construção de um box plot?</p><p>6. Um determinado pesquisador observou a massa de gordura corporal de</p><p>um grupo de pessoas em quarentena, distribuindo ao acaso os 54</p><p>indivíduos entre dois grupos: (1) grupo de treinamento: treinamento</p><p>físico, com duração de três meses, com orientação nutricional; e (2)</p><p>grupo controle: não realizaram nenhum tipo de treinamento físico</p><p>durante três meses, com orientação nutricional. Ao final, foi medida a</p><p>massa de gordura dos membros inferiores, expressa em quilogramas, no</p><p>período final do estudo, como apresentada na tabela a seguir.</p><p>Utilizando os dados acima, esboce um box plot (utilizando a técnica de valores</p><p>atípicos) para cada um dos dois grupos. Utilize a mesma escala nos dois box plots</p><p>para que eles sejam comparáveis, interpretando o que você obteve e se há alguma</p><p>relação entre os grupos e a massa de gordura de membros inferiores.</p><p>Como calcular os valores atípicos?</p><p>1. Calcular o intervalo interquartil (k = Q3-Q1)</p><p>2. Valores atípicos:</p><p>acima de Q3+(1,5 x k) ou</p><p>abaixo de Q1-(1,5 x k)</p><p>1. Dada a tabela abaixo, calcular o coeficiente de correlação</p><p>X-Xm Y-Ym(X) (Y)</p><p>51 189</p><p>48 72</p><p>57 109</p><p>48 140</p><p>49 88</p><p>52 135</p><p>Ym = 122,17</p><p>X-Xm Y-Ym</p><p>0.17 66.83</p><p>-2.83 -50.17</p><p>6.17 -13.17</p><p>-2.83 17.83</p><p>-1.83 -34.17</p><p>1.17 12.83</p><p>Xm = 50,83</p><p>X-Xm Y-YmIMC (X) HDL (Y)</p><p>51 189</p><p>48 72</p><p>57 109</p><p>48 140</p><p>49 88</p><p>52 135</p><p>X-Xm Y-Ym</p><p>0.17 66.83</p><p>-2.83 -50.17</p><p>6.17 -13.17</p><p>-2.83 17.83</p><p>-1.83 -34.17</p><p>1.17 12.83</p><p>(X-Xm)-(Y-Ym)(X-Xm)-(Y-Ym)</p><p>11.14</p><p>142.14</p><p>-81.19</p><p>-50.53</p><p>62.64</p><p>14.97</p><p>(soma)</p><p>99.17(DP em X)</p><p>3,43</p><p>(DP em Y)</p><p>41.97</p><p>(X-Xm)-(Y-Ym)</p><p>11.14</p><p>142.14</p><p>-81.19</p><p>-50.53</p><p>62.64</p><p>14.97</p><p>(soma)</p><p>99.17</p><p>(DP em X)</p><p>3,43</p><p>(DP em Y)</p><p>41.97</p><p>COV(X,Y) = (99.17)/(6-1)</p><p>COV(X,Y) = 19.83</p><p>𝑟 =</p><p>𝐶𝑂𝑉(𝑋, 𝑌)</p><p>𝑠𝑥𝑠𝑦</p><p>r = (19.83)/(3,43*41.97)</p><p>r = 0.14</p><p>2. Os dados a seguir referem-se ao peso ao nascer de 16 crianças (em</p><p>gramas) e a idade da mãe, em anos completos.</p><p>a) Esboce um gráfico de dispersão entre as variáveis X e Y</p><p>b) Encontre a covariância, média e desvio padrão entre X e Y</p><p>c) Encontre o coeficiente de correlação de Pearson entre X e Y,</p><p>interpretando o resultado.</p><p>Fundamentos de probabilidade</p><p>História da probabilidade profundamente relacionada com</p><p>jogos de azar</p><p>Experimentos determinísticos x não determinísticos</p><p>Repetidos sob as mesmas</p><p>condições, trazem os</p><p>mesmos resultados:</p><p>podemos antecipar os</p><p>resultados</p><p>Conhecido como</p><p>aleatório, podem trazer</p><p>resultados distintos</p><p>(exemplo: dado numérico)</p><p>Experimentos determinísticos x não determinísticos</p><p>Evento – resultado ou subconjunto de resultados de um</p><p>experimento</p><p>Espaço amostral – resultado de todos os possíveis</p><p>resultados de um experimento. (Ω)</p><p>Ω={1,2,3,4,5,6}</p><p>Ω={cara, coroa}</p><p>Observar agora os eventos existentes</p><p>A: número par</p><p>B: número ímpar</p><p>C: número maior que quatro</p><p>D: número 6</p><p>União, interseção e complemento de</p><p>eventos</p><p>U</p><p>U</p><p>Exemplo:</p><p>Ω = {1,2,3,4,5,6}</p><p>A: número par</p><p>B: número maior que 3</p><p>Exemplo:</p><p>Ω = {1,2,3,4,5,6}</p><p>A: número par</p><p>B: número maior que 3</p><p>Subconjuntos A={2,4,6} e B={3,4,5,6}</p><p>A U B = {1,2,3,4,5,6}</p><p>A B = {4,6}</p><p>U</p><p>A B</p><p>2</p><p>4</p><p>6</p><p>3</p><p>5</p><p>Exemplo:</p><p>Ω = {1,2,3,4,5,6}</p><p>A: observar um número par;</p><p>Ac: observar um número ímpar;</p><p>Ω = {1,2,3,4,5,6}</p><p>Complemento será aquele valor que resta</p><p>saber dentro de um conjunto.</p><p>Probabilidade</p><p>Medida da chance ocorrer – P(A)</p><p>Regras formais que definem probabilidade</p><p>(Kolmogorov, 1930):</p><p>1. Sempre maior ou igual a zero;</p><p>2. Sempre menor ou igual a 1;</p><p>3. Associada a um evento impossível é sempre zero;</p><p>4. A probabilidade de um evento é 1 menos a</p><p>probabilidade de ele ocorrer</p><p>- Sempre menor ou igual a 1;</p><p>0 <=P(A)<= 1</p><p>- A probabilidade de um evento é 1 menos a</p><p>probabilidade de ele ocorrer</p><p>P(Ac) = 1 – P(A)</p><p>Ω={1,2,3,4,5,6} – seis ocorrências</p><p>Definição clássica de probabilidade</p><p>A: número par</p><p>B: número ímpar</p><p>C: número maior que quatro</p><p>D: número 6</p><p>Então, P(A) = ½; P(B) = ½; P(C) = 1/3; P(D) = 1/6</p><p>Definição frequentista de probabilidade</p><p>𝑷 𝑨 =</p><p>𝒏ú𝒎𝒆𝒓𝒐 𝒅𝒆 𝒗𝒆𝒛𝒆𝒔 𝒒𝒖𝒆 𝒐 𝒆𝒗𝒆𝒏𝒕𝒐 𝑨 𝒐𝒄𝒐𝒓𝒓𝒆</p><p>𝒏ú𝒎𝒆𝒓𝒐 𝒅𝒆 𝒗𝒆𝒛𝒆𝒔 𝒒𝒖𝒆 𝒐 𝒆𝒙𝒑𝒆𝒓𝒊𝒎𝒆𝒏𝒕𝒐 é 𝒓𝒆𝒂𝒍𝒊𝒛𝒂𝒅𝒐</p><p>Ex.: Tipo sanguíneo (A,B,AB,O)</p><p>Seria ¼ para cada? SIM ou NÃO?</p><p>A = 38; B = 11; AB = 4; O = 47</p><p>TOTAL</p><p>Diagramas de VEEN e cálculos de</p><p>probabilidade</p><p>Ex.: 20% são hipertensos; 40% são diabéticos; 15% são</p><p>hipertensos e diabéticos</p><p>D H</p><p>0,150,40 –</p><p>0,15 =</p><p>0,25</p><p>0,20 –</p><p>0,15 =</p><p>0,05</p><p>0,55</p><p>Probabilidade de:</p><p>a. Ser diabético, mas não</p><p>hipertenso?</p><p>b. Ser hipertenso ou</p><p>diabético?</p><p>c. Não ser hipertenso nem</p><p>diabético?</p><p>Vamos de</p><p>exemplos?</p><p>1. Sejam Ω = {a,b,c,d,e}, A={a,b,d}, B={b,d,e}, encontre:</p><p>a) A U B d) A Ո B</p><p>b) Bc e) Ac Ո B</p><p>c) (A Ո B)c</p><p>2. Em uma universidade são lidos dois</p><p>jornais, A e B. Exatamente 80% dos</p><p>alunos leem o jornal A e 60%, o jornal</p><p>B. Sabendo que tudo aluno é leitor de</p><p>pelo menos um dos jornais, qual o</p><p>percentual de alunos que leem ambos?</p><p>1. Sejam Ω = {a,b,c,d,e}, A={a,b,d}, B={b,d,e}, encontre:</p><p>a) A U B</p><p>b) Bc</p><p>c) (A Ո B)c</p><p>d) A Ո B</p><p>e) Ac Ո B</p><p>Algumas imagens foram retiradas do Google Images</p>

Mais conteúdos dessa disciplina