Prévia do material em texto
Bioestatística
Prof° Thiago Piola
Conteúdos
POPULAÇÃO E AMOSTRA
MEDIDA DE TENDÊNCIA CENTRAL
Média aritmética
Média aritmética ponderada
Moda
Mediana
MEDIDAS DE DISPERSÃO
Amplitude
Desvio padrão
Pesquisa estatística?
Analise estatística?
Preferência
(Candidato, marca, alimento)
Opinião
(Aborto, maioridade penal)
Comportamento
(Hábitos, atividade física, sedentarismo)
Informação factual
(renda, desempenho)
Testar medicamentos
https://www.youtube.com/watch?v=VIMjvEWPwlI
Populações e amostras
Interesse dos pesquisadores é extrapolar os dados (resultados que se apliquem a toda população)
Psicólogos querem descobrir processos que ocorram em todos os seres humanos
Biólogos podem estar interessados em processos que ocorrem em todas as células
Economistas querem produzir modelos que se aplicam a todos os salários
Treinamento que se aplique a todas as pessoas
Populações e amostras
A população pode ser geral
Todos os seres humanos
Todos os gatos machos de pelo castanho-avermelhado chamados Bob
Ou muito pequena
Em comum, raramente, senão nunca, será possível ter acesso a cada membro de uma população
Populações e amostras
Portanto coletamos dados de um pequeno subconjunto de uma população (amostra) e usamos para inferir coisas sobre toda a população
Populações e amostras
População
Conjunto que contém todas as fontes de dados de interesse
Amostra
Subconjunto (parcela) da população
Medidas de tendência central
Medidas de posição
Medidas de posição sintetizam as informações e podem ser classificadas em: medidas de tendência central e separatrizes.
Medidas de tendência central divide o conjunto de dados em duas partes iguais.
Medidas separatrizes dividem os dados em quatro, dez e cem partes iguais.
Média aritmética simples
MÉDIA
É a soma das medidas divida pelo número de casos.
Empregada quando se deseja uma medida de posição de maior estabilidade e/ou quando a necessidade de cálculos posteriores.
Sofre grande influência de valores extremos.
Exemplo
Em uma pesquisa uma amostra de 50 lâmpadas apresentaram durabilidade conforme os dados a seguir:
Média aritmética ponderada
Quando atribuímos pesos aos números
Exemplo
Medidas de tendência central
MEDIANA (Md)
Valor que se encontra na posição central dos dados.
Empregada quando há valores extremos que possam afetar de maneira acentuada a média e/ou quando representa melhor a variável de estudo (salário).
Exemplo
Exemplo: Considere o conjunto A={1,2,3,5,6,1,2,35,8,4,26,5,2}
Moda
MODA (Mo)
Valor que ocorre com maior frequência em uma série de dados.
Exemplo
Considere o conjunto A={1,2,3,5,6,1,2,35,8,4,26,5,2}
O elemento que mais aparece é o 2, logo a moda do conjunto A é igual a 2
Questões
A média de um conjunto numérico pode ser igual a zero? Pode ser um número negativo?
Sim, basta a soma de seus elementos ser igual a zero.
Exemplo: conta bancária
Questão
Uma empresa, interessada em avaliar a qualidade de seu produto, elaborou uma pesquisa com consumidores finais para avaliar a importância relativa (peso) de quatro diferentes atributos do produto (durabilidade, confiabilidade, prazo de entrega e qualidade do pós-venda), que conjuntamente reflete a qualidade do produto como um todo. Em paralelo, a empresa solicitou a um grupo de representantes de vendas que dessem uma nota, de 0 a 100, para a qualidade de cada um dos atributos. Ao final do processo, os dados obtidos foram:
Continuação
a) Durabilidade nota 65 com peso igual a 25.
b) Confiabilidade nota 70 com peso igual a 30.
c) Prazo de entrega nota 80 com peso igual a 15.
d) Qualidade do pós-venda nota 50 com peso igual a 30.
Se a empresa esperava uma nota mínima de 65 pontos para seu produto, com base nos dados coletados, determine a nota média do produto e verifique se a expectativa da empresa foi confirmada ou não.
Questão
Um investidor está interessado em investir seu capital em uma rede de lojas de cosméticos de uma franquia A, por acreditar que o tempo de retorno do investimento é compatível com seus objetivos, que é o de começar a lucrar sobre o capital investido próximo de dois anos após o início. Suponha que os dados a seguir representem o tempo de retorno em meses (X) de 20 diferentes lojas da mesma franquia, espalhadas por diversas cidades brasileiras, com público consumidor similar ao da cidade do investidor:
Qual o tempo de retorno do investimento neste tipo de franquia, utilizando:
a) o tempo médio? Interprete o resultado.
b) o tempo mediano? Interprete o resultado.
c) o tempo modal? Interprete o resultado.
d) Qual das três medidas é mais adequada para avaliar o interesse do investidor?
Média, mediana e moda
Medidas separatrizes
Quartis
Representados por Q1, Q2 e Q3
Q1 = 25% da distribuição
Q2 = 50% da distribuição (coincide com a mediana)
Q3 = 75% da distribuição
Medidas separatrizes
Decis
D1, D2, D3... D9
Intervalo de 10% entre cada decil, sendo o D5 a mediana
Distribuição de frequências
Distribuição de frequências
Em estatística, a distribuição de frequência é um arranjo de valores que uma ou mais variáveis tomam em uma amostra. Cada entrada na tabela contém a frequência ou a contagem de ocorrências de valores dentro de um grupo ou intervalo específico, e deste modo, a tabela resume a distribuição dos valores da amostra.
Distribuição de frequências
Amplitude (A) = 26,75 – 8,81 = 17,94
Menor valor observado
Maior valor observado
Valor que mais se repetiu
Distribuição de classes
A = 17,94
Classes = 4
A / N° classes
17,94 / 4 = ± 4,48
Medidas de variabilidade ou dispersão
Medidas de variabilidade ou dispersão
O que são?
Medidas que representam o grau de dispersão (variabilidade) entre os valores.
Exemplo:
A massa corporal média de crianças em duas cidades é de 24Kg. Porém, uma das cidades apresenta poucos sujeitos obesos e desnutridos, e possui média de 24Kg. A outra cidade apresenta muitas crianças obesas e desnutridas, mas ainda com média de 24Kg.
Assim, conhecer apenas as medidas de posição não é o suficiente, pois não sabemos a proporção de sujeitos obesos e desnutridos.
Desvio padrão (SD ou DP)
A medida mais comum de dispersão estatística. Mostra o quanto de variação (dispersão) existe em relação à média. Um baixo DP indica que os dados tendem a estar próximos da média e um alto DP indicam que os dados estão espalhados por uma gama de valores.
Exemplo
A = {5 5 5 5 5}
B = { 2 2 1 5 15 }
Inferência
Inferência
Inferência estatística é um ramo da Estatística cujo objetivo é fazer afirmações a partir de um conjunto de valores representativo (amostra) sobre um universo (população), assume-se que a população é muito maior do que o conjunto de dados observados, a amostra.
População → Amostra → Análise → Inferência para a população
OBRIGADO
Thiago Piola
thiagopiola@claretiano.edu.br