todas aulas

•

PUC-MINAS

StudyKarla

07/09/2021

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 138 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 6, do total de 138 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 9, do total de 138 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Bioestatística I

12.434 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

Profa. Dra. Elaine C Marqueze
@EquipeMySete
@JessicaJulioti
Bioestatística
@elaine.marqueze
Introdução, População e Amostra,
Variáveis
Bioestatística
• Estatística – latim status (estado).
• Ciência que se preocupa com a coleta, organização, descrição, análise
e interpretação de dados experimentais.
• Pode ser usada para simplesmente descrever dados (estatística
descritiva) ou para comparar grupos e fazer generalizações a partir de
resultados obtidos (estatística inferencial, indutiva ou analítica).
Por que a estatística é necessária?
• As pessoas são condescendentes com os dados, especialmente com os
próprios.
• As diferenças, não raramente, são atribuídas a causas erradas.
• As coincidências ocorrem mais frequentemente do que se intui.
• Acrescentar polimento às publicações e apresentações.
• Para saber o grau de certeza das conclusões tiradas.
População x Amostra
População x Amostra
• População (N): qualquer conjunto de informações que tenham entre si
uma característica comum que delimite, inequivocamente, quais
elementos pertencem a ela.
• Amostra (n): são subconjuntos representativos de uma dada
população. A amostra deve ser representativa da população da qual
foi extraída, ser parecida com ela (qualitativa e quantitativamente),
devendo obedecer a dois princípios básicos:
• 1. deve ser suficientemente grande (representatividade);
• 2. seus constituintes devem preferencialmente serem selecionados
ao acaso.
Randomização
• Seleção ao acaso – random – significa que cada um dos
componentes da população estudada tem a mesma chance de ser
incluído na amostra e, além disso, que foi selecionado
independentemente.
• Isto implica que a inclusão de um particular membro não altera a
chance de inclusão dos demais.
• Se isso não ocorrer, diz-se que a amostra é não randomizada,
podendo ter um viés.
• Dados imprecisos, amostras viciadas, populações mal definidas e
critérios subjetivos levam a resultados igualmente imprecisos, que a
estatística não pode e não deve tentar salvar.
Randomização
Variáveis
Variáveis
• Uma das primeiras coisas a serem feitas é caracterizar qual tipo de
variável será trabalhada, pois muitas estatísticas são aplicáveis a
apenas um tipo de variável mas não são adequadas para outras.
• Qualitativas (categóricas) x Quantitativas (numéricas).
Variáveis Qualitativas
Variáveis nominais: são todos aquelas distribuídas em categorias nominais,
sem qualquer ordem. São geralmente apresentadas na forma de diagramas
de barras, pizzas e tabelas de contingência.
Esses tipos de variáveis são muito fáceis de serem descritas; geralmente,
basta apresentar o seu número (valores absolutos) e distribuição
(porcentagem por categoria).
Descrição das variáveis nominais
• Os indivíduos são classificados em categorias segundo uma
característica.
Ex: sexo (masculino, feminino),
hábito de fumar (fumante, não fumante),
sobrepeso (sim, não).
• Variáveis ordinais: são aquelas que se distribuem por categorias que têm
uma ordem. Frequentemente a mediana é usada para descrevê-las mas,
também, proporções podem ser utilizadas.
• Os indivíduos são classificados em categorias que possuem algum tipo
inerente de ordem. Neste caso, uma categoria pode ser "maior" ou
"menor" do que outra. Distribuição porcentagem por categoria.
EX: nível socioeconômico (A, B, C e D).
Variáveis Qualitativas
Variáveis Quantitativas
• Variáveis quantitativa Discreta: Número de refeições por dia.
• Variável quantitativa Contínua: Idade (anos e meses), peso (kg, g),
estatura (m, cm), nível de retinol sérico (g/dl), circunferência da
cintura (cm, mm).
Descrição das variáveis quantitativas
• Esse tipo de variável pode ser trabalhada para gerar informações que
expressem a tendência central e a dispersão.
• Medidas de tendência central:
• Média aritmética (𝓍): soma dos valores observados, dividida pelo
número de observações. Para variáveis quantitativas contínuas com
distribuição normal.
• Mediana (Md): aquele valor que, uma vez ordenados todos os
resultados, deixa igual número de resultados de cada lado. Numa
distribuição assimétrica ela é muito mais representativa da população
do que a média. Eventualmente, pode ser usada com dados ordinais.
Para variáveis quantitativas contínuas com distribuição não-normal e
variáveis quantitativas discretas.
• Moda (Mo): o valor mais frequente, o que se repete, podendo ter mais
de uma moda em uma mesma amostra. Para variáveis quantitativas
contínuas e discretas.
Descrição das variáveis quantitativas
• Medidas de dispersão:
• Desvio-padrão (DP): medida que expressa o grau de dispersão de
um conjunto de dados, em que um maior DP, maior a variabilidade
entre as observações. Grandes amostras (>100) e correspondente à
média aritmética.
• Erro-padrão (EP): variabilidade entre a média aritmética e a média
que poderia ser encontrada em outras amostras do mesmo
tamanho. Amostras pequenas (<100) e correspondente à média
aritmética.
Descrição das variáveis quantitativas
• Intervalo de confiança: indica a confiabilidade de uma estimativa.
Intervalo de confiança com nível de confiança de 95% é o mais
comum e significa que o resultado está dentro do intervalo de 95 dos
100 estudos hipoteticamente realizados. Correspondente à média
aritmética.
• Amplitude de variação: diferença entre o maior e o menor valor.
Descrição das variáveis quantitativas
• Amplitude interquartílica: é calculada com base no cálculo dos
quartis, sendo o primeiro quartil (inferior – 25%), o quartil
intermediário (mediana – 50%), o terceiro quartil (superior – 75%).
Correspondente à mediana.
0% 25% 50% 75% 100%
Descrição das variáveis quantitativas
Exercício
Qual a natureza das variáveis a seguir?
- Atividade física (sedentário e ativo);
- Nível de colesterol (mg/dl);
- Estágio da doença (inicial, intermediário, avançado);
- Número de filhos;
Exercício
Qual a natureza das variáveis a seguir?
- Nível de atividade física (sedentário e ativo): Qualitativa nominal.
- Nível de colesterol (mg/dl): Quantitativa contínua.
- Estágio da doença (inicial, intermediário, avançado): Qualitativa ordinal.
- Número de filhos: Quantitativa discreta.
O conteúdo desse curso
foi oferecido pelo
Centro Educacional Sete
de Setembro
em parceria com o
Professora Elaine C.
Marqueze
Profa. Dra. Elaine C Marqueze
@EquipeMySete
@JessicaJulioti
Bioestatística
@elaine.marqueze
Apresentação dos dados,
Distribuição dos dados
Apresentação dos dados
Apresentação dos dados
• Texto;
• Tabela;
• Gráfico.
Representação gráfica
• Um gráfico ou diagrama é uma representação geométrica da relação entre
as variáveis.
• Facilita a visualização de relações não identificáveis na observação de uma
tabela.
• Os gráficos mais informativos são relativamente simples e auto-
explicativos.
Gráfico de barras
• Utilizados para exibir uma distribuição de frequências para as variáveis
qualitativas nominais e ordinais.
• As várias categorias nas quais as observações são classificadas estão
apresentadas ao longo de um eixo horizontal.
• As barras devem ser de igual largura e separadas uma da outra de modo a
não implicar continuidade.
Gráfico de barras vertical
Histograma
• Para apresentar a distribuição de frequências para as variáveis
quantitativas discretas e contínuas.
• O eixo horizontal exibe os limites verdadeiros dos vários intervalos, que
são os pontos que os separam dos outros intervalos em ambos os lados,
por isso as barras são unidas.
Histogramas
Polígonos de frequência
• Similar ao histograma – usa os mesmos dois eixos que um histograma.
• É construído ao se colocar um ponto no centro de cada um dos intervalos
de forma tal que a altura do ponto seja igual à frequência absoluta ou
frequência relativa das observações.
• Os polígonos de frequência são facilmente superpostos e bons para se
comparar dois ou maisconjuntos de dados.
Polígonos de frequência
Quando os pontos estão interligados
significa que representam a mesma
pessoa ou conjunto de pessoas.
Caso sejam pessoas diferentes, não
faça a ligação dos pontos.
Polígonos de frequência
Box Plots
• Gráficos de dispersão unidimensionais – resumo das variáveis
quantitativas discretas ou contínuas.
• Usado em um único eixo horizontal para exibir a posição relativa de
cada um dos pontos dos dados no grupo.
Box Plots
Box Plots
Gráfico de dispersão bidimensional
• É usado para mostrar a relação entre duas medidas contínuas distintas.
• Cada um dos pontos no gráfico representa um par de valores.
• A escala para uma quantidade está marcada no eixo horizontal (eixo x), e
a escala da outra no eixo vertical (eixo y).
Gráfico de dispersão bidimensional
Distribuição dos dados
• A maioria dos fenômenos da natureza, em especial
os biológicos, apresenta variações dentro de um
intervalo definido.
• A curva normal ou de Gauss é simétrica e tem
forma de sino.
• Assume um série de formas mais ou menos
achatadas (curtose) em função da dispersão dos
dados ao redor do ponto central, no qual
coincidem a média aritmética, a moda, assim como
a mediana.
Distribuição dos dados
• A curva normal é próxima ao eixo
horizontal, suas caudas aproximam-se dele
mas não o tocam jamais, o que significa
que a variável pode assumir qualquer valor
entre –∞ e + ∞.
• Quando a distribuição dos dados é normal
(simétrica), a média representa bem a
população; quando a distribuição é
assimétrica, a mediana é mais
representativa.
Distribuição dos dados
• A distribuição normal se caracteriza por reunir um grande número de
valores em torno da média, que diminuem gradualmente de frequência à
medida que se afastam dela.
Distribuição dos dados
Distribuição dos dados
• A área subordinada à curva normal representa 100% das frequências.
• Em torno da média se determina intervalos com utilização dos DP,
conforme abaixo:
• 𝓍± DP = 68,26%
• 𝓍± 2DP = 95,45%
• 𝓍± 3DP = 99,73%
Distribuição dos dados
Distribuição dos dados - Exemplo
• 5.000 pessoas / média = 20 anos / DP = 3 anos.
• 𝔁± DP = 20 ± 3, ou seja, entre 17 e 23 anos.
• Portanto, 68,26% dos 5.000 indivíduos possuem entre 17 e 23 anos.
• Ou seja, 5.000 x 0,6826 = 3.413 indivíduos.
Distribuição dos dados - Exemplo
• 5.000 pessoas / média = 20 anos / DP = 3 anos
• 𝔁± 2DP = 20 ± 6, ou seja, entre 14 e 26 anos.
• Portanto, 95,45% dos 5.000 indivíduos possuem entre 14 e 26 anos.
• Ou seja, 5.000 x 0,9545 = 4.773 indivíduos.
• 𝔁± 3DP = 20 ± 9, ou seja, entre 11 e 29 anos.
• Portanto, 99,73% dos 5.000 indivíduos possuem entre 11 e 29 anos.
• Ou seja, 5.000 x 0,9973 = 4.987 indivíduos.
Distribuição dos dados - Exercício
• Uma amostra com 120 adultos, com peso médio de 80 kg e DP de 12
kg. Quantos adultos têm peso entre 𝓍± DP?
Distribuição dos dados
• Exercício:
• Uma amostra com 120 adultos, com peso médio de 80 kg e DP de 12
kg. Quantos adultos têm peso entre 𝓍± DP?
• 80 ± 12 / 68 a 92 kg. Deverá haver 68,26% adultos com peso entre 68
e 92 kg, isto é, 82 adultos (120 * 0,6826 = 82).
Distribuição dos dados
• Estatística paramétrica
• Estatística não-paramétrica
Distribuição dos dados
Latorre, 2009
O conteúdo desse curso
foi oferecido pelo
Centro Educacional Sete
de Setembro
em parceria com o
Professora Elaine C.
Marqueze
Profa. Dra. Elaine C Marqueze
@EquipeMySete
@JessicaJulioti
Bioestatística
@elaine.marqueze
Amostra
Amostra
Tipos de Amostragem
• Amostragem Não-Probabilística: São amostragens em que há uma
escolha deliberada dos elementos da amostra. Depende dos critérios e
julgamento do pesquisador.
• Amostragem Probabilística: São amostragens em que a seleção é
aleatória de tal forma que cada elemento da população tem uma
probabilidade conhecida de fazer parte da amostra. São métodos
rigorosamente científicos.
Amostragens não-probabilísticas
Tipos de amostragens não-probabilísticas
1. Amostragem por acessibilidade ou por conveniência:
• Menos rigoroso;
• Seleção de quem se tem acesso.
2. Amostragem intencional:
• Seleção baseada nas informações disponíveis para ser
representativo de toda população;
• Conhecimento da população e do subgrupo selecionado.
Tipos de amostragens não-probabilísticas
3. Amostragem por cotas:
• Maior rigor;
• Utilizada quando não existe um cadastro da população que
possibilite o sorteio, mas há informação suficiente sobre o perfil
populacional;
• Etapas: classificar a população, determinar a proporção da
população para cada classe, fixar cotas em observância à
proporção das classes consideradas.
Amostragens probabilísticas
Tipos de amostragens probabilísticas
1. Amostragem aleatória simples (AAS):
• Todos os elementos da população tem a mesma probabilidade de
pertencer à amostra;
• Indicada para populações homogêneas;
• A amostragem pode ser com ou sem reposição.
Tipos de amostragens probabilísticas
2. Amostragem sistemática:
• A população deve ser ordenada de forma que os elementos
sejam identificados pela posição;
• Indicada para populações homogêneas;
Tipos de amostragens probabilísticas
2. Amostragem sistemática:
• Determina-se a cota amostral pela fórmula, k=N/n, em que
N=População e n=Amostra;
• Escolhe-se aleatoriamente um elemento no intervalo; este será o
primeiro elemento da amostra;
• O segundo elemento será o primeiro mais k, e assim
sucessivamente.
Exemplo:
• N= 4.950
• n= 825
• k= N/n
• k= 4.950/825
• k= 6
1º sujeito (aleatório): número sorteado = 10,
2º sujeito: Número sorteado + k = 16,
3º sujeito: Número sorteado + 2k = 22,
E assim sucessivamente até chegar a amostra de 825 sujeitos.
Tipos de amostragens probabilísticas
3. Amostragem estratificada:
• Divide-se a população em subgrupos mais homogêneos (estratos),
procedendo-se à amostragem em cada estrato, proporcional ao
tamanho do estrato.
• Em geral, a retirada das amostras nos estratos é realizada de forma
aleatória simples.
Exemplo: estratos por idade, renda, ...
Para determinar o número de elementos da população no
iésimo estrato que irá participar da amostra (ni ) podemos usar a seguinte
fórmula:
Estrato Renda da População: A (1.238) – B (1.876) – C (835) – D (1.001)
nA = n * Ni nA = 825 * 1.238 nA = 0,1666 * 1.238
N 4.950
nA = 206,2508 nA = 206
nB = 313 / nC = 139 / nD = 167
Tipos de amostragens probabilísticas
4. Amostragem por conglomerados:
• Divide-se a população em pequenos grupos e sorteia-se um número
suficiente desses pequenos grupos (conglomerados);
• Este esquema amostral é utilizado quando há uma subdivisão da
população em grupos que sejam bastante semelhantes entre si, mas
com fortes discrepâncias dentro dos grupos, de modo que cada um
possa ser uma pequena representação da população de interesse
específico;
Tipos de amostragens probabilísticas
4. Amostragem por conglomerados:
• A amostragem é realizada em cima dos conglomerados, e não mais
sobre os indivíduos da população.
Exemplo: um quarteirão de uma cidade, bairros, municípios, regiões.
Tamanho da Amostra
Algumas razões para o uso de amostras:
• Minimização de custos, quando precisão absoluta não é necessária;
• Economia de tempo, quando há necessidade de resultados mais rápidos
do que seria possível com um censo;
• Na indústria, alguns testes são destrutivos e só podem ser feitos com uma
amostra de produtos;
• Em populações infinitas.
Amostragem
Tamanho Amostral
1. Nível de confiança (quanto maior o nível de confiança, maior o tamanho
da amostra – Erro Beta – representatividade - força da amostra);
2. Erro máximo permitido (quanto menor o erro permitido, maior o
tamanho da amostra – Erro Alfa - comparabilidade);
3. Variabilidade do fenômeno que está sendo investigado (quanto maior
a variabilidade, maior o tamanho da amostra).
Cálculo Amostral
N = Tamanho da populaçãoE0 = erro amostral tolerável (erro máximo permitido)
n0 = primeira aproximação do tamanho da amostra
n = tamanho da amostra
n0 = 1 / E0
2
n = N*n0 / N + n0
Barbetta PA. Estatística aplicada às ciências sociais. 5 ed, Florianópolis: UFSC, 2005.
Cálculo Amostral
N = Tamanho da população = 1.000
E0 = erro amostral tolerável = 5%
n0 = primeira aproximação do tamanho da amostra
n = tamanho da amostra
n0 = 1 / E0
2 = 1/(0,05) 2 = 1/0,0025 = 400
n = N*n0 / N + n0 = 1.000*400/1.000+400 =
n = 400.000/1.400 = 285,7 ≅ 286 pessoas
Portanto, com um erro amostral tolerável de 5%, a amostra será
constituída por 286 pessoas.
Cálculo Amostral
N = Tamanho da população = 1.000
E0 = erro amostral tolerável = 10%
n0 = primeira aproximação do tamanho da amostra
n = tamanho da amostra
n0 = 1 / E0
2 = 1/(0,10) 2 = 1/0,01 = 100
n = N*n0 / N + n0 = 1.000*100/1.000+100 =
n = 100.000/1.100 = 90,9 ≅ 91 pessoas
Portanto, com um erro amostral tolerável de 10%, a amostra será
constituída por 91 pessoas.
Cálculo Amostral
• G*Power - Software gratuito usado para calcular o poder amostral. O
programa oferece a capacidade de calcular a amostra para uma ampla
variedade de testes estatísticos, incluindo testes t, testes F e testes
qui-quadrado, entre outros.
G*Power – 1º Exemplo
• Estudo para comparar a proporção de pessoas sedentárias de acordo
com o sexo. Primeiro ver na literatura, qual a proporção encontrada
em estudos anteriores (encontrar estudos que sejam semelhantes ao
nosso). Supondo que faremos um estudo de base populacional,
podemos utilizar a prevalência apresentada pela OMS (2018):
prevalência de sedentarismo entre homens de 40,4% e entre
mulheres 53,3%.
• Primeiro precisaremos selecionar a família do teste (Exact), depois o
teste estatístico (Teste de proporção de dois grupos independentes).
G*Power - 1º Exemplo
• Depois o tipo da análise, e como estamos fazendo o cálculo para
saber quantas pessoas devemos pesquisar, escolheremos o “A priori”.
• Precisamos preencher os parâmetros para que seja calculada a
amostra.
• Primeiro escolher se será um teste bicaudal (usado se os desvios do
parâmetro estimado em qualquer direção de algum valor de
referência serão considerados teoricamente possíveis) ou unicaudal
(usado somente se os desvios em uma direção serão considerados
possíveis).
G*Power - 1º Exemplo
• Digitar a proporção dos grupos que foi encontrada anteriormente:
P1=0,404 e P2=0,533.
• Digitar o Erro Alfa – comparabilidade, que por convenção em estudos
epidemiológicos, consideramos 0,05.
• Digitar o Erro Beta – representatividade / força da amostra, que no
mínimo deve ser 80%, portanto, 0,80.
• E por fim, a razão de alocação que automaticamente é atribuído 1.
• Assim, precisaremos de n=492, sendo 246 homens e 246 mulheres.
G*Power – 2º Exemplo
• Estudo para comparar a média de idade entre as pessoas sedentárias
e as pessoas ativas. Vamos considerar que o estudo será feito com
adultos com idade entre 18 a 40 anos. Supondo que na literatura a
idade média das pessoas sedentárias era de 34,5 anos (DP 5,7 anos) e
das pessoas ativas 31,3 anos (DP 5,3 anos).
• Selecionar a família do teste (t tests), depois o teste estatístico (Teste
de diferença de médias de dois grupos independentes).
G*Power - 2º Exemplo
• Depois o tipo da análise, e como estamos fazendo o cálculo para
saber quantas pessoas devemos pesquisar, escolheremos o “A priori”.
• Precisamos preencher os parâmetros para que seja calculada a
amostra.
• Primeiro escolher se será um teste bicaudal (usado se os desvios do
parâmetro estimado em qualquer direção de algum valor de
referência são considerados teoricamente possíveis) ou unicaudal
(usado somente se os desvios em uma direção são considerados
possíveis).
G*Power - 2º Exemplo
• Precisamos calcular o tamanho do efeito. O programa calcula, apenas
precisamos colocar os valores médios que encontramos no referencial
teórico. Colocar o maior desvio padrão das médias.
• Digitar o Erro Alfa – comparabilidade, que por convenção em estudos
epidemiológicos, consideramos 0,05.
• Digitar o Erro Beta – representatividade / força da amostra, que no
mínimo deve ser 80%, portanto, 0,80.
• E por fim, a razão de alocação que automaticamente é atribuído 1.
• Assim, precisaremos de n=102, sendo 51 sedentários e 51 ativos.
O conteúdo desse curso
foi oferecido pelo
Centro Educacional Sete
de Setembro
em parceria com o
Professora Elaine C.
Marqueze
Profa. Dra. Elaine C Marqueze
@EquipeMySete
@JessicaJulioti
Bioestatística
@elaine.marqueze
Coleta de dados e Estatística
descritiva
Coleta e apuração dos dados
Coleta e apuração dos dados
• Fontes primárias:
• Observação,
• Questionário ou entrevista.
• Diferença entre um questionário e uma entrevista.
Coleta e apuração dos dados
• Normas para confecção de um questionário:
• Elaborar com clareza as perguntas,
• Perguntas que facilitem a memória,
• Não realize cálculos,
Coleta e apuração dos dados
• Não usar palavras técnicas no questionário (Não se deve perguntar: Você
usa o ácido acetilsalicílico?),
• Não fazer perguntas de intenção ou indução (Não se deve perguntar:
Assistiu à missa no domingo?).
Coleta e apuração dos dados
• Não formular uma pergunta que contenha uma resposta (Não se deve
perguntar: Você vai ao menos uma vez por semana ao cinema?),
• Evitar erros de tempo (Não se deve perguntar: Desde quando usa tal
produto?),
• Evitar perguntas sugestivas (Não se deve perguntar: Você não acha que as
dimensões desta sala são muito reduzidas?),
Coleta e apuração dos dados
• Permitir uma resposta adicional (Ex: Sim, Não, Não sei, Não quero
responder),
• Ordenar as perguntas,
• Extensão (tempo de pesquisa),
• Tabulação (organizar por categoria),
• Dados de controle (número do pesquisado).
Coleta e apuração dos dados
•Tipos de perguntas:
• Perguntas fechadas
• Perguntas abertas*
• *Tabulação dos dados
Coleta e apuração dos dados
•Entrevista:
• Preparar cuidadosamente as frases de apresentação, para ganhar a
confiança do entrevistado,
• Identificar-se junto ao entrevistado,
• Explicar rápida e claramente o objetivo da pesquisa,
Coleta e apuração dos dados
•Entrevista:
• Explicar sucintamente o que espera da pesquisa,
• Tranquilizar o entrevistado sobre o uso das informações,
• Termo de Consentimento Livre e Esclarecido - TCLE,
• Escolher um lugar tranquilo.
Coleta e apuração dos dados
• Fontes secundárias.
• Processamento de dados:
• Entrada de dados,
• Processamento de dados,
• Saída de dados.
Tipos de estatística
• Estatística descritiva
• Estatística inferencial ou indutiva
Estatística descritiva
• Utilizando o Jamovi para
construir um banco de dados
e realizar a estatística
descritiva.
• https://www.jamovi.org
https://www.jamovi.org/
Vamos fazer a estatística descritiva
no Jamovi?
O conteúdo desse curso
foi oferecido pelo
Centro Educacional Sete
de Setembro
em parceria com o
Professora Elaine C.
Marqueze
Profa. Dra. Elaine C Marqueze
@EquipeMySete
@JessicaJulioti
Bioestatística
@elaine.marqueze
Dúvidas dos alunos
“Malu Souza - Eu queria q você explicasse a
diferença entre DP e variância”
Variância da População :
σ2 = Σ(xi - μ)2 / N
Desvio-padrão da população (σ) é a
raiz quadrada da variância:
σ = √ Σ(xi - μ)2 / N
Variância da Amostra:
s2 = v = Σ(xi – x )2 / n – 1
Desvio-padrão (DP) é a raiz quadrada
da variância:
DP = √ Σ(xi – x )2 / n – 1
https://www.facebook.com/profile.php?id=100004026862559
“Danaê Malimpensa
Excelente! Por favor, quando há
experimentos com cultura de células, por
exemplo, onde o n certamente é menor do
que 100. O mesmo raciocínio também se
aplica?”
Sim, pois os programas de estatísticas consideram o número
de observações, sejam elas pessoas, grupos, células, animais,
etc.
https://www.facebook.com/danae.malimpensa
“Professora, a senhora disse que quando
não tivermos um programa de testeestatístico para realizar o cálculo de
distribuição normal, podemos inferir que
será normal se a média for próxima da
mediana. O quão longe é aceitável entre
esses valores?”
A distribuição normal é simétrica em torno da média o que
implica que a média, a mediana e a moda são todas
coincidentes (iguais).
“Considerando um n previamente calculado
com perdas (10%). Caso não haja essas
perdas ao longo do estudo, o tamanho
amostral "maior" do que o necessário irá interferir no
poder dos testes estatísticos das diferenças entre os
grupos?”
Conforme mostrei no G*Power, quanto maior a amostra, maior
o erro Beta, portanto, maior o poder amostral.
É importante considerar a questão ética no que refere ao n
pesquisado.
“Considerando o máximo de erro beta permitido e
considerando a impossibilidade de randomizar a
amostra. Se trabalharmos com o erro beta de 80%
e este erro nos permitir, assim, randomizar a amostra de
conveniência devido ao menor número de pessoas
participantes necessários, qual ofereceria maior poder de
resultados? Preferência pela randomização ou trabalhar com
erro beta maior?”
Dois dados distintos. O erro beta é para determinar o tamanho
da amostra. Se essa amostra será randomizada ou não, é um
tipo de amostragem.
Tipos de Amostragem
• Amostragem Não-Probabilística: São amostragens em que há uma
escolha deliberada dos elementos da amostra. Depende dos critérios e
julgamento do pesquisador.
• Amostragem Probabilística: São amostragens em que a seleção é
aleatória de tal forma que cada elemento da população tem uma
probabilidade conhecida de fazer parte da amostra. São métodos
rigorosamente científicos.
“Gabriela Boechat Souza
Fiquei um pouco confusa sobre a
randomização. Por exemplo, se eu quiser
fazer um estudo/artigo com pacientes que tenham
Parkinson, meu estudo só poderá ser randomizado se
eu tiver acesso a toda população de Parkinson do
Brasil? ou de algum Estado? Cidade?”
A randomização ocorrerá dentro da sua população, mas entende-se por
População (N): “qualquer conjunto de informações que tenham entre si
uma característica comum que delimite, inequivocamente, quais
elementos pertencem a ela.”
https://www.facebook.com/gabriela.boechatsouza.9
https://www.facebook.com/gabriela.boechatsouza.9
“Marcinha Dantas
Muito bom, professora! Queria muito outro curso que
descrevesse a aplicação dos testes. Professora, o teste F é
a mesma coisa que análise de variância?”
A análise de variância (ANOVA) é utilizado determinar se as médias de três ou mais
grupos são diferentes. A ANOVA usa testes F para testar estatisticamente a igualdade
entre médias.
Os testes-F recebem seu nome da sua estatística de teste, F, que recebeu seu nome em
homenagem a Sir Ronald Fisher. A estatística F é simplesmente uma razão de duas
variâncias. As variâncias são uma medida de dispersão, ou até que ponto os dados estão
dispersos em relação à sua média. Valores maiores representam maior dispersão.
A variância é o quadrado do desvio padrão. Para nós humanos, os desvios padrão são
mais fáceis de entender do que as variâncias pois estão nas mesmas unidades que os
dados, e não nas unidades quadradas. No entanto, muitas análises realmente usam
variâncias em seus cálculos.
https://www.facebook.com/marcia.marcinha.9022
https://www.facebook.com/marcia.marcinha.9022
“Professora, quando trata-se de pesquisas com
animais difere um pouco no que tange a
necessidade de verificar a representativa da
amostra na população? Tendo em vista a
limitação no uso de animais. A senhora pode
esclarecer?”
Sim, estudos com modelos animais são diferentes. O que passei nesse
curso foi sobre o cálculo de amostra com seres humanos. Portanto, para
ensaios com animais, a lógica da amostragem é diferente.
“Professora, pra fazer o cálculo de amostra
sempre será necessário ter dados de
estudos prévios ?”
Depende. Eu passei para vocês uma fórmula que não precisa dos dados
de prevalência ou incidência do desfecho analisado, mas também mostrei
o G*power que pede essa informação.
Há outros softwares que calculam o tamanho amostral, e eles são
distintos também. Em determinados softwares não precisa, por exemplo,
das análises estatísticas que serão empregadas.
G*Power – 1º Exemplo
• Cálculo da força a amostral a posteriori:
• Supondo que foi realizado um estudo para comparar a proporção de
pessoas sedentárias de acordo com o sexo, e que foi encontrada uma
prevalência de sedentarismo entre homens de 65% e entre mulheres
52%.
• Primeiro precisaremos selecionar a família do teste (Exact), depois o
teste estatístico (Teste de proporção de dois grupos independentes).
G*Power - 1º Exemplo
• Depois o tipo da análise, e como estamos fazendo o cálculo para
saber a força amostral, escolheremos o “Post hoc”.
• Precisamos preencher os parâmetros para que seja calculado o poder
amostral.
• Primeiro escolher se será um teste bicaudal (usado se os desvios do
parâmetro estimado em qualquer direção de algum valor de
referência serão considerados teoricamente possíveis) ou unicaudal
(usado somente se os desvios em uma direção serão considerados
possíveis).
G*Power - 1º Exemplo
• Digitar a proporção dos grupos que foi encontrada: P1=0,65 e
P2=0,52.
• Digitar o Erro Alfa – comparabilidade, que por convenção em estudos
epidemiológicos, consideramos 0,05.
• Digitar o tamanho da amostra pesquisada, a supor grupo 1=246 e
grupo 2=220.
• Assim, teremos uma amostra com força amostral de 80,6% e um Erro
Alfa atual de 0,04.
G*Power – 2º Exemplo
• Cálculo da força a amostral a posteriori:
• Supondo que foi realizado um estudo para comparar a média de
idade entre as pessoas sedentárias e as pessoas ativas. Vamos supor
que a idade média das pessoas sedentárias foi de 35 anos (DP 3,8
anos) e das pessoas ativas 33 anos (DP 3 anos).
• Selecionar a família do teste (t tests), depois o teste estatístico (Teste
de diferença de médias de dois grupos independentes).
G*Power - 2º Exemplo
• Depois o tipo da análise, e como estamos fazendo o cálculo para
saber a força amostral, escolheremos o “Post hoc”.
• Precisamos preencher os parâmetros para que seja calculado o poder
amostral.
• Primeiro escolher se será um teste bicaudal (usado se os desvios do
parâmetro estimado em qualquer direção de algum valor de
referência serão considerados teoricamente possíveis) ou unicaudal
(usado somente se os desvios em uma direção serão considerados
possíveis).
G*Power - 2º Exemplo
• Precisamos calcular o tamanho do efeito. O programa calcula, apenas
precisamos colocar os valores médios que encontramos. Colocar o
maior desvio padrão das médias, grupo 1=35 anos (DP 3,8 anos) e
grupo 2=33 anos (DP 3 anos). Tamanho do efeito 0,526.
• Digitar o Erro Alfa – comparabilidade, que por convenção em estudos
epidemiológicos, consideramos 0,05.
• Digitar o tamanho da amostra pesquisada, a supor grupo 1=54 e
grupo 2=66.
• Assim, teremos uma amostra com força amostral de 81,2%.
Indicação de livro
O conteúdo desse curso
foi oferecido pelo
Centro Educacional Sete
de Setembro
em parceria com o
Professora Elaine C.
Marqueze