Buscar

todas aulas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 138 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 138 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 138 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Profa. Dra. Elaine C Marqueze
@EquipeMySete
@JessicaJulioti
Bioestatística
@elaine.marqueze
Introdução, População e Amostra, 
Variáveis
Bioestatística
• Estatística – latim status (estado).
• Ciência que se preocupa com a coleta, organização, descrição, análise 
e interpretação de dados experimentais.
• Pode ser usada para simplesmente descrever dados (estatística 
descritiva) ou para comparar grupos e fazer generalizações a partir de 
resultados obtidos (estatística inferencial, indutiva ou analítica).
Por que a estatística é necessária?
• As pessoas são condescendentes com os dados, especialmente com os 
próprios.
• As diferenças, não raramente, são atribuídas a causas erradas.
• As coincidências ocorrem mais frequentemente do que se intui.
• Acrescentar polimento às publicações e apresentações.
• Para saber o grau de certeza das conclusões tiradas.
População x Amostra
População x Amostra
• População (N): qualquer conjunto de informações que tenham entre si 
uma característica comum que delimite, inequivocamente, quais 
elementos pertencem a ela.
• Amostra (n): são subconjuntos representativos de uma dada 
população. A amostra deve ser representativa da população da qual 
foi extraída, ser parecida com ela (qualitativa e quantitativamente), 
devendo obedecer a dois princípios básicos:
• 1. deve ser suficientemente grande (representatividade);
• 2. seus constituintes devem preferencialmente serem selecionados 
ao acaso.
Randomização
• Seleção ao acaso – random – significa que cada um dos 
componentes da população estudada tem a mesma chance de ser 
incluído na amostra e, além disso, que foi selecionado 
independentemente.
• Isto implica que a inclusão de um particular membro não altera a 
chance de inclusão dos demais. 
• Se isso não ocorrer, diz-se que a amostra é não randomizada, 
podendo ter um viés.
• Dados imprecisos, amostras viciadas, populações mal definidas e 
critérios subjetivos levam a resultados igualmente imprecisos, que a 
estatística não pode e não deve tentar salvar.
Randomização
Variáveis
Variáveis
• Uma das primeiras coisas a serem feitas é caracterizar qual tipo de
variável será trabalhada, pois muitas estatísticas são aplicáveis a
apenas um tipo de variável mas não são adequadas para outras.
• Qualitativas (categóricas) x Quantitativas (numéricas).
Variáveis Qualitativas
Variáveis nominais: são todos aquelas distribuídas em categorias nominais, 
sem qualquer ordem. São geralmente apresentadas na forma de diagramas 
de barras, pizzas e tabelas de contingência.
Esses tipos de variáveis são muito fáceis de serem descritas; geralmente, 
basta apresentar o seu número (valores absolutos) e distribuição 
(porcentagem por categoria).
Descrição das variáveis nominais
• Os indivíduos são classificados em categorias segundo uma 
característica.
Ex: sexo (masculino, feminino), 
hábito de fumar (fumante, não fumante),
sobrepeso (sim, não).
• Variáveis ordinais: são aquelas que se distribuem por categorias que têm 
uma ordem. Frequentemente a mediana é usada para descrevê-las mas, 
também, proporções podem ser utilizadas.
• Os indivíduos são classificados em categorias que possuem algum tipo
inerente de ordem. Neste caso, uma categoria pode ser "maior" ou
"menor" do que outra. Distribuição porcentagem por categoria.
EX: nível socioeconômico (A, B, C e D).
Variáveis Qualitativas
Variáveis Quantitativas
• Variáveis quantitativa Discreta: Número de refeições por dia.
• Variável quantitativa Contínua: Idade (anos e meses), peso (kg, g), 
estatura (m, cm), nível de retinol sérico (g/dl), circunferência da 
cintura (cm, mm).
Descrição das variáveis quantitativas
• Esse tipo de variável pode ser trabalhada para gerar informações que 
expressem a tendência central e a dispersão.
• Medidas de tendência central:
• Média aritmética (𝓍): soma dos valores observados, dividida pelo 
número de observações. Para variáveis quantitativas contínuas com 
distribuição normal.
• Mediana (Md): aquele valor que, uma vez ordenados todos os 
resultados, deixa igual número de resultados de cada lado. Numa 
distribuição assimétrica ela é muito mais representativa da população 
do que a média. Eventualmente, pode ser usada com dados ordinais. 
Para variáveis quantitativas contínuas com distribuição não-normal e 
variáveis quantitativas discretas.
• Moda (Mo): o valor mais frequente, o que se repete, podendo ter mais 
de uma moda em uma mesma amostra. Para variáveis quantitativas
contínuas e discretas.
Descrição das variáveis quantitativas
• Medidas de dispersão:
• Desvio-padrão (DP): medida que expressa o grau de dispersão de 
um conjunto de dados, em que um maior DP, maior a variabilidade 
entre as observações. Grandes amostras (>100) e correspondente à 
média aritmética.
• Erro-padrão (EP): variabilidade entre a média aritmética e a média 
que poderia ser encontrada em outras amostras do mesmo 
tamanho. Amostras pequenas (<100) e correspondente à média 
aritmética.
Descrição das variáveis quantitativas
• Intervalo de confiança: indica a confiabilidade de uma estimativa. 
Intervalo de confiança com nível de confiança de 95% é o mais 
comum e significa que o resultado está dentro do intervalo de 95 dos 
100 estudos hipoteticamente realizados. Correspondente à média 
aritmética.
• Amplitude de variação: diferença entre o maior e o menor valor.
Descrição das variáveis quantitativas
• Amplitude interquartílica: é calculada com base no cálculo dos 
quartis, sendo o primeiro quartil (inferior – 25%), o quartil 
intermediário (mediana – 50%), o terceiro quartil (superior – 75%). 
Correspondente à mediana.
0% 25% 50% 75% 100%
Descrição das variáveis quantitativas
Exercício
Qual a natureza das variáveis a seguir?
- Atividade física (sedentário e ativo);
- Nível de colesterol (mg/dl);
- Estágio da doença (inicial, intermediário, avançado);
- Número de filhos;
Exercício
Qual a natureza das variáveis a seguir?
- Nível de atividade física (sedentário e ativo): Qualitativa nominal.
- Nível de colesterol (mg/dl): Quantitativa contínua.
- Estágio da doença (inicial, intermediário, avançado): Qualitativa ordinal.
- Número de filhos: Quantitativa discreta.
O conteúdo desse curso 
foi oferecido pelo 
Centro Educacional Sete 
de Setembro 
em parceria com o 
Professora Elaine C. 
Marqueze 
Profa. Dra. Elaine C Marqueze
@EquipeMySete
@JessicaJulioti
Bioestatística
@elaine.marqueze
Apresentação dos dados, 
Distribuição dos dados
Apresentação dos dados
Apresentação dos dados
• Texto;
• Tabela;
• Gráfico.
Representação gráfica
• Um gráfico ou diagrama é uma representação geométrica da relação entre 
as variáveis.
• Facilita a visualização de relações não identificáveis na observação de uma 
tabela.
• Os gráficos mais informativos são relativamente simples e auto-
explicativos.
Gráfico de barras
• Utilizados para exibir uma distribuição de frequências para as variáveis 
qualitativas nominais e ordinais.
• As várias categorias nas quais as observações são classificadas estão 
apresentadas ao longo de um eixo horizontal.
• As barras devem ser de igual largura e separadas uma da outra de modo a 
não implicar continuidade.
Gráfico de barras vertical
Histograma
• Para apresentar a distribuição de frequências para as variáveis 
quantitativas discretas e contínuas.
• O eixo horizontal exibe os limites verdadeiros dos vários intervalos, que 
são os pontos que os separam dos outros intervalos em ambos os lados, 
por isso as barras são unidas.
Histogramas
Polígonos de frequência
• Similar ao histograma – usa os mesmos dois eixos que um histograma.
• É construído ao se colocar um ponto no centro de cada um dos intervalos 
de forma tal que a altura do ponto seja igual à frequência absoluta ou 
frequência relativa das observações.
• Os polígonos de frequência são facilmente superpostos e bons para se 
comparar dois ou maisconjuntos de dados.
Polígonos de frequência
Quando os pontos estão interligados
significa que representam a mesma
pessoa ou conjunto de pessoas.
Caso sejam pessoas diferentes, não
faça a ligação dos pontos.
Polígonos de frequência
Box Plots
• Gráficos de dispersão unidimensionais – resumo das variáveis 
quantitativas discretas ou contínuas.
• Usado em um único eixo horizontal para exibir a posição relativa de 
cada um dos pontos dos dados no grupo.
Box Plots
Box Plots
Gráfico de dispersão bidimensional
• É usado para mostrar a relação entre duas medidas contínuas distintas.
• Cada um dos pontos no gráfico representa um par de valores.
• A escala para uma quantidade está marcada no eixo horizontal (eixo x), e 
a escala da outra no eixo vertical (eixo y).
Gráfico de dispersão bidimensional
Distribuição dos dados
• A maioria dos fenômenos da natureza, em especial 
os biológicos, apresenta variações dentro de um 
intervalo definido.
• A curva normal ou de Gauss é simétrica e tem 
forma de sino.
• Assume um série de formas mais ou menos 
achatadas (curtose) em função da dispersão dos 
dados ao redor do ponto central, no qual 
coincidem a média aritmética, a moda, assim como 
a mediana.
Distribuição dos dados
• A curva normal é próxima ao eixo 
horizontal, suas caudas aproximam-se dele 
mas não o tocam jamais, o que significa 
que a variável pode assumir qualquer valor 
entre –∞ e + ∞.
• Quando a distribuição dos dados é normal 
(simétrica), a média representa bem a 
população; quando a distribuição é 
assimétrica, a mediana é mais 
representativa.
Distribuição dos dados
• A distribuição normal se caracteriza por reunir um grande número de 
valores em torno da média, que diminuem gradualmente de frequência à 
medida que se afastam dela.
Distribuição dos dados
Distribuição dos dados
• A área subordinada à curva normal representa 100% das frequências.
• Em torno da média se determina intervalos com utilização dos DP, 
conforme abaixo:
• 𝓍± DP = 68,26%
• 𝓍± 2DP = 95,45%
• 𝓍± 3DP = 99,73%
Distribuição dos dados
Distribuição dos dados - Exemplo
• 5.000 pessoas / média = 20 anos / DP = 3 anos.
• 𝔁± DP = 20 ± 3, ou seja, entre 17 e 23 anos.
• Portanto, 68,26% dos 5.000 indivíduos possuem entre 17 e 23 anos.
• Ou seja, 5.000 x 0,6826 = 3.413 indivíduos.
Distribuição dos dados - Exemplo
• 5.000 pessoas / média = 20 anos / DP = 3 anos
• 𝔁± 2DP = 20 ± 6, ou seja, entre 14 e 26 anos.
• Portanto, 95,45% dos 5.000 indivíduos possuem entre 14 e 26 anos.
• Ou seja, 5.000 x 0,9545 = 4.773 indivíduos.
• 𝔁± 3DP = 20 ± 9, ou seja, entre 11 e 29 anos.
• Portanto, 99,73% dos 5.000 indivíduos possuem entre 11 e 29 anos.
• Ou seja, 5.000 x 0,9973 = 4.987 indivíduos.
Distribuição dos dados - Exercício
• Uma amostra com 120 adultos, com peso médio de 80 kg e DP de 12 
kg. Quantos adultos têm peso entre 𝓍± DP? 
Distribuição dos dados
• Exercício:
• Uma amostra com 120 adultos, com peso médio de 80 kg e DP de 12 
kg. Quantos adultos têm peso entre 𝓍± DP? 
• 80 ± 12 / 68 a 92 kg. Deverá haver 68,26% adultos com peso entre 68 
e 92 kg, isto é, 82 adultos (120 * 0,6826 = 82).
Distribuição dos dados
• Estatística paramétrica 
• Estatística não-paramétrica
Distribuição dos dados
Latorre, 2009
O conteúdo desse curso 
foi oferecido pelo 
Centro Educacional Sete 
de Setembro 
em parceria com o 
Professora Elaine C. 
Marqueze 
Profa. Dra. Elaine C Marqueze
@EquipeMySete
@JessicaJulioti
Bioestatística
@elaine.marqueze
Amostra
Amostra
Tipos de Amostragem
• Amostragem Não-Probabilística: São amostragens em que há uma
escolha deliberada dos elementos da amostra. Depende dos critérios e
julgamento do pesquisador.
• Amostragem Probabilística: São amostragens em que a seleção é
aleatória de tal forma que cada elemento da população tem uma
probabilidade conhecida de fazer parte da amostra. São métodos
rigorosamente científicos.
Amostragens não-probabilísticas
Tipos de amostragens não-probabilísticas
1. Amostragem por acessibilidade ou por conveniência:
• Menos rigoroso;
• Seleção de quem se tem acesso.
2. Amostragem intencional:
• Seleção baseada nas informações disponíveis para ser
representativo de toda população;
• Conhecimento da população e do subgrupo selecionado.
Tipos de amostragens não-probabilísticas
3. Amostragem por cotas:
• Maior rigor;
• Utilizada quando não existe um cadastro da população que
possibilite o sorteio, mas há informação suficiente sobre o perfil
populacional;
• Etapas: classificar a população, determinar a proporção da
população para cada classe, fixar cotas em observância à
proporção das classes consideradas.
Amostragens probabilísticas
Tipos de amostragens probabilísticas
1. Amostragem aleatória simples (AAS):
• Todos os elementos da população tem a mesma probabilidade de
pertencer à amostra;
• Indicada para populações homogêneas;
• A amostragem pode ser com ou sem reposição.
Tipos de amostragens probabilísticas
2. Amostragem sistemática:
• A população deve ser ordenada de forma que os elementos
sejam identificados pela posição;
• Indicada para populações homogêneas;
Tipos de amostragens probabilísticas
2. Amostragem sistemática:
• Determina-se a cota amostral pela fórmula, k=N/n, em que
N=População e n=Amostra;
• Escolhe-se aleatoriamente um elemento no intervalo; este será o
primeiro elemento da amostra;
• O segundo elemento será o primeiro mais k, e assim
sucessivamente.
Exemplo:
• N= 4.950
• n= 825
• k= N/n
• k= 4.950/825
• k= 6
1º sujeito (aleatório): número sorteado = 10,
2º sujeito: Número sorteado + k = 16,
3º sujeito: Número sorteado + 2k = 22,
E assim sucessivamente até chegar a amostra de 825 sujeitos.
Tipos de amostragens probabilísticas
3. Amostragem estratificada:
• Divide-se a população em subgrupos mais homogêneos (estratos),
procedendo-se à amostragem em cada estrato, proporcional ao
tamanho do estrato.
• Em geral, a retirada das amostras nos estratos é realizada de forma
aleatória simples.
Exemplo: estratos por idade, renda, ...
Para determinar o número de elementos da população no
iésimo estrato que irá participar da amostra (ni ) podemos usar a seguinte
fórmula:
Estrato Renda da População: A (1.238) – B (1.876) – C (835) – D (1.001)
nA = n * Ni nA = 825 * 1.238 nA = 0,1666 * 1.238
N 4.950
nA = 206,2508 nA = 206
nB = 313 / nC = 139 / nD = 167
Tipos de amostragens probabilísticas
4. Amostragem por conglomerados:
• Divide-se a população em pequenos grupos e sorteia-se um número
suficiente desses pequenos grupos (conglomerados);
• Este esquema amostral é utilizado quando há uma subdivisão da 
população em grupos que sejam bastante semelhantes entre si, mas 
com fortes discrepâncias dentro dos grupos, de modo que cada um 
possa ser uma pequena representação da população de interesse 
específico; 
Tipos de amostragens probabilísticas
4. Amostragem por conglomerados:
• A amostragem é realizada em cima dos conglomerados, e não mais 
sobre os indivíduos da população. 
Exemplo: um quarteirão de uma cidade, bairros, municípios, regiões.
Tamanho da Amostra
Algumas razões para o uso de amostras:
• Minimização de custos, quando precisão absoluta não é necessária;
• Economia de tempo, quando há necessidade de resultados mais rápidos
do que seria possível com um censo;
• Na indústria, alguns testes são destrutivos e só podem ser feitos com uma
amostra de produtos;
• Em populações infinitas.
Amostragem
Tamanho Amostral
1. Nível de confiança (quanto maior o nível de confiança, maior o tamanho 
da amostra – Erro Beta – representatividade - força da amostra); 
2. Erro máximo permitido (quanto menor o erro permitido, maior o 
tamanho da amostra – Erro Alfa - comparabilidade); 
3. Variabilidade do fenômeno que está sendo investigado (quanto maior 
a variabilidade, maior o tamanho da amostra). 
Cálculo Amostral
N = Tamanho da populaçãoE0 = erro amostral tolerável (erro máximo permitido)
n0 = primeira aproximação do tamanho da amostra
n = tamanho da amostra
n0 = 1 / E0
2
n = N*n0 / N + n0
Barbetta PA. Estatística aplicada às ciências sociais. 5 ed, Florianópolis: UFSC, 2005. 
Cálculo Amostral
N = Tamanho da população = 1.000 
E0 = erro amostral tolerável = 5%
n0 = primeira aproximação do tamanho da amostra
n = tamanho da amostra
n0 = 1 / E0
2 = 1/(0,05) 2 = 1/0,0025 = 400
n = N*n0 / N + n0 = 1.000*400/1.000+400 =
n = 400.000/1.400 = 285,7 ≅ 286 pessoas
Portanto, com um erro amostral tolerável de 5%, a amostra será
constituída por 286 pessoas.
Cálculo Amostral
N = Tamanho da população = 1.000 
E0 = erro amostral tolerável = 10%
n0 = primeira aproximação do tamanho da amostra
n = tamanho da amostra
n0 = 1 / E0
2 = 1/(0,10) 2 = 1/0,01 = 100
n = N*n0 / N + n0 = 1.000*100/1.000+100 =
n = 100.000/1.100 = 90,9 ≅ 91 pessoas
Portanto, com um erro amostral tolerável de 10%, a amostra será
constituída por 91 pessoas.
Cálculo Amostral
• G*Power - Software gratuito usado para calcular o poder amostral. O 
programa oferece a capacidade de calcular a amostra para uma ampla 
variedade de testes estatísticos, incluindo testes t, testes F e testes 
qui-quadrado, entre outros.
G*Power – 1º Exemplo
• Estudo para comparar a proporção de pessoas sedentárias de acordo 
com o sexo. Primeiro ver na literatura, qual a proporção encontrada 
em estudos anteriores (encontrar estudos que sejam semelhantes ao 
nosso). Supondo que faremos um estudo de base populacional, 
podemos utilizar a prevalência apresentada pela OMS (2018): 
prevalência de sedentarismo entre homens de 40,4% e entre 
mulheres 53,3%.
• Primeiro precisaremos selecionar a família do teste (Exact), depois o 
teste estatístico (Teste de proporção de dois grupos independentes).
G*Power - 1º Exemplo
• Depois o tipo da análise, e como estamos fazendo o cálculo para 
saber quantas pessoas devemos pesquisar, escolheremos o “A priori”. 
• Precisamos preencher os parâmetros para que seja calculada a 
amostra.
• Primeiro escolher se será um teste bicaudal (usado se os desvios do 
parâmetro estimado em qualquer direção de algum valor de 
referência serão considerados teoricamente possíveis) ou unicaudal
(usado somente se os desvios em uma direção serão considerados 
possíveis).
G*Power - 1º Exemplo
• Digitar a proporção dos grupos que foi encontrada anteriormente: 
P1=0,404 e P2=0,533.
• Digitar o Erro Alfa – comparabilidade, que por convenção em estudos 
epidemiológicos, consideramos 0,05.
• Digitar o Erro Beta – representatividade / força da amostra, que no 
mínimo deve ser 80%, portanto, 0,80.
• E por fim, a razão de alocação que automaticamente é atribuído 1.
• Assim, precisaremos de n=492, sendo 246 homens e 246 mulheres.
G*Power – 2º Exemplo
• Estudo para comparar a média de idade entre as pessoas sedentárias 
e as pessoas ativas. Vamos considerar que o estudo será feito com 
adultos com idade entre 18 a 40 anos. Supondo que na literatura a 
idade média das pessoas sedentárias era de 34,5 anos (DP 5,7 anos) e 
das pessoas ativas 31,3 anos (DP 5,3 anos). 
• Selecionar a família do teste (t tests), depois o teste estatístico (Teste 
de diferença de médias de dois grupos independentes).
G*Power - 2º Exemplo
• Depois o tipo da análise, e como estamos fazendo o cálculo para 
saber quantas pessoas devemos pesquisar, escolheremos o “A priori”. 
• Precisamos preencher os parâmetros para que seja calculada a 
amostra.
• Primeiro escolher se será um teste bicaudal (usado se os desvios do 
parâmetro estimado em qualquer direção de algum valor de 
referência são considerados teoricamente possíveis) ou unicaudal
(usado somente se os desvios em uma direção são considerados 
possíveis).
G*Power - 2º Exemplo
• Precisamos calcular o tamanho do efeito. O programa calcula, apenas 
precisamos colocar os valores médios que encontramos no referencial 
teórico. Colocar o maior desvio padrão das médias.
• Digitar o Erro Alfa – comparabilidade, que por convenção em estudos 
epidemiológicos, consideramos 0,05.
• Digitar o Erro Beta – representatividade / força da amostra, que no 
mínimo deve ser 80%, portanto, 0,80.
• E por fim, a razão de alocação que automaticamente é atribuído 1.
• Assim, precisaremos de n=102, sendo 51 sedentários e 51 ativos.
O conteúdo desse curso 
foi oferecido pelo 
Centro Educacional Sete 
de Setembro 
em parceria com o 
Professora Elaine C. 
Marqueze 
Profa. Dra. Elaine C Marqueze
@EquipeMySete
@JessicaJulioti
Bioestatística
@elaine.marqueze
Coleta de dados e Estatística 
descritiva
Coleta e apuração dos dados
Coleta e apuração dos dados
• Fontes primárias:
• Observação,
• Questionário ou entrevista.
• Diferença entre um questionário e uma entrevista.
Coleta e apuração dos dados
• Normas para confecção de um questionário:
• Elaborar com clareza as perguntas,
• Perguntas que facilitem a memória,
• Não realize cálculos,
Coleta e apuração dos dados
• Não usar palavras técnicas no questionário (Não se deve perguntar: Você 
usa o ácido acetilsalicílico?),
• Não fazer perguntas de intenção ou indução (Não se deve perguntar: 
Assistiu à missa no domingo?).
Coleta e apuração dos dados
• Não formular uma pergunta que contenha uma resposta (Não se deve 
perguntar: Você vai ao menos uma vez por semana ao cinema?),
• Evitar erros de tempo (Não se deve perguntar: Desde quando usa tal 
produto?),
• Evitar perguntas sugestivas (Não se deve perguntar: Você não acha que as 
dimensões desta sala são muito reduzidas?),
Coleta e apuração dos dados
• Permitir uma resposta adicional (Ex: Sim, Não, Não sei, Não quero 
responder),
• Ordenar as perguntas,
• Extensão (tempo de pesquisa),
• Tabulação (organizar por categoria),
• Dados de controle (número do pesquisado).
Coleta e apuração dos dados
•Tipos de perguntas:
• Perguntas fechadas
• Perguntas abertas*
• *Tabulação dos dados
Coleta e apuração dos dados
•Entrevista:
• Preparar cuidadosamente as frases de apresentação, para ganhar a 
confiança do entrevistado,
• Identificar-se junto ao entrevistado,
• Explicar rápida e claramente o objetivo da pesquisa,
Coleta e apuração dos dados
•Entrevista:
• Explicar sucintamente o que espera da pesquisa,
• Tranquilizar o entrevistado sobre o uso das informações,
• Termo de Consentimento Livre e Esclarecido - TCLE,
• Escolher um lugar tranquilo.
Coleta e apuração dos dados
• Fontes secundárias.
• Processamento de dados:
• Entrada de dados,
• Processamento de dados,
• Saída de dados.
Tipos de estatística
• Estatística descritiva
• Estatística inferencial ou indutiva
Estatística descritiva
• Utilizando o Jamovi para 
construir um banco de dados 
e realizar a estatística 
descritiva.
• https://www.jamovi.org
https://www.jamovi.org/
Vamos fazer a estatística descritiva 
no Jamovi?
O conteúdo desse curso 
foi oferecido pelo 
Centro Educacional Sete 
de Setembro 
em parceria com o 
Professora Elaine C. 
Marqueze 
Profa. Dra. Elaine C Marqueze
@EquipeMySete
@JessicaJulioti
Bioestatística
@elaine.marqueze
Dúvidas dos alunos
“Malu Souza - Eu queria q você explicasse a 
diferença entre DP e variância”
Variância da População :
σ2 = Σ(xi - μ)2 / N 
Desvio-padrão da população (σ) é a 
raiz quadrada da variância:
σ = √ Σ(xi - μ)2 / N 
Variância da Amostra:
s2 = v = Σ(xi – x )2 / n – 1 
Desvio-padrão (DP) é a raiz quadrada 
da variância:
DP = √ Σ(xi – x )2 / n – 1 
https://www.facebook.com/profile.php?id=100004026862559
“Danaê Malimpensa
Excelente! Por favor, quando há 
experimentos com cultura de células, por 
exemplo, onde o n certamente é menor do 
que 100. O mesmo raciocínio também se 
aplica?”
Sim, pois os programas de estatísticas consideram o número 
de observações, sejam elas pessoas, grupos, células, animais, 
etc.
https://www.facebook.com/danae.malimpensa
“Professora, a senhora disse que quando 
não tivermos um programa de testeestatístico para realizar o cálculo de 
distribuição normal, podemos inferir que 
será normal se a média for próxima da 
mediana. O quão longe é aceitável entre 
esses valores?”
A distribuição normal é simétrica em torno da média o que 
implica que a média, a mediana e a moda são todas 
coincidentes (iguais).
“Considerando um n previamente calculado
com perdas (10%). Caso não haja essas 
perdas ao longo do estudo, o tamanho 
amostral "maior" do que o necessário irá interferir no 
poder dos testes estatísticos das diferenças entre os 
grupos?”
Conforme mostrei no G*Power, quanto maior a amostra, maior 
o erro Beta, portanto, maior o poder amostral. 
É importante considerar a questão ética no que refere ao n
pesquisado.
“Considerando o máximo de erro beta permitido e 
considerando a impossibilidade de randomizar a 
amostra. Se trabalharmos com o erro beta de 80% 
e este erro nos permitir, assim, randomizar a amostra de 
conveniência devido ao menor número de pessoas 
participantes necessários, qual ofereceria maior poder de 
resultados? Preferência pela randomização ou trabalhar com 
erro beta maior?”
Dois dados distintos. O erro beta é para determinar o tamanho 
da amostra. Se essa amostra será randomizada ou não, é um 
tipo de amostragem.
Tipos de Amostragem
• Amostragem Não-Probabilística: São amostragens em que há uma
escolha deliberada dos elementos da amostra. Depende dos critérios e
julgamento do pesquisador.
• Amostragem Probabilística: São amostragens em que a seleção é
aleatória de tal forma que cada elemento da população tem uma
probabilidade conhecida de fazer parte da amostra. São métodos
rigorosamente científicos.
“Gabriela Boechat Souza
Fiquei um pouco confusa sobre a 
randomização. Por exemplo, se eu quiser 
fazer um estudo/artigo com pacientes que tenham 
Parkinson, meu estudo só poderá ser randomizado se 
eu tiver acesso a toda população de Parkinson do 
Brasil? ou de algum Estado? Cidade?”
A randomização ocorrerá dentro da sua população, mas entende-se por 
População (N): “qualquer conjunto de informações que tenham entre si 
uma característica comum que delimite, inequivocamente, quais 
elementos pertencem a ela.”
https://www.facebook.com/gabriela.boechatsouza.9
https://www.facebook.com/gabriela.boechatsouza.9
“Marcinha Dantas
Muito bom, professora! Queria muito outro curso que 
descrevesse a aplicação dos testes. Professora, o teste F é 
a mesma coisa que análise de variância?”
A análise de variância (ANOVA) é utilizado determinar se as médias de três ou mais 
grupos são diferentes. A ANOVA usa testes F para testar estatisticamente a igualdade 
entre médias.
Os testes-F recebem seu nome da sua estatística de teste, F, que recebeu seu nome em 
homenagem a Sir Ronald Fisher. A estatística F é simplesmente uma razão de duas 
variâncias. As variâncias são uma medida de dispersão, ou até que ponto os dados estão 
dispersos em relação à sua média. Valores maiores representam maior dispersão.
A variância é o quadrado do desvio padrão. Para nós humanos, os desvios padrão são 
mais fáceis de entender do que as variâncias pois estão nas mesmas unidades que os 
dados, e não nas unidades quadradas. No entanto, muitas análises realmente usam 
variâncias em seus cálculos.
https://www.facebook.com/marcia.marcinha.9022
https://www.facebook.com/marcia.marcinha.9022
“Professora, quando trata-se de pesquisas com 
animais difere um pouco no que tange a 
necessidade de verificar a representativa da 
amostra na população? Tendo em vista a 
limitação no uso de animais. A senhora pode 
esclarecer?”
Sim, estudos com modelos animais são diferentes. O que passei nesse 
curso foi sobre o cálculo de amostra com seres humanos. Portanto, para 
ensaios com animais, a lógica da amostragem é diferente.
“Professora, pra fazer o cálculo de amostra 
sempre será necessário ter dados de 
estudos prévios ?”
Depende. Eu passei para vocês uma fórmula que não precisa dos dados 
de prevalência ou incidência do desfecho analisado, mas também mostrei 
o G*power que pede essa informação. 
Há outros softwares que calculam o tamanho amostral, e eles são 
distintos também. Em determinados softwares não precisa, por exemplo, 
das análises estatísticas que serão empregadas.
G*Power – 1º Exemplo
• Cálculo da força a amostral a posteriori:
• Supondo que foi realizado um estudo para comparar a proporção de 
pessoas sedentárias de acordo com o sexo, e que foi encontrada uma 
prevalência de sedentarismo entre homens de 65% e entre mulheres 
52%.
• Primeiro precisaremos selecionar a família do teste (Exact), depois o 
teste estatístico (Teste de proporção de dois grupos independentes).
G*Power - 1º Exemplo
• Depois o tipo da análise, e como estamos fazendo o cálculo para 
saber a força amostral, escolheremos o “Post hoc”. 
• Precisamos preencher os parâmetros para que seja calculado o poder 
amostral.
• Primeiro escolher se será um teste bicaudal (usado se os desvios do 
parâmetro estimado em qualquer direção de algum valor de 
referência serão considerados teoricamente possíveis) ou unicaudal
(usado somente se os desvios em uma direção serão considerados 
possíveis).
G*Power - 1º Exemplo
• Digitar a proporção dos grupos que foi encontrada: P1=0,65 e 
P2=0,52.
• Digitar o Erro Alfa – comparabilidade, que por convenção em estudos 
epidemiológicos, consideramos 0,05.
• Digitar o tamanho da amostra pesquisada, a supor grupo 1=246 e 
grupo 2=220.
• Assim, teremos uma amostra com força amostral de 80,6% e um Erro 
Alfa atual de 0,04.
G*Power – 2º Exemplo
• Cálculo da força a amostral a posteriori:
• Supondo que foi realizado um estudo para comparar a média de 
idade entre as pessoas sedentárias e as pessoas ativas. Vamos supor 
que a idade média das pessoas sedentárias foi de 35 anos (DP 3,8 
anos) e das pessoas ativas 33 anos (DP 3 anos). 
• Selecionar a família do teste (t tests), depois o teste estatístico (Teste 
de diferença de médias de dois grupos independentes).
G*Power - 2º Exemplo
• Depois o tipo da análise, e como estamos fazendo o cálculo para 
saber a força amostral, escolheremos o “Post hoc”. 
• Precisamos preencher os parâmetros para que seja calculado o poder 
amostral.
• Primeiro escolher se será um teste bicaudal (usado se os desvios do 
parâmetro estimado em qualquer direção de algum valor de 
referência serão considerados teoricamente possíveis) ou unicaudal
(usado somente se os desvios em uma direção serão considerados 
possíveis).
G*Power - 2º Exemplo
• Precisamos calcular o tamanho do efeito. O programa calcula, apenas 
precisamos colocar os valores médios que encontramos. Colocar o 
maior desvio padrão das médias, grupo 1=35 anos (DP 3,8 anos) e 
grupo 2=33 anos (DP 3 anos). Tamanho do efeito 0,526.
• Digitar o Erro Alfa – comparabilidade, que por convenção em estudos 
epidemiológicos, consideramos 0,05.
• Digitar o tamanho da amostra pesquisada, a supor grupo 1=54 e 
grupo 2=66.
• Assim, teremos uma amostra com força amostral de 81,2%.
Indicação de livro
O conteúdo desse curso 
foi oferecido pelo 
Centro Educacional Sete 
de Setembro 
em parceria com o 
Professora Elaine C. 
Marqueze

Continue navegando