Buscar

Apostila de Bioestatística - variáveis, gráficos, medidas de dispersão, amostras, etc

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 19 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 19 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 19 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Isabela Pedrini 2025.1 
2
BIOESTATÍSTICA – P1 E P2
SUMÁRIO
1. BIOESTATÍSTICA APLICADA NA SAÚDE: página 1 
2. CONCEITOS: página 3 
3. DADOS: página 5 
4. VARIÁVEIS: página 6 
5. MEDIDAS DE TENDÊNCIA CENTRAL (OU DE LOCAÇÃO): página 7 
6. DISTRIBUIÇÃO E FREQUÊNCIA: página 7 
7. MEDIDAS DE DISPERSÃO (OU DE VARIABILIDADE): página 8
8. GRÁFICOS: página 9 
9. BUSCA ELETRÔNICA EM BASE DE DADOS: página 12 
10. AMOSTRAGEM: página 13 
11. CORRELAÇÃO LINEAR SIMPLES (RXY): página 15 
12. SIGNIFICÂNCIA: página 19 
1. BIOESTATÍSTICA APLICADA NA SAÚDE 
· Aspectos conceituais: 
-A Bioestatística e epidemiologia é uma disciplina básica da saúde pública voltada à compreensão do processo saúde/doença no âmbito de populações
-Como ciência a Bioestatística fundamenta-se no raciocínio causal, como disciplina da saúde pública, preocupa-se com o desenvolvimento de estratégias para as ações voltadas à proteção e promoção da saúde da comunidade. 
-Bio e Epidemio atuam no estudo da frequência da distribuição e dos determinantes dos estados ou eventos relacionados à saúde em específicas populações e a aplicação desses estudos no controle dos problemas de saúde”.(Last J, 2001). 
-Inclui a vigilância, observação, elaboração e teste de hipóteses, estudos observacionais e experimentais. 
-Diz respeito à análise segundo características do tempo, espaço e classes de pessoas afetadas. 
-Incluem doenças, causas de óbito, comportamento como o uso do tabaco, adesão a condutas preventivas e ao uso de serviços de saúde. 
· Específicas populações 
-São aquelas com características identificáveis como associadas a determinados estados e eventos relacionados à saúde 
-O trecho final da definição torna explícito os objetivos da Bioestatística na Saúde e Epidemiologia, ou seja, a aplicação desses estudos na prevenção e controle dos problemas de saúde.
· Objetivos da Bioestatística na saúde e na epidemiologia 
-Identificação, quantificação e caracterização de danos à saúde da população
-Identificação de fatores de risco e fatores prognósticos para determinado agravo
-Ampliação da informação s obre a história natural de um agravo
-Estimativa da validade e confiabilidade de procedimentos de diagnóstico e intervenção
-Avaliação da eficácia/efetividade de um procedimento terapêutico ou  profilático
-Avaliação do impacto potencial da eliminação de um fator de risco
-Descrever o espectro clínico das doenças e sua história natural; 
-Avaliar o quanto os serviços de saúde respondem aos problemas e necessidades das populações; 
-Testar a eficácia, a efetividade e o impacto de estratégias de intervenção, assim como a qualidade, acesso e disponibilidade dos serviços de saúde para controlar, prevenir e tratar os agravos de  saúde na comunidade
RESUMINDO: Monitorar sistema de saúde, identificar fatores de risco, estimar confiabilidade de procedimentos, quantificar danos, testar eficácia, etc.
· Aplicações da Bioestatística em serviços de saúde
-Análise da Situação de Saúde: “É a análise epidemiológica de indicadores demográficos, sociais e de saúde com o objetivo de elaborar diagnósticos das condições de vida de uma comunidade que sirvam de subsídios para o estabelecimento de políticas públicas no setor saúde. 
-Identificação de perfis e fatores de risco: Identificação de fatores de risco e de grupos da população mais vulneráveis (grupos de risco) a determinados agravos à saúde com a finalidade de oferecer fundamentos técnicos para a elaboração de programas de saúde
-Avaliação epidemiológica de serviços: A avaliação de serviços de saúde, geralmente, leva em conta:
Acesso da população aos serviços
Cobertura oferecida (exemplos: proporção de crianças vacinadas; proporção de indivíduos atingidos por determinada doença que são tratados e acompanhados, proporção de gestantes inscritas e acompanhadas pelo programa, etc.)
-Vigilância em saúde pública: “vigilância é a observação contínua da distribuição e tendências da incidência de doenças mediante a coleta sistemática, consolidação e avaliação de informes de morbidade e mortalidade, assim como de outros dados relevantes e a regular disseminação dessas informações a todos que necessitam conhecê-la". Langmuir (1963)
OBS: Resumindo, a bioestatística na saúde pode ser entendida como fundamental em dois pressupostos: 
1) A doença humana não ocorre aleatoriamente na população;
2) A doença humana tem fatores causais, prognósticos e preventivos que podem ser identificados por meio de investigações sistemáticas de diferentes populações ou subgrupos de populações em diferentes pontos no tempo e/ou no espaço
· Etapas do raciocínio epidemiológico: 
1. A partir da observação clínica, de pesquisas de laboratório ou mesmo de especulações teóricas pode surgir uma hipótese a respeito de uma possível associação entre um  fator e a ocorrência da doença.
2. O teste dessa hipótese é efetuado mediante estudos epidemiológicos que incluem um grupo apropriado de comparação 
3. O estudo é efetuado mediante a coleta sistemática de dados e a análise correspondente com o objetivo de determinar a existência ou não de associação entre a exposição e o desfecho de interesse. 
4. Em seguida é necessário avaliar a validade das possíveis associações estatísticas observadas, excluindo o acaso, o erro sistemático na coleta ou interpretação dos dados (viés) ou o efeito de outras variáveis que podem ser responsáveis pela associação observada, efeito conhecido como fator de confusão. 
5. Finalmente, o julgamento focaliza a existência de uma associação de causa e efeito levando-se em consideração critérios de avaliação da associação causal, entre eles: força da associação, consistência dos resultados obtidos, efeito dose resposta, plausibilidade biológica, entre outros. (Hennekens & Buring, 1987). 
· Objetivos da bioestatística na saúde descritiva 
-Descrever a magnitude da doença na população
-Examinar a distribuição da doença na população usando dados da estatística vital 
-Analisar o comportamento das doenças segundo características das pessoas, do tempo e lugar
· Como organizar os dados:
· Pela característica das pessoas: idade, sexo, raça, etnia, estado conjugal e familiar, ocupação, educação, hábitos e costumes, atividades de lazer, etc. 
-Descrever os casos em detalhes, identificar os fatores comuns aos casos, obter denominadores para calcular taxas, comparar grupos. 
· Pelas características relativas ao tempo: a ocorrência das doenças varia no tempo. 
-Variações regulares: tendência secular, variação sazonal, variação cíclica. 
-Variações irregulares: epidemias. 
· Pela característica do espaço: país, estado, cidade, bairro, endereço de residência, local de nascimento, endereço de emprego, distrito escolar, unidade hospitalar, etc. 
· Formular hipóteses: 
-Fundamenta-se na: análise das diferenças, análise das semelhanças e por analogia. 
2. CONCEITOS
· Fenômeno estatístico: qualquer evento que se pretenda analisar, cujo estudo seja passível da aplicação do método estatístico. 
-De massa ou coletivo: não podem ser definidos por uma simples observação. A estatística dedica-se ao estudo desses fenômenos. 
-Individuais: compõem os fenômenos de massa. 
-De multidão: quando as características observadas pela massa não se verificam para o particular. 
· Dados estatísticos: dado numérico, matéria prima sobre a qual se aplicam os métodos estatísticos. 
· População: conjunto total de elementos portadores de, pelo menos, uma característica comum. Não é necessariamente geográfica, mas geralmente é. 
· Amostra: parcela representativa da população, examinada para tirar conclusões sobre ela.
· Parâmetros: valores singulares que existem na população e que servem para caracterizá-la. Para definir um, deve examinar toda a população. 
· Estimativa: valor aproximado do parâmetro. É calculado com o uso da amostra. 
· Atributo: quando os dados apresentam caráter qualitativo, o levantamento e os estudos necessários ao tratamento desses dados são designados genericamente de estatística de atributo. Pode ser dicotômico ou policotômico. 
-Ex: dicotômico→ classificação de alunos quanto ao sexo. Atributo: sexo. Classe: alunos. Dicotomia: 2 subclasses de sexo (masculino e feminino). 
-Ex: policotômico → classificação de alunos quanto ao estado civil. Atributo: estado civil. Classe: alunos. Policotomia: mais de 2 subclasses (solteiro, casado, viúvo, etc). 
· Escala: 
-Nominal: mede atributos que só conhecem relações de equivalência (igual ou diferente) e por isso não tem sentido de direção, nem unidade de distancia definida, nem reconhece valor nulo. Está associada a variáveis qualitativas nominais. 
-Intervalar: mede atributos de modo que os intervalos representem quantidades regulares. É uma função linear dos atributos. Possui a relação biunívoca entre atributos e códigos numéricos da escala e do sentido de orientação da medida, e a definição de unidade de mensuração. Tem um zero, mas é um ponto arbitrado para origem das unidades de medida e não tem correspondência com a situação zero de atributo. 
· ANOVA
-Técnica estatística cujo objetivo é testar a igualdade entre três ou mais médias. Ela permite testar se a variabilidade dentro dos grupos é maior que a existente entre os grupos. A técnica supõe independência e normalidade das observações, e igualdade entre as variâncias dos grupos.
· Coeficiente de confiança
-Corresponde a 1-  (probabilidade de aceitar a hipótese nula quando esta é verdadeira) e indica a probabilidade de decisão correta baseada na hipótese nula.
· Erro
-Tipo I: Rejeitar a hiptótese nula quando esta é verdadeira. A probabilidade de cometer este erro é denotada por  e recebe o nome de nível de significância do teste.
-Tipo II: Aceitar a hiptótese nula quando esta é falsa. A probabilidade de cometer este erro é denotada por. 
· Normalidade
-Dizer que há normalidade ou que os dados são normalmente distribuídos significa que eles seguem uma distribuição normal, isto é, valores concentrados simetricamente em torno da média e quanto maior a distância da média, menor a freqüência das observações.
· P-value
Corresponde ao menor nível de significância que pode ser assumido para rejeitar a hipótese nula. Dizemos que há significância estatística quando o p-value é menor que o nível de significância adotado. Por exemplo, quando p=0.0001 pode-se dizer que o resultado é bastante significativo, pois este valor é muito inferior aos níveis de significância usuais. Por outro lado, se p=0.048 pode haver dúvida pois, embora o valor seja inferior, ele está muito próximo ao nível usual de 5%.
· Poder de teste
Corresponde a 1- (probabilidade de rejeitar a hipótese nulaquando esta é falsa) e indica a probabilidade de decisão correta baseada na hipótese alternativa. Geralmente é interpretado como a chance de detectar uma real diferença entre as médias ou proporções. Por exemplo, um poder de 80% significa que, se de fato houver alguma diferença, haverá uma probabilidade de 80% de detectá-la.
· Precisão: 
-Absoluta: É a precisão especificada diretamente e na mesma unidade da estimativa que se pretende calcular.
-Relativa: É a precisão especificada não diretamente como precisão absoluta, mas sim proporcionalmente como porcentagem em relação ao verdadeiro valor.
· Teste:
-Student: É um teste de hipótese que usa conceitos estatísticos para rejeitar ou não uma hipótese, estes testes se aplicam a planos amostrais onde se deseja comparar dois grupos independentes. 
-Teste T: estatístico cujo objetivo é testar a igualdade entre duas médias. O teste supõe independência e normalidade das observações. As variâncias dos dois grupos podem ser iguais ou diferentes, havendo alternativas de teste para as duas situações. Neste serviço, consideramos apenas o caso em que as variâncias são iguais.
-Teste Z: Teste estatístico cujo objetivo é testar a igualdade entre uma média conhecida (numa população) e uma média calculada pelo pesquisador (numa amostra). O teste supõe normalidade das observações.
· Tipos de estudos: 
-Estudo caso-controle:
Comparação entre um grupo de doentes (casos) e um grupo de pessoas não doentes (controles). O objetivo é verificar se os casos diferem significativamente dos controles, em relação à exposição a um dado fator de risco.
-Estudo de coorte:
Comparação entre um grupo exposto a um fator de risco e outro grupo não exposto. Visa verificar se indivíduos expostos ao fator de risco desenvolvem a doença em questão, em maior ou menor proporção, do que um grupo de indivíduos não expostos. 
3. DADOS
· Problemas usais do levantamento de dados:
· Representatividade: fator associado a forma de amostragem. 
-Uso do critério de proporcionalidade: na seleção de amostras, procura-se reproduzir as características observáveis da população. 
-Uso do critério de aleatoriedade (sorteio): em caso de desconhecimento da composição da população. 
-Amostra tendenciosa: conclusões sem consistência. 
· Fidedignidade: relacionada a precisão ou qualidade dos dados. 
- Motivos de falta de precisão: falhas nos instrumentos de aferição, falha humana, problemas nos questionários empregados na obtenção de dados, modelo estatístico/desenho estatístico. 
· Características importantes dos dados:
-Centro: um valor representativo ou médio, que indica onde se localiza o meio do conjunto de dados. 
-Variação: uma medida de quanto os valores dos dados variam.
-Distribuição: a natureza ou forma de distribuição dos dados (ex: uniforme, assimétrico, sino). 
-Outliers ou valores discrepantes: valores amostrais que se localizam muito longe da grande maioria dos outros. 
-Tempo: características dos dados que mudam com o tempo. 
· Coleta de dados:
-Bom questionário: com perguntas abertas e fechadas. 
-Cuidado na hora de coletar informações: não adianta uma metodologia perfeita e um bom planejamento se na hora da coleta de dados houver alguma influencia do entrevistador perante o entrevistado. O entrevistador deve passar por um bom treinamento. 
4. VARIÁVEL
-Conjunto de resultados possíveis de um fenômeno. 
-É a característica de interesse que se deseja estudar em uma dada população. São classificadas segundo suas características particulares. Tais classificações não são simplesmente didáticas, mas assumem papel importante na estatística, pois terão tratamentos diferentes. 
-Variável: resposta ou covariável (explicativa). 
Ex: Resposta: tempo até a falha do tratamento. Covariável: tratamento. 
· Qualitativa (categórica): valores expressos por categorias (atributos). Uso de gráfico: de barra ou de setores. 
-Nominal: sem ordenação. Ex: sexo. 
-Ordinal: com ordenação. Ex: mês. 
· Quantitativa: conjunto de resultados possui uma estrutura numérica (possuem valores numéricos). Uso de gráfico: de linha, histograma, polígono de frequência, etc. 
-Discreta ou descontínua: números inteiros não negativos. Só tem sentido em valor inteiro. Resulta de contagens. Ex: nº de filhos 
-Contínua: números reais (qualquer valor entre 2 limites). Fazendo sentido serem fracionados. Resulta de mensuração. Ex: altura. 
· Independente: explica a dependente. Representa uma grandeza manipulada. 
-Causa/fator causal: é antecedente. 
Ex: A cada tarefa, ganho R$3,00. → a variável independente é a ‘cada tarefa’, pois é a que se tem controle. 
· Dependente: mede o fenômeno que se estuda. Grandeza cujo valor depende de como a variável independente é manipulada. 
-Efeito: é consequente. 
Ex: A cada tarefa, ganho R$3,00. → a variável dependente é ‘R$3,00’, pois depende da atividade que você realiza. 
OBS: Em estudos experimentais: a variável independente é manipulável (valores escolhidos pelo pesquisador). Na pesquisa não experimental (maioria das investigações epidemiológicas): não é possível a manipulação das variáveis. 
A escolha de qual será a variável independente e qual será a dependente é determinada pela suposição que certa condição variável (independente) produz uma certa mudança no estado e saúde ou de doença (dependente). 
5. MEDIDAS DE TENDÊNCIA CENTRAL ( OU DE LOCAÇÃO)
· Média: =MEDIA(
· Mediana: =MED(
-Escrever em ordem crescente. Ímpar: nº central. Par: média dos dois nºs centrais, ou seja,pega os 2 do meio e divide por 2. 
OBS: A mediana é menos influenciada por observações extremas do que a média, ou seja, a mediana é mais robusta ao encontrar observações discrepantes do resto da amostra.
Ex: 1, 2, 3, 4, 2519. Mediana: 3. Média: 505,8. 
· Moda: =MODO(
-Valor que ocorre mais frequentemente. Pode ser: unimodal, bimodal, multimodal ou amodal. 
· Ponto médio:
-É o valor a meio caminho entre o maior valor e o menor valor da série. 
6. DISTRIBUIÇÃO E FREQUÊNCIA
-Relacionam categorias ou classes de valores, juntamente com contagens (ou frequências) do numero de valores que se enquadram em cada categoria. 
-Limite de classes: extremos dos intervalos 
-Ao resumir os dados referentes a uma variável continua, perde-se informações. 
-Para construção de tabelas de frequências para variáveis contínuas, os dados devem ser agrupados em intervalos de classes. 
· Termos:
-Amplitude total ou range (R): diferença entre o maior e o menor valor. 
-Número de classes (k): isso significa a quantidade de classes. Conjunto de observações apresentadas na forma contínua, sem superposição de intervalos. Cada valor do conjunto possa ser alocado em um (apenas um) dos intervalos. 
Fórmula de Sturges: k = 1 + 3,322 (log n)
-Intervalos de classes (W): isso significa os intervalos de classes (quantos números ficam em cada classe), ou seja, tamanho de cada intervalo. Intervalos para cada conjunto de observações com n valores. 
W = R/k 
· Construção: 
-Calcular amplitude/range (R). 
-Calcular o número de classes (k). 
-Contar o nº de elementos que pertencem a cada classe, ou seja, o tamanho de cada intervalo (W). 
-Calcular a frequência absoluta (fs) e relativa (fr) de cada classe. 
OBS: o traço |- significa que INCLUI.
· Tabela (representação tabular): 
-A tabela deve ser simples, clara, objetiva e autoexplicativa. 
-Grandes volumes de dados devem ser divididos em várias tabelas. 
-Nenhuma casa da tabela deve ficar em branco, apresentando sempre um número ou um símbolo. 
-As tabelas (excluindo os títulos) serão delimitadas, no alto e em baixo, por traços horizontais grossos, preferencialmente. 
-Recomenda-se não delimitar as tabelas à direita e à esquerda por traços verticais. 
-Será facultativo o emprego de traços verticais para a separação de colunas no corpo da tabela. 
-Deve-se manter a uniformidade quanto ao número de casas decimais. 
-Os totais e subtotais devem ser destacados. 
OBS: Tabela de contingência → conjugando 2 séries em uma única tabela, obtém-se uma tabela de dupla entrada.
7. MEDIDAS DE DISPERSÃO (OU DE VARIABILIDADE)
-Compara a distância com o valor central. A dispersão fornece uma medida de proximidade da série de dados em torno de um valor de tendência central, tomado como comparação. Vai mostrar próximo da média o quanto esses valores vão dispersar em torno dessa média. 
-Dispersão: grau com qual os dados numéricos tendem a se dispersar em torno do valor médio. 
· Amplitude total 
-↑ amplitude = ↑ dispersão (diretamente proporcional). 
-Problema: são usados os extremos do conjunto (medidas instáveis). 
-Elemento auxiliar na análise: mostra a faixa de variação onde encontramos todos os elementos do conjunto. 
· Desvio médio: =DESV.MEDIO(
-É a média aritmética dos desvios absolutos dos elementos da série, tomados em relação á média. Ou seja, é a média dos valores dos desvios em relação à média. Média das distâncias entre cada elemento da amostra e seu valor médio. 
-Quanto cada indivíduo varia da média de um conjunto de dados. 
-O desvio de cada valor x é a diferença entre o valor x e a média. 
-Não há média dos desvios pois sua soma é igual a zero. 
-Em uma população: x – M (média populacional). Em uma amostra: x – X
· Variância: =VAR(
-Distância de cada medida para a média. 
- ↑ variância = ↑ dispersão (diretamente proporcional). 
-Medida direta da dispersão: conjunto com dados mais dispersos terá maior variância. Ex: grupo que mais varia, é o que tem mais diferença entre si. 
-Problema: é uma medida em unidade quadrada, o que dificulta sua interpretação. Para contornar isso, trabalhamos com desvio padrão. 
-É uma medida de dispersão das variáveis. Mede a (o quadrado da) distância entre as observações e sua média. É o somatório das distancias entre cada observação e a média desse conjunto elevado ao quadrado. 
-É a soma dos quadrados, porém não é usada como medida de dispersão porque seu valor cresce com o número de dados. Então, para medir a dispersão, usa-se a variância que leva em consideração o N. 
Logo, soma dos quadrados de cada valor e a média, dividida pela quantidade de elementos (nº de ocorrência) - 1. 
-É sempre maior ou igual a zero. 
· Desvio padrão: =DESV.PAD(
-Utilização: permite distinguir numericamente conjuntos de dados de mesmo tamanho e mesma média, mas que são visivelmente diferentes. 
-Tem a mesma unidade de medida dos dados. 
· Coeficiente de variação: calcular 
-É relativa (%), mede a variação do desvio padrão em relação à média aritmética. 
-É o desvio padrão expresso em porcentagem. Característica do fenômeno em que se procura identificar a importância da dispersão dos dados em relação à magnitude das observações. 
-É mais fácil de entender pois está sempre em porcentagem.
-↓ CV = ↑ homogeneidade (inversamente proporcional). 
-↑ dados mais homogêneos = ↓ dispersão relativa (inversamente proporcional). 
OBS: as vezes a dispersão dos dados em ambos os grupos é a mesma, mas o CV são diferentes. ? 
· Erro padrão da média: calcular 
-Medida de variação de uma média amostral em relação á média da população. Ajuda a verificar a confiabilidade da media amostral calculada. Basta dividir o desvio padrão pela raiz quadrada do tamanho amostral.
OBS: Quanto menor dispersão, menor amplitude, variância e desvio padrão. 
8. GRÁFICOS
-São representações visuais (pictóricas) dos dados estatísticos contidos nas tabelas. São caracterizadas pelo uso de escalas de valor do fenômeno em estudo. 
-Tem por finalidade dar uma ideia (a mais imediata possível) dos resultados obtidos, permitindo chegar a uma conclusão sobre a evolução do fenômeno ou sobre como se relacionam os valores da série. Ou seja, facilitar a interpretação de valores. 
-A escolha do gráfico mais apropriado fica a critério do analista. 
-Considerar elementos como simplicidade, clareza e veracidade. 
· DIAGRAMA: são gráficos dispostos em 2 dimensões. São os mais usados na representação de séries estatísticas.
-Coluna (vertical) ou barra (horizontal): QUALITATIVA 
Usado quando uma série é representada por meio de retângulos proporcionais, dispostos verticalmente (em colunas) ou horizontalmente (em barras), onde uma das dimensões é proporcional a magnitude a ser representada (fi). 
Usá-lo quando a ordem a ser observada é cronológica ou se a série for histórica. 
-Setores: QUALITATIVA 
São construídos com base em um círculo, e é empregado sempre que desejar-se ressaltar a participação do dado no total. 
Representa a composição (usualmente em porcentagem) de partes de um todo. Consiste num círculo de raio arbitrário, representando o todo, dividido em setores que correspondem às partes de maneira proporcional. 
-Linhas/curvas: pontos (de nºs inteiros) que se ligam, formando linhas/curvas. 
É indicado para dados coletados ao longo do tempo, ou de medidas repetidas. Através dele, é possível constatar algum tipo de tendência e identificar alguns eventos (ex: o surto de determinada doença). 
· PICTOGRAMA: desenho 
São constituídos de elementos gráficos e de figuras representativas do fenômeno de estudo. Devido a sua forma atraente e sugestiva, despertam a atenção do público leigo. 
· CARTOGRAMA: mapa 
São representações relativas a cartas geográficas (mapas). Seu objetivo é figurar os dados estatísticos diretamente relacionados com áreas geográficas ou políticas. 
· HISTOGRAMA: gráfico de barras porém com frequências. 
Possui barras contíguas, com bases proporcionais aos intervalos de classes e a área de cada retângulo proporcional à respectiva frequência. 
OBS: O gráfico de barras se parece bastante com um histograma.que representa dados contínuos. A diferença entre eles não reside no fato de que o gráfico de barras possuí espaço entre suas colunas e o histograma não. A diferença é sobre o tipo de informação que cada um representa. A diferença é a seguinte: Enquanto o DIAGRAMA é uma representação visual estruturada e simplificada de um determinado conceito, idéia, o HISTOGRAMA é uma representação gráfica da distribuição de frequências de uma massa de medições, normalmente um gráfico de barras verticais
· POLÍGONO DE FREQUÊNCIA: barras com linhas (ou apenas linhas) indicando frequência. 
É um gráfico em linha, onde as frequências são marcadas sobre perpendiculares ao eixo central, levantadas pelos pontos médios dos intervalos de classe. 
Para conseguir um polígono, ligamos os extremos da linha obtida aos pontos médios da classe anterior à primeira e da posterior à ultima, da distribuição. 
OBS: O polígono de frequência é formado através de um histograma.
OBS: O gráfico de linha/curva trata números inteiros, enquanto o polígono de frequência aborda frequências. 
· DISPERSÃO: pontos soltos (podendo conter uma linha reta na média entre eles). Os valores são representados por pontos ao longo da reta. 
9. BUSCA ELETRÔNICA EM BASE DE DADOS
· Métodos estatísticos/empíricos 
-Correlação de técnicas para extrair informações de dados e responder às perguntas de interesse. 
-Técnicas apropriadas para lidar com variação amostral. 
· Etapas da pesquisa clínica: 
-Pergunta clínica de interesse: pergunta à natureza
-Desenho do estudo: definir população de interesse (critérios de inclusão e exclusão), como coletar a amostra, definir o tamanho dela, etc. 
-Análise estatística: descritiva e inferencial (confirmatória). 
Ex: comparação de grupos (caso x controle), experimento controlado (grupos comparáveis), sujeito a viés, aleatorização (experimental x observacional). 
· Busca eletrônica em bases bibliográficas (fontes de consulta):
-Science Direct, PubMed, Biblioteca Virtual em Saúde (BVS), Scielo, Scopus, ISI Web of Knowledge, Web of Science, Lattes, Qualis CAPES, ResearchGate, Medline, ClinicalKey. 
· O que pode ser utilizado como referência?
-Artigos em periódicos, dissertações, teses, livros e alguns tipos de sites (ex: IBGE, DATASUS, FAO, etc). 
· O que um pesquisador ganha ao publicar artigos?
-Financiamento para projetos, aumento de chance de ser aprovado em concurso, progressão da carreira docente, bolsas de produtividade científica. 
· Bibliometria como ferramenta de análise (ou cienciometria/cientometria): 
Ciência que, mediante a aplicação de métodos estatísticos, permite fazer constatações a respeito do estado de uma dada arte ou ramo do conhecimento. 
-Identificar as tendências e o crescimento do conhecimento em uma área específica. 
-Identificar papéis de uma área/disciplina, prever as tendências de publicação. 
-Estudo da dispersão e a obsolescência da literatura científica. 
-Medir o grau e o padrão de colaboração entre os autores. 
-Analisar os processos de citação e co-citação. 
-Medir o crescimento de áreas específicas e a criação de novos temas. 
· Fator de impacto 
-Há uma grande controvérsia no sistema de fator de impacto. 
-Fator Thomson Reuters/Web of Science (JCR): tem aceitação mundial. 
-Fator SCImago/Scopus/Elsevier BV (SJR): é considerado por diversas constituições. 
· Índice H ou H-Index
-É o número de artigos com citações maiores ou iguais a esse número. É usado pelo Google Scholar. 
-Ex: um pesquisador com h-index = 10 tem 10 artigos que receberam 10 ou mais citações. 
10. AMOSTRAGEM
-Se os dados amostrais não forem coletados adequadamente, podem ser tão inúteis que nenhuma manipulação estatística poderá salvá-los. 
-A aleatoriedade comumente desempenha papel crucial na determinação de quais dados coletar. 
-Vantagens do levantamento por amostragem: custo menor, menor tempo e objetivos mais amplos. 
-Situações para trabalho com amostras: população muito grande, dificuldade de acesso, grande número de variáveis. 
-É necessário calcular o tamanho da amostra pois é ético e logístico, pois estuda a quantidade necessária de sujeitos da pesquisa. 
-Em várias ocasiões há de se proceder à coleta de dados diretamente na origem, isto é, dos sujeitos com quem pretendemos realizar determinado estudo.
-Em geral não se tem acesso a toda a população em que desejamos estudar o fenômeno, com isso recorremos a uma amostra da nossa população de interesse.
· Conceitos:
-POPULAÇÃO OBJETO: É a população total de interesse sobre a qual desejamos obter informações.
-CARACTERÍSTICA POPULACIONAL: Este é o aspecto da população que interessa ser medido.
-UNIDADE AMOSTRAL: Deve ser definida de acordo com o interesse do estudo, podendo ser uma peça, um indivíduo, uma família, uma fazenda, etc. A escolha deve ser feita no início da investigação.
-AMOSTRA: Conjunto formado por um subconjunto da população.
-CENSO: Exame de todos os elementos da população.
-ERRO AMOSTRAL: É a diferença entre um resultado amostral e o verdadeiro resultado populacional.
· Tipos de amostra:
PROBABILÍSTICA: São amostragens em que a seleção é aleatória de tal forma que cada elemento da
população tem uma probabilidade conhecida de fazer parte da amostra. São métodos rigorosamente científicos.
· Aleatória simples com ou sem reposição: 
É indicado para populações homogêneas;
É o processo mais elementar. O método se fundamenta no princípio de que todos os membros de uma população têm a mesma probabilidade de serem incluídos na amostra;
 Rotula os elementos da população e sorteia os indivíduos que farão parte da amostra;
Ex.: Aplicar um questionário sobre sintomas em 100 pacientes banco de dados de 1000 pessoas
· Sistemática 
A população deve ser ordenada de forma que os elementos sejam identificados pela posição;
População homogênea;
A retirada dos elementos é feita periodicamente.
Ex.: Aplicar um questionário sobre sintomas em 100 pacientes banco de dados de 1000 pessoas. 
· Estratificada 
Consiste em dividir a população em subgrupos mais homogêneos (estratos), de tal forma que haja uma homogeneidade dentro dos estratos e uma heterogeneidade entre os estratos;
A definição dos estratos pode ser de acordo com sexo, idade, renda, grau de instrução, etc.;
 Em geral, a retirada das amostras nos estratos é realizada de forma aleatória simples.
1. Uniforme - Na amostragem estratificada uniforme sorteia-se igual número de elementos de cada estrato.
2. Proporcional - Na amostra estratificada proporcional, o número de elementos em cada estrato é proporcional ao número de elementos existentes no estrato.
3. Ótima - Na amostra estratificada ótima, se toma em cada estrato um número de elementos proporcional ao número de elementos do estrato e também a variação da variável de interesse no estrato, medida pelo seu desvio padrão.
· Conglomerados 
NÃO PROBABILÍSTICA: São amostragens em que há uma escolha deliberada dos elementos da amostra.
Depende dos critérios e julgamento do pesquisador.
· Intencional
 Selecionar um subgrupo da população, que com base nas informações disponíveis, possa ser considerado representativo de toda população.
Requer conhecimento da população e do subgrupo selecionado.
Ex: entrevista com os representantes de turma do curso de turismo, aplicação de questionários com os líderes da comunidade
· Por acessibilidade ou por conveniência: 
O menos rigoroso de todos os tipos de amostragem;
Seleção dos elementos aos quais se tem acesso.
Ex.: Entrevistar os médicos (especialidade tal) x e y, pois foram os que autorizaram a entrevista.
· Cotas 
Apresenta maior rigor dentre as amostragens não probabilísticas;
Etapas: classificar a população, determinar a proporção da população para cada classe, fixar cotas em observância à proporção das classes consideradas;
É utilizada quando não existe um cadastro da população que possibilite a realização do sorteio necessário a amostragem aleatória mas, ao mesmo tempo, existe informação suficiente sobre o perfil populacional.
Ex.: Em geral é utilizada em pesquisa eleitoral e pesquisa de mercado· Fatores que determinam o tamanho da amostra
-Nível de confiança (quanto maior o nível de confiança, maior o tamanho da amostra);
-Erro máximo permitido (quanto menor o erro permitido,maior o tamanho da amostra);
-Variabilidade do fenômeno que está sendo investigado (quanto maior a variabilidade, maior o tamanho da amostra).
11. CORRELAÇÃO LINEAR SIMPLES (RXY)
-Em pesquisas, frequentemente, procura-se verificar se existe relação entre duas ou mais variáveis, isto é, saber se as alterações sofridas por uma das variáveis são acompanhadas por alterações nas outras. Ex: Peso vs. Idade; consumo vs. Renda; altura vs. peso de um indivíduo, tempo de gestação X peso da criança, tempo de gestação+ingestão de cálcio X peso da criança, tempo de gestação+ingestão de cálcio X nº de semanas de gestação.
-O termo correlação significa relação em dois sentidos, é usado em estatística para designar a força que mantém unidos dois conjuntos de valores. A verificação da existência e do grau de relação entre as variáveis é o objeto de estudo da correlação.
-Uma vez caracterizada esta relação, procura-se descrevê-la sob forma matemática, através de uma função. A estimação dos parâmetros dessa função é o objeto da regressão. 
-Os pares de valores das duas variáveis poderão ser colocados num diagrama cartesiano chamado “diagrama de dispersão”. A vantagem de construir um diagrama de dispersão está em que, muitas vezes sua simples observação já nos dá uma ideia bastante boa de como as duas variáveis se relacionam.
-O coeficiente de correlação rxy linear é um número puro que varia de –1 a +1 e sua interpretação dependerá do valor numérico e do sinal. 
-Verifica se existe relação entre duas variáveis 
-Objeto de estudo: verificação da existência e do grau da relação entre elas
-Objeto de regressão: estimação dos parâmetros da função dessa relação
 
-Os valores podem ser colocados em DIAGRAMA DE DISPERSÃO.
-Mais forte: quanto mais perto de 1 ou -1
-Mais fraca: quanto mais perto de 0
Ela é classificada em: 
· Perfeita negativa (rxy= -1): 
-Os pontos estão perfeitamente alinhados, mas em sentido contrário. 
-Conforme variável independente aumenta, a dependente diminui. 
-GRÁFICO: linha reta descendo com pontos próximos
 
· Negativa (-1 < rxy < 0): 
-Quando valores crescentes da variável X estiverem associados a valores decrescentes da variável Y (ou vice-versa: decrescentes de X associados a crescentes de Y). 
-GRÁFICO: linha reta descendo com pontos espalhados 
· Nula (rxy = 0)
-Não há relação (correlação) entre as variáveis X e Y. Eles ocorrem independentemente. 
-GRÁFICO: monte de bola espalhada 
· Positiva (0 < rxy < 1): 
-Quando os valores crescentes de x estiverem associados a valores de y.
-GRÁFICO: linha reta subindo / com pontos espalhados
· Perfeita positiva (rxy = 1): 
-Caso anterior, mas os pontos estão perfeitamente alinhados. 
-Conforme variável independente aumenta, a dependente também aumenta. 
-GRÁFICO: linha reta subindo / com pontos próximos 
· Espúria: 
-Variáveis X e Y são independentes, coeficiente será nulo. Entretanto, algumas vezes isso não acontece, então o coeficiente pode apresentar valor próximo de 1 ou -1. 
· Não linear: 
-GRAFICO: em forma de parábola 
· TESTE DE HIPÓTESES: 
-O coeficiente de correlação é apenas uma estimativa do populacional e não devemos esquecer que o rxy é calculado com base em n pares de dados constituindo amostras aleatórias. Muitas vezes os pontos da amostra podem apresentar uma correlação, e no entanto, a população não. Neste caso, há um problema de interferência pois o rxy diferente de 0 não é garantia que pxy é diferente de 0. 
-Podemos resolver o problema aplicando o teste de hipóteses, ara verificarmos se o valor de Rxy é coerente com o tamanho da amostra n, a um nível de significância α, que realmente existe correlação linear entre as variáveis.
· COEFICIENTE DE DETERMINAÇÃO 
-Indica a proporção da variação da variável independente (y) que é explicada pela dependente (x) através da função ajustada.
-Ferramenta que avalia a qualidade do ajuste 
-quanto mais próximo da unidade R2 estiver = melhor a qualidade do ajuste
Ex: 
proporção que Y é explicada por X, ou seja, 98,50% da variação do número de livros é explicado pelo tempo que frequentou a escola.
12. SIGNIFICÂNCIA
· Estatisticamente significante
-Dizer que um resultado é estatisticamente significante significa que as diferenças encontradas são grandes o suficiente para não serem atribuídas ao acaso. Uma diferença " estatisticamente significante" pode não ser " clinicamente importante"; a importância em termos biológicos não deve ser julgada pelos estatísticos, mas sim pelos profissionais da área em que a pesquisa está sendo feita.
· Cálculo: 100 – (Menor nº/maior nº x 100) 
· Nível de significância
É denotado por  e indica a probabilidade de cometer um erro tipo-I. Na maioria dos softwares, a significância estatística é expressa pelo nível descritivo (p-value). Os níveis de significância mais utilizados são 5%, 0.1%, 1% e 10%.

Continue navegando