Buscar

resumo bioestatistica - conceitos, definicoes, testes, medidas de posicao

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 13 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 13 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 13 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Definição de estatística: É a parte da matemática aplicada que fornece métodos para a coleta, organização, descrição, análise e interpretação de dados e para a utilização dos mesmos na tomada de decisões.
Definição de bioestatística: É um ramo da estatística que tem como foco a área de saúde e outras profissões relacionadas com ciências biológicas.
Ramos da estatística: 
· Estatística Dedutiva ou Estatística Descritiva se encarrega de descrever o conjunto de dados desde a elaboração da pesquisa até o cálculo de determinada medida.
· Estatística Indutiva ou Estatística Inferencial está relacionada à incerteza. Inicia-se no cálculo das Probabilidades e se desenvolve por toda área da inferência. 
Fases do método estatístico: são 7!
1. Definição do problema
2. Planejamento
3. Coleta de dados
a. Direta: feita sobre elementos informativos de registro obrigatório ou coletados pelo próprio pesquisador.
b. Indireta: feita com base em elementos já pesquisados (revista, jornal, livros, etc.)
4. Apuração dos dados
5. Crítica dos dados
6. Apresentação dos dados
7. Analise dos resultados
População amostras e variáveis:
População: conjunto de indivíduos ou objetos que apresentam pelo menos uma característica em comum.
Amostra: subconjunto não vazio da população.
Variáveis: características dos elementos que formam o conjunto de dados. Em estatística não trabalhamos diretamente com os elementos que formam o conjunto de dados, mas sim com suas características.
Os tipos de variáveis:
Variáveis qualitativas: Apresentam como possíveis resultados uma qualidade ou atributo do indivíduo pesquisado. Ex: sexo, cor dos olhos, classe social e escolaridade. Elas podem ser:
· Nominal: não existe nenhuma ordenação nas possíveis realizações. Ex: sexo, religião, cor dos olhos.
· Ordinal: existe uma certa ordem ou hierarquia entre os possíveis resultados. Ex: escolaridade, classe social.
Variáveis quantitativas: Apresentam como possíveis resultados números resultantes de uma contagem ou mensuração. Ex: peso, altura, nº de médicos que trabalhem no hospital x. Elas podem ser:
· Discretas: os possíveis valores formam um conjunto finito ou enumerável (que se pode contar). Ex: nº de colaboradores, nº de exames feitos.
· Contínuas: os possíveis valores formam um intervalo dos números reais e que resultam, normalmente, de uma mensuração. ex: altura, média de acidentes de trabalho em 2017.
Cuidados importantes ao observar fenômenos:
	No uso de formulários: perguntas claras para quem responde, evite esforço de memória do pesquisado, evite que o pesquisado precise fazer contas, nunca incluir respostas nas perguntas.
	Nas entrevistas: não induzir o entrevistado, aproveite para coletar informações do ambiente e do comportamento do entrevistado e suas emoções.
Comitê de ética em pesquisa – CEP: Tem por finalidade identificar, analisar e avaliar as implicações éticas nas pesquisas científicas que envolvam seres humanos. A submissão de novos projetos é feita por meio da plataforma brasil. Ela, é uma base nacional e unificada de registro das pesquisas envolvendo seres humanos. Ela permite que pesquisas em desenvolvimento sejam acompanhadas em seus diferentes estágios, ou seja, desde a sua submissão e aprovação, até o encerramento da pesquisa na instituição de vínculo dos pesquisadores.
	Uso de escalas para coletar dados numéricos.
Os dados podem ser:
· Dados absolutos: dados estatísticos resultantes da coleta mediante contagem ou medida.
· Dados relativos: são os resultados de comparações por quociente (razões) que se estabelecem entre dados absolutos e têm por finalidade realçar ou facilitar as comparações entre quantidades. Ex.: percentagens, índices, coeficientes e taxas.
A apresentação dos dados em tabelas: dentre os seus componentes, as tabelas devem ter: 
· Título: explica o conteúdo.
· Corpo: formado pelas linhas e colunas dos dados.
· Cabeçalho: explica o conteúdo das colunas.
· Coluna indicadora: explica conteúdo das linhas.
· Opcional: fonte, notas, chamdas.
Séries estatísticas: podem ser:
Série de dados não agrupados: aquelas que podem estar relacionadas a época de ocorrência, a localização, ou a um fator específico relacionado ao problema estudado, ou ainda fazer referência a mais de um destes fatores. Podendo ser:
· Temporal, histórica, cronológica, evolutiva: descrevem os valores da variável, em determinado local, discriminados segundo intervalos de tempo variáveis.
· Geográficas ou de localização: descrevem os valores da variável, em determinado instante, discriminados segundo regiões.
· Específicas ou categóricas: descrevem os valores da variável, em determinado tempo e local, discriminados segundo especificações ou categorias.
· Séries conjugadas ou mistas: tabela de dupla entrada. Tabela que apresenta a variação de valores de mais de uma variável (conjugação de duas ou mais séries).
Série de dados agrupados: Uma das maneiras de sumarizar os valores de uma variável discreta ou contínua é a montagem de uma distribuição de frequência.
E como transformar uma tabela de dados brutos em uma tabela de distribuição de frequências? 
	Exemplo: peso ao nascer. Tabela com 100 pacientes.
1°) Encontrar o maior e o menor peso. Sugestão: colocar os dados em ordem crescente (rol). Ex: Menor peso: 1,570 kg Maior peso: 4,600 kg. Sendo a amplitude total (AT): 
Amplitude total (AT) AT = 4,600 - 1,570 AT = 3,030 kg.
2°) calcular o número de classes K:
	k = 1 + 3,3 log n, em que n = tamanho da amostra. Então:
	k = 1 + 3,3 log 100, k = 7,6 classes (em geral, de 5 a 20 classes).
3°) calcular a amplitude das classes h: 
Sabe-se então que:
- Intervalo de classe (0,5 Kg): intervalo coberto pela classe.
- Extremo de classe: limites dos intervalos de classe 1,5 Ι— 2,0: fechado a esquerda (não pertencem a classe os Valores 2; pertencem a classe os valores 1,5 e < 2,0).
 - Ponto médio: soma dos extremos da classe ÷ 2 (ex.: 1,5 + 2,0 = 3,5 / 2 = 1,75.
Resultando na seguinte tabela: 
Representação gráfica: recurso visual da Estatística utilizado para representar um fenômeno, que coloca em evidência as tendências, as ocorrências ocasionais, os valores mínimos e máximos e também as ordens de grandezas dos fenômenos que estão sendo observados. Prezando sempre pela simplicidade, clareza e veracidade das informações. Tendo os seguintes componentes básicos:
· Título: pode ser colocado tanto acima como abaixo;
· Escala: crescem da esquerda para a direita e de baixo para cima;
· Legendas: devem ser colocadas à direita do gráfico.
Podendo ser:
Gráfico de barras: formado por retângulos horizontais de larguras iguais, onde cada um deles representa a intensidade de uma modalidade ou atributo. É usado para representar variáveis qualitativas ou variáveis ordinais.
Gráfico de colunas;
Gráfico de setores: Conhecido também como gráfico tipo pizza ou circular é o tipo de gráfico onde a variável em estudo é projetada num círculo, de raio arbitrário, dividido em setores com áreas proporcionais às frequências das suas categorias. São indicados quando se deseja comparar cada valor da série com o total. Recomenda-se seu uso para o caso em que o número de categorias não é muito grande e não obedecem a alguma ordem específica.
Gráficos de dispersão: os dados apresentados fazem referência a duas variáveis contínuas.
Gráficos de caixa (Boxplot): este gráfico estende-se do 1º quartil ao 3º quartil que correspondem, respectivamente, às bases inferior e superior do retângulo e representa 50% das observações totais. A mediana é representada por uma linha grossa dentro da caixa. Os outliers, que são assinalados com um círculo, podem representar erros de introdução de dados. É comum fazermos a análise com e sem outliers e registrar as diferenças. Ex:
Histogramas: Os dados apresentados em tabelas de distribuição de frequência são apresentados graficamente em histogramas.
Gráfico de linhas: permite representar séries longas, o que auxilia detectar flutuações e analisar tendências. Também podem ser representadas várias séries em um mesmo gráfico.
Gráfico polar: É representação de uma série pormeio de um polígono. Geralmente presta-se para apresentação de séries temporais. Para construí-lo, divide-se uma circunferência em tantos arcos iguais quantos forem os dados a representar.
Polígono de frequência: é um gráfico de linha cuja construção é feita unindo-se os pontos de coordenadas de abscissas correspondentes aos pontos médios de cada classe e as ordenadas, às frequências absolutas ou relativas dessas mesmas classes.
Gráfico em escala logarítmica: É utilizado para a representação de valores em que a amplitude total é muito grande, tornandose inviável ou pouco prática a utilização da escala aritmética devido ao seu tamanho.
Representação gráfica no EXCEL:
Medidas de tendencia central: Valor médio (de meio), típico ou esperado de um conjunto de dados. Valor de ponto em torno do qual os dados se distribuem. Sendo:
· Média aritmética: Pode ser aplicada em variáveis em escala de intervalo. Função no Excel MÉDIA.
Para dados não agrupados ou agrupados em intervalo de classe: 
· Mediana: Pode ser aplicada também em variáveis ordinais. Função no Excel MED.
Para calcular a mediana devemos, em primeiro lugar, ordenar os dados do menor para o maior valor. Se o número de observações for ímpar, a mediana será a observação central. Se o número de observações for par, a mediana será a média aritmética das duas observações centrais.
· Moda: Pode ser aplicada também em variáveis nominais. Função no Excel MODO.
É o valor mais frequente entre todos os dados (o que mais aparece).
Medidas de separatizes: podem ser:
· Quartis;
· Decis;
· Percentis;
Medidas de assimetria: 
Medidas de dispersão: As medidas de dispersão ou de variabilidade indicam se os valores estão relativamente próximos um dos outros, ou separados em torno de uma das medidas de posição (geralmente a média).
1) Variância (S² ou ²): A variância de um conjunto de dados é a média dos quadrados dos desvios dos valores a contar da média, ou seja, é a diferença de cada dado para a média. Função no Excel: VAR.
2) Desvio Padrão (S ou ): avalia o grau de dispersão, isto é, quanto cada dado se desvia em relação à média. É a raiz quadrada da variância. Função no Excel: DESVPAD.
3) Coeficiente de Variação De Pearson (CV): É a medida de dispersão relativa mais utilizada, sendo definida como a razão entre o desvio padrão e a média. 
A partir do coeficiente de variação pode-se avaliar a homogeneidade do conjunto de dados e, consequentemente, se a média é uma boa medida para representar estes dados.
Classificação da distribuição quanto à dispersão: 
· Dispersão baixa: CV ≤ 15% 
· Dispersão média: 15% < CV < 30%
· Dispersão alta: CV ≥ 30%
Introdução a Probabilidade:
	Probabilidade mede a possibilidade de um experimento aleatório.
Experimento é qualquer processo que permite fazer observações e que o resultado está sujeito a incertezas. Podendo ser:
· Determinísticos: aqueles cujos resultados são sempre os mesmos, apesar de se repetirem várias vezes em condições semelhantes. Ex.: nascimento de um bebê (é certo que haverá o nascimento).
· Aleatórios: é o experimento que a cada repetição é impossível prever, com absoluta certeza, qual o resultado será obtido, e, além disso, a ocorrência de um deles exclui a possibilidade de ocorrência dos demais (o que chamamos de eventos mutuamente exclusivos). Por exemplo, o sexo do bebê que nasceu (pode ser masculino ou feminino).
Espaço amostral: O espaço amostral (S) de um experimento aleatório (E) é o conjunto de todos os resultados possíveis desse experimento.
Evento: qualquer resultado possível, obtido da realização de um experimento E, ou seja, evento é qualquer subconjunto do espaço amostral S.
	Aproximação da probabilidade pela frequência relativa: Também chamada de probabilidade empírica, é dada pelo número de vezes em que ocorreu um determinado evento pelo número de vezes que o procedimento foi repetido.
	Probabilidade Clássica (Conceito Histórico): A probabilidade clássica se aplica a situações em que os resultados que compõem o espaço amostral têm a mesma possibilidade de ocorrerem, ou seja, os eventos simples são considerados equiprováveis e o espaço amostral é finito. 
	Probabilidade subjetiva: Um exemplo é quando os meteorologistas usam seus conhecimentos específicos de condições do tempo para saber se irá chover no dia de amanhã, então desenvolvem uma estimativa de probabilidade.
	Notação para probabilidades: 
· P representa a probabilidade 
· A, B, C,representam eventos específicos
· P(A) representa a probab. de ocorrer o evento A 
· n(A) é o número de elementos de A,
· n(S) é o número de elementos de S.
Distribuição normal: características:
A variável pode assumir qualquer valor real; 
O Gráfico da distribuição normal é uma curva em forma de sino, simétrico em torno da média ()
A área total da curva vale 1, significando que a probabilidade de ocorrer qualquer valor real é 1; 
Como a curva é simétrica em torno da média, os valores maiores do que a média e os valores menores do que a média, ocorrem com igual probabilidade. 
Tem achatamento proporcional ao desvio padrão ou a variância ².
Gráficos com 2 extremos um máximo e um mínimo e entre eles, uma distribuição gradativa (maioria dos valores ao redor da média). 
Curva de Gauss: As medidas que originam a estes gráficos são variáveis com distribuição normal
Predição de um valor entre dois números quaisquer: usa-se a tabela de distribuição normal.
Ex.: A probabilidade de ocorrência de um valor > 0 é 0,5, mas qual é a probabilidade de ocorrer um valor entre 0 e z = 1,25?
	Como usar a tabela de distribuição normal?
1) Localizar na coluna indicadora (1°) o valor 1,2
2) No cabeçalho (1° linha), localizar o valor 5.
3) O 1,2 compõe com o algarismo 5, o n ° z = 1,25.
4) No cruzamento da linha 1,2 com a coluna 5 está o número 0,3944. Está é a probabilidade (39,44%) do ocorrer valor entre zero e z= 1,25.
Predição de um valor: ex:
Qual é a probabilidade de um individuo apresentar um colesterol entre 200 e 225 mg% (média)= 200 mg% / = desvio padrão = 20 mg%
A estatística Z mede quanto um determinado valor afasta-se da média em unidades de Desvio padrão (quando coincide c/ a média, o escore é Z = 0).
Estatística inferencial:
A inferência estatística pode ser dividida em estimação de parâmetros e em teste de hipóteses.
Amostragem é o processo de determinação de uma amostra a ser pesquisada. Desta forma, a teoria da amostragem estuda as relações existentes entre uma população e as amostras extraídas dessa população. É útil para avaliação de grandezas desconhecidas da população (como a média, a variância, etc), ou para determinar se as diferenças observadas entre duas amostras são devidas ao acaso ou se são verdadeiramente significativas (Teste de Hipóteses).
Tamanho da amostra:
	O Nível de confiança e erro padrão da estimativa constitui a precisão de uma estimativa.
Para uma amostra de tamanho fixo, à medida que aumentamos o valor do nível de confiança do intervalo, o erro padrão de estimativa também aumenta. Em termos de precisão, o ideal seria aumentar o nível de confiança e diminuir o erro padrão de estimativa. Isto só podemos conseguir aumentando o tamanho da amostra. Então surge a questão: “Qual deve ser o tamanho da amostra para se atingir determinada precisão?”
Determinação do Tamanho da Amostra para Média Populacional: Podemos determinar o tamanho mínimo necessário da amostra considerando-se um erro de estimação, e um nível de confiança desejados, e conhecendo ou estimando um valor para , através das seguintes fórmulas: ACIMA!
Determinação do Tamanho da Amostra para a Proporção populacional: Na estimação da proporção populacional, determinamos o valor mínimo para n considerando um erro de estimação e um nível de confiança desejados, e supondo um valor para p, através das seguintes fórmulas:
1) Quando não se conhece o desvio padrão populacional (σ), usa-se: 
2) No cálculo n para estimar a proporção populacional, necessita-se da estimativa preliminar da proporção, que pode ser obtida por meio de: 
a. dados históricos sobre a população de interesse;
b. resultadosobtidos em estudos similares ao que está sendo realizado; através de uma amostra piloto;
c. se não se dispuser de qualquer estimativa preliminar para p, utiliza-se p = 0,5.
3) Qualquer resultado obtido por essas fórmulas que seja menor do que 30 deve ser aumentado para 30, pois as mesmas são baseadas no uso da distribuição Normal. Isso só não será feito se a população estudada for normalmente distribuída e o conhecido.
4) Qualquer resultado fracionário é sempre arredondado para o número inteiro imediatamente superior, pois essas fórmulas nos dão o tamanho mínimo necessário.
TESTES DE HIPÓTESES: Em Inferência Estatística, a teoria da decisão significa tomar decisões sobre populações, com base em informações amostrais. Muitos problemas relacionados a análise ambiental requerem que decidamos entre aceitar ou rejeitar uma afirmação sobre um parâmetro. A afirmação é chamada de hipótese e o procedimento de tomada de decisão sobre a hipótese é chamado de teste de hipóteses. Estas decisões estatísticas ocorrem com relação a qualidade de algum processo, igualdade de parâmetros, igualdade ou diferença de tratamentos, natureza da população, etc.
Hipótese: resposta presumida e provisória que de acordo com critério (teste) será ou não rejeitada. Podem ser: 
· Hipótese nula (H0): não há diferença 
· Hipótese alternativa (H1): há diferença
Processo para testar hipóteses:
1) Identifique o parâmetro de interesse, a partir do contexto do problema; 
2) Estabeleça a hipótese nula H0; 
3) Especifique a hipótese alternativa apropriada H1 (atenção, H1 define o tipo de teste a ser empregado);
4) Especifique o nível de significância para o teste, por exemplo, 1% ou 5%;
5) Selecione o teste estatístico ou Z amostral, que será usada para decidir rejeitar ou não a hipótese nula, ou seja, estabelecer o(s) “valor(es) crítico(s)” e identifique qual o valor da Estatística de Teste necessário para rejeitar H0, (valor tabelado);
6) Calcule o estimador e verificar se está na região de aceitação ou na região de rejeição da hipótese;
7) Tomada de decisão: O valor observado da medida estatística da amostra é comparado com o(s) valor(es) crítico(s) estabelecido para o teste estatístico;
8) Decida se H0 deve ou não ser rejeitada e reporte isso no contexto do problema: 
- Se o estimador estiver na área de aceitação, não se pode rejeitar H0; 
- Se o estimador estiver na área de rejeição, rejeita-se H0; 
Assim, podem ser emitidas as conclusões.
Tipos de testes de hipóteses: Segundo Fisher: todo experimento existe somente com o propósito de dar aos fatos uma oportunidade de afastar a H0.
Erro tipo I: rejeitar a H0 sendo verdadeira (fato obtido pelo azar), rara ocorrência estatística; amostras pequenas.
Erro tipo II: aceita a H0 sendo falsa (erro mais frequente).
Conceitos importantes: 
Nível de Significância: É o critério para decidir se a diferença entre a informação amostral e o valor estabelecido na Hipótese Nula, é significativamente grande a ponto de se rejeitar Ho. A máxima probabilidade de ocorrência do Erro Tipo I; é o valor máximo do risco α.
Risco α: Risco que o pesquisador corre de cometer um Erro Tipo I ao efetuar um teste de hipótese. 
Risco β: Risco que o pesquisador corre de cometer um Erro Tipo II ao efetuar um teste de hipótese.
Hipótese: uma expectativa a respeito de um valor de um parâmetro de uma população.
Hipótese Nula (H0): è a hipótese que se acredita ser correta, que deve ser aceita ou rejeitada utilizando valores amostrais e um critério de avaliação.
Hipótese Alternativa (H1): Hipótese que assumiremos como válida no caso de se rejeitar a hipótese nula.
Estatística Teste: É o estimador não tendencioso do parâmetro que está sendo testado, sua escolha depende do tipo de teste estatístico que será efetuado.
Valor Crítico: O(s) valor(es) extremo(s) da estatística teste, ou seja, o(s) valor(es) que se for(em) excedido(s) acarreta(m) em evidências ínfimas para suportar a hipótese nula, levando–nos a aceitar H1.
Testes estatísticos paramétricos e não paramétricos:
Estatísticas paramétricas: são aquelas em que a função de distribuição de uma variável aleatória é especificada obedecendo a certas premissas (modelos probabilísticos teóricos contínuos – Distribuição Normal). Os testes incidem explicitamente sobre um parâmetro de uma ou mais populações (ex., sobre a média ou sobre a variância); A distribuição de probabilidades da estatística de teste pressupõe uma forma particular das distribuições populacionais de onde as amostras foram recolhidas.
Estatísticas não paramétricas: se não conhecemos a distribuição teórica subjacente à nossa estatística de teste ou quando são utilizadas medidas nominais, categóricas e ordinais. Os testes não paramétricos não estão condicionados por qualquer distribuição de probabilidades dos dados em análise, sendo também designados por “distribution-free tests”. Exemplos de testes não paramétricos:
· Teste de Independência e de ajustamento do X² 
· Teste de Fisher – F
· Teste de Kolmogorov-Smirnov (K-S)
· Teste de Wilcoxon, Mann-Whitney, etc.
· Teste do Qui-Quadrado - X²: mede a probabilidade de as diferenças encontradas em dois grupos de uma amostra serem devidas ao acaso, partindo do pressuposto que, na verdade, não há diferenças entre os dois grupos na população donde provem. Se a probabilidade for alta poderemos concluir que não há diferenças estatisticamente significativas. Se a probabilidade for baixa (particularmente menor que 5%) poderemos concluir que um grupo (A) é diferente do grupo (B) quanto ao fator estudado.
Para a hipótese nula ser aceita, as diferenças entre as frequências observada (fo) e esperada (fe) devem ser atribuídas à variabilidade da amostragem no nível de significância designado. 
Testes da independência envolvem (pelo menos) duas variáveis categóricas, e o que é testado é a premissa de que as variáveis são estatisticamente independentes. Independência implica que o conhecimento da categoria na qual a observação é classificada, em relação a uma variável, não tem efeito sobre a probabilidade da outra variável estar em uma das duas categorias. 
feij = [(soma da linha i).(soma da coluna j)] / total geral γ = (L - 1).(C – 1)
Teste do Qui-Quadrado - X² ou Teste McNemar:
Exemplo: ANTES x DEPOIS Dois grupos de 100 pacientes foram acompanhados quanto a incidência de câncer do pulmão associado ao tabagismo. No grupo de fumantes a incidência de câncer foi igual a 28 pacientes, no grupo controle (não-fumantes) foi igual a 8 pacientes. No presente estudo a incidência de câncer de pulmão está associada ao tabagismo?
H0: a incidência de pacientes com câncer independe do tabagismo. H1: a incidência de pacientes com câncer depende do tabagismo. Nível alfa = 0,05 (5%) p = 0,0004 
Resultado: Rejeita a hipótese nula, conclui-se que o tabagismo influencia a incidência de câncer.
Teste de Kolmogorov-Smirnov (K-S):
Ao contrário do teste do X², o teste K-S não se aplica a dados qualitativos nem a variáveis discretas, no entanto, tem a vantagem de não estar dependente de classificações dos dados, que além de serem sempre algo arbitrárias envolvem perdas de informação. 
O teste K-S só pode ser aplicado quando a distribuição indicada na hipótese nula está completamente especificada. O teste do X² é aplicado em grandes amostras, enquanto que o teste K-S é aplicável a pequenas amostras.
Comparam-se as frequências relativas acumuladas registradas na amostra com as que se esperariam se a distribuição populacional fosse a especificada na hipótese nula. A Estatística do teste de K-S considera a maior das diferenças, em valor absoluto, entre a proporção de observações inferiores ou iguais a x, S(x), e a probabilidade de se observar um valor inferior ou igual a x se a distribuição populacional for a especificada em H0, F0(x):
Teste de KRUSKAL-WALLIS:
Dadas k populações nas quais se estuda uma característica comum e de onde foram extraídas k amostras aleatórias e independentes, pretende-se testar a hipótese H0 de que as distribuições populacionais são idênticas, isto é, as k amostras podemser consideradas como provenientes de populações com a mesma distribuição. O teste de Kruskal-Wallis é particularmente sensível a diferenças nas medidas de posição. Assim, as hipóteses são geralmente formuladas em termos das médias ou das medianas populacionais.
Teste de FISHER ou da Probabilidade Exata:
· Usado para amostras pequenas
· Menos erro tipo I e II em relação ao qui-quadrado
· n < 20 ou n > 20 e n < 40 
Exemplo: Suposição de uma determinada enzima em pessoas submetidas a uma reação sorológica:
Teste de WILCOXON:
É um teste para variáveis ordinais e destina-se a comparar dois grupos emparelhados; é usado exatamente da mesma situação do teste t para amostras emparelhadas. 
· Calcular a diferença entre os valores 
· Atribuir postos aos valores absolutos das diferenças (a menor diferença recebe o posto 1)
· Somar todos os postos das diferenças positivas e das negativas obtendo-se somas chamadas de T
Na tabela apropriada (tabela A-8), encontrar os valores de p correspondentes aos valores dos T obtidos, considerando como n o número de pares em que a diferença é 0. Se os dois valores estiverem bastante afastados, o valor de p será pequeno: algumas tabelas usam apenas o menor valor de T.
	Teste de MANN-WHITNEY:
utilizado para testar se duas amostras independentes provêm de populações com médias iguais. 
· Não exige que as populações tenham a mesma variância; 
· É quase tão forte quanto o de duas amostras para média (teste t)
· Baseado na soma de posições (soma de filas - R);
· A fila é composta como se todas as observações fizessem parte de uma única amostra;
· Ho é verdadeira se os postos baixos, médios e altos distribuir-se equilibradamente entre as duas amostras;
· Se H1, é verdadeira, uma amostra tenderá a ter mais postos baixos (e, assim, uma soma de postos menor) enquanto que a outra tenderá a ter maior soma de postos.
Teste de FRIEDMAN
Usado para experimentos com blocos aleatórios
· Os blocos são independentes.
· Não existe interação entre os blocos e tratamentos.
· As observações dentro de cada bloco podem ser ranqueadas.
· H0: Os tratamentos nas populações são iguais
· H1: Pelo menos um tratamento em uma população produziu grandes efeitos.
Teste de COCHRAN: Usado para experimentos com blocos aleatórios.
· Supõe que há k > 2 tratamentos experimentais e aquele as observações são arranjados dentro b blocos.
· Uma aproximação grande da amostra; no detalhe, supõe aquele b é “grande”.
· Os blocos foram selecionados aleatoriamente da população de todos os blocos possíveis.
· Os resultados dos tratamentos podem ser codificados como as respostas binárias (isto é, um “0” ou “1”) em uma maneira que seja comum a todos os tratamentos dentro de cada bloco.
Exemplo: Tempo de latência (s) de três anestésicos (A, B, C) foi medido em um ensaio com um total de 15 cobaias H0: Os tratamentos são igualmente eficazes. H1: Há uma diferença na eficácia entre tratamentos.
TESTES ESTATISTICOS PARAMÉTRICOS:
	Por exemplo, a distribuição da estatística de teste do teste t - Student para comparar as médias de duas amostras pressupõe que as amostras foram retiradas de uma população que se distribui segundo uma função de probabilidades Normal, e além disso pressupõe também que as variâncias das duas amostras são homogêneas
Teste t (Student):
· tc (t calculado) tc (t crítico: obtido na tab. de valores de t) 
Significa que as médias não são iguais, podendo se afastar a Hipótese nula Ex.: Verificar se duas dietas para emagrecer são igualmente eficientes ou se determinada dieta foi melhor (produziu significativamente menor perda de peso).
ANOVA: Analysis of Variance - (Teste paramétrico): 
É usada para comparar médias de mais de duas populações. Exemplo: testar 4 drogas diferentes ao mesmo tempo e avaliar o efeito de cada droga sobre o débito urinário em 16 cobaias. 
teste t: comparar os grupos 2 a 2 (6 testes t separados) - perda de tempo - erro tipo I de 30% (5% de erro em 6 análises).
Então, vamos usar o teste ANOVA (comparação de pares): 
· Se os grupos são semelhantes, a variância em cada um (dentro) dos grupos é semelhante aquela entre os grupos. 
· Determinar a variabilidade das médias dentro de cada amostra e a variabilidade entre as médias das amostras
Teste de Tukey (Teste paramétrico):
Permite estabelecer a diferença mínima significante (d.m.s): a menor diferença de médias de amostras a ser usada como significante em um determinado Fórmula:
d.m.s. = 3,53 √ 7,35/9 = 3,19 Outros autores DHS: diferença honestamente significativa Como vemos, aplicando a ANOVA, a média dos 3 grupos são diferentes. Mas, qual é ou quais são as médias diferentes entre si? Teste de Tukey: duas médias são estatisticamente deferentes se o valor absoluto da diferença for maior que d.m.s.
	ESCOLHA DO TESTE ESTATISTICO: os detalhes que devem orientar a escolha do teste são:
a) a existência ou não de vinculação entre dois ou mais fatores de variação; 
b) o número de componentes da amostra, que vão ser comparados.
Correlação e regressão linear:
Correlação: quando duas variáveis estão ligadas por uma relação estatística, dizemos que existe correlação entre elas. A correlação, então, é a verificação da existência e do grau de relação entre duas (ou mais) variáveis.
Diagrama de dispersão: 
X = Horizontal (eixo das abscissas): variável independente ou explanatória 
Y = Vertical (eixo das ordenadas): variável dependente
A correlação quantifica quão bem o X e Y variam em conjunto.
Diagrama de dispersão: O gráfico da equação é a melhor reta ajustada, também chamada de reta de mínimos quadrados.
A correlação indica o grau de associação entre duas variáveis, ao passo que a regressão diz respeito a capacidade de prever um valor baseado no conhecimento do outro (de prever Y dado que X é conhecido).
Coeficiente de Determinação ou de Explicação (r²):
Tem-se que: 0 ≤ r² ≤ 1
· Se r² = 0, o modelo adotado não explica nada da realidade; 
· Se r² = 1, o modelo adotado explica a realidade com perfeição. 
Assim, quanto maior o coeficiente de explicação, melhor o modelo adotado.

Continue navegando