Buscar

POSTAGEM

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 15 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 15 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 15 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

FARMÁCIA 
 
 
 
INTRODUÇÃO EM CIÊNCIAS FARMACÊUTICAS (ICF) 
 
 
 
POSTAGEM 3 
ATIVIDADE 3 – EXAME 
ARTIGO DE REVISÃO DA LITERATURA 
 
 
 
 
ANA CLAUDE MOURA BEZERRA CARVALHO – RA: 2100378 
GILMAR MARQUES – RA: 2132203 
JULIANA APARECIDA DE SOUZA DE OLIVEIRA – RA: 0416426 
RUI CICERO MOURA BESERRA – RA: 2100416 
VINÍCIUS TEODORO BERNARDINELLI – RA: 2123578 
 
 
 
 
 
 
 
POLO: ERCÍLIA/SÃO JOSÉ DO RIO PRETO 
DATA: 12/2022 
2. RESUMO 
Uma grande quantidade de métodos estatísticos supõe que os dados provenham de 
uma distribuição normal, pois este fato permite que seja realizada a maioria das 
técnicas de inferência estatística conhecidas, pois a estatística é o campo da 
matemática que relaciona fatos e números em que há um conjunto de métodos que 
nos possibilita coletar dados e analisá-los, assim sendo possível realizar alguma 
interpretação deles. Neste trabalho vamos falar um pouco de alguns testes estáticos, 
sendo eles Teste t de Student, Teste de Shapiro-Wilk, Teste de Kolmogorov-Smirnov, 
Teste de Wilcoxon-Mann-Whitney, Teste Qui-Quadrado. 
Palavras chave: Estática, Teste, Teste Estatísticos, 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
3. INTRODUÇÃO 
A estatística compreende a estatística descritiva, a teoria da probabilidade e 
amostragem” A estatística que se utiliza números para descrever fatos é chamada de 
estatística descritiva. Compreende a organização, o resumo em geral, a simplificação 
de informações que podem ser muito complexas. Ex: taxas de acidentes, índices de 
mortalidade, litros por quilômetros, etc. Estatística relacionada a probabilidade é útil 
para analisar situações que envolvem o acaso. Como jogos de cartas, jogos de dados, 
lançamento de moeda para o ar, e também a maioria dos jogos esportivos (futebol, 
basquete, entre outros.) O terceiro ramo da estatística é a inferência, diz respeito a 
análise e interpretação de dados amostrais. A ideia básica da amostragem é efetuar 
determinada mensuração sobre uma pequena parcela, mas típica, de determinada 
população e utilizar essa informação para fazer inferência sobre a população toda 
(SANTOS, 2007). 
A preocupação de relatar adequadamente os resultados de pesquisas 
biomédicas está presente na literatura mundial desde décadas passadas. A 
frequência do uso adequado dos testes estatísticos pode ser vista em diversas áreas 
médicas, como oncologia, radiologia, cirurgia e anestesiologia. As consequências 
podem ser sérias se a análise do conteúdo científicos for inadequada, como 
resultados falsos com suposições não justiçadas e conclusões sem respaldo biológico 
(SIEGEL, 2006). 
Um dos principais instrumentos usados na estatística é o modelo. Os modelos 
são versões simplificadas de algum problema ou situação da vida real. São usados 
para ilustrar certos aspectos da situação, evitando grande número de detalhes que 
talvez sejam irrelevantes para o problema. As mais diversas orientações para relatos 
de dados e medidas estatísticas estão disponíveis aos pesquisadores e já foram 
publicadas por vários autores de artigos científicos que demonstraram quais itens são 
importantes para ser usados em relatos de pesquisas científicas. Apesar da existência 
de tais orientações, os erros nos relatos de pesquisas que usam a estatística ainda 
continuam a existir e se devem tanto ao uso da estatística básica como da estatística 
avançada, porém a maior frequência ocorre com o uso da estatística básica, ao 
contrário do que se pode acreditar. Iremos abordar nesse trabalho alguns testes 
estatísticos sendo eles, Teste t de Student, Teste de Shapiro-Wilk, Teste de 
Kolmogorov-Smirnov, Teste de Wilcoxon-Mann-Whitney, Teste Qui-Quadrado. 
 
4. JUSTIFICATIVA E OBJETIVO 
O uso inadequado da estatística é o maior responsável pelo erro de 
interpretacão quando se tem dados estatísticos. O objetivo deste trabalho de revisão 
de literatura foi rever alguns tópicos básicos de estatística para analisar e saber sobre 
a importância do relato adequado da estatística básica. 
5. MATERIAL E MÉTODOS 
Foi executada uma pesquisa bibliográfica e transversal por meio de publicacões 
de livros e artigos científicos obtidos em meios eletrônicos, nas bases de dados 
SciELO (Scientific Electronic Library Online) e PubMed, do National Center for 
Biotechnology Information, Google Acadêmico. 
6. REVISÃO DA LITERATURA 
A Estatística é um conjunto de técnicas úteis para a tomada de decisão sobre 
um processo ou população, baseada na análise da informação contida em uma 
amostra desta população. A Estatística é uma ciência que oferece uma coleção de 
métodos para planejar experimentos e levantamentos para obter dados, organizar, 
resumir, analisar, interpretar dados e deles extrair conhecimento (MAGALHÃES, 
20070. 
Deste modo, a Estatística contribui para que dados gerem conhecimento e, 
como tal, deve ter como objetivo não só a produção de dados, como também a 
interpretação de dados já existentes, utilizando a combinação de gráficos, tabelas e 
medidas numéricas que permitam interpretar o que esses dados significam. 
(MORAES, 2005). 
Os dados em geral são números, mas não são "apenas números". Os dados 
são números com um contexto. Procure entender o que os dados dizem em cada 
contexto específico. Todos os métodos estatísticos nada mais são do que 
instrumentos que nos ajudam a entender os dados. Deixe para uma calculadora ou 
um computador o máximo possível dos cálculos e gráficos e procurar concentrar-se 
no que fazer, e por que fazer, enfoque as grandes ideias da estatística, e não apenas 
regras e receitas. A estatística está presente nas decisões simples até nas mais 
complexas do nosso cotidiano, e essas informações não podem ou não deveriam ser 
repassadas de qualquer maneira. Existem regras específicas para a coleta de dados, 
para sua análise e até mesmo para a definição da estimativa de confiabilidade da 
pesquisa, enfim, todas essas regras surgem baseadas em ferramentas desenvolvidas 
no estudo da estatística. Para compreender-se o estudo da estatística, existem 
conceitos básicos que precisam estar bem definidos, são eles os conceitos iniciais de 
estatística, mais especificamente: definição de população, amostra, variável, tabela, 
frequência e gráfico (TRIOLLA, 2005). 
Conceitos básicos uma população é uma coleção completa de todos os 
elementos (valores, pessoas, medidas, etc.) a serem estudados. Um censo é uma 
coleção de dados relativos a todos os elementos de uma população. Uma amostra é 
uma sub-coleção de elementos extraídos de uma população. Um parâmetro é uma 
medida numérica que descreve uma característica de uma população. Uma estatística 
é uma medida numérica que descreve uma característica de uma amostra. Os dados 
quantitativos consistem em números que representam contagens ou medidas. Os 
dados qualitativos podem ser separados em diferentes categorias que se distinguem 
por alguma característica não-numérica. Os dados são a matéria prima da Estatística. 
Definido o assunto de interesse, os dados são obtidos da medição de determinada 
característica ou propriedade desse objeto, pessoa ou coisa. Os dados discretos 
resultam de um conjunto finito de valores possíveis, ou de um conjunto enumerável 
desses valores. Os dados contínuos resultam de um número infinito de valores 
possíveis que podem ser associados a pontos em uma escala contínua de tal maneira 
que não haja lacunas ou interrupções. Variável - Qualquer conjunto de dados contém 
informações sobre algum grupo de indivíduos. As informações são organizadas em 
variáveis. Uma variável é uma característica, propriedade ou atributo de uma unidade 
da população, cujo valor pode variar entre as unidades da população. O padrão de 
variação de uma variável constitui a sua distribuição. A distribuição de uma variável 
quantitativa registra seus valores numéricos e a frequência de ocorrência de cada 
valor. 
Os dados sãoparte crucial no estudo da variabilidade, pois, assim como são 
geradores de resultados podem também ser geradores de incerteza, estimulando e 
motivando mais aprofundamento e estudo sobre seu comportamento e sobre sua 
distribuição. Aos dados também estão associadas às fontes de erros que interferem 
diretamente na aplicação dos métodos estatísticos. 
O Planejamento é crucial numa coleta de dados que vise um estudo estatístico. 
Os processos ou padrões definidos para coletar dados são chamados de 
planejamentos. Os planejamentos devem abordar principalmente: Como vamos 
selecionar os indivíduos a serem estudados (tipo de amostragem ou de delineamento 
experimental); quantos indivíduos devemos estudar (tamanho da amostra); se há 
https://mundoeducacao.uol.com.br/matematica/conceitos-iniciais-estatistica.htm
https://mundoeducacao.uol.com.br/matematica/conceitos-iniciais-estatistica.htm
necessidade de composição de grupos e como eles devem ser formados para que 
possam ser comparados (alinhamento da amostra com os objetivos e restrições); 
como serão feitas as medições (procedimentos e instrumentos de medição); etc. O 
planejamento sistemático para gerar dados é um dos primeiros passos para a 
realização de um estudo com base científica. A falta de planejamento pode levar a 
tendenciosidades, à falta de dados ou a resultados confusos e imprecisos. 
Produção de dados: parte crucial para a inferência estatística, para responder 
questões específicas formuladas antes dos dados serem produzidos. • Estudos 
observacionais ou levantamentos: visam retratar a população a menos distorcida 
possível pelo ato da coleta de informações. Não tentamos manipular, influenciar ou 
modificar as respostas dos elementos a serem estudados. Experimentos: decorre da 
aplicação de determinado tratamento para posterior observação de seus efeitos. 
Preocupação com a relação de causa e efeito sobre os elementos pesquisados. Impõe 
deliberadamente algum tratamento aos indivíduos, a fim de observar sua reação e 
medir respostas. Requer planejamento apropriado para serem válidos cientificamente. 
Simulação: Uso de modelo matemático ou físico para reproduzir as condições de uma 
situação ou processo, usando métodos computacionais. A simulação é uma 
alternativa quando é impraticável ou mesmo perigoso estudar os fenômenos de 
interesse em condições reais. A Inferência Estatística objetiva estudar a população 
por meio de evidências decorrentes de uma avaliação minuciosa da amostra. É parte 
da inferência estatística, produzir estimativas e testar hipóteses. 
6.1 TESTE T DE STUDENT 
Mais conhecido pelo seu pseudônimo Student, Willian Sealy Gosset (1876-
1937) formou-se em química e matemática pela Oxford University e foi trabalhar na 
cervejaria Guinness na Irlanda em 1899, a fim de aprimorar os métodos de produção 
da empresa. Devido ao seu trabalho, estudou várias ferramentas de análise estatística 
e teve contato com vários estatísticos da época, como Karl Pearson, Egon Pearson e 
Ronald Aylmer Fisher (HANLEY; JULIEN; MOODIE, 2008). 
Em 1908, publicou dois de seus trabalhos mais importantes, “The probable 
error of a mean” e “Probable error of a correlation coefficient” sob o pseudônimo de 
Student, uma vez que as normas da Guinness o impediam que publicasse em seu 
nome. No artigo “The probable error of a mean” Gosset apresentou a distribuição 
amostral da variância S2 e do desvio padrão S para uma amostra independente e 
identicamente distribuída de tamanho n para uma população normal. Ele também 
mostrou que a média e o desvio padrão de tal amostra não são correlacionadas e 
apresentou a distribuição t de Student (FIENBERG; LAZAR, 2001). 
Como o foco dos estatísticos da época estavam na teoria assintótica e a ênfase 
de Gosset era em problemas com pequenas amostras, sua publicação não teve 
grande impacto na comunidade estatística. De acordo com Fienberg e Lazar (2001), 
o trabalho de Gosset não foi totalmente reconhecido até Fisher generalizar a 
distribuição t de Student. Fisher também introduziu a noção de graus de liberdade, 
que não havia sido considerada por Gosset e o nome “distribuição t de Student”. É um 
teste de hipótese que usa conceitos estatísticos para rejeitar ou não uma hipótese 
nula quando a estatística de teste (t) segue uma distribuição t de Student. 
Teste t pode ser conduzido para: Comparar uma amostra com uma população, 
comparar duas amostras pareadas, comparar duas amostras independentes. 
Este teste se aplica a planos amostrais onde se deseja comparar dois grupos 
independentes. Esses grupos podem ter sido formados de duas maneiras diferentes: 
a) Extraiu-se uma amostra da população A e outra amostra da população B; 
b) Indivíduos da mesma população foram alocados aleatoriamente a um dos dois 
tratamentos em estudo. 
Teste t para comparar a média de uma amostra com a de uma população: 
Calcula-se o t: 
 
Onde: 
𝑥 é a média da amostra 
𝜇 é a média da população (ou referência) 
S é o desvio padrão n é o número de sujeitos 
Quando o objetivo é comparar duas populações quanto a uma variável quantitativa, é 
muito comum que os pesquisadores não conheçam os parâmetros de nenhuma delas, 
isto é, sejam desconhecidas as médias e também os desvios padrão populacionais; 
dessa forma, muitos estudos biológicos são realizados com duas amostras 
independentes de indivíduos, denominadas grupo experimental e grupo controle, 
respectivamente. 
6.2 TESTE DE SHAPIRO-WILK 
O teste de Shapiro & Wilk (1965) é possivelmente o teste mais utilizado para 
verificar se um determinado conjunto de dados independentes segue a distribuição 
Normal. Este teste tem um maior poder de decisão do que outros 
testes (NIST/SEMATECH, 2013), como o teste de Kolmogorov-Sminorv (Rodrigues & 
Iemma, 2009) por exemplo. 
As principais vantagens e desvantagens do teste são: 
Vantagens: é específico para a distribuição Normal, alto poder de decisão; 
Desvantagens: limitado a amostras com tamanho entre 3 e 50 observações, sensível 
a valores iguais ou muito próximos, dificilmente rejeita a hipótese nula de Normalidade 
dos para amostras pequenas, tende a rejeitar a hipótese nula de normalidade quando 
os dados apresentam pequenas discrepâncias quanto a normalidade dos dados em 
amostras muito grandes. 
A hipótese nula do teste é que os dados seguem, pelo menos aproximadamente, a 
distribuição Normal. Já a hipótese alternativa, é de que os dados não seguem a 
distribuição Normal. Formalmente, temos o seguinte: 
H0: Os dados seguem uma distribuição Normal. 
H1: Os dados não seguem uma distribuição Normal. 
Utilizamos o termo “uma” distribuição Normal, pois temos infinitas distribuições 
Normais, uma para cada par de média e desvio padrão. Para testar a hipótese do teste 
precisamos estimar a estatística do teste de Shapiro-Wilk (DS−W), e compara-la com 
o valor tabelado (DS−W critico) para um determinado nível de confiança. 
Se o valor da estatística de Shapiro-Wilk for menor do que o valor 
tabelado, temos evidências para rejeitar a hipótese nula de Normalidade dos 
dados. Caso contrário, não temos evidências para rejeitar a hipótese de Normalidade 
dos dados. Também podemos testar a hipótese do teste calculando o valor de p-valor 
para a estática obtida e comparar com um nível de significância estabelecido 
previamente (α (%)). Neste caso, é necessário o uso de um software que estime o p-
valor, pois os cálculos são demasiadamente longos. A conclusão do teste baseado no 
p-valor é feita da seguinte forma: se o p-valor for maior do que α, temos 
evidências para rejeitar a hipótese de Normalidade dos dados. Caso contrário, não 
temos evidências para rejeitar a hipótese de normalidade dos dados. 
A estatística do teste de Shapiro-Wilk é obtida através da seguinte forma: 
https://andersonmdcanteli.github.io/Shapiro-Wilk/#shapiro-wilk
https://andersonmdcanteli.github.io/Shapiro-Wilk/#nist-sematech
https://andersonmdcanteli.github.io/Shapiro-Wilk/#rodrigues-iemmahttps://andersonmdcanteli.github.io/Shapiro-Wilk/#rodrigues-iemma
 
Onde Xi é o valor de cada medida independente que foi obtida, x é a média de 
todas as medidas obtidas, e b é um parâmetro que deve ser calculado e que depende 
de um outro parâmetro a e também da quantidade de observações (n) que temos 
de Xi. 
 
O valor de a é um valor tabelado e que necessita que os valores de x estejam 
ordenados de forma crescente, pois ele depende da posição de cada medida devido 
a ordem das operações que devem ser feitas. 
6.3 TESTE DE KOLMOGOROV-SMIRNOV 
Kolmogorov-Smirnov testa uma maneira muito eficiente de determinar se duas 
amostras são significativamente diferentes uma da outra. Geralmente é usado para 
verificar a uniformidade de números aleatórios. A uniformidade é uma das 
propriedades mais importantes de qualquer gerador de números aleatórios e o teste 
de Kolmogorov-Smirnov pode ser usado para testá-la. O teste de Kolmogorov-
Smirnov também pode ser usado para testar se duas distribuições de probabilidade 
unidimensionais subjacentes diferem. É uma maneira muito eficiente de determinar se 
duas amostras são significativamente diferentes uma da outra. Aplicamos o teste de 
aderência de Kolmogorov-Smirnov para verificar se determinada amostra vem de 
população com distribuição específica. Essa “distribuição específica” é, na maioria das 
vezes, a distribuição normal. Nesses casos, podemos dizer que estamos usando 
o teste de normalidade de Kolmogorov-Smirnov (LOPES, 2013). 
A estatística de Kolmogorov-Smirnov quantifica a distância entre a função de 
distribuição empírica da amostra e a função de distribuição cumulativa da distribuição 
de referência, ou entre as funções de distribuição empírica de duas amostras. 
Para usar o teste de verificação da uniformidade de números aleatórios, usamos o 
CDF (função de distribuição cumulativa) de U [0, 1]. 
F(x)=x for 0<=x<=1 
CDF empírico, Sn(x)= (number of R1, R2...Rn < x) / N array of random numbersos 
números aleatórios devem estar no intervalo de [0, 1]. 
Hipótese usada - H 0 (hipótese nula): a hipótese nula assume que os números estão 
uniformemente distribuídos entre 0-1. Se pudermos rejeitar a hipótese nula, isso 
significa que os números não estão uniformemente distribuídos entre 0-1. A falha em 
rejeitar a hipótese nula, embora não signifique necessariamente que os números 
seguem a distribuição uniforme. kstest função no scipy Python - 
Parâmetros: 
Estatísticas: este é o valor calculado de D, onde D=|F(x)-Sn(x)|. 
-> Este D é comparado com D alfa, onde alfa é o nível de significância. Alfa é definido 
como a probabilidade de rejeitar a hipótese nula desde que a hipótese nula (H 0 ) seja 
verdadeira. Para a maioria das aplicações práticas, alfa é escolhido como 0,05. 
valor p: é calculado com a ajuda de D.-> Se valor p> alfa, não rejeitamos a hipótese 
nula. Caso contrário, concluímos que os números não são uniformes. Idealmente, o 
valor p deve ser o maior possível. Para uma distribuição uniforme perfeita pvalue = 1 
e Statisitics = 0. 
6.4 TESTE DE WILCOXON-MANN-WHITNEY 
Este teste não paramétrico é indicado para testar se duas amostras 
independentes são provenientes da mesma população ou de populações idênticas. A 
utilização deste teste ocorre quando as variáveis estudadas são mensuradas em 
escala pelo menos em nível ordinal é uma alternativa ao Teste T (SIEGEL & 
CASTELLAN, 2006). O procedimento para aplicação do teste ´e o seguinte: Seja m o 
número de casos na amostra do grupo X e n o número de casos na amostra Y. 
O teste de Mann-Whitney teste foi desenvolvido primeiramente por F. Wilcoxon 
em 1945, para comparar tendências centrais de duas amostras independentes de 
tamanhos iguais. Em 1947, H.B. Mann e D.R. Whitney generalizaram a técnica para 
amostras de tamanhos diferentes. O teste de Mann-Whitney (Wilcoxon rank-sum test) 
é indicado para comparação de dois grupos não pareados para se verificar se 
pertencem ou não à mesma população e cujos requisitos para aplicação do teste t de 
Student não foram cumpridos. Na verdade, verifica-se se há evidências para acreditar 
que valores de um grupo A são superiores aos valores do grupo B. O teste U pode ser 
considerado a versão não paramétrica do teste t, para amostras independentes. Ao 
contrário do teste t, que testa a igualdade das médias, o teste de Mann-Whitney (U) 
testa a igualdade das medianas. Os valores de U calculados pelo teste avaliam o grau 
de entrelaçamento dos dados dos dois grupos após a ordenação. A maior separação 
dos dados em conjunto indica que as amostras são distintas, rejeitando-se a hipótese 
de igualdade das medianas. 
A lógica do teste é a mesma do teste t: calcula-se uma certa estatística de teste e 
obtém-se o p-valor a partir da distribuição amostral dessa estatística sob H0. A 
diferença é que ao invés de construir essa estatística com dados originais, eles são 
previamente convertidos em postos (ordenações). A vantagem é que, com isso, as 
suposições de normalidade e homogeneidade das variâncias não são necessárias, 
permitindo mais generalidade aos resultados. Perceba também que aquele outlier 
perde sua influência nessa abordagem, sendo apenas o maior valor da amostra. Outra 
vantagem desse teste é que ele pode ser aplicado em uma variável que seja 
originalmente ordinal, enquanto que o teste t exige uma escala pelo menos intervalar. 
Uma desvantagem é que ao substituir os dados originais por postos, “joga-se fora” 
alguma informação. Se as condições para o teste t são satisfeitas, ainda assim poder-
se-ia usar o teste de Mann-Whitney, mas ele não seria tão poderoso quanto o teste t. 
A estatística U, que é a base para a decisão sobre a aceitação ou não da hipótese de 
nulidade é calculada da seguinte maneira: É formado um conjunto W, com todos os 
dados das duas amostras (A e B), O conjunto W é ordenado de forma crescente, 
anota-se a ordem de cada elemento deste conjunto, separam-se novamente as 
amostras A e B, O valor de U é a soma das ordens da amostra A. Quanto mais baixo 
for o valor de U, maior será a evidência de que as populações são diferentes. Isso se 
explica porque U é a soma de ordens, portanto seu valor será baixo se na categoria 
A estiverem os primeiros da ordem (obviamente em B estarão os dados de ordem 
superior). É claro então que neste caso se evidencia uma diferença entre as 
populações. Se as diferenças entre as situações forem aleatórias, como é postulado 
pela hipótese nula, então os resultados devem ser aproximadamente os mesmos e, 
consequentemente, as ordens devem ser também aproximadamente as mesmas para 
as duas situações. Se houver uma preponderância de ordens altas ou baixas numa 
situação ou na outra, então é porque a diferença no total dos resultados ordenados 
para cada situação é devida aos efeitos previstos da variável independente e não ao 
acaso. Se a soma total das ordens for muito baixa para uma das situações, então terá 
de haver uma preponderância de ordens elevadas na outra situação. Quanto menor 
for U mais significativas serão as diferenças entre as ordens das duas situações. Para 
amostras Pequenas (nenhum n>20) A estatística do teste Mann-Whitney (U) é 
calculada a partir dos tamanhos amostrais de cada grupo e a soma dos postos de um 
deles. Existe uma distribuição teórica e exata para a estatística U especialmente 
desenvolvida para amostras pequenas (nenhum n>20), cuja tabela pode ser vista em 
Siegel. Para amostras grandes por outro lado, quando os tamanhos amostrais forem 
de pelo menos dez em cada grupo (n2>20), a aproximação pela distribuição normal 
para a estatística T1 já é razoável. 
6.5 Teste Qui-Quadrado 
É um teste de hipóteses que se destina a encontrar um valor da dispersão para 
duas variáveis categóricas nominais e avaliar a associação existente entre variáveis 
qualitativas. Teste não paramétrico: não depende de parâmetros populacionais (média 
e variância). O princípio básicodeste teste é comparar proporções, ou seja, possíveis 
divergências entre as frequências observadas e esperadas para um certo evento. 
O teste é utilizado para: Verificar se a frequência com que um determinado 
acontecimento observado em uma amostra se desvia significativamente ou não da 
frequência com que ele é esperado. Comparar a distribuição de diversos 
acontecimentos em diferentes amostras, a fim de avaliar se as proporções observadas 
destes eventos mostram ou não diferenças significativas ou se as amostras diferem 
significativamente quanto às proporções desses acontecimentos. Os grupos devem 
ser independentes, os itens de cada grupo são selecionados aleatoriamente, as 
observações devem ser frequências ou contagens, cada observação pertence a uma 
e somente uma categoria, a amostra deve ser relativamente grande (pelo menos 5 
observações em cada célula e, no caso de poucos grupos, pelo menos 10. Exemplo: 
em tabelas 2x 2). 
Para avaliar as possíveis discrepâncias entre proporções observadas e 
esperadas: 
 
A média dos desvios e nula, porem a elevação ao quadrado transforma todos 
os desvios em valores positivos, tornando possível a soma dos desvios sem haver 
cancelamento. O desvio (o - e) entre cada proporção observada e esperada pode ser 
expressa por d, e, portanto, a fórmula também pode ser escrita como 𝑑² 𝑒 
O teste χ2 é, essencialmente, um mecanismo pelo qual os desvios de uma 
proporção hipotética são reduzidos a um único valor, que permite determinar uma 
probabilidade a respeito da casualidade ou não dos desvios entre as proporções 
observadas e esperadas. 
Neste sentido, o X² será o somatório destes desvios, ou seja, 𝜒² = 𝑑² 𝑒. Assim, 
quando as frequências observadas são muito próximas às esperadas, o valor de X² é 
pequeno, e quando as divergências são grandes, consequentemente assume valores 
altos. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
7. CONCLUSÃO 
Podemos concluir que a Estatística se interessa pelos métodos científicos para 
coleta, organização, resumo, apresentação e análise de dados, bem como na 
obtenção de conclusões válidas e na tomada de decisões razoáveis baseadas em tais 
análises. Algumas vezes, o termo Estatística é empregado para designar os próprios 
dados ou números, por exemplo, estatística de empregos, de acidentes etc. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
8. REFERÊNCIAS BIBLIOGRÁFICAS 
LOPES, Manuela de Mesquita; CASTELO BRANCO, Verônica Teixeira Franco; 
SOARES, Jorge Barbosa. Utilização dos testes estatísticos de Kolmogorov-
Smirnov e Shapiro-Wilk para verificação da normalidade para materiais de 
pavimentação. 2013. 
MAGALHAES, m. n.; lima, a. c. p. de. Noções de probabilidade e estatística. São 
Paulo: IME-USP, 2010. 
MORAIS, Carlos. Escalas de medida, estatística descritiva e inferência 
estatística. 2005. 
NIST/SEMATECH. (2013). e-Handbook of Statistical Methods. 
DOI: https://www.itl.nist.gov/div898/handbook/prc/section2/prc213.htm. 
RODRIGUES, m. i., & iemma, a. f. (2009). Planejamento de Experimentos & 
Otimização de Processos (2nd ed.). Casa do Espírito Amigo Fraternidade Fé e 
Amor. 
SANTOS, Carla. Estatística descritiva. Manual de auto-aprendizagem, v. 2, 2007. 
SIEGEL, s. castellan jr, n.j. Estatísticas não paramétrica para ciências do 
comportamento. Edição: Artimed, 2006. 448p 
SHAPIRO, a. s. s., & wilk, m. b. (1965). An Analysis of Variance Test for Normality 
(Complete Samples). Biometrika, 52(3/4), 591–611. 
Link: https://doi.org/https://doi.org/10.2307/2333709. 
TRIOLLA, M. F. Introdução a Estatísticas. 9 ed. Cidade: Editora, 2005 
 
https://www.itl.nist.gov/div898/handbook/prc/section2/prc213.htm
https://doi.org/https:/doi.org/10.2307/2333709

Continue navegando