Baixe o app para aproveitar ainda mais
Prévia do material em texto
DEFINIÇÃO Conceito de Estatística e sua aplicação. Medidas de tendência central e de dispersão. Construção de tabelas de distribuição de frequência e aplicação de testes estatísticos. PROPÓSITO Compreender o conceito e a origem da Estatística objetivando tomar decisões baseadas em dados e evidências para oferecer um diferencial em um mercado cada vez mais competitivo. PREPARAÇÃO Antes de iniciar o conteúdo deste tema, tenha em mãos uma calculadora científica ou use a calculadora de seu smartphone/computador. OBJETIVOS MÓDULO 1 Identificar as fases do método estatístico e seus conceitos norteadores MÓDULO 2 Aplicar as medições de posição ou tendência central MÓDULO 3 Aplicar as medições de dispersão MÓDULO 4 Aplicar testes estatísticos para tomada de decisões INTRODUÇÃO A estatística é definida como um conjunto de métodos e técnicas de tratamento de dados para a tomada de decisão. É um meio de pensar nas soluções de problemas práticos e não apenas em um amontoado de números e fórmulas. É uma ferramenta que, se usada adequadamente, pode prestar valiosa ajuda no processo de desenvolvimento de conhecimentos, podendo ser aplicada a praticamente todas as áreas do conhecimento. Veremos, neste tema, que a Estatística é um segmento da Matemática Aplicada, dividida em cinco etapas, que ficam a cargo da coleta, organização, descrição, análise e interpretação de dados. Para dar embasamento ao tomador de decisão na utilização dos dados, as três primeiras etapas – coleta, organização e a descrição dos dados – ficam a cargo da Estatística Descritiva. Já a análise e a interpretação desses dados ficam a cargo da Estatística Indutiva ou Inferencial. MÓDULO 1 Identificar as fases do método estatístico e seus conceitos norteadores FASES DO MÉTODO ESTATÍSTICO A estatística tem um papel fundamental na geração de conhecimento. Por meio do seu uso, governos, empresas, pesquisadores, universidades, escolas e organizações de diversas naturezas atuam na formulação de soluções dos problemas da sociedade contemporânea. Com o advento da tecnologia, novos problemas são criados e não podemos utilizar soluções antigas para esses problemas. Vejamos as etapas da Estatística: (Fonte: AdresiaStock / Shutterstock) FASE 1: COLETA DE DADOS A primeira etapa no processo de um estudo estatístico, após o planejamento dos objetivos que serão pesquisados e a devida determinação das características mensuráveis do que se quer pesquisar, é darmos início à coleta dos dados numéricos necessários à sua descrição. FASE 2: ORGANIZAÇÃO DOS DADOS Obtidos os dados, eles devem ser cuidadosamente criticados, em busca de possíveis falhas e imperfeições. FASE 3: APURAÇÃO DOS DADOS Nada mais é do que a soma e o processamento dos dados obtidos e a disposição mediante critérios de classificação. FASE 4: EXPOSIÇÃO E APRESENTAÇÃO DOS DADOS Os dados devem ser apresentados de forma adequada (tabelas ou gráficos), tornando mais fácil a interpretação do que está sendo objeto de tratamento estatístico. FASE 5: ANÁLISE DOS RESULTADOS O objetivo da Estatística é tirar conclusões sobre o todo (população) a partir de informações fornecidas por parte representativa do todo (amostra). FASES DO MÉTODO ESTATÍSTICO Assim, realizadas as fases anteriores, podemos fazer uma análise dos resultados obtidos por meio dos métodos da Estatística Indutiva ou Inferencial, e tiramos desses resultados conclusões e previsões. Agora vamos entender o conceito de população e amostra. POPULAÇÃO E AMOSTRA Toda pesquisa estatística precisa atender a um público, pois é com base nesse conjunto de pessoas que os dados são coletados e analisados de acordo com o objetivo da pesquisa. Ao conjunto de entes portadores de, pelo menos, uma característica comum denominamos população estatística ou universo estatístico. Uma amostra é um subconjunto finito de uma população, segmento ou parte do grupo. Isso porque seria impossível coletar os dados de toda uma população de eleitores, por exemplo. Agora que você já entendeu os conceitos de população e amostra, é importante compreender que existem diversos tipos de variáveis que vão influenciar e ser influenciadas por essas amostras. (Fonte: hobbit / Shutterstock) TIPOS DE VARIÁVEIS Imagine que o país é assolado por uma pandemia. Surge um novo vírus, que tem altas taxas de contaminação e mortalidade. Os responsáveis pela tomada de decisão precisam agir rápido para frear os impactos desta doença. Contudo, esses gestores têm pouca informação sobre o que fazer. Surge a necessidade de conhecer cada fenômeno que corresponde a um número de resultados possíveis. Cada um desses fenômenos é chamado de Variável. (Fonte: Blue Planet Studio / Shutterstock) SAIBA MAIS As variáveis nos estudos estatísticos são os fatores que possuem determinadas características dentro de uma pesquisa e podem ser classificadas em qualitativas e quantitativas. Uma Variável é uma característica comum que pode ser observada ou medida nos elementos de uma população; é cada um dos resultados possíveis de um fenômeno. VARIÁVEL QUALITATIVA Não podem ser expressas numericamente, pois seus valores são expressos por atributos ou qualidades, como, por exemplo, sexo e religião. Podem ser divididas em: Qualitativas nominais - apresentam uma característica ou qualidade simples, por exemplo, nome, endereço, cidade; Qualitativas ordinais - representam uma ordem que não pode ser alterada, por exemplo, meses de uma gravidez e nível de escolaridade. VARIÁVEL QUANTITATIVA Neste caso, os valores são expressos em números, por exemplo, salário ou idade. Se uma variável for identificada como quantitativa, pode ser discreta ou contínua. De modo geral, as contagens dão origem a variáveis discretas e as mensurações dão origem a variáveis contínuas. Por exemplo, o número de alunos de uma escola pode assumir qualquer um dos valores do conjunto dos números inteiros, mas nunca valores decimais, por exemplo, 2,5 ou 3,78. Logo, é uma variável discreta. Por outro lado, o peso ou altura dos alunos é uma variável contínua, pois um dos alunos pode pesar tanto 77kg como 82,66kg etc. Agora veja no quadro abaixo um resumo sobre as variáveis. (Fonte: o Autor) TEORIA NA PRÁTICA 1. Você seria capaz de identificar os tipos de variáveis na tabela a seguir? Pesquisa sobre o tratamento de uma doença (Rio de Janeiro) Indivíduo Município Idade Estado civil Nível de escolaridade Tempo de internação em dias Renda familiar 1 Duque de Caxias 40 Solteiro Fundamental 6 1.000 2 Niterói 25 Casado Médio 4 2.500 3 Rio de Janeiro 67 Casado Superior 9 3.000 Fonte: Elaborado pelo autor. RESOLUÇÃO Variáveis qualitativas nominais: município, estado civil; Variáveis qualitativas ordinais: nível de escolaridade; Variáveis quantitativas discretas: idade, tempo de internação em dias; Variáveis quantitativas contínuas: renda familiar. DADOS BRUTOS E ROL DE DADOS Imagine que surge a necessidade de realizar uma pesquisa sobre o tempo de recuperação dos pacientes, em dias, acometidos por uma doença X e que os dados são expostos de acordo com o quadro abaixo. 2 4 5 7 12 2 20 25 4 4 12 7 10 2 48 33 5 3 24 6 11 4 50 33 9 3 24 5 1 4 51 33 2 3 36 5 1 1 15 11 2 1 3 1 2 1 15 31 1 4 4 1 2 1 16 33 1 2 8 1 5 1 11 33 Fonte: Elaborado pelo autor. A princípio, temos uma dificuldade em estabelecer em torno de qual valor tendem a se concentrar os dias de recuperação dos pacientes, ou ainda a determinar se a recuperação se concentra acima ou abaixo de determinado dia. Isso acontecer por estarmos lidando com dados brutos, aqueles que ainda não foram numericamente ordenados. javascript:void(0) DADOS BRUTOS São dados primariamente levantados ou reunidos, têm uma característica aleatória. SAIBA MAIS A partir dos dados brutos, você pode organizá-los de forma crescente ou decrescente. Esse arranjo de dados ordenados é chamado de Rol de dados. TEORIA NA PRÁTICA 2. Você seria capaz de ordenar os dados da tabela anterior,criando, assim, o rol de dados? 1 1 2 4 5 9 15 33 1 1 2 4 5 10 16 33 1 1 2 4 5 11 20 33 1 1 2 4 5 11 24 33 1 2 3 4 6 11 24 36 1 2 3 4 7 12 25 48 1 2 3 4 7 12 31 50 1 2 3 5 8 15 33 51 Fonte: Elaborado pelo autor. Agora, fica mais fácil identificar quantos pacientes necessitaram de dois dias para se recuperar, por exemplo. Podemos, também, encontrar facilmente a amplitude total (AT) desta tabela. Para isso, basta subtrair o maior elemento pelo menor elemento deste rol. Assim, teremos: javascript:void(0) AMPLITUDE TOTAL (AT) A amplitude total é a diferença entre o maior e o menor valor observado. AT = L – L AT = 51 – 1 AT = 50 Atenção! Para visualização completa da equação utilize a rolagem horizontal DISTRIBUIÇÃO DE FREQUÊNCIA Um dos objetivos da estatística é o de organizar e resumir os dados coletados e mostrar as informações em forma de tabelas. Portanto, as tabelas são um dos instrumentos mais usados em análise e interpretação de dados, pois permitem uma conclusão rápida sobre o assunto em estudo. (Fonte: vinnstock / Shutterstock) Uma distribuição de frequência pode ser expressa em um tipo de tabela que deve ser completada a partir da coleta de dados com as informações de: Frequência Simples (fi); Frequência Relativa (fri %); Frequência Acumulada (Fi); Frequência Acumulada Relativa (Fri %). FREQUÊNCIA SIMPLES (FI) A frequência simples, representada por fi indica a ocorrência de vezes que um elemento aparece em uma observação estatística. TEORIA NA PRÁTICA Exemplo: Um profissional de saúde coletou a idade dos 25 infectados por uma doença e organizou da seguinte forma: Rol de Dados 20 25 45 50 60 20 25 45 50 60 20 25 45 50 60 20 30 45 50 60 20 30 45 60 60 Fonte: Elaborado pelo autor. Tabela de distribuição de frequência Idade (xi) frequência (fi) 20 5 25 3 30 2 45 5 50 4 60 6 Fonte: Elaborado pelo autor. RESOLUÇÃO A partir a coleta de dados, o profissional da saúde pode realizar a tabulação, em que cada elemento é ordenado na coluna Idade, chamada de xi, e cada ocorrência deste elemento será inserido na coluna frequência simples (fi). Após a conclusão da tabela, precisamos realizar o somatório da coluna fi. Para isso, utilizamos o símbolo ∑ (sigma) que representa uma auto soma dos elementos. Assim, podemos dizer que o somatório da frequência simples (∑fi) será 25. FREQUÊNCIA RELATIVA (FRI %) A frequência relativa apresenta seus elementos em forma de porcentagem. Para isso, temos uma fórmula: FRI = FI N X 100 Atenção! Para visualização completa da equação utilize a rolagem horizontal TEORIA NA PRÁTICA Neste caso, temos a divisão de cada um dos elementos da série pelo total de elementos. Esse resultado apresenta a participação percentual do elemento. Assim, teremos a tabela de distribuição de frequência com a inclusão da coluna frequência relativa (fri): Idade frequência (fi) Frequência relativa (fri) % 20 5 20 25 3 12 30 2 8 45 5 20 50 4 16 60 6 24 ∑fi = 25 ∑fri = 100% Fonte: Elaborado pelo autor. RESOLUÇÃO fr1 = f1 n = 5 25 = 0 ,20 fr2=f2n=325=0,12 x 100=12% fr3=f1n=225=0,08 x 100=8% fr4=f1n=525=0,20 x 100=20% fr5=f1n=425=0,16 x 100=16% fr6=f1n=625=0,24 x 100=24% Atenção! Para visualização completa da equação utilize a rolagem horizontal O resultado do somatório da coluna fri será um valor igual ou próximo de 100%. FREQUÊNCIA ACUMULADA DE UM ELEMENTO DA SÉRIE – FI OU FRI É a soma da frequência simples deste elemento com a frequência simples dos elementos que o antecedem. Ele é utilizado para apresentar o valor acumulado das frequências. A frequência simples acumulada é representada por Fi (F maiúsculo). Já a frequência relativa acumulada é representada por Fri (F também maiúsculo). Assim, teremos: Fi = frequência simples acumulada; FI=F1+F2+F3+…+FI Atenção! Para visualização completa da equação utilize a rolagem horizontal Fri = frequência relativa acumulada. FRI=FR1+FR2+FR3+…+FRI Atenção! Para visualização completa da equação utilize a rolagem horizontal EXEMPLO Observe a tabela a seguir. Precisamos encontrar a frequência acumulada. Tanto a frequência simples acumulada (fi) como a frequência relativa acumulada (Fri) estão estabelecidas: xi fi Fi fri % Fri % 20 5 5 20 20 25 3 8 12 32 30 2 10 8 40 45 5 15 20 60 50 4 19 16 76 60 6 25 24 100 Fonte: Elaborado pelo autor. TEORIA NA PRÁTICA Como chegamos a esses resultados? Vamos encontrar a frequência simples acumulada (Fi): Para isso, usaremos como referência a frequência simples. O primeiro elemento desta nova coluna será o primeiro elemento da coluna da frequência simples. Neste caso, será cinco. O segundo elemento será o valor anterior, já encontrado, que é o cinco, somado à próxima frequência que é o três. Teremos 5 + 3 = 8, esse será o valor do segundo elemento da frequência simples acumulada. Agora, basta repetir o processo assim por diante. RESOLUÇÃO Veja na fórmula: Fi=f1+f2+f3+…+fi F1=f1=5 F2=f1+f2=5+3=8 F3=f1+f2+f3=8+2=10 F6=f1+f2+f3+f4+f5+f6=10+5=15 F7=f1+f2+f3+f4+f5+f6+f7=15+4=19 F8=f1+f2+f3+f4+f5+f6+f7+f8=19+6=25 Atenção! Para visualização completa da equação utilize a rolagem horizontal O último elemento da frequência simples acumulada deve ser igual ao somatório da frequência simples. TEORIA NA PRÁTICA Como encontrar a frequência relativa acumulada? A construção será a mesma da frequência simples acumulada. Contudo, agora, a coluna de referência será a coluna da frequência relativa. Assim, teremos: O primeiro elemento desta nova coluna será o primeiro elemento da coluna da frequência relativa. Neste caso, será 20%. O segundo elemento será o valor anterior, já encontrado, que é 20%, somado à próxima frequência relativa que é o 12%. Teremos 20 + 12 = 32%, esse será o valor do segundo elemento da frequência relativa acumulada. Como antes, o processo continua. RESOLUÇÃO Veja na fórmula: Fri=fr1+fr2+fr3+…+fri Fr1=fr1=20 Fr2=fr1+fr2=20+12=32 Fr3=fr1+fr2+fr3=32+8=40 Fr4=fr1+fr2+fr3+fr4+fr5+fr6=40+20=60 Fr5=fr1+fr2+fr3+fr4+fr5+fr6+fr7=60+16=76 Fr6=fr1+fr2+fr3+fr4+fr5+fr6+fr7+fr8=76+24=100 Atenção! Para visualização completa da equação utilize a rolagem horizontal O último elemento da frequência relativa acumulada será um valor igual ou próximo de 100%. DICA: Utilize duas casas decimais após a vírgula! DISTRIBUIÇÃO DE FREQUÊNCIA COM VARIÁVEL CONTÍNUA Na construção de uma tabela, com dados de uma variável quantitativa contínua, usamos uma distribuição de frequências com intervalos de classes quando temos dados com valores dispersos. DICA Tabelas com dados acima de 25 elementos costumam ser melhor empregadas neste tipo de tabela. Para isso, alguns elementos precisam ser conhecidos, pois há a necessidade de apresentar os dados por meio de um intervalo de classes. Anteriormente, na construção de uma tabela, cada um dos elementos que compõem o rol é chamado de xi e cada ocorrência deste valor é chamado de fi. Nas variáveis contínuas, não temos a figura do xi, não de forma explicita. COMENTÁRIO Com isso, para encontrar o xi utilizamos a fórmula: (L+l)2,em que L é o limite superior e l é o limite inferior. Mas, onde encontrar esses limites? Antes de responder, vamos conhecer os elementos essenciais para a construção de uma tabela de distribuição de frequência, com uma variável contínua. Já sabemos que as variáveis contínuas são aquelas que expressam valores fracionados. São dados pertencentes a um conjunto dos números reais, que podem receber valores inteiros e decimais. Assim, precisaremos dos elementos nesta ordem: ATENÇÃO 1º – Amplitude total, encontrada pela fórmula: AT=L-l; 2º – Valor de k, encontrado pela fórmula: n; 3º – Número de classes, encontrado pela fórmula: N.classes=ATk. Vamos ao exemplo: Um hospital registrou a pressão arterial sistólica (mmHg) de 40 pacientes, conforme rol: 70 90 100 110 123 71 93 102 115 123 73 95 103 115 123 76 97 105 115 123 80 97 105 117 124 81 97 109 117 124 83 99 109 121128 86 99 109 121 128 Fonte: Elaborado pelo autor. Antes de iniciar a montagem da tabela, precisaremos encontrar: ETAPA 1 1º – Amplitude total, encontrada pela fórmula: AT=L-l Atenção! Para visualização completa da equação utilize a rolagem horizontal AT = 128 (maior valor do ROL) – 70 (menor valor do ROL) = 58 ETAPA 2 2º – Valor de k, encontrado pela fórmula: n Atenção! Para visualização completa da equação utilize a rolagem horizontal 40=6,32 podemos arredondar este valor para um inteiro, para cima ou para baixo. Vamos arredondar para baixo, ou seja 6. ETAPA 3 3º – Número de classes, encontrado pela fórmula: javascript:void(0) javascript:void(0) javascript:void(0) N. classes=ATk Atenção! Para visualização completa da equação utilize a rolagem horizontal N. classes=586 =9,66 podemos também arredondar para um inteiro. Vamos arredondar para cima, ou seja 10. Assim, podemos criar 10 classes com intervalo de 6 ou 6 classes com intervalo de 10. Vamos optar pela segunda. Tabela de distribuição de frequência Número de classes Intervalo de classes Frequência 1 70 Ⱶ 80 4 2 80 Ⱶ 90 4 3 90 Ⱶ 100 8 4 100 Ⱶ 110 8 5 110 Ⱶ 120 6 6 120 Ⱶ 130 10 Fonte: Elaborado pelo autor. Para construir os intervalos, partimos do limite inferior da primeira classe, ou seja, o menor valor presente no rol de dados, neste caso, 70. Como usaremos o intervalo igual a 10, o limite superior desta primeira classe será 70 + 10 = 80. Para a segunda classe, para o limite inferior, iremos repetir o 80 da classe anterior e somar ao intervalo. Assim, teremos: 80 + 10 = 90. Esse será o limite superior da segunda classe. Seguiremos até a construção da sexta classe. Agora, vamos encontrar a frequência. Para isso, basta consultar o rol e contar os valores dentro de cada intervalo. Na construção dos intervalos, temos o símbolo Ⱶ que representa fechado à esquerda, aberto à direita. Isso significa que, fechado, inclui o limite inferior. Aberto, exclui o limite superior. Observe: Para a construção da frequência, precisamos contar os valores de cada intervalo, assim temos: Tipo do intervalo Símbolo Valor incluídos no intervalo Fechado à esquerda Aberto à direita 70 Ⱶ 80 70, 71, 73, 76 Fonte: Elaborado pelo autor. No intervalo 70 a 80, temos o limite inferior de 70 e o limite superior de 80. Como o intervalo é fechado à esquerda, podemos incluir o 70. Porém, no limite superior, como é aberto à direita, não incluímos o 80. Na contagem da frequência da primeira classe, ao consultarmos o rol, contamos quantos elementos estão presentes neste intervalo. Neste caso, apenas 4 elementos atendem a esse intervalo. Assim, a frequência da primeira classe será 4. DICA Deve-se proceder da mesma forma para encontrar a frequência relativa, frequência acumulada e frequência acumulada relativa. VERIFICANDO O APRENDIZADO 1. UMA GRANDE CLÍNICA RADIOLÓGICA CONTRATOU UMA EMPRESA DE CONSULTORIA NA ÁREA DE FÍSICA MÉDICA PARA REALIZAR AUDITORIA NAS SALAS DE MAMOGRAFIA. ELA FOI CONSTRUINDO A DISTRIBUIÇÃO DE FREQUÊNCIA ABAIXO INFORMANDO QUE, DAS OITO SALAS DESTINADAS AO EXAME DE MAMOGRAFIA, CINCO APRESENTARAM NÃO CONFORMIDADE COMO APRESENTADO A SEGUIR. MARQUE A OPÇÃO QUE POSSUI A FREQUÊNCIA RELATIVA ACUMULADA. XI FI FI FRI % FRI % 1 6 2 14 3 16 4 10 5 4 A) 6 | 20 | 36 | 46 | 50 B) 12 | 28 | 32 | 20 | 8 C) 12 | 40 | 72 | 92 | 100 D) 6 | 14 | 16 | 10 | 4 2. OS DADOS A SEGUIR REPRESENTAM O TEMPO DE EXPOSIÇÃO EM 35 TOMÓGRAFOS DE DIFERENTES COLIMAÇÕES NT PARA O EXAME DE ABDÔMEN. A PARTIR DESSA ANÁLISE, MARQUE A OPÇÃO QUE APRESENTA A AMPLITUDE TOTAL. 900 2000 4100 4700 4900 1000 2500 4200 4800 4900 1200 2900 4300 4800 4900 1500 3000 4400 4800 4900 1900 3200 4500 4800 4900 2000 4000 4500 4800 4900 2000 4100 4500 4800 4900 A) 4900 B) 900 C) 4000 D) 5800 GABARITO 1. Uma grande clínica radiológica contratou uma empresa de consultoria na área de física médica para realizar auditoria nas salas de mamografia. Ela foi construindo a distribuição de frequência abaixo informando que, das oito salas destinadas ao exame de mamografia, cinco apresentaram não conformidade como apresentado a seguir. Marque a opção que possui a frequência relativa acumulada. xi fi Fi fri % Fri % 1 6 2 14 3 16 4 10 5 4 A alternativa "C " está correta. A frequência relativa acumulada deve apresentar os valores somados à frequência anterior, usando como base a coluna da frequência relativa. Assim, teremos: 12 | 40 | 72 | 92 | 100. 2. Os dados a seguir representam o tempo de exposição em 35 tomógrafos de diferentes colimações NT para o exame de abdômen. A partir dessa análise, marque a opção que apresenta a amplitude total. 900 2000 4100 4700 4900 1000 2500 4200 4800 4900 1200 2900 4300 4800 4900 1500 3000 4400 4800 4900 1900 3200 4500 4800 4900 2000 4000 4500 4800 4900 2000 4100 4500 4800 4900 A alternativa "C " está correta. A Amplitude total, encontrada pela fórmula: AT=L-L Atenção! Para visualização completa da equação utilize a rolagem horizontal AT = 4900 (maior valor do ROL) – 900 (menor valor do ROL) = 4000 MÓDULO 2 Aplicar as medições de posição ou tendência central A IMPORTÂNCIA DA MÉDIA NO CONTROLE DA QUALIDADE MEDIDAS DE POSIÇÃO OU TENDÊNCIA CENTRAL As medidas de tendência central são usadas para sumarizar um conjunto de dados em um único valor. Procura-se definir um valor que represente bem a distribuição da variável de interesse. Se a distribuição for do tipo simétrica, ou seja, quando as observações estão igualmente distribuídas em torno de um valor (metade acima e metade abaixo), você pode usar a medida de tendência central conhecida como média aritmética. (Fonte: PopTika / Shutterstock) Uma medida de tendência central ou posição de um conjunto de dados mostra o valor em torno do qual se agrupam as observações. A seguir você conhecerá as três medidas de tendência central mais utilizadas: média, mediana e moda. Medidas Significado Média Valor que representa o ponto de equilíbrio. Moda Valor que representa a frequência que mais se repete. Mediana Valor que separa um conjunto de dados em duas partes iguais, o elemento meio que representa 50%. Fonte: Elaborado pelo autor. CONCEITOS MÉDIA É usada quando a distribuição dos dados for simétrica, tendo em vista que ela é influenciada por valores extremos. A média pode ser obtida pelo quociente da soma de todos os dados do experimento e o número total de dados. Existem vários tipos de média, mas focaremos nosso estudo na média aritmética simples, de modo geral, a mais importante de todas elas. SAIBA MAIS A média aritmética simples é calculada por meio da soma de todos os elementos dividida pela quantidade de elementos. Para o cálculo, somam-se todos os valores e, em seguida, divide-se pelo número de observações (n). A fórmula é dada por: X¯=∑XIN Atenção! Para visualização completa da equação utilize a rolagem horizontal Lê-se: x barra é igual ao somatório de xi divido por n. Imagine que temos um grupo de elementos: 2, 4, 6, 8 e nosso objetivo é calcular a média. Teremos: X¯=∑(2+4+6+8)4=5 Atenção! Para visualização completa da equação utilize a rolagem horizontal TEORIA NA PRÁTICA O nutricionista do Núcleo de Apoio à Saúde da Família (NASF) de um município coletou o número de paciente mulheres atendidas na Unidade Básica de Saúde, durante 5 dias. Obtendo os seguintes valores: 6; 8; 7; 5; 9. Calcule a média dos atendimentos. X¯=∑6+8+7+5+95=7 Atenção! Para visualização completa da equação utilize a rolagem horizontal RESOLUÇÃO O cálculo da média, para um pequeno grupo de dados, é relativamente simples. Basta somar todos os elementos e dividir pela quantidade. Contudo, caso tenhamos um grupo maior de dados, podemos agrupá-los em formato de uma tabela de distribuição de frequência. O modo mais prático de obtenção da média com os dados agrupados é abrir, na tabela, uma colunacorrespondente aos produtos xifi, temos a fórmula: X¯=∑XIFI∑FI Atenção! Para visualização completa da equação utilize a rolagem horizontal Lê-se: Somatório de xi multiplicado fi, dividido pelo somatório de fi. EXEMPLO xi fi xifi 0 2 0 1 6 6 2 10 20 3 12 36 4 4 16 ∑ 34 78 Fonte: Elaborado pelo autor. ∑XIFI=78 ∑FI=34 X¯=∑XIFI∑FI=7834=2,29=2,30 Atenção! Para visualização completa da equação utilize a rolagem horizontal MÉDIA ARITMÉTICA COM INTERVALO DE CLASSE ESTATURAS EM CM FREQUÊNCIA Xifi xi 150 Ⱶ 154 4 608 152 154 Ⱶ 158 9 1404 156 158 Ⱶ 162 11 1760 160 162 Ⱶ 166 8 1312 164 166 Ⱶ 170 5 840 168 170 Ⱶ 174 3 516 172 TOTAL 40 6440 - Fonte: Elaborado pelo autor. O cálculo da média aritmética simples, com intervalo de classe, tem a mesma fórmula. Somatório de todos os elementos do produto xifi, dividido pelo somatório da frequência simples, que também será o valor de n. X¯=∑XIFI∑FI=644040=161CM Atenção! Para visualização completa da equação utilize a rolagem horizontal MODA Representa o valor mais frequente em uma distribuição, ou seja, aquele valor que mais se repete. Ela só é uma boa medida de tendência central em distribuições simétricas com um tamanho amostral grande. Em distribuições pequenas, tende a assumir valores afastados do centro, por essa razão é muito pouco usada. Se mais de um valor se repete com a mesma frequência, isso significa que não temos frequência significativa, a distribuição será amodal, ou seja, ausência de moda. Para determinar o valor da moda de uma série de observações, devemos organizar os dados em formato de rol e verificar qual o número que tem a maior ocorrência. Exemplos: UNIMODAL 1 ; 4 ; 4 ; 4 ; 5 ; 5 ; 7 ; 9 ; 12. Apenas o número quatro tem maior frequência. BIMODAL 3 ; 3 ; 3 ; 3 ; 4 ; 4 ; 4 ; 4. Temos agora, dois números que se repetem a mesma quantidade de vezes. Se, por acaso, um dos números se repetisse em quantidade menor, a moda seria Unimodal. AMODAL 1; 2 ; 3 ; 4 ; 5 ; 6 ; 7 ; 8 ; 10 ; 12. Se mais de um valor se repete com a mesma frequência, isso significa que não temos frequência significativa, a distribuição será amodal, ou seja, ausência de moda. Todos os números têm apenas a frequência 1. MODA COM INTERVALO DE CLASSES Para encontrar a moda em uma tabela com intervalo de classes, precisamos encontrar a classe com a maior frequência, depois aplicamos a fórmula. Esse asterisco ( * ), que aparece na fórmula, significa que a moda será calcula pelos intervalos da classe com maior frequência, também chamada de classe modal. MO=(L *+ L*)2 Atenção! Para visualização completa da equação utilize a rolagem horizontal l* é o limite inferior da classe modal; L* é o limite superior da classe modal. TEORIA NA PRÁTICA Com base na tabela a seguir, calcule a moda. ESTATURAS EM CM FREQUÊNCIA Xifi xi 150 Ⱶ 154 4 608 152 154 Ⱶ 158 9 1404 156 158 Ⱶ 162 11 1760 160 162 Ⱶ 166 8 1312 164 166 Ⱶ 170 5 840 168 170 Ⱶ 174 3 516 172 TOTAL 40 6440 - Fonte: Elaborado pelo autor. RESOLUÇÃO Antes de calcular a moda, precisamos encontrar a classe modal. Essa classe é a terceira, pois tem a maior frequência. Agora, basta realizar a média aritmética simples do seu intervalo: MO=(L*+ L*)2 MO=(158+162)2 MO=3202=160CM Atenção! Para visualização completa da equação utilize a rolagem horizontal MEDIANA A mediana (Md) é usada quando a distribuição dos dados for assimétrica, pois ela é uma medida de posição (ou posto). A mediana não leva em conta a magnitude das observações, tendo em vista que ela se baseia apenas na ordenação dos valores e não na sua expressão numérica. Assim, perde-se informação quando se usa mediana. Ela também divide a distribuição ou conjunto de dados em duas partes iguais. Para aplicar a medida da mediana é necessário que a variável possa ser ordenada em forma de um rol. Veja o exemplo, de como encontrar a mediada de dados não agrupados: Dada uma série de valores: 5, 13, 10, 2, 18, 15, 6, 16, 9 De acordo com a definição de mediana, o primeiro passo a ser dado é ordenar os valores: 2, 5, 6, 9, 10, 13, 15, 16, 18. Md = 10 Número ímpar de observações: É o valor do item médio ou central. Ex.: 4; 7; 8; 9; 12; 13; 17 A mediana é 9. Número par de observações: Quando os números são pares, tem-se dois elementos centrais e a mediana será a média aritmética. Ex.: 4; 7; 8; 10; 12; 13; 17; 20 A mediana será: MD=(10+12)2 MD=222 MD=11 Atenção! Para visualização completa da equação utilize a rolagem horizontal MEDIANA DE DADOS AGRUPADOS SEM INTERVALO DE CLASSES Precisamos identificar a frequência acumulada imediatamente superior à metade da soma das frequências. A mediana será aquele valor da variável que corresponde a tal frequência acumulada. (Fonte: o Autor) Md = 2 meninos No caso de existir uma frequência acumulada (F1), tal que: FI=(ΣF1)÷2 Atenção! Para visualização completa da equação utilize a rolagem horizontal A mediana será dada por: MD=[(XI+XI+1)]÷2 Atenção! Para visualização completa da equação utilize a rolagem horizontal (Fonte: o Autor) Sendo: (∑FI)÷2=8÷2=4 Atenção! Para visualização completa da equação utilize a rolagem horizontal Logo: MD=(15+16)÷2 =31÷2= =15,5 MD=15,5 MENINOS Atenção! Para visualização completa da equação utilize a rolagem horizontal MEDIANA DE DADOS AGRUPADOS COM INTERVALO DE CLASSES Na prática, devemos seguir 3 passos: 1º – Determinar as frequências acumuladas (Fi); 2º – Calcular ∑fi2; 3º – Identificar a classe correspondente à frequência acumulada imediatamente anterior, em seguida aplicar a fórmula: MD=L+(∑FI2-FI(ANTERIOR).HFI Atenção! Para visualização completa da equação utilize a rolagem horizontal EXEMPLO (Fonte: o Autor) MD=L*+(∑FI2-FI(ANTERIOR).H*FI* Atenção! Para visualização completa da equação utilize a rolagem horizontal Com base na fórmula, vamos identificar seus elementos? l*→ limite inferior, o asterisco significa que será da classe que tiver a maior frequência; neste caso, a terceira classe tem a maior frequência 11. O limite inferior desta classe é 30. ∑fi2 a Somatório das frequências dividido por 2. Fi(anterior) → Frequência acumulada anterior, identifique a classe com a maior frequência. Agora, identifique a frequência acumulada. Por último, a fórmula pede a anterior que é 13. h* → amplitude da classe com maior frequência. A amplitude será a subtração do limite superior pelo limite inferior. Lembra-se do asterisco? Então, significa classe com a maior frequência; fi* → maior frequência da tabela, ou seja, 11. Agora, basta substituir e resolver a fórmula: MD=30+(402-13).1011 RESPOSTA: MD=36,36 Atenção! Para visualização completa da equação utilize a rolagem horizontal VERIFICANDO O APRENDIZADO 1. CONSIDERE A SÉRIE DE MEDIDAS A SEGUIR PARA AS DOSES DE ENTRADA NA PELE (DEP), EM MGY, PARA UM MAMÓGRAFO 5, 6, 6, 7, 7, 8, 8, 8, 8. MARQUE A OPÇÃO QUE APRESENTA A MÉDIA, A MODA E A MEDIANA, RESPECTIVAMENTE: A) 7 | 8 | 7 B) 5 | 6 | 7 C) 6 | 7 | 8 D) 7 | 7 | 7 2. A DISTRIBUIÇÃO DE FREQUÊNCIA ABAIXO INDICA A QUANTIDADE DE RADIOGRAFIAS QUE FORAM FEITAS EM PACIENTES DE IDADES COMPREENDIDAS ENTRE 5 A 11 DIARIAMENTE. A MÉDIA ARITMÉTICA É APROXIMADAMENTE? XI FI 5 2 7 3 8 5 9 4 11 2 A) 16,7 B) 5,489 C) 8,06 D) 11,0 GABARITO 1. Considere a série de medidas a seguir para as doses de entrada na pele (DEP), em mGy, para um mamógrafo 5, 6, 6, 7, 7, 8, 8, 8, 8. Marque a opção que apresenta a média, a moda e a mediana, respectivamente: A alternativa "A " está correta. Para encontrar as medidas de tendência central em dados não agrupados a partir do rol, devemos observar: Média: Soma dos elementos dividido pela quantidade = 7; Moda: O elemento que mais se repete = 8; Mediana: Ao dividir o grupo em partes iguais, será o elemento central = 7. 2. A distribuição de frequência abaixo indica a quantidadede radiografias que foram feitas em pacientes de idades compreendidas entre 5 a 11 diariamente. A média aritmética é aproximadamente? xi fi 5 2 7 3 8 5 9 4 11 2 A alternativa "C " está correta. O cálculo da média aritmética simples, com dados agrupados, tem a mesma fórmula: X¯=∑XIFI∑FI=12916=8,062 Atenção! Para visualização completa da equação utilize a rolagem horizontal Somatório de todos os elementos do produto xifi dividido pelo somatório da frequência simples, que também será o valor de n. MÓDULO 3 Aplicar as medições de dispersão MEDIDAS DE DISPERSÃO As medidas de tendência central (média, moda e mediana) fornecem um resumo parcial das informações de um conjunto de dados. A necessidade de uma medida de variação é aparente, para que nos permita, por exemplo, comparar conjuntos diferentes de valores. Algumas características desta medida devem ser atendidas como veremos a seguir. (Fonte: higyou / Shutterstock) CONCEITOS AMPLITUDE É definida como a diferença entre o mais alto valor (estatística denominada máximo) e o mais baixo valor (estatística denominada mínimo). A amplitude, portanto, só considera os extremos (valor máximo e valor mínimo) e pode não captar bem a situação verdadeira. javascript:void(0) AMPLITUDE A amplitude de uma amostra é a diferença entre o máximo e o mínimo. EXEMPLO Para os valores 25, 29, 38, 51, 52, 77 e 80, temos: AT=L-L AT=80 –25=55 Atenção! Para visualização completa da equação utilize a rolagem horizontal Quanto maior a amplitude total, maior a dispersão ou variabilidade dos valores da variável. VARIÂNCIA E DESVIO-PADRÃO No estudo da Estatística, dispomos de algumas estratégias para verificar se os valores apresentados em um conjunto de dados estão dispersos ou não e o quão distantes um do outro eles podem estar. As ferramentas empregadas para que isso seja possível são classificadas como medidas de dispersão e denominadas de variância e desvio-padrão. A variância mede o afastamento de cada valor em relação à média. Matematicamente, mede o afastamento ao quadrado de cada valor em relação à média e pode ser definida como a média dos quadrados dos desvios das observações em relação à média da amostra. Pode ser calculada da seguinte forma: Variância amostral: S2=(∑XI-X)2N-1 Atenção! Para visualização completa da equação utilize a rolagem horizontal Variância populacional: S2=(∑XI-X)2N Atenção! Para visualização completa da equação utilize a rolagem horizontal TEORIA NA PRÁTICA Foram obtidos os seguintes desvios em relação à média dos dados do estudo sobre a avaliação do índice de massa corporal (IMC) em adolescentes de uma escola pública. Os dados são apresentados a seguir. IMC xi - x (xi - x)2 21,76 1,91 3,65 20,56 0,71 0,50 21,43 1,58 2,50 22,33 2,48 6,15 22,53 2,68 7,18 18,34 -1,51 2,28 17,32 -2,53 6,40 16,22 -3,63 13,18 18,43 -1,42 2,02 19,58 -0,27 0,07 Média = 19,85 - Soma = 43,93 Fonte: Elaborado pelo autor. RESOLUÇÃO S2=(∑XI-X)2N-1 S2=43,9310-1 S2=43,939 S2=4,88 Atenção! Para visualização completa da equação utilize a rolagem horizontal DESVIO-PADRÃO O desvio-padrão representa a raiz quadrada da variância. Calcula a média da dispersão (afastamento) dos valores em relação à média. Em outras palavras, é a raiz quadrada da média dos desvios ao quadrado de cada valor em relação à média. Tem a vantagem de voltar a variável ao seu valor original, por essa razão é mais usada do que a variância. A variância não vem representada na mesma unidade das observações. Se tomarmos a raiz quadrada da variância, obtemos o desvio- padrão que também é uma medida de dispersão e vem na mesma unidade das observações. DESVIO-PADRÃO – MÉTODO PRÁTICO DADOS NÃO AGRUPADOS S=∑XI2N-(∑XIN)2 Atenção! Para visualização completa da equação utilize a rolagem horizontal TEORIA NA PRÁTICA Tomemos como exemplo o conjunto de valores da variável x: 40, 45, 48, 52, 54, 62, 70 O modo mais prático para se obter o desvio-padrão é formar uma tabela com duas colunas, assim como fizemos na variância, uma para xi e outra para xi2. xi xi2 40 1600 45 2025 48 2304 52 2704 54 2916 62 3844 70 4900 ∑xi = 371 ∑xi2 = 20.293 Fonte: Elaborado pelo autor. RESOLUÇÃO S=202937-(3717)2 S=2899-532 S=90=9,486 Atenção! Para visualização completa da equação utilize a rolagem horizontal DESVIO-PADRÃO – MÉTODO PRÁTICO DADOS AGRUPADOS Como, neste caso, temos a presença de frequências, temos que levá-las em consideração, resultando na fórmula: S=∑FIXI2N-(∑FIXIN)2 Atenção! Para visualização completa da equação utilize a rolagem horizontal TEORIA NA PRÁTICA O modo mais prático de se obter o desvio-padrão é abrir, na tabela dada, uma coluna para os produtos fixi e outra para fixi2. Exemplo: xi fi fixi fixi2 xi2 0 2 0 0 0 1 6 6 6 1 2 12 24 48 4 3 7 21 63 9 4 3 12 48 16 Σ 30 63 165 - Fonte: Elaborado pelo autor. RESOLUÇÃO S=16530-(6330)2 S=5,5-4,41 S=1,09=1,044 Atenção! Para visualização completa da equação utilize a rolagem horizontal DESVIO-PADRÃO – MÉTODO PRÁTICO DADOS AGRUPADOS COM INTERVALO DE CLASSES ESTATURAS EM CM FREQUÊNCIA xi xi2 fixi fixi2 150 Ⱶ 154 4 152 92416 608 92416 154 Ⱶ 158 9 156 219024 1404 219024 158 Ⱶ 162 11 160 281600 1760 281600 162 Ⱶ 166 8 164 215168 1312 215168 166 Ⱶ 170 5 168 141120 840 141120 170 Ⱶ 174 3 172 88752 516 88752 TOTAL 40 6440 1038080 Fonte: Elaborado pelo autor. S=1.038.08040-(644040)2 S=25.952-25.921 S=31=5,567 Atenção! Para visualização completa da equação utilize a rolagem horizontal COEFICIENTE DE VARIAÇÃO (CV) O coeficiente de variação (CV) representa a dispersão dos dados em termos relativos, ou seja, expressa a variabilidade dos dados tirando a influência da ordem de grandeza da variável, por meio da comparação do desvio-padrão (s) com a média (x). Trata-se de um dado adimensional, ou seja, um número puro, usualmente expresso em porcentagem. É zero quando não há variabilidade entre os dados, isto é, quando s = 0, o que ocorre quando todos os valores da amostra são iguais. É útil para fornecer uma medida de homogeneidade do conjunto de dados. Assim, quanto mais baixo o coeficiente de variação, mais homogêneo é o conjunto de dados. Trata-se de uma forma simples de calcular a dispersão, e por não ter unidade de medida, permite a comparação de variáveis com unidades e médias diferentes. DICA O CV leva em consideração tanto a medida de dispersão absoluta (desvio-padrão) quanto a média da série. É uma medida de dispersão mais completa que uma medida absoluta. Na comparação entre dois ou mais conjuntos de dados, o conjunto com a maior dispersão relativa apresenta a maior dispersão de dados no geral. A medida de dispersão relativa prevalece sobre a medida de dispersão absoluta. Fórmula: CV=SX×100 Atenção! Para visualização completa da equação utilize a rolagem horizontal ATENÇÃO Onde: CV é o coeficiente de variação; S é o desvio padrão; x é a média dos dados. TEORIA NA PRÁTICA Considere os resultados das medidas das estaturas e dos pesos de um mesmo grupo de indivíduos: x s Estaturas 175cm 5,0cm PESOS 68kg 2,0kg Fonte: Elaborado pelo autor. RESOLUÇÃO CVE=5,0175×100=2,85% CVP=2,068×100=2,94% Atenção! Para visualização completa da equação utilize a rolagem horizontal MEDIÇÃO DE INCERTEZAS VERIFICANDO O APRENDIZADO 1. A VARIÂNCIA MEDE O AFASTAMENTO DE CADA VALOR EM RELAÇÃO À MÉDIA. MATEMATICAMENTE, MEDE O AFASTAMENTO AO QUADRADO DE CADA VALOR EM RELAÇÃO À MÉDIA. O DESVIO–PADRÃO DE UM CONJUNTO DE DADOS É 9. A VARIÂNCIA É: A) 3 B) 36 C) 81 D) 18 2. SUPONHA QUE UMA CLÍNICA RADIOLÓGICA TENHA DUAS SALAS DE RAIOS. NA SALA X, O TEMPO MÉDIO DE EXPOSIÇÃO É DE 1.000MS E O DESVIO-PADRÃO É IGUAL A 20MS. NA SALA Y, O TEMPO MÉDIO É DE 500MS E O DESVIO-PADRÃO IGUAL A 5MS. ADMITA QUE CVX É O COEFICIENTE DE VARIAÇÃO DA FILIAL X, E CVY, O COEFICIENTE DE VARIAÇÃO DA FILIAL Y. MARQUE A OPÇÃO DE REPRESENTA,RESPECTIVAMENTE, OS VALORES DO CVX E DO CVY PARA O TEMPO DE EXPOSIÇÃO. A) CVX = 1% e CVY = 5% B) CVX = 2,7% e CVY = 1,8% C) CVX = 5% e CVY = 4% D) CVX = 2% e CVY = 3% GABARITO 1. A variância mede o afastamento de cada valor em relação à média. Matematicamente, mede o afastamento ao quadrado de cada valor em relação à média. O desvio–padrão de um conjunto de dados é 9. A variância é: A alternativa "C " está correta. A variância é a média dos quadrados dos desvios das observações em relação à média da amostra. O desvio-padrão representa a raiz quadrada da variância. Dessa forma, para encontrar a variância basta elevar o 9 ao quadrado. Resultado 81. 2. Suponha que uma clínica radiológica tenha duas salas de raios. Na sala X, o tempo médio de exposição é de 1.000ms e o desvio- padrão é igual a 20ms. Na sala Y, o tempo médio é de 500ms e o desvio-padrão igual a 5ms. Admita que CVX é o coeficiente de variação da filial X, e CVY, o coeficiente de variação da filial Y. Marque a opção de representa, respectivamente, os valores do CVX e do CVY para o tempo de exposição. A alternativa "D " está correta. Para resolver essa questão, basta aplicar a fórmula do coeficiente de variação: CV=SX×100 Atenção! Para visualização completa da equação utilize a rolagem horizontal CVX=201000×100=2% Atenção! Para visualização completa da equação utilize a rolagem horizontal CVY=15500×100=3% Atenção! Para visualização completa da equação utilize a rolagem horizontal MÓDULO 4 Aplicar testes estatísticos para tomada de decisões ESTATÍSTICA INFERENCIAL (Fonte: everything possible / Shutterstock) A Estatística pode ser dividida em duas grandes áreas: a estatística descritiva e a inferência estatística. Na inferência estatística, utilizamos dados amostrais para fazer estimativas, testar hipóteses e fazer previsões sobre características de uma população. Uma amostra constitui uma redução da população a dimensões menores, sem perda das características essenciais. (Fonte: Iamnee / Shutterstock) CONCEITOS TESTES DE HIPÓTESES Neste módulo, vamos concentrar nossos estudos no teste de hipóteses, o qual é um procedimento padrão para se testar uma afirmativa sobre uma propriedade da população (OLIVEIRA, 2018). HIPÓTESES Segundo o dicionário Michaelis, hipótese pode ser definida como uma suposição, com base em evidências, que se pretende explicar ou prever certas observações ou fatos cuja comprovação depende de investigações posteriores. EXEMPLO Com base em estudos anteriores, sabe-se que o efeito imunológico de determinada vacina se prolonga por mais de um ano em apenas 20% das pessoas que a tomam. Uma nova vacina foi desenvolvida para a mesma finalidade, sendo necessário testar sua eficácia sobre a atual, ou seja, se a proporção de pessoas imunizadas após um ano é maior que 20%. Como a eficácia da vacina varia de pessoa para pessoa, precisamos utilizar algum método estatístico para chegarmos a uma conclusão. Por meio de um teste de hipóteses, tomamos decisões em presença da variabilidade, ou seja, verificamos se estamos diante de uma diferença real ou de uma diferença que se deve simplesmente pela flutuação aleatória do processo. javascript:void(0) Para testarmos uma hipótese estatística, devemos estabelecer um par de hipóteses. Uma delas representa uma afirmativa e a outra, o contrário. A hipótese que contém a afirmativa de igualdade é a hipótese nula (representada por H0) e o complemento da hipótese nula é a hipótese alternativa (representada por H1 ou Ha). Representamos a hipótese alternativa usando um desses operadores: <, > ou ≠. Vamos supor, se uma afirmativa para a média populacional é que ela assume o valor k, alguns pares possíveis de hipótese nula e alternativa são: {H0:Μ=KH1:Μ≠K {H0:Μ=KH1:Μ>K {H0:Μ=KH1:Μ<K Atenção! Para visualização completa da equação utilize a rolagem horizontal “SE VOCÊ ESTÁ FAZENDO UM ESTUDO E DESEJA USAR UM TESTE DE HIPÓTESES PARA APOIAR SUA AFIRMATIVA, ESTA DEVE SER ESCRITA DE MODO A SE TORNAR A HIPÓTESE ALTERNATIVA (E DEVE SER EXPRESSA USANDO APENAS OS SÍMBOLOS <, > OU ≠)". (TRIOLA, 2017, p. 376) Ou seja, você não deve apoiar uma afirmativa de que um parâmetro seja igual a algum valor específico. EXEMPLO 1 Um fabricante afirma que sua vacina previne 80% dos casos de certa doença. Um grupo de médicos desconfia que a vacina não seja tão eficiente assim. Indique a hipótese que está sendo testada. {H0:Ρ=0,80H1:Ρ<0,80 Atenção! Para visualização completa da equação utilize a rolagem horizontal Indicamos a proporção populacional por ρ - Rô. O fabricante afirma sobre o parâmetro que a proporção de casos prevenidos pela vacina é de 80%. Como o grupo de médicos desconfia que a vacina não seja eficiente assim, a hipótese alternativa será p < 0,80. EXEMPLO 2 Um fabricante de bateria para automóveis alega que a vida média de um determinado modelo é de 48 meses. Um proprietário de automóvel deseja testar essa afirmação. Qual hipótese deverá ser testada neste caso? {H0:Μ=48H1:Μ≠48 Atenção! Para visualização completa da equação utilize a rolagem horizontal A média populacional é representada por μ - Mi. O proprietário deseja testar a afirmação do fabricante (de que a vida média da bateria é de 48 meses), portanto utilizamos o símbolo ≠ na hipótese alternativa. EXEMPLO 3 Uma empresa instalou um equipamento antipoluição sonora com o objetivo de manter o ruído médio abaixo de 65 decibéis. O sindicato decide testar se o equipamento está ou não cumprindo sua função. {H0:Μ=65H1:Μ<65 Atenção! Para visualização completa da equação utilize a rolagem horizontal A empresa afirma que o equipamento instalado mantém o ruído médio abaixo de 65 decibéis. O sindicato deseja testar se o ruído médio está abaixo de 65 decibéis após a instalação do equipamento, portanto utilizamos na hipótese alternativa o símbolo <. TESTE DE HIPÓTESES PARA A MÉDIA POPULACIONAL Agora, além da realização de um teste de hipóteses (H0 e H1), precisamos seguir algumas etapas. Para isso, os seguintes conceitos são imprescindíveis: Erros do tipo I e II; Nível de significância; Estatística de teste; Região crítica; Valor crítico; Conclusão do teste baseado no método tradicional ou do valor p. DICA Mas atenção, quando realizamos um teste de hipóteses, estamos utilizando dados de uma amostra. Devemos, então, aceitar o fato de que a decisão de rejeitar ou não H0 pode estar incorreta. A única maneira de se ter certeza de que H0 é verdadeira ou falsa é testar toda a população e sabemos que isso é quase impossível, dependendo do tamanho da sua população. Assim, quando realizamos um teste de hipóteses, dois erros podem ser cometidos: Rejeitar a hipótese H0, quando tal hipótese é verdadeira; Não rejeitar a hipótese H0, quando ela deveria ser rejeitada. Na realização de um teste de hipóteses, temos os resultados possíveis: Situação Decisão H0 é verdadeira H0 é falsa Rejeitar H0 Erro tipo I Decisão correta Não rejeitar H0 Decisão correta Erro tipo II Fonte: Elaborado pelo autor. A probabilidade de cometermos o erro do tipo I é denotada por α – Alfa – e a probabilidade de cometermos o erro do tipo II é denotada por β – Beta. Desejamos que as probabilidades α e β sejam próximas de zero, à medida que diminuímos o erro do tipo I, a probabilidade de erro do tipo II tende a aumentar. DICA Ao definir as hipóteses, o erro mais importante a ser evitado é o erro do tipo I. A probabilidade máxima permitida de ocorrer um erro do tipo I é denominada nível de significância. As escolhas comuns para α são 0,05; 0,01 e 0,10. Após a identificação das hipóteses nula e alternativa e da especificação do nível de significância, utilizamos dados de uma amostra aleatória para calcular o valor da estatística de teste. Utilizamos as seguintes estatísticas de teste para a média: ESTATÍSTICA DE TESTE CONDIÇÕES z = x- μ σn A amostra é uma amostra aleatória simples; O valor do desvio-padrão populacionalσ é conhecido; Pelo menos uma das condições seguintes é verdadeira: a população é normalmente distribuída ou n > 30. t = x- μ sn A amostra é uma amostra aleatória simples; O valor do desvio-padrão populacional σ não é conhecido. O número de graus de liberdade (g.l.) é n – 1 Pelo menos uma das condições seguintes é verdadeira: a população é normalmente distribuída ou n > 30. Fonte: Elaborado pelo autor. Um teste de hipóteses pode ser bicaudal (ou bilateral), unilateral à esquerda (monocaudal esquerdo) ou unilateral à direita (monocaudal direito). A identificação de cada um destes tipos é feita por meio da hipótese alternativa. Temos: (Fonte: o Autor) Sinal usado em H1: < Teste unilateral à esquerda (Fonte: o Autor) Sinal usado em H1: > Teste unilateral à direita (Fonte: o Autor) Sinal usado em H1: ≠ Teste bilateral EXEMPLO Um laboratório farmacêutico lançou no mercado um novo medicamento contra dor de cabeça, retirando de circulação o antigo, com a justificativa de que este novo medicamento tem ação mais rápida. O antigo medicamento tinha um tempo médio de 30 minutos para o início do efeito. Em uma amostra aleatória de 35 pessoas que tomaram o novo medicamento, obteve-se um tempo médio de 27 minutos, com desvio-padrão de 4 minutos. Teste a eficácia do novo medicamento, ao nível de 5%. Resposta: Neste estudo, temos uma amostra aleatória de 35 pessoas. Não conhecemos o desvio-padrão populacional e o tamanho amostral é n > 30. Portanto, os requisitos necessários para a realização do teste de hipóteses para a média populacional com σ desconhecido estão satisfeitos. Agora, vamos aos passos necessários para a realização do teste: (Fonte: Sunflowerr / Shutterstock) 1º PASSO Hipóteses: {H0:Μ=30H1:Μ<30 Atenção! Para visualização completa da equação utilize a rolagem horizontal (Fonte: Sunflowerr / Shutterstock) 2º PASSO O nível de significância geralmente informado é: Α=0,05(5%/100) Atenção! Para visualização completa da equação utilize a rolagem horizontal (Fonte: Sunflowerr / Shutterstock) 3º PASSO Estatística de teste, por se tratar de amostra: T = X- Μ SN Atenção! Para visualização completa da equação utilize a rolagem horizontal Substituindo os valores, teremos: T = 27 - 30 435 T = 27 - 30 45,916 T = 27 - 30 0,6761 T = -3 0,6761 T = -4,4371 Atenção! Para visualização completa da equação utilize a rolagem horizontal (Fonte: Sunflowerr / Shutterstock) 4º PASSO O número de grau de liberdade é: N–1=35–1=34 Atenção! Para visualização completa da equação utilize a rolagem horizontal (Fonte: Sunflowerr / Shutterstock) 5º PASSO Buscar o valor crítico: TC=–1,691 Atenção! Para visualização completa da equação utilize a rolagem horizontal (Fonte: Sunflowerr / Shutterstock) 6º PASSO Conclusão: (Fonte: o Autor) Como o teste é unilateral à esquerda (pois, H1 contém o sinal <), o valor crítico é encontrado levando em conta o nível de significância que está na última linha da tabela. Por isso, escolhemos a terceira coluna (α=0,05). Rejeitamos H0 se t<tc. Como –4,4371<–1,691, a estatística de teste está na área de rejeição. Portanto, rejeitamos H0, ou seja, os dados amostrais fornecem evidências suficientes para se concluir que o tempo médio de ação do novo medicamento é inferior ao tempo médio de ação do antigo medicamento. INFERÊNCIA ESTATÍSTICA VERIFICANDO O APRENDIZADO 1.POR MEIO DE UM TESTE DE HIPÓTESES, TOMAMOS DECISÕES EM PRESENÇA DA VARIABILIDADE, OU SEJA, VERIFICAMOS SE ESTAMOS DIANTE DE UMA DIFERENÇA REAL OU DE UMA DIFERENÇA DEVIDA SIMPLESMENTE À FLUTUAÇÃO ALEATÓRIA AO PROCESSO. PARA UTILIZAR O TESTE PARA A POPULAÇÃO, PRECISAMOS ANALISAR ALGUMAS AÇÕES. MARQUE A OPÇÃO INCORRETA. A) A amostra é uma amostra aleatória simples. B) O valor do desvio-padrão populacional σ é conhecido. C) Pelo menos uma das condições seguintes é verdadeira: a população é normalmente distribuída ou n > 30. D) O valor do desvio-padrão populacional σ não é conhecido. 2. UM TESTE DE HIPÓTESES PODE SER BICAUDAL (OU BILATERAL), UNILATERAL À ESQUERDA (MONOCAUDAL ESQUERDO) OU UNILATERAL À DIREITA (MONOCAUDAL DIREITO). A IDENTIFICAÇÃO DE CADA UM DESSES TIPOS É FEITA POR MEIO DA HIPÓTESE ALTERNATIVA. EM UM TESTE BILATERAL, O SINAL UTILIZADO EM H1 SERÁ: A) Sinal usado em H1: < Teste bilateral B) Sinal usado em H1: > Teste bilateral C) Sinal usado em H1: ≠ Teste bilateral D) Sinal usado em H1: >= Teste bilateral GABARITO 1.Por meio de um teste de hipóteses, tomamos decisões em presença da variabilidade, ou seja, verificamos se estamos diante de uma diferença real ou de uma diferença devida simplesmente à flutuação aleatória ao processo. Para utilizar o teste para a população, precisamos analisar algumas ações. Marque a opção INCORRETA. A alternativa "D " está correta. Ao analisar o teste de hipótese, temos como ação “O valor do desvio-padrão populacional σ é conhecido” como condição para realização do teste em uma amostra. Portanto, a alternativa D está incorreta. 2. Um teste de hipóteses pode ser bicaudal (ou bilateral), unilateral à esquerda (monocaudal esquerdo) ou unilateral à direita (monocaudal direito). A identificação de cada um desses tipos é feita por meio da hipótese alternativa. Em um teste bilateral, o sinal utilizado em H1 será: A alternativa "C " está correta. Em um teste bilateral, o sinal utilizado em H1 será Sinal usado em H1: ≠ Teste bilateral. CONCLUSÃO CONSIDERAÇÕES FINAIS Este tema apresentou os conceitos da estatística e sua utilização como ferramenta de apoio aos tomadores de decisões. Por fim, foi apresentada uma introdução breve sobre testes de hipóteses estatísticos. AVALIAÇÃO DO TEMA: REFERÊNCIAS FERREIRA, Valéria Aparecida. Estatística Básica. Rio de Janeiro: Seses, 2015. OLIVEIRA, Uanderson Rébula de. Estatística I (para leigos): aprenda fácil e rápido. São Paulo: Edição do Autor – Saraiva Publique-se, 2017. _____. Estatística II (para leigos): aprenda fácil e rápido. São Paulo: Edição do Autor – Saraiva Publique-se, 2019. _____. O que é estatística inferencial? Profes, 2018. Consultado em meio eletrônico em: 7 jul. 2020. PADILHA, Luana Lopes. Fundamentos de Estatística e Epidemiologia. Rio de Janeiro: Seses, 2019. PINNTO, Marcos. Estatística Básica: para quem não é especialista. Fortaleza/Arquivo Kindle, 2019. SOARES, Elisângela. Fundamentos de Estatística. Rio de Janeiro: Seses, 2015. TRIOLA, Mario F. Introdução à Estatística. 12. ed. Rio de Janeiro: LTC, 2017. EXPLORE+ Para saber mais sobre os assuntos tratados neste tema, acesse: Leia o texto Importância da estatística para o processo de conhecimento e tomada de decisão, de Sérgio Aparecido Ignácio; Para verificar as aplicações das operações apresentadas nesse tema no Excel acesse o passo a passo clicando aqui. CONTEUDISTA Rafael Monteiro javascript:void(0); CURRÍCULO LATTES javascript:void(0);
Compartilhar