Baixe o app para aproveitar ainda mais
Prévia do material em texto
Bioestatística Autores: Profa. Carina Helena Fraga Prof. Roberto Bianco Colaboradoras: Profa. Vanessa Santhiago Profa. Laura Cristina da Cruz Dominciano Professores conteudistas: Carina Helena Wasem Fraga / Roberto Bianco Carina Helena Wasem Fraga Possui licenciatura plena pela Universidade Federal do Rio Grande do Sul (UFRGS), mestrado em Ciências do Movimento Humano pela Universidade Federal do Rio Grande do Sul (UFRGS) e doutorado em Ciências da Motricidade pela Universidade Estadual Paulista (UNESP). Desenvolve Pesquisa na linha de Biomecânica do Movimento Humano. Atua como pesquisadora colaboradora no Laboratório de Biomecânica da Universidade de São Paulo (USP). É professora titular da Universidade Paulista (UNIP) do curso de Educação Física, líder da disciplina de Bioestatística nessa instituição, e coordenadora de cursos de especialização na área de Biomecânica e Aprendizagem Motora. Ainda, é professora convidada de cursos de especialização de diversos lugares do Brasil. Roberto Bianco Possui graduação e mestrado em Educação Física pela Escola de Educação Física e Esporte da Universidade de São Paulo (EEFE‑USP). Atualmente desenvolve seu doutorado em Educação Física no Laboratório de Biomecânica da Escola de Educação Física e Esporte da Universidade de São Paulo (EEFE‑USP). É professor assistente da Universidade Paulista (UNIP) do Curso de Educação Física e líder das disciplinas de Biomecânica e Biomecânica Aplicada ao Esporte. Coordena os cursos de especialização na área de Biomecânica, Cinesiologia e Aprendizagem Motora, e é professor convidado de cursos de especialização de diversos lugares do Brasil. © Todos os direitos reservados. Nenhuma parte desta obra pode ser reproduzida ou transmitida por qualquer forma e/ou quaisquer meios (eletrônico, incluindo fotocópia e gravação) ou arquivada em qualquer sistema ou banco de dados sem permissão escrita da Universidade Paulista. Dados Internacionais de Catalogação na Publicação (CIP) F811 Fraga, Carina Helena. Bioestatística / Carina Helena Fraga. – São Paulo: Editora Sol, 2019. 140 p. il. Nota: este volume está publicado nos Cadernos de Estudos e Pesquisas da UNIP, Série Didática, ano XXV, n. 2‑020/19, ISSN 1517‑9230. 1. Estatística. 2. Distribuição de dados. 3. Testes. I. Título. CDU 57.087 U500.56 – 19 Prof. Dr. João Carlos Di Genio Reitor Prof. Fábio Romeu de Carvalho Vice-Reitor de Planejamento, Administração e Finanças Profa. Melânia Dalla Torre Vice-Reitora de Unidades Universitárias Prof. Dr. Yugo Okida Vice-Reitor de Pós-Graduação e Pesquisa Profa. Dra. Marília Ancona‑Lopez Vice-Reitora de Graduação Unip Interativa – EaD Profa. Elisabete Brihy Prof. Marcelo Souza Prof. Dr. Luiz Felipe Scabar Prof. Ivan Daliberto Frugoli Material Didático – EaD Comissão editorial: Dra. Angélica L. Carlini (UNIP) Dra. Divane Alves da Silva (UNIP) Dr. Ivan Dias da Motta (CESUMAR) Dra. Kátia Mosorov Alonso (UFMT) Dra. Valéria de Carvalho (UNIP) Apoio: Profa. Cláudia Regina Baptista – EaD Profa. Betisa Malaman – Comissão de Qualificação e Avaliação de Cursos Projeto gráfico: Prof. Alexandre Ponzetto Revisão: Carla Moro Luanne Batista Sumário Bioestatística APRESENTAÇÃO ......................................................................................................................................................7 INTRODUÇÃO ...........................................................................................................................................................7 Unidade I 1 CONCEITOS GERAIS DE ESTATÍSTICA ..........................................................................................................9 1.1 Definições de estatística .......................................................................................................................9 1.2 População e amostra .......................................................................................................................... 11 2 ESTATÍSTICA DESCRITIVA .............................................................................................................................. 16 2.1 Tipos de variáveis: quantitativas e qualitativas ....................................................................... 17 2.2 Variáveis de posição: valores máximos, mínimos, moda, média e mediana ................ 26 3 MEDIDAS DE VARIABILIDADE ..................................................................................................................... 42 3.1 Variância .................................................................................................................................................. 44 3.2 Desvio‑padrão ....................................................................................................................................... 50 3.3 Coeficiente de variação ..................................................................................................................... 52 4 GRÁFICOS E TABELAS .................................................................................................................................... 56 4.1 Elaboração de tabelas ......................................................................................................................... 56 4.2 Representações gráficas .................................................................................................................... 59 Unidade II 5 ANÁLISE NA DISTRIBUIÇÃO DOS DADOS .............................................................................................. 77 5.1 Distribuição normal ............................................................................................................................. 77 5.2 Testes de normalidade ........................................................................................................................ 81 6 FORMULAÇÃO DE HIPÓTESES .................................................................................................................... 84 6.1 Estratégias de busca de artigos científicos ................................................................................ 90 7 TESTES ESTATÍSTICOS: TESTE T .................................................................................................................... 95 7.1 Teste t para uma amostra ................................................................................................................. 95 7.2 Teste t pareado ...................................................................................................................................... 98 7.3 Teste t para amostras independentes ........................................................................................101 8 OUTROS TESTES ESTATÍSTICOS .................................................................................................................104 8.1 Teste de Anova ....................................................................................................................................104 8.2 Teste de Friedman ..............................................................................................................................108 8.3 Teste de Correlação............................................................................................................................109 8.4 Teste de Regressão Linear ...............................................................................................................119 7 APRESENTAÇÃO Em Educação Física, invariavelmente, é necessário realizar análises entre o desempenho de diferentes grupos ou investigar até que ponto uma intervenção ou treinamento alcançou seus objetivos previamente propostos. Para tanto, uma análise estatística permite uma comparação ou caracterização confiável do grupo de dados coletados. Nesse sentido, a disciplina Bioestatística visa a conceituar a estatística aplicada à pesquisa científica, relacionando os projetosde pesquisa e a bioestatística em Educação Física. Após a leitura deste livro, você estará apto para utilizar a Bioestatística como ferramenta de organização, descrição, análise e interpretação de dados relacionados à sua prática profissional. Na unidade I, abordaremos as ferramentas para a compreensão da linguagem estatística, discutindo os conceitos e aplicações práticas das medidas descritivas de posição e de dispersão. A partir do cálculo desses dados, vamos tratar sobre as possibilidades de construção e interpretação de tabelas e gráficos. Na unidade II, serão discutidas as formas de aplicação de testes comparativos, de regressão e de correlação entre grupos e condições, o que proporcionará ferramentas para determinar a escolha do teste estatístico mais adequado a ser empregado na análise das diversas situações práticas vinculadas à área de Educação Física. INTRODUÇÃO A Estatística pode ser definida como um conjunto de técnicas que promove a padronização e a adequação das formas de coleta, organização e análise de dados. Para muitos alunos de quase todas as áreas do conhecimento, os conceitos dessa disciplina acabam parecendo muito abstratos, o que faz com que seja considerada, muitas vezes, como altamente complexa. Muitas pessoas, inclusive, contratam serviços particulares de profissionais de Estatística por desconhecerem as ferramentas mais básicas de aplicação dessa matéria. Neste livro, veremos que a estatística não está distante da nossa realidade, pois seus procedimentos estão presentes de várias formas no nosso cotidiano. Usamos esses procedimentos quando tentamos interpretar nosso consumo mensal de água ou de luz; quando dividimos a conta do restaurante com amigos; quando precisamos trocar nosso dinheiro por outra moeda e avaliamos diferentes cotações; entre tantos outros exemplos. Além disso, entender Estatística torna‑se fundamental em nossa vida profissional. São as ferramentas estatísticas que nos permitem descrever as características de um grupo de pessoas e também comparar as características de dois grupos diferentes. Em Educação Física, isso também é válido, independente da área de atuação do profissional: escola, academias, clubes, entre outros. Vamos a dois exemplos práticos de comparação entre grupos que somente torna‑se possível utilizando as ferramentas estatísticas: (1) na academia, você pode ter por objetivo comparar os níveis de força de mulheres que praticam duas modalidades diferentes; (2) no clube, você pode ter como meta comparar a distância de salto de meninos de diferentes faixas etárias. 8 Unidade I Re vi sã o: C ar la - D ia gr am aç ão : M ár ci o - 22 /0 2/ 20 13 - || - 2ª R ev isã o Lu an e - co rr eç ão : F ab io - 1 8/ 03 /1 3 // 3 ª R ev isã o: A m an da / Co rr eç ão : M ár ci o - 22 /0 3/ 20 13 Dessa forma, como a atuação em Educação Física envolve, geralmente, a prescrição de exercícios físicos e a implantação de programas de treinamento, um profissional pode, por exemplo, ter como objetivo investigar até que ponto a sua intervenção afetou as características da população com a qual o trabalho foi realizado. Para tanto, não basta apenas medir a característica do grupo de praticantes, mas é necessário saber, por exemplo, quanto foi o ganho médio a partir de sua intervenção; se houve diferença entre os sujeitos ou se todos apresentaram os mesmos ganhos; se os valores medidos antes e depois da intervenção podem ser considerados diferentes ou se a diferença é tão pequena que não pode ser considerada significativa. Para essa e outras situações, usualmente presentes na vida do profissional de Educação Física, é que a Estatística torna‑se tão importante. Contudo, para que se possa ter segurança nos resultados obtidos a partir de uma análise estatística, é necessário conhecer essas ferramentas de análise e conhecer os cuidados na sua aplicação. Pode‑se perceber que a leitura de dados de qualquer artigo de nossa área de atuação pressupõe que o aluno seja apto a identificar se os testes utilizados foram adequadamente empregados no estudo. Por isso, o intuito da disciplina é apresentar e discutir os conceitos e definições básicos que lhe permitam a proficiência necessária para a adequada utilização das ferramentas estatísticas. 9 Re vi sã o: C ar la - D ia gr am aç ão : M ár ci o - 22 /0 2/ 20 13 - || - 2ª R ev isã o Lu an e - co rr eç ão : F ab io - 1 8/ 03 /1 3 // 3 ª R ev isã o: A m an da / Co rr eç ão : M ár ci o - 22 /0 3/ 20 13 BIOESTATÍSTICA Unidade I 1 CONCEITOS GERAIS DE ESTATÍSTICA Nesta unidade, iniciaremos nossos estudos definindo os conceitos básicos de Bioestatística, analisando algumas aplicações possíveis. Em seguida, discutiremos as diferenças entre população e amostra, classificaremos os tipos variáveis existentes e aprenderemos como são calculados e para que servem as variáveis de posição e de variabilidade. Por fim, abordaremos, ainda, os diferentes tipos de representações gráficas e quais as situações mais indicadas para aplicar cada tipo. 1.1 Definições de estatística Figura 1 – Exigência de força de flexão do cotovelo A Estatística é uma disciplina que busca estratégias e meios para descrever ou interpretar um conjunto de dados observados sobre um grupo ou um fenômeno. Portanto, ela envolve técnicas para coletar, organizar, descrever, analisar e interpretar dados provenientes de experimentos ou observações. A partir daí, Bioestatística é a aplicação de métodos estatísticos buscando investigar os fenômenos biológicos. Sendo assim, é uma disciplina de grande aplicação à Educação Física. A técnica para se analisar um conjunto de dados depende de sua origem, de onde eles provêm e do que se busca alcançar com uma ferramenta estatística. Por exemplo, podemos estar interessados em como duas características de um grupo de sujeitos se relacionam. Vamos supor que, nessa situação, estejamos interessados em avaliar o quanto a circunferência do braço pode estar relacionada com a força de flexão do cotovelo. Lembrete A Estatística é um conjunto de técnicas que possibilita padronização das formas de coleta, organização e análise de dados. A Bioestatística aplica esses métodos estatísticos buscando investigar os fenômenos biológicos. 10 Unidade I Re vi sã o: C ar la - D ia gr am aç ão : M ár ci o - 22 /0 2/ 20 13 - || - 2ª R ev isã o Lu an e - co rr eç ão : F ab io - 1 8/ 03 /1 3 // 3 ª R ev isã o: A m an da / Co rr eç ão : M ár ci o - 22 /0 3/ 20 13 Um segundo exemplo que poderia ser investigado é quanto um período de treinamento interfere na execução de uma habilidade motora, como o arremesso da bola de basquete ao cesto. Poderíamos estar interessados em saber quantas bolas um grupo de pessoas acerta no cesto em dez tentativas, antes e depois de uma intervenção (sessão de treinamento). Outra possibilidade de análise poderia ser investigar quanto varia a pontuação no arremesso de dardo ao longo de vinte tentativas em função da distância de arremesso e do membro dominante ou não dominante. Nesse caso, há a interferência de duas variáveis: a distância de arremesso e o membro superior usado para o arremesso (dominante ou não dominante). Vale a pena observar que são intermináveis os exemplos e as aplicações possíveis das ferramentas estatísticas. Basta ter muito claro o que se quer saber por meio da análise e escolher a ferramenta que melhor responda à pergunta que foi levantada. Exemplo de aplicação Os procedimentos estatísticos embasam praticamente todas as informações presentes nos livros didáticos da nossa área de conhecimento. Reflita de que forma a Estatística foi utilizada nos dados descritos no último livro didático que você utilizou para outra disciplina do curso de Educação Física. Técnicas diferentes de análise são usadas para obter objetivos diferentes como: • descrevercaracterísticas dos dados; • testar associações entre dois ou mais conjuntos de dados; • testar diferenças entre dois ou mais conjuntos de dados. Descrever características dos dados: suponha que estivéssemos interessados em caracterizar um grupo de pessoas, por exemplo, avaliar os alunos de uma universidade, com relação ao seu percentual de gordura. Nessa situação, escolhemos um teste para determinação dessa característica e avaliamos todos os alunos dessa instituição. Na posse dos dados dessas pessoas, naturalmente, observaríamos valores bem diferentes entre elas, mas digamos que desejássemos saber em torno de qual valor o percentual de gordura dos alunos varia; quanto o percentual de gordura varia; se ele varia muito ou se os valores são semelhantes; qual o percentual de gordura mínimo e máximo, entre outras tantas possíveis aplicações. Observação Note que nesse exemplo estamos interessados em caracterizar os nossos alunos, não estamos interessados nas causas nem na relação dessa variável com outras variáveis. 11 Re vi sã o: C ar la - D ia gr am aç ão : M ár ci o - 22 /0 2/ 20 13 - || - 2ª R ev isã o Lu an e - co rr eç ão : F ab io - 1 8/ 03 /1 3 // 3 ª R ev isã o: A m an da / Co rr eç ão : M ár ci o - 22 /0 3/ 20 13 BIOESTATÍSTICA Testar associações entre dois ou mais conjuntos de dados: ainda usando o exemplo da determinação do percentual de gordura dos alunos de uma universidade, vamos supor que o objetivo seja testar quanto o percentual de gordura está relacionado à quantidade de vezes que essas pessoas praticam exercícios físicos na semana. Nesse caso, estaríamos interessados em saber se existe relação entre o percentual de gordura e a frequência semanal de prática de exercícios físicos. Poderíamos, então, observar que as duas variáveis estão inversamente relacionadas, ou seja, quanto maior a frequência semanal de treino, menor o percentual de gordura dos alunos, por exemplo, ou observar que essas duas variáveis não estão relacionadas, ou seja, não importa quantas vezes a pessoa faça exercício na semana, isso não interfere no percentual de gordura. Observação Note que, nessa estratégia, o objetivo é encontrar alguma relação que uma característica de um grupo apresenta com outra característica. Testar diferenças entre dois ou mais conjuntos de dados: ainda usando o mesmo exemplo, vamos supor que o objetivo seja identificar se existe diferença entre o percentual de gordura de alunos de Educação Física e os alunos de outros cursos da universidade. Para tanto, deveríamos agrupar os resultados dos alunos do curso de Educação Física e os resultados dos alunos de outros cursos e ver se a possível diferença é suficientemente alta para podermos afirmar que os resultados são diferentes ou se a diferença é pequena a ponto de considerá‑los semelhantes. Observação Note que, nessa estratégia, o objetivo é comparar os resultados de dois grupos diferentes de pessoas. 1.2 População e amostra Para poder realizar alguma descrição ou comparação entre variáveis, torna‑se necessário entender o conceito de população e amostra. A população é um conjunto de indivíduos ou objetos que apresentam pelo menos uma característica em comum. Por exemplo, de um universo como o Brasil, digamos que estamos interessados em avaliar uma população específica, todos os possíveis praticantes de exercícios físicos, todos aqueles que praticam corrida de rua ou todos os indivíduos idosos do país. 12 Unidade I Re vi sã o: C ar la - D ia gr am aç ão : M ár ci o - 22 /0 2/ 20 13 - || - 2ª R ev isã o Lu an e - co rr eç ão : F ab io - 1 8/ 03 /1 3 // 3 ª R ev isã o: A m an da / Co rr eç ão : M ár ci o - 22 /0 3/ 20 13 Figura 2 – População de indivíduos com pelo menos uma característica em comum A população pode se apresentar em diferentes níveis dependendo dos objetivos da investigação ou do estudo que queremos conduzir. Nesse sentido, pode se apresentar em âmbito nacional, municipal ou local. Sendo de âmbito nacional, teríamos uma característica comum ao universo de pessoas presentes no país; por exemplo, praticantes de atividade física no Brasil. Uma população de âmbito municipal, poderia ainda ser, segundo o exemplo, praticantes de atividade física da cidade de São Paulo. Repare que praticantes de atividade física da cidade do Rio de Janeiro não fazem parte dessa população, pois estes se encontram em outra cidade, ou seja, eles compartilham da característica comum, praticar atividade física, mas não compartilham da característica de pertencerem à mesma cidade. Nessa mesma perspectiva, uma população de âmbito local seria aquela composta por praticantes de atividade física, da cidade de São Paulo, alunos da Universidade Paulista. Nesse caso, os indivíduos dessa população precisam atender a estas três características em comum: (1) praticarem atividade física; (2) morarem na cidade de São Paulo; (3) estudarem na Universidade Paulista. Portanto, a população da nossa pesquisa dependerá exclusivamente dos objetivos da investigação. Não há nenhum critério que defina como deve ser a população de um estudo. Os critérios são definidos pelos objetivos impostos, aos quais, obviamente, necessitam ser coerentes. Uma população pode apresentar mais de uma característica em comum, isso a torna mais homogênea, ou seja, mais semelhante, mas não necessariamente apresentará duas características em comum. Por isso, é importante definir corretamente qual característica que necessitamos que seja comum à nossa população. Por exemplo, se quisermos analisar a influência da maturação no ganho de massa muscular, teremos que buscar a população que ainda se encontra em uma fase específica de maturação, mas teremos que excluir indivíduos que treinem alguma modalidade que desenvolva força, caso contrário, ocorreria a interferência de uma variável que poderia comprometer os resultados da análise. Lembrete A população é um conjunto de indivíduos ou objetos que apresentam pelo menos uma característica em comum. 13 Re vi sã o: C ar la - D ia gr am aç ão : M ár ci o - 22 /0 2/ 20 13 - || - 2ª R ev isã o Lu an e - co rr eç ão : F ab io - 1 8/ 03 /1 3 // 3 ª R ev isã o: A m an da / Co rr eç ão : M ár ci o - 22 /0 3/ 20 13 BIOESTATÍSTICA A amostra é uma redução representativa da população a dimensões menores, porém sem perda da característica específica, conforme ilustra a figura 3. Figura 3 – Representação dos conceitos de população e amostra, sendo esta classificada com um subconjunto da população específica, no caso uma amostra de praticantes de Tai Chi Em quase todas as ocasiões, não é possível fazer medições em todos os indivíduos de uma população. Imagine, seguindo o exemplo anterior, que seria inviável avaliarmos todos os praticantes de atividade física de São Paulo. Por isso, escolhemos um número de indivíduos que possam servir como representantes dessa população e que permitam uma análise rápida, mas fiel do que seria a resposta da população como um todo. Por exemplo, certamente não é possível avaliar a marcha de todas as pessoas com lesão no ligamento cruzado anterior, mas podemos selecionar uma amostra dessa população, que conte com indivíduos que apresentem uma lesão no ligamento cruzado anterior e que sirvam como representantes. É claro que dez pessoas não permitem entendermos o que acontece com uma população em sua totalidade, mas possibilitam termos uma ideia geral do comportamento. Obviamente, há aqueles dessa amostra podem apresentar algumas variações na resposta em função das diferenças individuais, mas, obrigatoriamente, as características gerais da população devem ser preservadas. Para tanto, é importante que o número de sujeitos de uma amostra seja suficiente e que as características neles presentes sejam representativas à população. Quantos sujeitos determinam uma amostra suficientementegrande que me permita extrapolar os resultados para toda a população? Não há uma resposta exata para essa pergunta, pois isso depende de quanto a característica varia de uma pessoa para a outra em uma população. Se uma característica apresentar uma variedade muito grande entre os sujeitos de uma população, torna‑se necessário ter uma amostra maior, como o que ocorre quando queremos validar um medicamento como eficiente para hipertensão. Como em uma população cada metabolismo, hábitos, atividades são diferentes, necessitamos de muitos sujeitos para afirmar que o medicamente funciona ou não. Por outro lado, se o objetivo for muito específico, uma amostra menor, mas com mais características em comum permite responder à pergunta da investigação. Por exemplo, para investigar o efeito do treinamento de força sobre o rendimento na corrida, basta selecionar sujeitos já corredores, com certa 14 Unidade I Re vi sã o: C ar la - D ia gr am aç ão : M ár ci o - 22 /0 2/ 20 13 - || - 2ª R ev isã o Lu an e - co rr eç ão : F ab io - 1 8/ 03 /1 3 // 3 ª R ev isã o: A m an da / Co rr eç ão : M ár ci o - 22 /0 3/ 20 13 experiência ou não, que nunca praticaram treinamento de força. Nesse caso, uma amostra menor permite responder à pergunta da investigação. Figura 4 – Imagem associada ao exemplo anterior sobre os atletas corredores e o treinamento de força Quantos indivíduos deve ter a amostra nos dois casos exemplificados anteriormente? Não há uma resposta definitiva para essa pergunta. No caso da investigação da medicação, uma amostra composta por dez sujeitos é pequena, mas uma amostra composta por duzentos sujeitos já se torna mais confiável. É claro que trezentos sujeitos agregam maior certeza aos resultados, mas esse número é subjetivo. Já no exemplo dos corredores, cerca de dez a quinze sujeitos permitem uma caracterização adequada sobre a interferência do treinamento de força. Contudo, se a amostra for de vinte sujeitos, a certeza nas afirmações se torna maior. Na tentativa de atribuir uma maior precisão na determinação do número de indivíduos que deve compor cada amostra, muitos trabalhos sugerem a utilização de um cálculo amostral, que considera as características da amostra e a variabilidade nos resultados encontrados. Lembrete A amostra é uma redução representativa da população a dimensões menores, porém sem perda de pelo menos uma característica específica comum que define a população. Para a adequada seleção de uma amostra do universo de uma população, é importante ter bem definidos critérios que tornem essa amostragem representativa. Uma população pode ser definida segundo uma característica comum, mas, às vezes, alguns indivíduos dela apresentam certas características específicas que não são compartilhadas pelas demais pessoas que a compõem e que os tornam sujeitos não representativos dessa amostra. Por isso, quando o objetivo for selecionar uma amostra de uma população, devemos ter bem claro os critérios que permitam a participação do indivíduo na amostragem e os que o impeçam de fazer parte dela. A isso chamamos de critérios de inclusão e de exclusão para os indivíduos da amostra. 15 Re vi sã o: C ar la - D ia gr am aç ão : M ár ci o - 22 /0 2/ 20 13 - || - 2ª R ev isã o Lu an e - co rr eç ão : F ab io - 1 8/ 03 /1 3 // 3 ª R ev isã o: A m an da / Co rr eç ão : M ár ci o - 22 /0 3/ 20 13 BIOESTATÍSTICA Figura 5 – Imagem relacionada aos conceitos de critério de inclusão e exclusão Os critérios de inclusão são aquelas características que os indivíduos devem apresentar para compor a amostra, tornando‑os representativos de uma população em questão. Por exemplo, vamos supor que estejamos interessados em identificar o nível de desenvolvimento motor em que se encontram os alunos do Ensino Fundamental, na cidade de São Paulo. A nossa população é composta por todos os alunos, de todas as escolas da cidade de São Paulo, que se encontram no Ensino Fundamental. Para compor a amostra, precisamos de alunos que representem os quatro anos dessa modalidade de ensino, mas também precisamos considerar as diferenças existentes entre as escolas presentes nos diferentes bairros da cidade de São Paulo. Por isso, talvez selecionar algumas escolas que representem os diferentes níveis socioeconômicos‑culturais seria importante. Note que a nossa amostra precisará ser relativamente grande, pois dez ou quinze alunos não serão suficientes para representar essa população com características tão diversas. Por outro lado, necessitamos ter alguns critérios de exclusão, que envolvem as características que os indivíduos apresentam que os tornam não representativos da população, pois os caracterizam como indivíduos únicos ou com atributos muito peculiares. Usando o nosso exemplo anterior, seriam critérios de exclusão aqueles que afetariam o nível de desenvolvimento motor dos alunos do Ensino Fundamental. Por exemplo, teríamos que excluir da amostra todos os repetentes, pois certamente estariam numa faixa etária maior e teriam provavelmente um nível de desenvolvimento motor maior que os demais indivíduos da população. 16 Unidade I Re vi sã o: C ar la - D ia gr am aç ão : M ár ci o - 22 /0 2/ 20 13 - || - 2ª R ev isã o Lu an e - co rr eç ão : F ab io - 1 8/ 03 /1 3 // 3 ª R ev isã o: A m an da / Co rr eç ão : M ár ci o - 22 /0 3/ 20 13 Outro exemplo de critério de exclusão seria a presença de qualquer tipo de deficiência física ou mental, pois não é uma característica inerente aos alunos de Ensino Fundamental, não correspondendo a uma característica presente na maioria dos indivíduos da amostra e que afeta a avaliação do nível de desenvolvimento motor. Por outro lado, participar regularmente das aulas de Educação Física afeta o nível de desenvolvimento motor, mas não podemos selecionar apenas alunos que participam dessa disciplina, pois estaríamos sendo tendenciosos, e os resultados não refletiriam a realidade das nossas escolas. Por isso, essa é uma característica que devemos ter registrada para posteriormente verificarmos se ela exerceu alguma interferência nos resultados da nossa investigação. Observe que os critérios de inclusão e de exclusão não são características fixas preestabelecidas, mas, sim, variam em função dos objetivos do estudo ou da investigação que queremos conduzir. Lembrete Os critérios de inclusão e exclusão de um indivíduo a uma amostra devem ser condizentes com os objetivos da análise de um determinado estudo. 2 ESTATÍSTICA DESCRITIVA Uma primeira dúvida muito comum, após coletar dados de uma amostra, é o que fazer com essas informações. Um primeiro passo é descrevê‑las para que seja possível identificar o comportamento ou a característica geral que apresentam. Esse é o processo de aplicação da estatística descritiva. Em estatística descritiva busca‑se a determinação de como o conjunto de dados em questão se comporta, ou seja, uma descrição sistemática dos resultados. Como deve ser feita essa descrição? O que deve ser descrito? Podem ser essas as próximas dúvidas pertinentes para a análise descritiva dos dados. Nesse sentido, não há uma única forma de se descrever os dados, pois dependendo dos objetivos da investigação, a descrição deverá adotar caminhos distintos, visto que, para cada objetivo, existe uma caminho mais adequado. Geralmente, a análise estatística de uma investigação é realizada usando um software de estatística, que contém diversas ferramentas de análise que utilizam métodos computacionais muito eficientes. Entretanto, é fundamental termos uma noção clara do que cada uma das ferramentas faz e quando cada uma delas deve ser usada. Caso contrário, podemos incorrer em erros que comprometeriam nossa análise e a confiabilidade dos resultados discutidos. Você já deve ter ouvido falar no ditado sobre a incoerência de comparar “bananascom laranjas”. Pois é exatamente isso que pode acontecer quando os softwares de estatística são usados indiscriminadamente por pessoas que não apresentam domínio sobre as ferramentas que estão utilizando nesses programas. Softwares quase sempre permitem os mais variados cálculos, independentemente dos valores que são digitados no sistema. Portanto, é necessário que o usuário desse sistema tenha conhecimento suficiente para avaliar a pertinência e a adequação da aplicação da análise estatística realizada pelo software. 17 Re vi sã o: C ar la - D ia gr am aç ão : M ár ci o - 22 /0 2/ 20 13 - || - 2ª R ev isã o Lu an e - co rr eç ão : F ab io - 1 8/ 03 /1 3 // 3 ª R ev isã o: A m an da / Co rr eç ão : M ár ci o - 22 /0 3/ 20 13 BIOESTATÍSTICA É nessa perspectiva que discutiremos sobre algumas ferramentas de análise nos tópicos a seguir. Com base nesse conhecimento, você, aluno, será capaz de identificar o que foi feito e interpretar os resultados de forma mais aprofundada. Observação Existem atualmente no mercado diversos softwares que permitem a aplicação de inúmeros procedimentos estatísticos. Entretanto, é importante que o usuário entenda os conceitos atrelados ao teste a ser utilizado. 2.1 Tipos de variáveis: quantitativas e qualitativas Antes de abordarmos os tipos de variáveis, é necessário definirmos alguns termos fundamentais em estatística e que, muitas vezes, possuem um significado um pouco distinto daquele que lhes é atribuído habitualmente. Chamamos de Unidade Experimental a menor unidade capaz de fornecer informações que podem ser pessoas, animais, fatos ou objetos. Por exemplo, em um experimento, podemos analisar ratos albinos que são submetidos a exercícios físicos. Dados são informações numéricas ou não, obtidas a partir de um determinado experimento. No exemplo anterior, podemos afirmar que os dados são “ratos albinos” e “a prática de exercícios físicos”. Variável é a denominação para todas as características, atributos ou medidas que podem ser analisadas na Unidade Experimental, apresentando variações entre os indivíduos avaliados. Voltando ao exemplo da prática de exercícios físicos de ratos albinos, podemos analisar, por exemplo, a área de secção transversa de um determinado músculo desses animais. Portanto, nesse exemplo, a área de secção transversa é a nossa variável de análise. Figura 6 – Imagem associada ao exemplo da prática de exercícios físicos de ratos albinos 18 Unidade I Re vi sã o: C ar la - D ia gr am aç ão : M ár ci o - 22 /0 2/ 20 13 - || - 2ª R ev isã o Lu an e - co rr eç ão : F ab io - 1 8/ 03 /1 3 // 3 ª R ev isã o: A m an da / Co rr eç ão : M ár ci o - 22 /0 3/ 20 13 As variáveis podem ser de diferentes tipos, e torna‑se importante classificá‑las, pois cada tipo apresenta um procedimento estatístico mais adequado para realizar a análise. A principal classificação das variáveis de análise está relacionada à sua natureza qualitativa ou quantitativa. A variável qualitativa é uma medida de natureza não numérica, ou seja, ela não é representada por um número, mas, sim, por uma qualidade. Por exemplo, forte ou rápido são classificações atribuídas a variáveis qualitativas. Ainda que possam ser atribuídos números a essas variáveis (sexo feminino – 1; sexo masculino – 2), a quantificação dessas variáveis não apresenta sentido para sua interpretação. Uma variável qualitativa pode ainda ser classificada como nominal ou ordinal. Uma variável é qualitativa nominal quando a mesma não expressa nenhum critério que possa ser classificado como maior ou menor, melhor ou pior, entre outros. São características que as classificam, atribuem qualidade à medida, mas não há uma ordem lógica nessa classificação. Por exemplo, considere a variável cor dos olhos. Podemos classificar as pessoas segundo a cor de seus olhos, e assim teríamos pessoas com olhos castanhos, verdes, azuis etc. Essa classificação não permite ordenar as pessoas, pois não há uma cor de olho superior a outra; as cores simplesmente são diferentes. Portanto, cor dos olhos é uma variável qualitativa nominal. Gênero, tipo sanguíneo, cor da pele são outros exemplos de variáveis qualitativas nominais. Figura 7 – Exemplo de variável qualitativa nominal: cor dos olhos Uma variável é qualitativa ordinal quando apresenta uma ordem, e podemos classificar uma variável como superior e outra como inferior. Como exemplo, podemos citar a variável nível de condicionamento físico de diferentes indivíduos. Obviamente, nesse caso, os indivíduos que apresentarem um nível de condicionamento regular estarão em uma classificação superior àqueles que apresentarem um nível de condicionamento ruim, mas estarão em uma classificação inferior aos indivíduos que apresentarem um nível de condicionamento considerado bom. Portanto, nesse exemplo, podemos atribuir uma ordem a partir das qualidades correspondentes a cada variável. Contudo, é importante que essa ordenação seja inerente ao tipo de variável analisada, e não por julgamento por conveniência do pesquisador. 19 Re vi sã o: C ar la - D ia gr am aç ão : M ár ci o - 22 /0 2/ 20 13 - || - 2ª R ev isã o Lu an e - co rr eç ão : F ab io - 1 8/ 03 /1 3 // 3 ª R ev isã o: A m an da / Co rr eç ão : M ár ci o - 22 /0 3/ 20 13 BIOESTATÍSTICA Outros exemplos de variáveis qualitativas ordinais são: níveis de dor, níveis de intensidade de exercício avaliados em uma escala subjetiva de esforço, grau de instrução, entre outros. Lembrete O que difere as variáveis qualitativas nominais e ordinais é a possibilidade de classificação e ordenação dos dados. Variáveis qualitativas ordinais podem ser classificadas como melhores ou piores. Já a variável quantitativa, é uma medida de natureza numérica, sendo expressa por um valor, ou seja, é‑lhe atribuído um número. Podemos citar como exemplo, a variável peso corporal, na qual é atribuído um valor correspondente que geralmente é expresso em quantidade de quilos do indivíduo. Vamos supor que o objetivo de um estudo seja comparar a variável peso corporal de um indivíduo antes e após um programa de treinamento, como é o caso da pessoa pesava 60 Kg e após o treinamento passou a pesar 56 Kg. Dessa forma, houve uma quantificação do peso corporal do indivíduo avaliado. As variáveis quantitativas podem ser classificadas como discretas ou como contínuas. Figura 8 – Exemplo de variável quantitativa: peso corporal 20 Unidade I Re vi sã o: C ar la - D ia gr am aç ão : M ár ci o - 22 /0 2/ 20 13 - || - 2ª R ev isã o Lu an e - co rr eç ão : F ab io - 1 8/ 03 /1 3 // 3 ª R ev isã o: A m an da / Co rr eç ão : M ár ci o - 22 /0 3/ 20 13 As variáveis quantitativas discretas são aquelas que são expressas exclusivamente por números inteiros. Números fracionados não apresentam sentido lógico para esse tipo de variável. Vamos supor que seu objetivo seja avaliar a variável número de esteiras de uma academia. Nesse exemplo, certamente o resultado que você encontrará corresponderá a um número inteiro, pois não é possível dizermos que a academia possui uma esteira e meia. Outros exemplos de variáveis quantitativas discretas são: número de praticantes de uma determinada modalidade, quantidade de crianças com necessidades especiais em uma escola, número de carros. Já as variáveis quantitativas contínuas, podem apresentar qualquer valor em um intervalo de variação possível, ou seja, elas podem ser expressas em números fracionados. Vamos supor que seu objetivo seja comparar a variável altura de dois alunos. Nessa situação, você provavelmente encontrará valores que não são inteiros. Por exemplo, um aluno pode ter 1,58 m e outro 1,47 m de altura. Entretanto, e se considerar a variável peso corporal: podemos classificá‑la como discreta ou contínua? Nesse caso, embora sejamais comum você encontrar valores inteiros para essa variável, não necessariamente os resultados serão sempre inteiros. Assim, valores que não são inteiros (como 60,4 Kg e 59,7 Kg) fazem sentido para expressar o peso corporal e, portanto, essa variável pode ser classificada como quantitativa contínua. Outros exemplos de variáveis quantitativas contínuas são: tempo de treinamento, idade dos alunos, sobrecarga de um exercício. Figura 9 – Exemplo de variável quantitativa contínua 21 Re vi sã o: C ar la - D ia gr am aç ão : M ár ci o - 22 /0 2/ 20 13 - || - 2ª R ev isã o Lu an e - co rr eç ão : F ab io - 1 8/ 03 /1 3 // 3 ª R ev isã o: A m an da / Co rr eç ão : M ár ci o - 22 /0 3/ 20 13 BIOESTATÍSTICA Lembrete O que difere as variáveis quantitativas discretas e contínuas é a possibilidade de um valor fracionado. Variáveis discretas só podem ser expressas em números inteiros. Outra forma de classificar as variáveis está relacionada à função que elas apresentam dentro de um trabalho de pesquisa. A partir desse pressuposto, estabelece‑se a seguinte classificação: variável independente; variável dependente; variável categórica; variável de controle e variável interveniente. Variável independente é aquela que o pesquisador deseja manipular, ou seja, é sua variável experimental. Vamos supor que sua intenção seja avaliar a influência de diferentes tipos de exercício no ganho de força de determinado grupo muscular. Sua variável independente, nesse caso, corresponde aos diferentes tipos de exercício, pois é isso que você está testando ou “manipulando” para avaliar os possíveis ganhos de força muscular. Dito de outra forma, você está testando se alterações na variável independente (tipo de exercício) podem causar diferenças no ganho de força muscular. Já a variável dependente é aquela que pode ser medida ou registrada para acessar o efeito da variável independente. No exemplo anterior, a variável dependente é a força de determinado grupo muscular. A partir das mudanças nas variáveis independentes (tipo de exercício), pode ou não ocorrer alterações nas variáveis dependentes (força muscular). Figura 10 – Diferentes tipos de exercício (variáveis independentes) podem ou não gerar alterações na força muscular (variáveis dependentes) Dessa forma, pode‑se perceber que existe uma inter‑relação entre as variáveis independentes e dependentes do tipo causa‑efeito, sendo que a variável independente está associada à causa, enquanto que a variável dependente representa o efeito. Para ficar mais claro, vamos a outro exemplo: imagine que o seu objetivo de pesquisa seja avaliar a influência da fase de aprendizado motor no número de chutes a gol realizados com êxito no futebol. A 22 Unidade I Re vi sã o: C ar la - D ia gr am aç ão : M ár ci o - 22 /0 2/ 20 13 - || - 2ª R ev isã o Lu an e - co rr eç ão : F ab io - 1 8/ 03 /1 3 // 3 ª R ev isã o: A m an da / Co rr eç ão : M ár ci o - 22 /0 3/ 20 13 partir desse exemplo, qual será a variável independente e qual será a variável dependente? Nesse caso, a variável independente será aquela capaz de modificar a variável dependente. Portanto, a variável independente é a fase de aprendizado motor. Já a variável dependente, é aquela que você deseja medir e que é influenciada pela independente; portanto, corresponde ao número de chutes a gol realizados com êxito no futebol. Exemplo de aplicação De modo semelhante ao que foi realizado anteriormente, pense em um objetivo de pesquisa. Agora, procure determinar as variáveis independentes e dependentes de acordo com esse objetivo que você propõe. Figura 11 – Prática do voleibol que pode ou não ser influenciada pela prática do treinamento pliométrico, conforme proposta de pesquisa A variável categórica pode ser considerada um tipo de variável independente, mas ela não pode ser manipulada, pois está em categorias. Essas categorias nada mais são do que classificações das variáveis que permitem identificá‑las como pertencentes a um determinado grupo. São exemplos de variáveis categóricas dados como idade, raça, gênero, entre outros. Imagine que o objetivo de seu estudo seja analisar o efeito de um treinamento pliométrico no desempenho de jogadores de voleibol. Nesse caso, a variável independente é a modalidade do treinamento e a variável dependente é o desempenho de jogadores de voleibol. E as variáveis categóricas? Podemos assumir que os efeitos do treinamento pliométrico poderão ser diferentes dependendo do gênero dos jogadores de voleibol e da faixa etária em que estes se encontram. Portanto, o gênero desses indivíduos e a sua faixa etária podem ser considerados importantes variáveis categóricas. Claro que poderíamos ter inúmeras variáveis categóricas, mas é importante avaliar sua interferência no projeto de pesquisa para determinar aquelas que são mais relevantes. Dito de outra forma é importante identificar, em um estudo, se a inter‑relação causa‑efeito da variável independente sobre a variável dependente pode ser diferente na presença de uma variável categórica. 23 Re vi sã o: C ar la - D ia gr am aç ão : M ár ci o - 22 /0 2/ 20 13 - || - 2ª R ev isã o Lu an e - co rr eç ão : F ab io - 1 8/ 03 /1 3 // 3 ª R ev isã o: A m an da / Co rr eç ão : M ár ci o - 22 /0 3/ 20 13 BIOESTATÍSTICA A variável controle está relacionada a um fator que poderia, possivelmente, influenciar os resultados do estudo, ou seja, a variável dependente. Como se espera que as possíveis alterações na variável dependente possam ser atribuídas ao efeito da variável independente, qualquer outra variável que possa exercer influência sobre a variável dependente precisa ser controlada. Exatamente por isso essa variável deve ser analisada separadamente, ou, se for o caso, mantida fora da pesquisa. Vamos supor que o objetivo do seu estudo agora seja determinar a frequência cardíaca máxima em um teste incremental de corrida em esteira. Nessa condição, a variável independente corresponde ao teste incremental de corrida em esteira, enquanto que a variável dependente é a frequência cardíaca máxima. Obviamente, a velocidade máxima alcançada no teste e, consequentemente, a frequência cardíaca máxima a ser atingida será influenciada pela condição de fadiga que algum indivíduo possa apresentar. Dessa forma, nesse exemplo, a fadiga apresentada previamente à realização do teste precisa ser controlada para que ela não cause alteração na variável dependente (frequência cardíaca máxima). Seria recomendado que, nessa situação, fosse solicitado aos indivíduos que não realizassem exercícios muito extenuantes 24 horas antes da realização do referido teste de corrida. Por fim, a variável interveniente é um fator que também pode afetar a relação entre a variável independente e dependente, mas não pode ser totalmente excluída ou controlada. De acordo com Lakatos e Marconi (2001), a variável interveniente se posiciona entre a variável independente e dependente, podendo ampliar, reduzir ou anular o efeito da variável independente sobre a variável dependente. Considere novamente o exemplo anterior sobre a determinação da frequência cardíaca máxima a partir de um teste incremental de corrida em esteira. Vamos supor que, no dia do teste, esteja fazendo muito calor e que, na sala em que o teste será realizado, não haja nenhum sistema de ar condicionado. Podemos dizer, então, que a temperatura pode ser considerada uma variável interveniente. Quanto maior o controle que o pesquisador conseguir exercer sobre as variáveis intervenientes, mais fortemente poderá se assumir que as alterações na variável dependente foram causadas devido à influência da variável independente. Ao contrário, quanto maior a influência da variável interveniente sobre a variável dependente, maior será a chance de atribuir erroneamente uma relação causa‑efeito entrea variável independente e dependente. Observação A inter‑relação entre as variáveis independentes e dependentes é do tipo causa‑efeito. A variável independente representa causa, enquanto a variável dependente representa o efeito. É claro que dificilmente uma pesquisa estará livre dos efeitos de alguma variável interveniente. Sendo assim, assume‑se que, em quase todas as pesquisas, há alguma fonte de erro. Como futuro pesquisador, é importante que você perceba a necessidade de minimizar ao máximo qualquer possível 24 Unidade I Re vi sã o: C ar la - D ia gr am aç ão : M ár ci o - 22 /0 2/ 20 13 - || - 2ª R ev isã o Lu an e - co rr eç ão : F ab io - 1 8/ 03 /1 3 // 3 ª R ev isã o: A m an da / Co rr eç ão : M ár ci o - 22 /0 3/ 20 13 fonte de erro. Podemos dizer que alguns são mais graves que outros, dependendo de sua natureza. Basicamente, podemos dividir os erros em dois tipos de acordo com suas características: erro sistemático e erro aleatório. Chama‑se de erro sistemático aquele que representa uma interferência que é constante em todas as medidas. Assim, o erro é quase sempre o mesmo em todos os resultados obtidos em uma medição. Já o erro aleatório pode ser observado eventualmente, ou seja, em torno da medida verdadeira, os erros podem ou não serem observados. Para exemplificar esses dois tipos de erro, vamos à seguinte aplicação prática: imagine que, na determinação da velocidade em uma esteira, ocorra um erro atribuindo sempre um acréscimo de 1 km/h em todas as velocidades. Nessa situação, você tem um erro sistemático, pois este será observado em todas as velocidades e para todos os indivíduos avaliados. Agora imagine que esse acréscimo, na velocidade da esteira, ocorra apenas em algumas situações, e que você não tenha controle sobre a presença ou não desse acréscimo. Nessa situação, você tem um erro aleatório que está presente em algumas condições, mas em outras não. Como já mencionamos anteriormente, obviamente devemos tentar minimizar ao máximo qualquer fonte de erro, mas imagine que você não tenha como impedir uma fonte de erro. Nessa condição, o que preferiria: o erro sistemático ou o erro aleatório? O erro sistemático parece ser preferível, pois como ele ocorre constantemente, é mais fácil conhecê‑lo e o quantificar. Uma vez que esse erro é conhecido, torna‑se possível excluí‑lo do valor real correspondente à medida. Por exemplo, imagine que você está utilizando um estadiômetro (equipamento usado para medir a estatura), o qual apresenta um incremento de 2 cm nas medidas realizadas. É preferível que esse erro aconteça em todas as medidas do que ocorra eventualmente, pois conhecendo o erro constante (2 cm), basta subtrair esse valor de erro das medidas realizadas. Podemos classificar, ainda, os erros de acordo com as suas causas, como: • erro instrumental; • erro ambiental; • erro observacional; • erro teórico. O erro instrumental ocorre quando há alguma imprecisão no instrumento de medida utilizado para realizar a pesquisa. Tomemos como exemplo uma balança utilizada para mensurar a massa corporal esteja desregulada e que ela forneça sempre 1 Kg a mais no momento de realizar a medida. 25 Re vi sã o: C ar la - D ia gr am aç ão : M ár ci o - 22 /0 2/ 20 13 - || - 2ª R ev isã o Lu an e - co rr eç ão : F ab io - 1 8/ 03 /1 3 // 3 ª R ev isã o: A m an da / Co rr eç ão : M ár ci o - 22 /0 3/ 20 13 BIOESTATÍSTICA Outro exemplo de erro sistemático instrumental bastante comum na Educação Física é a imprecisão de alguns plicômetros utilizados para aferir as dobras cutâneas para a do percentual de gordura corporal; fornecem resultados sistematicamente superiores ou inferiores em todas as medidas realizadas. O erro ambiental refere‑se a alguma alteração no meio de avaliação, ou seja, no ambiente que promova alteração na variável dependente. Utilizando um exemplo anterior, podemos citar a presença de um ambiente muito quente. Outra possibilidade é um ambiente muito escuro que não permita, por exemplo, a execução de uma determinada habilidade motora fina. Figura 12 – Exigência de flexibilidade – variável que pode ser testada em diversos tipos de protocolo O erro observacional representa uma inconsistência na análise ou um erro de leitura na medição. Isso acontece, por exemplo, quando algum método de análise é utilizado de forma inapropriada, não fornecendo resultados que possam ser considerados válidos. Para exemplificar, imagine que seu objetivo seja realizar uma avaliação e análise dos níveis de flexibilidade de um determinado indivíduo. Para tanto, você utiliza o teste conhecido como sentar e alcançar e encontra índices muito baixos de flexibilidade. Com isso, a partir dessa análise, você poderia concluir que a flexibilidade do indivíduo avaliado é ruim. Entretanto, a análise única e exclusivamente deste teste não permite essa conclusão, pois desconsidera a mobilidade de outras articulações. Outro erro observacional muito comum é a medição equivocada por parte do avaliador em função de um erro de leitura do equipamento. Isso geralmente acontece quando um indivíduo não está familiarizado a utilizar um determinado instrumento de medida. Também é bastante comum em avaliadores que usam pela primeira vez um plicômetro para avaliação das dobras cutâneas em avaliação física. 26 Unidade I Re vi sã o: C ar la - D ia gr am aç ão : M ár ci o - 22 /0 2/ 20 13 - || - 2ª R ev isã o Lu an e - co rr eç ão : F ab io - 1 8/ 03 /1 3 // 3 ª R ev isã o: A m an da / Co rr eç ão : M ár ci o - 22 /0 3/ 20 13 São considerados erros teóricos aqueles associados à falta de clareza na determinação das variáveis de análise. Imagine que você deseja calcular o percentual de gordura de um aluno a partir das medidas de dobras cutâneas realizadas. O problema é que existem inúmeras fórmulas que permitem esses cálculos, diferindo de acordo com a população para qual se deve aplicar cada uma delas. Dessa forma, sem adequado conhecimento sobre a população‑alvo, tais fórmulas podem ser aplicadas levando a uma considerável fonte de erro. Como o objetivo primordial de qualquer medida é minimizar e controlar as fontes de erro, sugere‑se que se tomem os devidos cuidados para reduzir os fatores aleatórios de erros, repetindo medições e garantindo a apropriada proficiência dos avaliados com o instrumento de medida. Lembrete Os erros podem ser de dois tipos de acordo com suas características: erro sistemático (interferência constante em todas as medidas) e erro aleatório (pode ser observado eventualmente). 2.2 Variáveis de posição: valores máximos, mínimos, moda, média e mediana Uma vez que as variáveis foram definidas e classificadas, vamos tratar de um tipo específico de variável conhecido como variável de posição, que é calculada quando desejamos representar um conjunto de dados por um valor único. Existem variáveis de posição conhecidas como valores extremos, que correspondem aos valores máximos e mínimos de um conjunto de dados. Outro subconjunto de variáveis de posição são as medidas de tendência central. Nesse caso, é calculado um valor central no conjunto de dados. Os valores de tendência central mais utilizados são: a média, a moda e a mediana. Figura 13 – Representação da série de 10 chutes a gol, conforme explicitado no exemplo 27 Re vi sã o: C ar la - D ia gr am aç ão : M ár ci o - 22 /0 2/ 20 13 - || - 2ª R ev isã o Lu an e - co rr eç ão : F ab io - 1 8/ 03 /1 3 // 3 ª R ev isã o: A m an da / Co rr eç ão : M ár ci o - 22 /0 3/ 20 13 BIOESTATÍSTICA Muitas vezes, esses valores são utilizados para representar a tendência central do conjunto de dados, mesmo sendo este um valor abstrato. Para ficar mais claro, vamos a um exemplo: imagine que você tem um conjunto de dados de seis alunos representandoo número de chutes a gol realizados com sucesso em dez tentativas. Nessa situação, a partir do desempenho dos alunos, você obteve o seguinte conjunto de dados: 8, 7, 8, 6, 9 e 5. A partir desses valores, você pretende agora calcular o valor médio desse conjunto de dados, ou seja, serão calculados, em média, quantos chutes a gol foram realizados com sucesso em dez tentativas para esses alunos. O valor obtido será 7,16 chutes a gol com sucesso. Entretanto, note que esse valor não está originalmente no conjunto de dados. Portanto, não é real ao conjunto de dados, e sim apenas um valor utilizado como representativo do conjunto. Lembrete Os principais valores de posição são valor máximo, valor mínimo, valor de média, valor de moda e valor de mediana. Valor máximo e valor mínimo: Os valores máximos e mínimos são aqueles que se encontram nos extremos de um conjunto de dados. Dessa forma, o valor máximo (Vmáx.) – também conhecido como valor de pico – corresponde ao maior valor do conjunto de dados, enquanto que o valor mínimo (Vmín.) representa o menor valor desse conjunto. Vamos supor que tenhamos conjunto de dados conhecido como (A) que apresenta os seguintes valores: (A) = 7, 9, 1, 12, 6, 4, 9, 7. Nessa situação, temos: Vmáx. (A) = 12 Vmín. (A) = 1 Ou seja, o valor máximo de (A) é 12 e o valor mínimo é 1. A figura 14 ilustra uma curva obtida a partir de um conjunto de dados, e nela podemos observar a determinação dos valores máximos e mínimos. 28 Unidade I Re vi sã o: C ar la - D ia gr am aç ão : M ár ci o - 22 /0 2/ 20 13 - || - 2ª R ev isã o Lu an e - co rr eç ão : F ab io - 1 8/ 03 /1 3 // 3 ª R ev isã o: A m an da / Co rr eç ão : M ár ci o - 22 /0 3/ 20 13 Máximo Mínimo Figura 14 – Gráfico mostrando a determinação dos valores máximos e mínimos de um conjunto de dados Há grande aplicabilidade da utilização desses valores em função de sua fácil obtenção, pois podem ser determinados diretamente, sem a necessidade da realização de cálculos e aplicados em diversas condições específicas da área da Educação Física. Figura 15 – Exercício de caminhada, a partir do qual o objetivo pode ser determinar os ângulos máximos e mínimos das diferentes articulações do membro inferior Para ficar mais claro, vamos a um exemplo prático. Imagine que durante uma caminhada você tem como objetivo determinar os ângulos máximos e mínimos das diferentes articulações do membro inferior. Utilizando técnicas de filmagem e uma análise biomecânica do movimento, é possível determinarmos a variação angular de cada articulação ao longo de um ciclo de uma passada, ou seja, do momento em que um pé toca o solo, até o contato subsequente desse mesmo pé com o solo. A figura 16 mostra a variação angular durante um ciclo de marcha, ou seja, uma passada, para as principais articulações do membro inferior: quadril, joelho e tornozelo. 29 Re vi sã o: C ar la - D ia gr am aç ão : M ár ci o - 22 /0 2/ 20 13 - || - 2ª R ev isã o Lu an e - co rr eç ão : F ab io - 1 8/ 03 /1 3 // 3 ª R ev isã o: A m an da / Co rr eç ão : M ár ci o - 22 /0 3/ 20 13 BIOESTATÍSTICA Quadril Joelho Tornozelo Ân gu lo a rt ic ul ar Porcentagem do ciclo Co nt at o do c al ca nh ar Pé a pl ai na do Ap oi o m éd io Re tir ad a do c al ca nh ar Re tir ad a do s d ed os Ba la nç o m éd io Co nt at o do c al ca nh ar 30 50 ‑10 10 10 30 70 10 ‑10 20 40 ‑20 0 0 20 60 0 ‑20 0 10 20 30 40 50 60 70 80 90 100 Figura 16 – Variação angular das articulações do quadril, joelho e tornozelo em uma passada da marcha Nessa figura, o valor 0, no eixo horizontal (eixo x), representa o contato do pé com o solo, e o valor 100 corresponde ao novo contato desse mesmo pé com o solo novamente. Portanto, temos a descrição do que acontece ao longo do período correspondente a uma passada. No eixo vertical (eixo y), temos a visualização de três diferentes gráficos simultaneamente, correspondentes às articulações do quadril, joelho e tornozelo, que se encontram nessa ordem de cima para baixo. Para cada articulação é possível observar um valor de zero, que corresponde, nas diferentes articulações, à posição neutra, ou posição anatômica dessas articulações. Para as articulações do quadril e joelho, valores positivos significam que o segmento do indivíduo está posicionado em flexão, enquanto os valores negativos representam o segmento posicionado em extensão. Já para a articulação do tornozelo, os valores positivos denotam uma flexão dorsal, enquanto valores negativos correspondem a uma posição de flexão plantar. Uma vez que os dados da figura 16 foram explicados, podemos ter como objetivo a determinação dos valores máximos e mínimos, identificando sua localização aproximada em função do percentual do ciclo da passada. Para a articulação do quadril: • Vmáx. 28° em flexão, ocorrendo em 85% do ciclo de passada, quando o segmento precisa se posicionar a frente para iniciar uma nova passada. Vmín. 20° em extensão, ocorrendo em 55% do ciclo de passada, um pouco antes de dar início à fase aérea. 30 Unidade I Re vi sã o: C ar la - D ia gr am aç ão : M ár ci o - 22 /0 2/ 20 13 - || - 2ª R ev isã o Lu an e - co rr eç ão : F ab io - 1 8/ 03 /1 3 // 3 ª R ev isã o: A m an da / Co rr eç ão : M ár ci o - 22 /0 3/ 20 13 Para a articulação do joelho: • Vmáx. 70° em flexão, ocorrendo em 72% do ciclo de passada, quando uma grande flexão torna‑se importante para absorção de choque mecânico. • Vmín. 3° em extensão, ocorrendo em 98% do ciclo de passada, que mostra imediatamente antes do contato o joelho se posicionar com o máximo de extensão possível, ou seja, a articulação está retesada. Para a articulação do tornozelo: • Vmáx. 10° em flexão dorsal, ocorrendo em 50% do ciclo de passada, representando o avanço máximo da tíbia sobre o pé na fase de apoio. • Vmín. 15°, ocorrendo em 8% do ciclo de passada, representando a flexão plantar necessária para o aplanamento do pé após o contato. Como realizado no exemplo anterior, pode‑se perceber que a determinação dos valores máximos e mínimos torna‑se de suma importância para adequada caracterização do movimento – no caso, a marcha. Lembrete Os valores de posição considerados extremos são conhecidos como valor máximo (maior valor do conjunto de dados) e como valor mínimo (menor valor desse conjunto). De forma semelhante, esse procedimento pode ser realizado para caracterizar outras formas do movimento humano. A identificação desses ângulos em diferentes atividades torna‑se importante para associação das ações musculares em cada fase do movimento, o que pode apresentar grande aplicabilidade na determinação do treinamento, na tentativa de deixá‑lo o mais específico possível, aumentando sua funcionalidade. Exemplo de aplicação Utilizando as informações da figura 17 que é apresentada a seguir, determine aproximadamente: a) o valor máximo no eixo horizontal; b) o valor mínimo no eixo horizontal; c) o valor máximo no eixo vertical; d) o valor mínimo no eixo vertical. 31 Re vi sã o: C ar la - D ia gr am aç ão : M ár ci o - 22 /0 2/ 20 13 - || - 2ª R ev isã o Lu an e - co rr eç ão : F ab io - 1 8/ 03 /1 3 // 3 ª R ev isã o: A m an da / Co rr eç ão : M ár ci o - 22 /0 3/ 20 13 BIOESTATÍSTICA A partir desses valores calcule, de forma aproximada, a amplitude da passada e altura da passada por meio das seguintes fórmulas: Amplitude da passada = 2 x (valor máximo no eixo horizontal – valor mínimo no eixo horizontal); Altura da passada = 2 x (valor máximo no eixo vertical – valor mínimo no eixo vertical); b 100 50 75 25 0 0 100 20050 150 Deslocamento horizontal (cm) De slo ca m en to v er tic al (c m ) 250 a c ∆a ∆c Figura 17 – Deslocamentos verticais e horizontais a partirdo eixo de coordenadas do ponto de referência posicionado no calcâneo, representativo de um ciclo de passada, método utilizado para quantificar a amplitude de passada Valor de média Os valores de média são calculados considerando a média aritmética dos valores de um conjunto de dados. A média é o valor de medida central mais utilizado, em função do seu fácil emprego e interpretação dos resultados, apresentando grande aplicabilidade para diversas populações. A média é geralmente representada pela letra x acrescida de um traço superior (leia‑se x barra). Dessa forma, tem‑se a seguinte fórmula: x x x x x n n n� � � � � � � 1 2 3 ... xi i=n n Sendo que: Σ x = soma de todos os valores de x. n = ao número de dados que temos no conjunto. 32 Unidade I Re vi sã o: C ar la - D ia gr am aç ão : M ár ci o - 22 /0 2/ 20 13 - || - 2ª R ev isã o Lu an e - co rr eç ão : F ab io - 1 8/ 03 /1 3 // 3 ª R ev isã o: A m an da / Co rr eç ão : M ár ci o - 22 /0 3/ 20 13 Vamos a um exemplo simples: imagine que tenhamos um conjunto de dados contendo os seguintes valores: 2, 5, 3, 7 e 8. Para este exemplo, Σ x será a soma de todos os valores, ou seja: Σ x = 2 + 5 + 3 + 7 + 8 Σ x = 25 E n corresponde ao número de valores que temos no conjunto; portanto: n = 5 Dessa forma, a média será: Média = 25/5 = 5 Para ficar mais claro, vamos a um exemplo prático: imagine que em um teste de resistência, dois alunos conseguiram executar os seguintes números de repetições em seis tentativas: • Aluno 1: 28, 29, 32, 35, 35, 30. • Aluno 2: 21, 20, 20, 21, 24, 19. A partir desses dados, vamos calcular o desempenho médio dos referidos alunos nos testes de resistência. Para tanto, temos o seguinte: • Desempenho médio do aluno 1: (28 + 29 + 32 + 35 + 35 + 30)/6 Desempenho médio do aluno 1: 189/6 = 31,5 repetições. • Desempenho médio do aluno 2: (21 + 20 + 20 + 21 + 24 + 19)/6 Desempenho médio do aluno 2: 125/6 = 20,83 repetições. Agora, poderíamos ter como objetivo realizar o cálculo do desempenho médio considerando os dois alunos em conjunto. Nesse caso, poderíamos somar os 12 valores e dividir por 12 (que é o número total de testes realizados pelos dois alunos). Entretanto, é importante lembrar que já calculamos o desempenho médio para cada aluno. Assim, de posse desses valores, bastará calcular uma nova média a partir dos valores correspondentes ao desempenho médio de cada aluno. 33 Re vi sã o: C ar la - D ia gr am aç ão : M ár ci o - 22 /0 2/ 20 13 - || - 2ª R ev isã o Lu an e - co rr eç ão : F ab io - 1 8/ 03 /1 3 // 3 ª R ev isã o: A m an da / Co rr eç ão : M ár ci o - 22 /0 3/ 20 13 BIOESTATÍSTICA Portanto, temos: • desempenho médio do aluno 1 = 31,5 repetições; • desempenho médio do aluno 2 = 20,83 repetições; • cálculo da Média = (31,5 + 20,83)/2 = 52,33/2 = 26,16; • desempenho médio dos dois alunos = 26,16 repetições. Vamos a mais dois exemplos práticos especificamente relacionados à área da Educação Física. Exemplo 1 Imagine que você pediu para um grupo de cinco alunos para que realizassem uma corrida leve (um trote). Durante essa atividade você decidiu aferir a frequência cardíaca em batimentos por minuto (b.p.m.) para cada aluno, e foram obtidos os seguintes valores: aluno 1: 123 b.p.m. aluno 2: 136 b.p.m. aluno 3: 154 b.p.m. aluno 4: 108 b.p.m. aluno 5: 121 b.p.m. Agora, você deseja calcular a frequência cardíaca média para esse grupo de alunos. Para tanto, deve ser realizado o seguinte cálculo: média = (123+136+154+108+121)/5 FC média = 128,4 b.p.m. Exemplo 2 Imagine, agora, que, para avaliar os possíveis índices de sobrepeso e obesidade de um grupo de alunos de uma turma de Educação Física Escolar, você mensurou a massa corporal de cada aluno desse grupo: massa corporal de dez alunos: 64 kg, 70 kg, 59 kg, 71 kg, 67 kg, 72 kg, 70 kg, 81 kg, 83 kg, 75 kg. Agora, você deseja calcular a massa corporal média desse grupo de alunos. Para tanto, será realizado o seguinte cálculo: 34 Unidade I Re vi sã o: C ar la - D ia gr am aç ão : M ár ci o - 22 /0 2/ 20 13 - || - 2ª R ev isã o Lu an e - co rr eç ão : F ab io - 1 8/ 03 /1 3 // 3 ª R ev isã o: A m an da / Co rr eç ão : M ár ci o - 22 /0 3/ 20 13 média = (64, 70, 59, 71, 67, 72, 70, 81, 83, 75)/10 massa corporal média = 71,2 kg Lembrete Para calcular a média, devem‑se somar todos os valores de um conjunto de dados e dividir pelo número de dados. Valor de Moda A moda é um valor de tendência central muito fácil de determinar em um conjunto de dados, pois também não envolve nenhum procedimento matemático específico. Para identificar o valor de moda, basta determinar o valor que mais se repete no conjunto de dados, ou seja, de maior frequência. Esse conceito apresenta significado semelhante ao que popularmente se chama de moda para outras aplicações. Por exemplo, quando dizemos que uma determinada modalidade de ginástica de academia está na moda, significa que muita gente está praticando essa modalidade. Podemos pressupor que se formos a uma academia, a sala dessa determinada modalidade estará cheia de alunos e que a maioria dos alunos da academia a estão praticando. Assim, chama‑se de moda aquilo que se repete com maior frequência. Figura 18 – Modalidade de ginástica de academia que pode ser considerada como moda 35 Re vi sã o: C ar la - D ia gr am aç ão : M ár ci o - 22 /0 2/ 20 13 - || - 2ª R ev isã o Lu an e - co rr eç ão : F ab io - 1 8/ 03 /1 3 // 3 ª R ev isã o: A m an da / Co rr eç ão : M ár ci o - 22 /0 3/ 20 13 BIOESTATÍSTICA Agora, vamos entender matematicamente o que isso representa. Imagine que você tem os seguintes valores no conjunto de dados (B). (B) = 4, 7, 9, 3, 6, 7, 2 Nesse exemplo, o valor de moda é 7, pois é aquele que mais vezes aparece no conjunto de dados. Agora, imagine que temos os seguintes valores no conjunto de dados (C). (C)= 3, 9, 10, 8, 8, 2, 9 Nesse caso, os valores de moda são 9 e 8, pois ambos se repetem duas vezes no conjunto de dados. Dessa forma, não temos apenas um valor de moda, mas dois. Lembrete A moda é o valor que mais se repete no conjunto de dados, ou seja, o valor de maior frequência. A partir disso, podemos dizer que um conjunto de dados pode apresentar diferentes formas de distribuição, podendo ser classificado como: • amodal: quando o conjunto de dados não apresenta nenhum valor de moda; • unimodal: quando apenas um valor de moda é identificado; • bimodal: quando dois valores de moda são identificados; • multimodal: quando mais de dois valores de moda são identificados. Vamos a um exemplo. Imagine os conjuntos de dados (A) e (B): (A) = 1, 2, 2, 2, 3, 4, 5, 6, 6, 6, 7, 9. (B) = 5, 5, 5, 3, 1, 5, 1, 6, 4, 3, 1, 5. Identifique o (s) valor (es) de moda para cada conjunto e classifique‑o como amodal, unimodal, bimodal ou multimodal. Conjunto (A): moda: 2 e 6; classificação: bimodal. 36 Unidade I Re vi sã o: C ar la - D ia gr am aç ão : M ár ci o - 22 /0 2/ 20 13 - || - 2ª R ev isã o Lu an e - co rr eç ão : F ab io - 1 8/ 03 /1 3 // 3 ª R ev isã o: A m an da / Co rr eç ão : M ár ci o - 22 /0 3/ 20 13 Conjunto (B): moda: 5; classificação: unimodal. Note que no conjunto (B) outros valores também se repetem (como o valor 1 e o valor 3), mas apenas o valor 5 é considerado como moda, uma vez que é aquele que mais se repete. Para fixarmos melhor essa ideia, vamos a outro exemplo: em seis avaliações de uma turma do curso de Educação Física, quatro alunos obtiveram as seguintes notas: • aluno 1: 8, 6, 7, 9, 6, 7; • aluno 2: 4, 6, 5, 6, 6, 7; • aluno 3: 7, 8, 5, 9, 6,10; • aluno 4: 6, 8, 7, 7, 8, 6. Determine o valor de moda para cada aluno e classifique o conjunto de notas de cada um como amodal, unimodal, bimodal ou multimodal.• Aluno 1: valores de moda – 6 e 7; classificação – bimodal. • Aluno 2: valor de moda – 6; classificação – unimodal. • Aluno 3: sem nenhum valor de moda; classificação – amodal. • Aluno 4: valores de moda – 6, 8 e 7; classificação – multimodal. Observação Um conjunto de dados pode ser classificado como amodal (sem moda), unimodal (um valor de moda), bimodal (dois valores de moda), e multimodal (mais de dois valores de moda). Valor de Mediana A mediana é uma medida de tendência central correspondente ao valor da variável que ocupa a posição central de um conjunto de n dados ordenados. Assim, para calcularmos o valor de mediana, o primeiro procedimento importante é colocarmos os valores do conjunto de dados em ordem crescente. Esse valor é geralmente expresso pelo símbolo Md. 37 Re vi sã o: C ar la - D ia gr am aç ão : M ár ci o - 22 /0 2/ 20 13 - || - 2ª R ev isã o Lu an e - co rr eç ão : F ab io - 1 8/ 03 /1 3 // 3 ª R ev isã o: A m an da / Co rr eç ão : M ár ci o - 22 /0 3/ 20 13 BIOESTATÍSTICA Assim, pode‑se dizer que o valor Md divide o conjunto de dados em duas partes de igual tamanho, ou seja, há mesma quantidade de valores menores e maiores em torno desse valor. Por exemplo, considere o conjunto de dados (A) formado pelos valores 2, 6, 3, 7, 8. Ao ordenarmos esse conjunto de dados, teremos a seguinte sequência de valores: Dados ordenados: Conjunto (A) = 2, 3, 6, 7, 8. A partir disso, o valor de mediana corresponde àquele valor que está no “meio”, ou seja, o valor central. Como nesse exemplo temos poucas variáveis (apenas cinco números), torna‑se mais fácil identificar esse valor. Temos dois valores para esquerda (números 2 e 3) e dois valores para direita (números 7 e 8), sendo que a variável correspondente ao número 6 ocupa a posição central, sendo, portanto, o valor da mediana. 2 3 6 7 8 ↑ Posição mediana Assim, Md = 6. Entretanto, nem sempre esse valor é identificável tão rapidamente, pois quando há um grande número de dados, essa rápida visualização torna‑se inviável. Exatamente por isso, após a primeira etapa de ordenamento dos dados, sugere‑se a aplicação da seguinte fórmula para identificar a posição da mediana: Posição da mediana = n+1 2 Nesse caso, n corresponde ao número de variáveis do conjunto de dados. Vamos aplicar essa fórmula no nosso exemplo anterior em que tínhamos o conjunto de dados (A) e você perceberá que o mesmo valor determinado anteriormente será obtido. O conjunto de dados (A) apresenta cinco valores; portanto, n é igual a 5. Assim, para identificar a posição da mediana no conjunto de dados (A), temos: Posição da mediana = 5 1 2 3 � � Portanto, para o conjunto (A), a valor de mediana está na posição 3 dos dados ordenados. 38 Unidade I Re vi sã o: C ar la - D ia gr am aç ão : M ár ci o - 22 /0 2/ 20 13 - || - 2ª R ev isã o Lu an e - co rr eç ão : F ab io - 1 8/ 03 /1 3 // 3 ª R ev isã o: A m an da / Co rr eç ão : M ár ci o - 22 /0 3/ 20 13 Dados ordenados: Conjunto (A) = 2, 3, 6, 7, 8. Valor da mediana na posição 3 = 6 Md = 6 Vamos a um exemplo aplicado à Educação Física: você registrou o número de saques no voleibol realizados com sucesso para nove alunos e obteve os seguintes valores: 13, 8, 7, 11, 9, 8, 12, 5, 10. Para calcular a mediana, a primeira coisa a se fazer é ordenar esses valores: Dados ordenados: Valores de saques realizados com sucesso = 5, 7, 8, 8, 9, 10, 11, 12, 13. Para esse conjunto de dados, temos o valor de n igual a 9 (número de variáveis do conjunto). Agora, usando a fórmula para encontrar a posição da mediana, temos: Posição da mediana = 9 1 2 5 � � Valor da mediana na posição 5 = 9 Md = 9 Dessa forma, a utilização desse procedimento permitirá a identificação de forma simples e rápida do valor correspondente à mediana. Entretanto, a identificação direta desse valor ocorre apenas quando temos um número ímpar de variáveis no nosso conjunto de dados. Note que nos dois exemplos anteriores o valor de n era ímpar (no conjunto de dados (A), o n era igual a 5; e 9 alunos realizaram saques no voleibol – portanto, nessa condição o n era 9). Lembrete A mediana corresponde ao valor da variável que ocupa a posição central de um conjunto de n dados ordenados. Quando o valor correspondente a n for um número ímpar, ao encontrar a posição da mediana, você terá exatamente a mesma quantidade de valores superiores e inferiores ao valor da Md. E quando o conjunto de dados tiver um número par de variáveis? Como devemos proceder nessa situação? 39 Re vi sã o: C ar la - D ia gr am aç ão : M ár ci o - 22 /0 2/ 20 13 - || - 2ª R ev isã o Lu an e - co rr eç ão : F ab io - 1 8/ 03 /1 3 // 3 ª R ev isã o: A m an da / Co rr eç ão : M ár ci o - 22 /0 3/ 20 13 BIOESTATÍSTICA Figura 19 – Registro do número de saques no voleibol realizados com sucesso para nove alunos Para ficar mais claro, vamos a um exemplo: imagine que você tenha os seguintes valores no conjunto de dados (B). Conjunto de dados (B) = 4, 8, 2, 1, 9, 6 Como vimos, o primeiro passo é ordenar os dados desse conjunto. Dessa forma, temos: Conjunto de dados (B) = 1, 2, 4, 6, 8, 9 O próximo passo é aplicar a fórmula para encontrar a posição da mediana: n+1 2 Como o conjunto de dados (B) apresenta seis variáveis, temos nosso valor de n nessa condição correspondente a 6. Então, aplicando a fórmula anterior para determinarmos a posição da mediana, teremos: Posição da mediana = 6 1 2 3 5 � � , 40 Unidade I Re vi sã o: C ar la - D ia gr am aç ão : M ár ci o - 22 /0 2/ 20 13 - || - 2ª R ev isã o Lu an e - co rr eç ão : F ab io - 1 8/ 03 /1 3 // 3 ª R ev isã o: A m an da / Co rr eç ão : M ár ci o - 22 /0 3/ 20 13 O problema é que não existe a posição 3,5, existe um valor correspondente à posição 3 e outro correspondente à posição 4, mas a posição 3,5 não é real e, portanto, não podemos atribuir diretamente um valor de Md. Nessa situação, utilizamos os valores em torno da posição encontrada e calculamos a média desses dois valores. Seguindo o nosso exemplo anterior, encontramos a Md na posição 3,5. Assim, vamos tomar os valores de uma posição imediatamente superior e de uma posição imediatamente inferior para calcularmos a média desses valores. A posição imediatamente superior a 3,5 é o valor na posição 3, e aquela imediatamente inferior é o valor na posição 4. Considerando o conjunto de dados ordenados, temos: • valor na posição 3 = 4; • valor na posição 4 = 6. Agora, calculamos a média entre esses dois valores. Dessa forma, temos: Média entre os valores das duas posições = (4+6)/ 2 = 5 Portanto, para o conjunto de dados (B), em que o valor de n corresponde a um número par, encontramos o seguinte valor de Md. Valor da mediana na posição 3,5 = 5 Md = 5 Vamos a outro exemplo mais diretamente relacionado à área da Educação Física. Imagine oito crianças pulando corda e que queira determinar quantas vezes elas conseguem saltar seguidamente sem cometer nenhum erro. Considerando o desempenho de cada criança, você chega ao seguinte conjunto de dados: Saltos realizados com sucesso: 23, 41, 9, 17, 22, 39, 12, 28. Agora, vamos calcular o número de Md para esse conjunto de dados, sendo a primeira etapa ordenar os dados. Saltos realizados com sucesso (ordenados): 9, 12, 17, 22, 23, 28, 39, 41. A segunda etapa é achar a posição da mediana. Considerando que temos 8 valores (oito crianças saltaram), nosso n é igual a 8. Posição da mediana= n� � � � 1 2 8 1 2 4 5, 41 Re vi sã o: C ar la - D ia gr am aç ão : M ár ci o - 22 /0 2/ 20 13 - || - 2ª R ev isã o Lu an e - co rr eç ão : F ab io - 1 8/ 03 /1 3 // 3 ª R ev isã o: A m an da / Co rr eç ão : M ár ci o - 22 /0 3/ 20 13 BIOESTATÍSTICA Como o valor de n é par,
Compartilhar