Baixe o app para aproveitar ainda mais
Prévia do material em texto
Estatística & Bioestatística (2017) – Lauro Boechat Batista; Keila Moreira Batista - Cap. 1 - População e Amostras 1 1 INTRODUÇÃO 1.1 DEFINIÇÃO Segundo Ronald A. Fisher (1890-1962), o maior estatístico de todas as épocas, Estatística é a Matemática aplicada aos dados de observação. No entanto, para melhor compreensão, vamos supor que desejamos prever quem será o próximo presidente do Brasil. Assim, fazemos um planejamento de uma pesquisa, executamos a pesquisa, coletamos os dados, analisamos os dados e chegamos a uma determinada conclusão de quem será o próximo presidente da república. Logicamente, nesse planejamento, determinamos o tamanho da amostra, de acordo com o erro máximo que pretendemos cometer. Na análise dos dados, aplicamos métodos estatísticos para tirarmos conclusão sobre a população, com relação à intenção dos eleitores, a partir da pesquisa efetuada. Isto que vem ser a Estatística, ou seja, temos um questionamento, planejamos um experimento, conduzimos o experimento, coletamos os dados, analisamos os dados e depois concluímos a pesquisa. A Estatística é aplicada na solução de questionamentos por meio de experimentos planejados e conduzidos, com a obtenção e análise dos dados, com a devida conclusão. Estatística & Bioestatística (2017) – Lauro Boechat Batista; Keila Moreira Batista - Cap. 1 - População e Amostras 2 Se a Estatística trabalhar com dados biológicos, da saúde de maneira geral e da medicina, em particular, ela assume um nome especial, passando a ser denominada Bioestatística. A Estatística é subdividida em diversas partes, como a Estatística Descritiva, Estatística Inferencial, Estatística Matemática, Amostragem, Testes Não-paramétricos, Modelos Lineares, Estatística Experimental, Superfícies de respostas etc. No entanto, para iniciantes, a estatística será estudada em apenas duas, sendo uma delas a Descritiva e a outra Inferencial. Na Estatística Descritiva, planejamos os experimentos, executamos os experimentos, coletamos os dados, determinamos as principais medidas estatísticas como as de tendência central e de dispersão, analisamos os dados, apresentamos os dados por meio de tabelas e gráficos e as conclusões versam somente sobre as amostras estudadas. Na Estatística Inferencial ou Indutiva, temos os mesmos procedimentos da Estatística Descritiva, diferenciando-se dela pois as conclusões são estendidas para as populações, por meio de intervalos de confiança e testes de significância, baseando-se na teoria das probabilidades. A diferença entre a Estatística Descritiva e a Inferencial é que na primeira as conclusões só valem para as amostras, enquanto que na segunda as conclusões podem ser projetadas para as populações de onde as amostras foram obtidas, por meio do emprego de intervalos de confiança e testes de significância (testes de hipóteses), com o uso da teoria das probabilidades. Estatística & Bioestatística (2017) – Lauro Boechat Batista; Keila Moreira Batista - Cap. 1 - População e Amostras 3 1.2 MOTIVOS DO EMPREGO DA ESTATÍSTICA Em um campeonato brasileiro de futebol são 20 times, que jogam entre sim no turno e no returno. É lógico que nas inúmeras partidas, temos os números de gols, de faltas, de impedimentos, de vitórias, de expulsões etc. Assim sendo, se perguntar a qualquer torcedor, quantos gols os times A e B, digamos, fizeram e quantos gols levaram, é impossível precisar essas quantidades, salvo se houver o emprego da Estatística, pois ela apresenta, por meio de gráficos e tabelas, esses números questionados. Portanto, sem a Estatística, jamais poderíamos ter esses dados, com fidedignidade. Um outro exemplo, o quanto você gasta todos os meses, durante um determinado ano. Ora, ao responder este questionamento, ninguém iria detalhar o que gasta em cada mês. Para facilitar, diria: em média, eu gasto R$ 2.500,00 por mês, usando a Estatística. Assim sendo, nesses dois simples exemplos, você está vendo como a Estatística é importante e como descreve os fenômenos. 1.3 BREVE HISTÓRICO DA ESTATÍSTICA A Estatística começou a ser aplicada bem antes do nascimento de Jesus Cristo. Era usada na coleta de informações relativas às taxas, às produções agrícolas, aos censos, etc. O próprio nascimento do Nosso Senhor Jesus Cristo é relatado na Bíblia Sagrada como um fato estatístico, pois naquela época saíra um decreto de César Augusto para que todos se alistassem na sua própria cidade e, assim, José e Maria encaminharam-se à Belém, onde nasceu Cristo. Estatística & Bioestatística (2017) – Lauro Boechat Batista; Keila Moreira Batista - Cap. 1 - População e Amostras 4 Segundo Wikipédia, o termo estatística surge da expressão em latim statisticum collegium palestra sobre os assuntos do Estado, de onde surgiu a palavra em língua italiana statista, que significa "homem de estado", ou político, e a palavra alemã Statistik, designando a análise de dados sobre o Estado. A palavra foi proposta pela primeira vez no século XVII, em latim, por Schmeitzel na Universidade de Jena e adotada pelo acadêmico alemão Godofredo Achenwall. Matemáticos como Pascal, Leibnitz, Fermat e Bernoulli deram grandes contribuições ao desenvolvimento da Estatística, principalmente na parte referente à probabilidade, de modo a utilizar estratégias nos jogos de azar. Em 1733 DeMoivre descreveu a equação da distribuição normal, a qual é de suma importância na Estatística. Esta equação é conhecida como distribuição Gaussiana, em homenagem a Gauss, que também derivou esta equação de um estudo de erros em medidas repetidas de uma mesma quantidade. Galton cooperou no desenvolvimento da Estatística, no campo das ciências sociais. Sua mais notável contribuição foi na aplicação da Estatística em problemas envolvendo hereditariedade e eugenia. Galton e Karl Pearson trabalharam em conjunto na teoria da regressão e correlação. Pearson ainda colaborou no desenvolvimento da teoria da amostragem. William S. Gosset contribuiu para o progresso da Estatística, em especial na publicação de seus estudos relativos aos resultados de pesquisas baseados em pequenas amostras. Gosset publicou seus trabalhos sob o nome de “Student”. O teste t de “Student” é, sem sombra de dúvidas, um fato importante. De todos, o mais importante foi Ronald A. Fisher que estudou e desenvolveu a teoria de pequenas amostras, como também a Estatística Experimental. Estatística & Bioestatística (2017) – Lauro Boechat Batista; Keila Moreira Batista - Cap. 1 - População e Amostras 5 Muitos outros pesquisadores contribuíram de modo significativo na Estatística, como Box, Scheffé, Cochran, Cox, Federer, Finney, Hunter, John, Kempthorne, Satterthwaite, Snedecor, Tukey, Wilson, Yates e Steel, sendo que este último um dos autores deste capítulo teve a oportunidade de jantar na casa dele, em North Carolina, USA, em 1977. No Brasil, temos diversos pesquisadores que trabalham com Estatística e um dos mais importantes e dos mais famosos foi, indiscutivelmente, o Prof. Pimentel Gomes (Professor Catedrático da Escola Superior de Agricultura “Luiz de Queiroz”), orientador de mestrado em Experimentação e Estatística de um dos autores, e gentilmente citou um trabalho desse autor denominado “Delineamento em Círculos”, no capítulo relativo a superfícies de resposta, em seu famoso livro de Estatística Experimental. Os Professores Frederico Pimentel Gomes, Isaías Rangel Nogueira, Humberto de Campos,Roberto Simionato, Décio Barbim e outros grandes mestres criaram no Brasil o primeiro Curso de pós-graduação em Experimentação e Estatística, na Escola Superior de Agricultura “Luiz de Queiroz” da Universidade de São Paulo (USP), de renome internacional. No Km 47, na antiga Escola Nacional de Agronomia (ENA) da Universidade Rural do Brasil (URB), atual UFRRJ, além do Prof. Alberto de Figueiredo Penteado, contamos com a Dra. Dirce Pinto Pacca de Souza Britto, uma incansável professora e pesquisadora na área de Estatística, quando um dos autores deste capítulo teve a oportunidade de trabalhar com ambos. À ela e ao Prof. Frederico Pimentel Gomes, nossas homenagens eternas. 1.4 CAMPOS DE APLICAÇÃO A Estatística é aplicada em quase todos os campos das ciências. Por exemplo, na agricultura, quando procuramos pesquisar a respeito das melhores variedades de Estatística & Bioestatística (2017) – Lauro Boechat Batista; Keila Moreira Batista - Cap. 1 - População e Amostras 6 soja para o Estado do Paraná, deve-se fazer diversos experimentos envolvendo variedades de soja, naquele estado, para depois, por meio da análise do conjunto de experimentos, indicar qual ou quais a(s) variedade(s) que melhor rendimento proporciona(m). Um outro exemplo, na agricultura, é a pesquisa relativa às doses ideais dos nutrientes, de modo a se alcançar a produção máxima de uma cultura, quando se faz adubação. Nesse sentido, foram desenvolvidos diversos delineamentos experimentais propícios ao ajustamento aos dados um polinômio do segundo grau, com duas ou mais variáveis independentes. É uma área onde um dos autores deste capítulo atua com bastante desenvoltura, criando novos delineamentos, quando pesquisador do CNPq, orientando diversas bolsas de iniciação científica, nessa área de delineamentos experimentais, atuando como professor da Universidade Federal Rural do Rio de Janeiro. Na pecuária, o campo de aplicação da Estatística também é vastíssimo. Por exemplo, quais são as melhores rações para o crescimento e engorda de frangos de corte? Quais são as raças de bovinos de leite que proporcionam maior produção leiteira? Qual é a data ideal de abate de frangos de corte? Qual a data ideal, após o nascimento dos suínos, para se fazer a castração? Qual a percentagem de um nutriente em uma determinada ração, de modo que se obtenha uma ração bem eficiente? Perguntas deste tipo são respondidas, satisfatoriamente, por meio da experimentação estatística. Um dos autores orientou diversas teses de mestrado e doutorado em pecuária, onde os pesquisadores procuravam comparar os tipos de fecundação artificial em eqüinos, os períodos entre partos, a idade ao primeiro parto de vacas leiteiras, o comprimento da carcaça, a influência da castração na engorda de suínos, etc. Estatística & Bioestatística (2017) – Lauro Boechat Batista; Keila Moreira Batista - Cap. 1 - População e Amostras 7 Na Medicina Veterinária, o campo de aplicação da Estatística também é de grande valia. Por exemplo, pode-se argüir se o tetramisol influencia ou não no combate à doença de Newcastle. Pode-se perguntar qual o efeito de um determinado parasito na quantidade de hemácias/mm3 do sangue de um animal. Pode-se pesquisar o tempo de duração da validade de uma determinada vacina, sob certas condições. Pode-se estudar o efeito da mastite na composição química e física do leite. Essas indagações e muitas outras são respondidas por meio do emprego de tratos estatísticos. Um dos autores orientou também diversas teses de mestrado e doutorado em Medicina Veterinária, onde os pesquisadores procuraram estudar o efeito de Warfarina Técnica a 2% no combate aos morcegos hematófagos, o uso do tetramisol como coadjuvante para o combate à doença de Newcastle, o efeito da palpação do útero de vacas para o aparecimento do primeiro cio, o efeito da suplementação alimentar pós- parto sobre a produção e reprodução de vacas mestiças leiteiras, o estudo da idade ao primeiro parto de vacas leiteiras, o estudo de suco ruminal de caprinos, o estudo da ocorrência de esporos e toxinas de Clostridium botulinum Tipos C e D em cacimbas utilizadas como bebedouros de bovinos em pastagens no Vale do Araguaia, Estado de Goiás, Brasil, etc. Na Medicina, a Estatística é muito aplicada, principalmente na parte referente a Epidemiologia e Saúde Pública. Um dos autores orientou dissertações de mestrado e teses de doutorado, na parte relativa à Estatística, envolvendo a influência da sílica no desenvolvimento da doença denominada silicose, do hormônio RT3 como fator de diagnose em indivíduos cardíacos, dos fatores que influenciam as doenças sexualmente transmissíveis (DST), do estudo comparativo da pressão intra-ocular e da acuidade visual após facotrabeculectomia com incisão de um sítio ou em dois sítios, etc. Nas pesquisas florestais, a Estatística é utilizada de diversas maneiras. Por exemplo, pode-se pesquisar quais são as melhores variedades de eucalipto para a produção de celulose, qual é a época ideal do corte dos eucaliptos, qual é a adubação Estatística & Bioestatística (2017) – Lauro Boechat Batista; Keila Moreira Batista - Cap. 1 - População e Amostras 8 ideal das espécies florestais, qual é a produção estimada de celulose em uma determinada floresta, etc. Perguntas desse tipo e muitas outras a Estatística responde, com certo grau de confiabilidade. Na Educação Física, por exemplo, pode-se pesquisar se o tênis é um esporte elitista ou não. Pode-se pesquisar qual é o melhor tipo de treinamento para a corrida dos 200 metros. Pode-se, também, pesquisar qual o número de dias para que uma determinada equipe de basquete atinja o ponto ideal. Pode-se pesquisar o número de batimentos cardíacos quando se usa uma determinada técnica de exercícios. As respostas às indagações anteriores e muitas outras são explicadas por meio da Estatística. Na Química, Física, Biologia, Administração, Ciências Econômicas e Sociais e muitas outras, a Estatística tem um imenso campo de aplicação. Com o passar dos tempos, o estudante irá vendo a aplicação da Estatística, na sua área de estudo. 1.5 IMPORTÂNCIA A Estatística é de suma importância, pois sem a mesma não há progresso de uma nação. Por exemplo, se não pudéssemos estimar a produção e o consumo de café, no Brasil, como poderíamos saber qual a quantidade disponível desse produto para a exportação? Aliás, você sabia que a estimativa da produção de café no Brasil pode abalar a bolsa de mercadoria de Chicago? Um determinado governo deseja melhorar os sistemas de saúde e de ensino no Brasil. Como ele poderia adotar determinadas medidas se não soubesse dados a respeito da população brasileira? Como a população mundial vem crescendo a cada ano, o importante é o aumento da produtividade, principalmente da agropecuária. Como se pode aumentar a produtividade da soja, por exemplo, sem fazermos experimentação agrícola, a qual Estatística & Bioestatística (2017) – Lauro Boechat Batista; Keila Moreira Batista - Cap. 1 - População e Amostras 9 envolve o emprego da Estatística? Por meio desses exemplos e de muitos outros, o leitor poderá constatar a importância da Estatística. 1.6 POPULAÇÃO Todas as vezes que se deseja fazer uma pesquisa científica há necessidade de se estabelecer a população a ser estudada. Geralmente ela é delimitada no tempo e no espaço. Em qualquer pesquisa científica, há necessidade do envolvimento da estatística para dar credibilidade a mesma. A credibilidade de uma pesquisa é em função dos métodos estatísticosadotados. Para melhor compreensão, é necessário o entendimento do que vem a ser uma população, pois geralmente uma pesquisa científica visa a população e raramente a um dado isolado, a não ser em estudo de caso. Por exemplo, se você leitor tiver uma opinião sobre a didática de um determinado professor, o seu parecer isolado não é um dado importante, pois pode ser que o professor não seja simpático a você (e assim poderia influenciar negativamente em sua resposta) ou então que o professor seja simpático a você (e assim poderia influenciar positivamente em sua resposta). Desta forma, a sua opinião isolada não é fundamental. Por outro lado, se a maioria dos leitores achasse que o professor não tem uma didática boa, aí poder-se-ia dizer que o professor deixa a desejar, caso contrário, se a maioria fosse de opinião que o professor tem uma didática boa, aí o professor poderia comemorar a sua didática. Estatística & Bioestatística (2017) – Lauro Boechat Batista; Keila Moreira Batista - Cap. 1 - População e Amostras 10 Inúmeras pesquisas são realizadas constantemente e na área da saúde são conduzidas de modo a desenvolver drogas para combater determinadas doenças. Logicamente, essas pesquisas não são realizadas objetivando o benefício de uma determinada pessoa, mas sim, da população. Em ambos os casos, verifica-se que o objetivo é a população e não pessoas isoladas. Por definição, população é um conjunto de elementos com características definidas no tempo e no espaço. População é um conjunto de elementos com características definidas no tempo e no espaço. Por exemplo, todos os alunos do curso de Enfermagem do Univeritas, em 2017, formam uma população. Neste caso, o conjunto de elementos seria todos os alunos, a característica definida seria curso de Enfermagem, enquanto que o Univeritas é o espaço e 2017 é o tempo. Assim, esta população está bem definida. Observe que todos os elementos de uma população têm de ter pelo menos uma característica em comum. No exemplo citado, uma das características em comum é de serem do Univeritas, outra seria de pertencerem ao curso de Enfermagem. Ao abordarmos o conceito de população, os elementos referem-se a pessoas, animais, plantas, objetos etc., ou seja, não necessariamente a pessoas. Os elementos de uma população podem ser pessoas, animais, plantas, objetos etc. Estatística & Bioestatística (2017) – Lauro Boechat Batista; Keila Moreira Batista - Cap. 1 - População e Amostras 11 Como os elementos de uma população têm de ter características definidas, implica dizer que todos os elementos têm de ter pelo menos uma característica em comum. Todos os elementos de uma população têm de ter pelo menos uma característica em comum. Entretanto, se a característica definida fosse “alunos dos cursos superiores” do Univeritas, em 2017, certamente todos os alunos do curso de Enfermagem do Univeritas não formariam uma população, mas seriam uma parte de uma população, que é denominada amostra. Amostra é uma parte de uma população. A definição de população de um estudo é de extrema importância na pesquisa científica. Assim, à medida que acrescentamos características à população, a mesma fica igual ou menor do que a anterior. Por exemplo, os alunos da Universidade Federal Fluminense no ano de 2017 formam uma população. Entretanto, se disséssemos os alunos do sexo feminino da Universidade Federal Fluminense no ano de 2017 teríamos uma nova população, com um número de elementos menor ou igual ao anterior, onde não se especificou o sexo. Seria igual se na UFF estudassem somente alunos do sexo feminino. O leitor poderá notar se acrescentássemos uma outra característica, como, por exemplo, moradores de Niterói, a população tenderia a ficar menor, pois somente iríamos considerar os alunos do sexo feminino, moradores de Niterói e que fossem estudantes da UFF, em 2017. Estatística & Bioestatística (2017) – Lauro Boechat Batista; Keila Moreira Batista - Cap. 1 - População e Amostras 12 Quanto mais características forem consideradas na população, menor será o seu tamanho. Assim, antes de começarmos qualquer estudo, é necessário definirmos a população, tanto no espaço quanto no tempo. Por exemplo, os alunos da UFRRJ no ano de 2017 formam uma população (delimitamos tanto o espaço - UFRRJ – quanto o tempo - 2017), pois senão os alunos da UFRRJ anterior e posteriormente ao ano de 2017 fariam parte da população. Se faz mister que uma população seja definida no tempo e no espaço. Podemos ter dois tipos de população, a saber: 1.6.1 População finita Uma população é finita quando ela é constituída de um número finito de elementos. População finita é aquela constituída por um número limitado de elementos. Por exemplo, os alunos dos cursos superiores da Universidade Estácio de Sá do primeiro semestre do corrente ano letivo formam uma população finita, pois existe um número limitado de elementos (alunos) no presente semestre. Pode-se concluir que se a população é finita, então pode-se trabalhar com todos os elementos da população, embora na grande maioria das vezes trabalha-se com amostras. Estatística & Bioestatística (2017) – Lauro Boechat Batista; Keila Moreira Batista - Cap. 1 - População e Amostras 13 No caso de população finita, pode-se trabalhar com todos os elementos da população. 1.6.2 População infinita Uma população é infinita quando ela é constituída de um número infinito de elementos. População infinita é aquela constituída por um número ilimitado de elementos. Por exemplo, os alunos dos cursos superiores da UFRRJ formam uma população infinita, pois não podemos precisar a quantidade de alunos, haja vista não ter sido delimitado o tempo. Observe que quando não delimitamos o tempo, podemos considerar todos os alunos desde à época da fundação da UFRRJ até os próximos anos vindouros, constituindo um número infinito de elementos. Um outro exemplo de população infinita: os peixes dos oceanos. Não temos a mínima noção de quantos são e quais são. Portanto, não existe possibilidade de se trabalhar com todos os elementos de uma população se ela for infinita, pois não temos possibilidade de conhecer todos os elementos. Não existe possibilidade de se trabalhar com todos os elementos no caso de população infinita. Estatística & Bioestatística (2017) – Lauro Boechat Batista; Keila Moreira Batista - Cap. 1 - População e Amostras 14 Embora uma população seja finita, a mesma pode ser considerada como infinita, quando ela é grande. Assim, os alunos da Universidade Estácio de Sá no presente semestre letivo é uma população finita que pode ser considerada como sendo infinita, para efeito de cálculos. Mesmo sendo uma população finita, se ela for grande, pode ser considerada como infinita para efeito de cálculos. Embora a literatura consultada não cite qualquer outro tipo de classificação de população, pode-se inovar e fazer um novo tipo de classificação de população, considerando o seu comportamento. Quando há renovação na população, com relação aos seus elementos, de tal sorte que os seus atributos não sofram modificações significativas, dizemos que a população é imutável. Em caso contrário, a população é dita ser mutável, isto é, quando os atributos sofrem modificações significativas. População imutável quando seus elementos são substituídos por outros,mas suas características permanecem praticamente as mesmas. Caso contrário, se sofrerem modificações perspectiveis, a população é dita ser mutável. Por exemplo, a população dos docentes da Universidade Estácio de Sá do ano de 2016 para a de 2017. Embora tenha havido algumas substituições no corpo docente, estas não modificaram significativamente os atributos dessa população, com relação ao grau máximo de instrução dos mesmos, por exemplo. Assim, poderíamos dizer que a população, nesse caso, é imutável. Estatística & Bioestatística (2017) – Lauro Boechat Batista; Keila Moreira Batista - Cap. 1 - População e Amostras 15 Entretanto, quando comparamos a população de docentes da Universidade Estácio de Sá de vinte anos atrás com a atual, podemos dizer que ela sofreu uma mutação, haja vista que os seus atributos foram modificados, significativamente. 1.7 AMOSTRAS Se estivermos interessados em saber a opinião do povo brasileiro com relação aos graus de aceitação/rejeição do atual presidente da República do Brasil, o leitor poderá notar que é praticamente impossível perguntar a todos os brasileiros o que pensam a respeito do presidente, além, é claro, de ser uma pesquisa de custo elevadíssimo. Assim, podemos ver que é difícil trabalhar com a população total, neste exemplo. Portanto, em pesquisa de opinião não se costuma trabalhar com toda a população, mas sim, com uma parte da população. Um outro exemplo é com relação à eficiência de uma partida de fósforos. Logicamente, se riscássemos todos os fósforos para sabermos a eficiência dos mesmos, tal procedimento não faria sentido, pois iríamos consumir toda a carga. Portanto, o leitor poderá notar que, nesse caso, é impossível trabalhar com toda a população. Então, bastaria trabalhar com uma porção de caixa de fósforos para se saber a eficiência dos fósforos. Se estivéssemos interessados em estudar o sangue de um determinado paciente, não poderíamos retirar todo o sangue daquele paciente, que seria a população de sangue daquele paciente. Assim, teríamos de trabalhar com uma porção, digamos, de 5 mL de sangue. Mais um exemplo, se quisermos saber se o ponche está bom, não precisamos beber todo o ponche, mas apenas uma ou duas taças, embora alguns (apreciadores) diriam que seria necessário tomar umas 20 a 30 taças. Estatística & Bioestatística (2017) – Lauro Boechat Batista; Keila Moreira Batista - Cap. 1 - População e Amostras 16 Portanto, o leitor poderá verificar que na impossibilidade de se trabalhar com a população, deve-se trabalhar com uma parte da mesma e essa porção da população é o que chamamos de amostra. Raramente trabalha-se com toda a população por diversos motivos e assim utiliza-se amostra que é uma porção de uma população. Mas, o que nos interessa, nos exemplos, é a população, isto é, o que pensa o povo brasileiro a respeito do presidente do Brasil, qual a eficiência dos fósforos, naquela partida, as condições do hemograma do paciente, e o sabor do ponche. Assim, o leitor poderá concluir que se trabalharmos com amostras, estas devem ser representativas de suas populações, para não chegarmos a resultados distorcidos. Vamos supor que deseja-se pesquisar qual o professor mais inteligente da Universidade Estácio de Sá e que na pesquisa adotou-se uma amostra constituída de três pessoas (Kellen, Keila e Karla, que são filhas do prof. Boechat). O resultado da pesquisa foi que o professor mais inteligente da Estácio é o professor Lauro Boechat. Portanto, verifica-se que esta amostra não é representativa da população, pois a amostra foi constituída exclusivamente das filhas do professor, levando a um resultado incorreto. Uma amostra tem de ser representativa da população para não se chegar a conclusões errôneas. Existem diversos institutos de opinião pública e um dos mais importantes e dos mais conhecidos é o IBOPE, no Brasil, o qual sempre trabalhou com amostras. Estatística & Bioestatística (2017) – Lauro Boechat Batista; Keila Moreira Batista - Cap. 1 - População e Amostras 17 Para se ter uma idéia de ordem de grandeza do tamanho de uma amostra, na eleição de 2.014 para presidente do Brasil, o IBOPE trabalhou com aproximadamente 2.000 eleitores (amostra) para um universo (população) de mais de 150.000.000 de eleitores, em cada pesquisa de opinião. Assim, pode-se dizer que trabalhar com amostras é bem mais fácil, mais econômico, mais rápido e mais eficiente. Trabalhar com amostra é mais fácil, mais econômico, mais rápido e mais eficiente. 1.8 PARÂMETROS Já vimos que o importante para nós é a população. Portanto, o ideal seria se pudéssemos trabalhar com toda a população. Entretanto, isto é praticamente impossível, na grande maioria das vezes. Por outro lado, devemos representar a população por valores e estes valores são os que denominamos de parâmetros. Por exemplo, suponha que a altura média de todos os alunos da UFF, no segundo semestre de 2016, do Curso de Medicina Veterinária, fosse de 1,67 m. Logicamente, as alturas dos alunos do Curso de Medicina Veterinária da UFF, no segundo semestre de 2016, é uma característica e todos os alunos com esta característica formam uma população. O valor 1,67 m é um parâmetro, da variável altura. Assim, por meio do parâmetro podemos ter uma ideia da população. Parâmetros são valores que representam uma população, ou seja, dão ideia dos atributos da população. Observe o leitor que todos os elementos da população têm de ter, pelo menos, uma característica em comum. Assim, no exemplo, todos eles foram alunos do Curso de Medicina Veterinária, na UFF, no segundo semestre de 2016, embora eles Estatística & Bioestatística (2017) – Lauro Boechat Batista; Keila Moreira Batista - Cap. 1 - População e Amostras 18 pudessem ter outras características diferentes. A altura, o peso, as notas obtidas no vestibular, etc. são variáveis que podem ser estudadas dessa população. Se dissermos que a média de aprovação dos alunos foi 8,5 em Anatomia, podemos ter noção como os alunos foram bem nesta disciplina. Assim, o parâmetro é um valor que possibilita ao pesquisador fazer ideia sobre a população. Vamos supor que a população de alunos dos cursos superiores da Universidade Federal Rural do Rio de Janeiro, no ano passado, fosse constituída de 30.000 alunos. Se estivermos interessados em saber qual é a altura média dessa população, devemos somar as 30.000 alturas e depois dividirmos o resultado por 30.000. Assim, teríamos a média populacional, que é um parâmetro. Suponhamos que o resultado obtido tenha sido 1,66 m, isto é, a média populacional = 1,66 m. Se novamente perguntássemos a cada aluno a sua altura e depois somássemos as 30.000 alturas e dividíssemos o resultado por 30.000, iríamos encontrar o mesmo valor para a média populacional, isto é, = 1,66 m, pois a altura de cada aluno seria a mesma. Portanto, verificamos que parâmetros são valores fixos obtidos de uma população. Parâmetros são valores fixos obtidos de uma população. 1.9 ESTIMATIVAS Repetimos que o importante é a população e, assim, é necessário descrever os parâmetros de uma população, para termos noção sobre a população. Entretanto, como praticamente não trabalhamos com a população, mas sim com amostras, ao invés de determinarmos os parâmetros podemos estimar os seus valores. Vamos utilizar o mesmo exemplo anterior, quando trabalhamos com parâmetros. Supondo que a média paramétrica seja desconhecida, se trabalharmos com todos os valores da populaçãopodemos calcular a mesma. Para que isto ocorra, é necessário Estatística & Bioestatística (2017) – Lauro Boechat Batista; Keila Moreira Batista - Cap. 1 - População e Amostras 19 somarmos todos os valores da população e depois dividirmos o resultado obtido pelo número de elementos da população. No exemplo anterior, = 1,66 m. No entanto, se não quisermos trabalhar ou se não pudermos trabalhar com todos os valores da população, logicamente não teremos uma média paramétrica. Assim, se trabalharmos com uma parcela da população, isto é, se trabalharmos com amostra, o valor obtido será uma estimativa do verdadeiro valor da população (parâmetro). Por exemplo, se a nossa amostra for constituída de 100 elementos, certamente devemos somar as 100 alturas e depois dividirmos o resultado por 100 e, assim, teremos uma estimativa da média. Esta estimativa poderá ser igual, superior ou inferior ao verdadeiro parâmetro, que supomos anteriormente ser igual a 1,66 m. Se utilizarmos uma outra amostra, logicamente o valor da estimativa da média não precisará ser igual ao valor da estimativa da média da amostra anterior, salvo se os mesmos elementos que entraram na amostra anterior participarem também nessa amostra, o que é praticamente impossível, probabilisticamente. Portanto, as estimativas da média podem ser diferentes, embora próximas do valor paramétrico, de acordo com a amostra obtida. Então, podemos definir estimativas como sendo valores variáveis obtidos de amostras. Estimativas (estatísticas) são valores variáveis obtidos de amostras. A média de uma amostra é um estimador, enquanto que o valor da média da amostra é uma estimativa. Portanto, existe diferença entre estimador e estimativa. A medida que representa uma amostra é um estimador e o valor dessa medida é uma estimativa. Estatística & Bioestatística (2017) – Lauro Boechat Batista; Keila Moreira Batista - Cap. 1 - População e Amostras 20 A medida que representa uma amostra é um estimador e o valor dessa medida é uma estimativa. Vamos supor dois candidatos (A e B) disputando a prefeitura em um município e que foram realizadas três pesquisas antes da eleição, cujos resultados, abstraindo-se dos nulos e brancos, encontram-se na tabela abaixo: Tabela 1.1. Intenções de votos nos candidatos A e B em três pesquisas efetuadas e resultado final da eleição no município, no ano de 2016. Pesquisas Candidato A Candidato B Primeira 62,5% 37,5% Segunda 63,0% 37,0% Terceira 65,0% 35,0% Resultado da eleição 63,4% 36,6% Analisando a Tabela 1.1, verifica-se que as percentagens iguais a 62,5%, 63,0% e 65,0% foram valores obtidos pelo candidato A nas amostras, portanto, são estimativas, enquanto que a percentagem obtida na eleição (63,4%) englobando toda a população é o parâmetro. O estimador vem ser a proporção nas pesquisas e os valores das proporções nas pesquisas são as estimativas. Mesmo raciocínio poderia ser feito para o candidato B. Geralmente o IBOPE faz pesquisa com 2% de erro. O que significa isto? Se no exemplo tivesse sido adotado o erro da pesquisa igual a 2%, ao se determinar a estimativa na primeira pesquisa do percentual de intenção de votos no candidato A igual a 62,5%, significa que se a eleição fosse naquele momento o verdadeiro valor (parâmetro) de intenção de votos no candidato A estaria entre 62,5% ± 2%, ou seja, o parâmetro estaria entre 60,5% a 64,5%. Na eleição, o parâmetro foi igual a 63,4%, dentro do intervalo. Para as pesquisas 2 e 3 os intervalos de confiança seriam, respectivamente, 61% a 65% e 63% a 67%. Estatística & Bioestatística (2017) – Lauro Boechat Batista; Keila Moreira Batista - Cap. 1 - População e Amostras 21 Intervalo de confiança é o espaço onde o parâmetro deve estar contido. Um exemplo bastante prático na área da saúde é com relação ao estudo da eficiência dos medicamentos. Por exemplo, quando se faz uma pesquisa com um determinado medicamento, com 2% de erro, e se a eficiência obtida na amostra foi de 90%, isto implica dizer que a eficiência verdadeira (parâmetro) está entre 90% ± 2%, ou seja, a eficiência verdadeira está entre 88% a 92%. Se em uma pesquisa, com 2% de erro, envolvendo uma amostra, indicar 90% de eficiência para um medicamento, indica que a sua verdadeira eficiência está entre 88% a 92%. Supondo que a Anvisa libera qualquer medicamento com eficiência maior do que 85%, então o medicamento do exemplo anterior poderia ser liberado para consumo, pois o mínimo que poderia alcançar (88%) é maior do que 85% preconizado pela Anvisa. Quando a Anvisa estipula que para um medicamento ser liberado tem de ter eficiência maior do que um percentual x, então a eficiência mínima que o medicamento tem de atingir (valor mínimo do intervalo de confiança), considerando o erro da pesquisa, deve ser maior do que o estipulado pela Anvisa, acrescida do erro. Estatística & Bioestatística (2017) – Lauro Boechat Batista; Keila Moreira Batista - Cap. 1 - População e Amostras 22 Por exemplo, se a Anvisa determinar que para um medicamento ser liberado tem de ter eficiência maior do que 85% e se foi feita uma pesquisa com 2% de erro, então para que o medicamento seja liberado a eficiência mínima do medicamento encontrada na pesquisa tem de ser maior do que 87%, pois 87% - 2% = 85%. Por outro lado, se a Anvisa determinar que para um medicamento ser liberado tem de ter eficiência igual ou maior do que 85% e se foi feita uma pesquisa com 2% de erro, então para que o medicamento seja liberado a eficiência mínima do medicamento encontrada na pesquisa tem de ser igual ou maior do que 83%, pois 85% - 2% = 83%. Se para o medicamento ser liberado a sua eficiência tem de ser igual ou maior do que um percentual x, então a eficiência mínima que o medicamento tem de atingir deve ser igual ou maior do que o estipulado pela Anvisa, subtraída do erro. 1.10 AMOSTRAGEM Já vimos que trabalhar com amostras é bem mais interessante, pois a pesquisa torna-se mais fácil, mais rápida, mais econômica e mais eficiente, além, é claro, de que na maioria das vezes ser impossível trabalhar com toda a população. Portanto, o uso da amostra torna-se fundamental. Por outro lado, é de suma importância que uma amostra seja representativa da população, pois senão podemos estimar valores que não representem fidedignamente a população. Assim, exige-se certas técnicas para a obtenção de amostras não tendenciosas ou imparciais e estas técnicas são obtidas por meio da amostragem. Estatística & Bioestatística (2017) – Lauro Boechat Batista; Keila Moreira Batista - Cap. 1 - População e Amostras 23 Amostragem é um ramo da estatística que estuda as amostras não tendenciosas. Existem muitas técnicas para a obtenção de amostras não tendenciosas e diversos livros tratam desse assunto e tivemos a oportunidade de fazer, a nível de pós- graduação, pelo menos dois cursos sobre amostragem. Os leitores deverão consultar livros específicos sobre amostragem, caso estejam mais interessados nesse assunto. Ao escolhermos uma amostra de uma população, devemos ter bastante cuidado, de modo que a mesma não proporcione estimativas tendenciosas, viezadas ou parciais. As estimativas devem ser não tendenciosas, imparciais ou sem viés. Por exemplo, se perguntássemos entre os políticos adversários o que eles pensavam a respeito do então presidente do Brasil, logicamente as respostas não seriam satisfatórias, digamos que 98% atribuiriam como sendoum governo ruim, provocando um erro grande de amostragem. Por outro lado, se fizéssemos a mesma pergunta somente aos correligionários do Presidente, provavelmente as respostas seriam totalmente ao contrário, digamos que 93% consideraria o governo bom, provocando, também, um erro grande de amostragem. Isso, nos dois casos, porque a amostragem não foi feita corretamente. Deve-se ser cuidadoso na obtenção de amostras de tal sorte que não nos leve a resultados falsos. No caso de levantamento de dados, principalmente com o uso de questionários, quando é pesquisa de campo, tem-se os principais tipos de amostras: Estatística & Bioestatística (2017) – Lauro Boechat Batista; Keila Moreira Batista - Cap. 1 - População e Amostras 24 1.10.1 Amostra Casualizada, Randômica ou Aleatória Uma amostra é casualizada, randômica ou aleatória quando todos os elementos da população têm a mesma probabilidade de participarem da amostra. Amostra casualizada, randômica ou aleatória é aquela na qual todos os elementos da população têm a mesma probabilidade de participarem da amostra. Geralmente, os elementos que farão parte da amostra são obtidos por meio de sorteio. Por exemplo, considere uma turma (população) de 100 alunos, onde deseja-se obter uma amostra de 15 elementos. Se colocarmos os 100 nomes dos alunos em uma urna e retirarmos (com ou sem reposição) 15 nomes, todos eles terão a mesma probabilidade de pertencerem à amostra, independentemente da amostragem ser com ou sem reposição, desde que todos os papéis com os nomes escritos tenham o mesmo tamanho, ou seja, todos os papéis sejam semelhantes, de tal sorte que nenhum deles tenha mais chance de ser escolhido por mero acaso do que um outro. Por outro lado, se colocássemos na urna o nome do aluno A repetido 5 vezes, o do aluno B repetido 3 vezes, o do aluno C repetido 4 vezes e dos demais uma só vez, é fácil verificar que os alunos A, B e C teriam probabilidades maiores de serem selecionados do que os demais. Portanto, nesse segundo exemplo, a amostra extraída não é casualizada. É uma amostra tendenciosa, viezada ou viciada. Estatística & Bioestatística (2017) – Lauro Boechat Batista; Keila Moreira Batista - Cap. 1 - População e Amostras 25 Na amostra aleatória geralmente faz-se sorteio para a obtenção dos elementos que farão parte da amostra e jamais um sorteio para ganhar um determinado prêmio. 1.10.2 Amostra Sistemática Uma amostra é sistemática quando se adota um sistema intervalar de tempo ou de espaço para a obtenção dos dados. Amostra sistemática é aquela na qual adota-se um sistema intervalar de tempo ou espaço para a obtenção dos dados. Por exemplo, suponhamos que estamos interessados em fazer uma pesquisa sobre diversos atributos das famílias da cidade do Rio de Janeiro que vão passar, de carro, o fim de semana na Região dos Lagos, no Estado do Rio de Janeiro. É fácil verificar que é impossível colocar todos os nomes de todas as famílias em uma urna para depois extrairmos uma certa quantidade de famílias, para que possamos fazer a pesquisa. Portanto, neste caso, a amostra a ser extraída da população não pode ser uma amostra casualizada. Assim, para a obtenção dessa amostra, devemos adotar um sistema, diferente da casualização. Por exemplo, se colocarmos os entrevistadores (as pessoas que coletam os dados) na ponte Rio-Niterói, no sentido Rio para Niterói, no pedágio, para obtermos os dados, um certo sistema tem de ser adotado de modo que não atrapalhe o fluxo do trânsito. Portanto, parar os carros de final 1, por exemplo, ou senão de 50 em 50 carros, não são sistemas satisfatórios, pois provavelmente haverá engarrafamento na ponte. Assim, deve-se adotar um sistema de modo que haja fluxo normal dos veículos. Talvez Estatística & Bioestatística (2017) – Lauro Boechat Batista; Keila Moreira Batista - Cap. 1 - População e Amostras 26 o melhor sistema seja parar um carro de 20 em 20 minutos para cada entrevistador, desde que o tempo de coleta das informações seja inferior a 20 minutos, é claro. Este tipo de amostra é o que chamamos de amostra sistemática, isto é, foi adotado um sistema intervalar de tempo para a obtenção dos dados. Um outro exemplo é quando em uma turma de 200 alunos queremos obter uma amostra de 10 alunos. Assim, dividimos 200 por 10, cujo resultado 20 significa que a cada 20 alunos obtemos um deles para compor a amostra sistemática. Ou seja, para sabermos qual vai ser o primeiro aluno que fará parte da amostra, sorteamos um número entre 1 a 20 e a partir do número sorteado selecionamos de 20 em 20 alunos. Neste caso o sistema intervalar é de espaço. Façamos de conta que o número sorteado foi 8. Assim, os 10 alunos que farão parte da amostra serão os de ordem 8º., 28º., 48º., 68º., 88º., 108º., 128º., 148º., 168º. e 188º.. Devemos sempre sortear o primeiro número, pois senão a tendência seria pegar o aluno de ordem 1 para fazer parte da amostra e a partir dele selecionaríamos de 20 em 20. Por exemplo, se o primeiro número sorteado entre os 20 fosse o número 15, o primeiro seria de ordem 15º., o segundo 35º., 55º., e assim sucessivamente até o de ordem 195º. 1.10.3 Amostra Estratificada Uma amostra é estratificada quando dividimos a população em estratos e dentro de cada estrato retiramos uma certa quantidade de elementos. Amostra estratificada é aquela na qual dividimos a população em estratos e dentro de cada estrato retiramos uma certa quantidade de elementos. Estatística & Bioestatística (2017) – Lauro Boechat Batista; Keila Moreira Batista - Cap. 1 - População e Amostras 27 A extração dos elementos dentro de cada estrato pode ser por meio da casualização ou senão adotando uma coleta sistemática. Embora o termo mais apropriado seja colheita de dados, usaremos o termo coleta que é o mais conhecido pelos pesquisadores. Na montagem dos estratos devemos considerar que os elementos dentro dos estratos têm de ter pelo menos uma característica em comum. No exemplo anterior poderíamos, também, obter os dados por meio de outro tipo de amostragem. Sabemos que a Região dos Lagos é composta de diversos locais e, assim, iríamos obter os dados dentro de cada local, isto é, seriam obtidos dados em Saquarema, Maricá, Araruama, etc. Então, na obtenção da amostra dividimos a população em estratos e dentro de cada estrato retiramos uma certa quantidade de elementos. Certamente, a quantidade dentro de cada estrato irá depender, fundamentalmente, da variação dos dados dentro de cada estrato. Maior variação requer maior quantidade de dados. Um outro exemplo de amostra estratificada é quando desejamos estudar as alturas dos alunos dos cursos superiores da Universidade Federal Rural do Rio de Janeiro, em um determinado semestre. Podemos dividir a população em estratos (os cursos: Agronomia, Veterinária, Administração, Educação Física, etc.) e dentro de cada estrato obter uma certa quantidade de elementos. Logicamente, a quantidade de elementos dentro de cada estrato vai depender da variação dos dados, isto é, menor variação dos dados no estrato implica em menor quantidade de elementos a ser obtido naquele estrato. Observe o leitor que todos os alunos de Agronomia, Veterinária, Biologia, Zootecnia, etc. têm uma característica em comum que define a população – serem alunos da Universidade Rural – enquanto que cada estrato tem a sua própria característica – alunos de um determinado curso Estatística & Bioestatística(2017) – Lauro Boechat Batista; Keila Moreira Batista - Cap. 1 - População e Amostras 28 (Agronomia, Veterinária, etc.). Assim, os componentes de cada estrato têm de ter as suas próprias características. 1.10.4 Amostra estratificada proporcional Uma amostra é estratificada quando dividimos a população em estratos e dentro de cada estrato retiramos uma certa quantidade de elementos. Se retirarmos proporcionalmente a quantidade de elementos de cada estrato, dizemos que a amostra é estratificada proporcional. Amostra estratificada proporcional é aquela na qual dividimos a população em estratos e dentro de cada estrato retiramos uma quantidade de elementos proporcional ao tamanho de cada estrato. Por exemplo, vamos supor que uma universidade A seja constituída de 600 alunos de Administração, 500 alunos de Ciências Contábeis, 900 alunos de Direito, 800 alunos de Enfermagem e 1.200 alunos de Medicina. Portanto, o tamanho da população é de 4.000 alunos. Desejamos obter uma amostra estratificada proporcional de 600 alunos, ou seja, 600 em 4.000 representam 15%. Desta forma, devemos retirar de cada estrato (curso) 15% dos alunos para a composição da amostra estratificada proporcional. Deste modo, a amostra estratificada proporcional será de 90 alunos do curso de Administração (15% de 600), 75 alunos do curso de Ciências Contábeis (15% de 500), 135 alunos do curso de Direito (15% de 900), 120 alunos de Enfermagem (15% de 800) e 180 alunos do curso de Medicina (15% de 1.200). Então, a amostra estratificada proporcional será constituída de 90 + 75 + 135 + 120 + 180 = 600 alunos. Estatística & Bioestatística (2017) – Lauro Boechat Batista; Keila Moreira Batista - Cap. 1 - População e Amostras 29 1.10.5 Amostra por Conglomerado Amostra por Conglomerado é aquela onde dividimos a população em conglomerados (seções ou estratos), sorteamos um ou mais conglomerado e trabalhamos com os elementos dos conglomerados sorteados. Amostra por Conglomerado é aquela na qual dividimos a população em estratos, sorteamos um ou mais estratos e trabalhamos com os elementos dos estratos sorteados. A Amostra por Conglomerado é semelhante à Amostra Estratificada, pois divide- se a população em estratos, sendo que na Estratificada trabalha-se com todos os estratos enquanto que na Amostra por Conglomerado trabalha-se somente com os estratos sorteados. Por exemplo, no caso do estudo das alturas dos alunos dos cursos superiores da Universidade Federal Rural do Rio de Janeiro, dividiríamos a população em seções (Agronomia, Veterinária, Biologia, Zootecnia, etc.) e depois selecionaríamos por mero acaso um certo número de seções e iríamos trabalhar com os elementos das seções selecionadas. Suponhamos que desejássemos trabalhar com duas seções as quais foram sorteadas Veterinária e Engenharia Florestal. Assim, a amostra seria constituída dos estudantes de Veterinária e de Engenharia Florestal da Universidade Feral Rural do Rio de Janeiro. Esta amostra assim obtida seria por conglomerados. Estatística & Bioestatística (2017) – Lauro Boechat Batista; Keila Moreira Batista - Cap. 1 - População e Amostras 30 Geralmente o aluno faz confusão entre amostra aleatória e amostra por conglomerado. Na amostra aleatória os elementos são sorteados, enquanto que na amostra por conglomerados os estratos é que são sorteados. Amostra aleatória os elementos são sorteados e na amostra por conglomerados os estratos é que são sorteados. 1.10.6 Amostra por Conveniência Amostra por Conveniência é aquela onde os dados são obtidos por comodidade, por conveniência. Amostra por conveniência é aquela na qual adotamos um processo prático e conveniente para a obtenção dos dados. Por exemplo, se quisermos estudar algum atributo dos discentes da Universidade Estácio de Sá, campus Taquara, ficaríamos em um determinado local e a alguns alunos que passassem por aquele local, faríamos a pergunta sobre aquele atributo. Um outro método, o professor poderia perguntar a todos os alunos que passassem diante de sua sala de aula. 1.11 VARIÁVEIS Ao se fazer uma pesquisa científica, geralmente trabalhamos com variáveis. Estatística & Bioestatística (2017) – Lauro Boechat Batista; Keila Moreira Batista - Cap. 1 - População e Amostras 31 Variável é uma característica da população. Assim, altura e o peso dos elementos de uma população são exemplos de variáveis. As variáveis podem ser determinísticas ou aleatórias. 1.11.1 Variáveis Determinísticas Seja a seguinte seqüência de números: 2, 7, 12, 17, 22, 27, 32, ... O leitor poderá facilmente deduzir que o próximo valor da variável será 37, pois os números estão em progressão aritmética, de razão 5. Este tipo de variável é o que chamamos de variável determinística. A Estatística não trabalha com este tipo de variável, pois a probabilidade do evento ocorrer seria de 100%, isto é, a probabilidade de saber exatamente o próximo valor da variável é 100%. 1.11.2 Variáveis Aleatórias Na seqüência de alturas de alunos: 1,70 m; 1,67 m; 1,91 m; 1,87 m; 1,72 m; 1,68m; 1,170 m; 1,71m... não existe qualquer “pista” para podermos afirmar com 100% de certeza qual será o próximo valor da variável. Este tipo de variável é o que chamamos de variável aleatória, isto é, quando a sua estimativa está sujeita a erro. Variável aleatória é aquela na qual a sua estimativa está sujeita a erro. Por exemplo, quando quisermos “adivinhar” a altura de uma pessoa, geralmente “chutamos” a altura dela, mas não temos 100% de certeza de que acertamos. Esse tipo de variável é que chamamos de aleatória, pois está sujeita a erro. Existem dois tipos de variáveis aleatórias, a saber: Estatística & Bioestatística (2017) – Lauro Boechat Batista; Keila Moreira Batista - Cap. 1 - População e Amostras 32 1.11.2.1 Variável qualitativa (categórica) Uma variável é qualitativa quando se refere à qualidade. Por exemplo, a didática de um professor (excelente, boa, regular, ruim e péssima), cor das rosas (vermelha, branca, amarela, etc.), tipos de doenças pulmonares (câncer, tuberculose, silicose, etc.) são variáveis qualitativas. As variáveis qualitativas podem ser nominais e ordinais. 1.11.2.1.1 Variáveis Qualitativas Nominais As variáveis qualitativas nominais são aquelas cujas respostas podem ser encaixadas em categorias, sendo que cada categoria é independente, sem nenhuma relação com as outras. Por exemplo, times de futebol (Botafogo, Flamengo, Vasco, Fluminense, etc.), sexo (masculino, feminino), raça (branca, preta, amarela, etc.), são exemplos de variáveis nominais. Variáveis qualitativas nominais são aquelas que podem ser classificadas em categorias, não ordenadas. 1.11.2.1.2 Variáveis Qualitativas Ordinais As variáveis qualitativas ordinais são aquelas cujas categorias se mantém uma relação de ordem com as outras. Por exemplo, os conceitos obtidos em uma disciplina (reprovado, D, C, B e A), o desempenho de um candidato em uma entrevista (péssimo, ruim, regular, bom, ótimo) e a classe social (baixa, média e alta). Estatística & Bioestatística (2017) – Lauro Boechat Batista; Keila Moreira Batista - Cap. 1 - População e Amostras 33 Variáveis qualitativas ordinais são aquelas que podem ser classificadas em categorias ordenadas. Em uma variável qualitativa ordinal pode-se atribuir valores, ou seja, no caso do desempenho deum candidato pode-se atribuir 1 se for péssimo, 2 se for ruim, 3 se for regular, 4 se for bom e 5 se for ótimo. 1.11.2.2 Variável Quantitativa Variável quantitativa é a variável que refere à quantidade. Por exemplo, o número de alunos por turma, o peso dos alunos, as alturas dos alunos, etc. são variáveis quantitativas. As variáveis quantitativas podem ser: discretas e contínuas. 1.11.2.2.1 Variável Discreta Variável discreta é aquela que pode assumir somente determinados valores dentro de um certo campo de variação. Variáveis quantitativas discretas são aquelas que podem assumir determinados valores dentro de um campo de variação. Todas as vezes que pudermos “enumerar” ou “contar”, trata-se de variável discreta. Por exemplo, o número de alunos por turma, o número de leitões por leitegada, o número de hemácias por mm3 de sangue, o número de filhos por família e o número de pessoas com sífilis são exemplos de variável discreta. O salário dos Estatística & Bioestatística (2017) – Lauro Boechat Batista; Keila Moreira Batista - Cap. 1 - População e Amostras 34 funcionários de uma indústria também é um exemplo de variável discreta, pois o salário é contado e a sua variação é em centavos. No caso do número de filhos por família, só pode ocorrer 0, 1, 2,..., n filhos pois não pode ocorrer 2,35 filhos, por exemplo. Assim, a variação é de 1 em 1 filho. Já no caso dos salários, não existe o valor R$ 389,4567, pois os salários variam de centavos em centavos (menor variação), isto é, entre R$ 120,00 e R$ 120,05 só existem R$ 120,00; R$ 120,01; R$ 120,02; R$ 120,03; R$ 120,04 e R$ 120,05. 1.11.2.2.2 Variável Contínua Variável contínua é aquela que pode assumir todos e quaisquer valores dentro de um certo campo de variação. Variáveis quantitativas contínuas são aquelas que podem assumir todos e quaisquer valores dentro de um campo de variação. Quando pudermos “medir” ou “pesar”, a variável em questão é contínua. Assim, a temperatura, os pesos de frangos ao abate, a produção agrícola de arroz em kg/ha, a velocidade de um veículo, as alturas dos alunos da Universidade Federal Fluminense, a pressão sistólica e a idade das pessoas são exemplos de variáveis contínuas (as pessoas vivem continuamente). Entre as alturas 1,70 m e 1,72 m existem uma infinidade de alturas, ou seja, a variável pode assumir quaisquer valores dentro deste intervalo. Basta aumentarmos a precisão da medição. O leitor poderá observar que a altura de um indivíduo de 1,70 m (número fracionário) é igual a 170 cm (número inteiro). Portanto, não faz sentido dizer que a Estatística & Bioestatística (2017) – Lauro Boechat Batista; Keila Moreira Batista - Cap. 1 - População e Amostras 35 variável contínua está restrita aos números fracionários e a variável discreta aos números inteiros, como erroneamente alguns livros afirmam. Uma observação bem interessante é a seguinte: quando perguntamos a altura de um aluno e ele responde 1,89 m, a variável altura é quantitativa contínua, pois pode ser medida. No entanto, se perguntarmos a esse aluno qual a sua estatura (baixa, média ou alta), ele responderá alta, ou seja, está classificando. Nesse caso, embora a altura seja uma variável quantitativa contínua, a estatura é qualitativa ordinal. Como verificar o tipo de variável: a maneira mais simples é fazer uma pergunta, abordando a variável. Se para responder à pergunta a pessoa tiver de contar, pesar ou medir, ela é quantitativa, sendo no caso de contar é quantitativa discreta e pesar ou medir quantitativa contínua. Por outro lado, se a pessoa não precisar contar, pesar ou medir, ela é qualitativa. Se puder ser ordenada, é qualitativa ordinal. Se não puder ser ordenada, é qualitativa nominal. Exercício 1.1 Seja a população constituída por 100 pesos de alunos, em kg, dados a seguir: 62 59 62 56 60 73 55 61 61 55 58 55 60 68 64 62 52 63 60 63 64 59 57 54 59 52 67 67 60 63 65 69 70 59 72 52 54 70 67 59 66 55 59 64 54 59 54 61 62 55 54 66 53 57 59 60 62 58 56 58 75 66 61 61 69 58 58 60 56 59 51 59 58 63 71 60 60 64 59 63 57 64 60 49 63 59 54 55 53 60 68 58 67 65 57 57 54 54 67 59 Estatística & Bioestatística (2017) – Lauro Boechat Batista; Keila Moreira Batista - Cap. 1 - População e Amostras 36 Obtenha as seguintes amostras: a) uma amostra casualizada de 10 elementos. b) uma amostra sistemática de 5 elementos. c) uma amostra estratificada de 2 elementos por estrato, considerando cada coluna como um estrato. d) uma amostra por conglomerado de 2 estratos com 3 elementos por estrato, considerando cada coluna como um estrato (conglomerado).
Compartilhar