Prévia do material em texto
Compilado Por: Esmail Henriques Curso: Módulo: Código do Módulo: Nivel Formador: Nome de formando/a: Número:___ Turma:_____ Esmail Henriques Estatística Descritiva Curso: Eletricidade Indústrial Módulo: Resolver problemas de estatística Código do Módulo: UC HG034002171 Nivel: IV Formador: de formando/a: ____________________________ Beira , setembro de 2022 P á g i n a 1 | 44 Resolver problemas de estatística HG034002171 P á g i n a 2 | 44 Compilado Por: Esmail Henriques Índice 1. Habilidades de estudo 3 1.2. Precisa de apoio? 3 1.3. Avaliação 3 2. Introdução à estatística 4 2.2. Fases do método estatístico: 4 2.3. Um pouco de historia da estatística 5 2.4. Importância da estatística 6 3. Conceitos básicos da estatística 8 3.1. Conceitos de população e amostra 9 3.1.1.tipos de amostragem 9 3.2.tipos de variáveis 11 4. Distribuição de frequências e gráficos 15 4.1. Tabela de frequências 15 4.2. Distribuição de frequências 15 5. Gráficos de distribuição de frequências 21 6. Medidas de tendência central 25 7. Anexos 40 7.1. Auto avaliação 40 P á g i n a 3 | 44 Compilado Por: Esmail Henriques 1. HABILIDADES DE ESTUDO Caro estudante \ formandos! Para frequentar com sucesso este módulo terá que buscar através de uma leitura cuidadosa das fontes de consulta a maior parte da informação ligada ao assunto abordado. Para o efeito, no fim de cada unidade \ resultados de aprendizagem apresenta-se uma sugestão \ dúvidas de livros para leitura complementar. Antes de resolver qualquer tarefa ou problema, o estudante \ formandos deve certificar se de ter compreendido a questão colocada; É importante questionar se as informações colhidas na literatura são relevantes para a abordagem do assunto ou resolução de problemas; Sempre que possível, deve fazer uma sistematização das ideias apresentada no texto. Desejamos - lhe muitos sucessos! 1.2. PRECISA DE APOIO? Dúvidas e problemas são comuns ao longo de qualquer estudo. Em caso de dúvida numa matéria tente consultar os manuais e Docentes \ formadores disponíveis na instituição onde se encontra. Se tiver dúvidas na resolução de algum exercício, procure estudar os exemplos semelhantes apresentados no manual. Se a dúvida persistir, consulte seus colegas que entendera a matéria. Se a dúvida persistir, veja a resolução do exercício. Sempre que julgar pertinente, pode consultar o tutor que está à sua disposição na tua instituição. Não se esqueça de consultar também colegas da escola que tenham compreendido ou feito a cadeira de Estatística, vizinhos e até estudantes de universidades que vivam na sua zona e tenham ou estejam a fazer cadeiras relacionadas com Estatística. 1.3. AVALIAÇÃO O Módulo de Estatística terá 4 avaliações que deverá ser feito na instituição onde se encontra. A avaliação visa não só informar-nos sobre o seu desempenho nas lições, mas também estimular- lhe a rever alguns aspectos e a seguir em frente. Durante o estudo deste módulo o estudante será avaliado com base na realização de avaliação, caso se não alcança terá que reavaliação ou autoavaliação previstas em cada resultado de aprendizagem ou unidade. P á g i n a 4 | 44 Compilado Por: Esmail Henriques 2. INTRODUÇÃO À ESTATÍSTICA 2.1. OBJECTO DA ESTATÍSTICA De uma forma sintética, pode-se dizer que a Estatística é um conjunto de técnicas apropriadas para recolher, classificar, apresentar e interpretar conjuntos de dados numéricos. E tem por objectivo a análise e avaliação numérica de observações. Os computadores e calculadoras são meios excelentes para trabalhar com Estatística. Assim, a Estatística é mais um método do que uma teoria, pois o seu objectivo fundamental é descrever fenómenos e não tanto explicá-los. O método estatístico na medida em que utiliza a linguagem de números, é um método quantitativo. Num estudo estatístico, normalmente segue-se um conjunto de passos que designamos por fases do método estatístico para facilitar o estudo estatístico. 2.2. FASES DO MÉTODO ESTATÍSTICO: a) Definição do problema - a primeira fase consiste na definição e formulação do problema a ser estudado. O investigador deve ainda analisar outros estudos feitos sobre o mesmo tema. b) Planificação - definido o problema, é preciso determinar um processo para o resolver e em especial, como obter informações sobre a variável em estudo. É nesta fase que se decide pela observação de toda população ou de uma amostra e a calendarização das actividades a realizar. c) Recolha de dados - os dados podem ser recolhidos através de: Questionário; Entrevista; Observação; Experimentação; Pesquisa bibliográfica, etc. d) Organização ou classificação de dados - consiste em “resumir” os dados através da sua contagem e agrupamento. Deste modo, obtém-se um conjunto de números que possibilita distinguir o comportamento do atributo estatístico. e) Apresentação dos dados - há duas formas de apresentação que não se excluem mutuamente: Apresentação por tabelas; P á g i n a 5 | 44 Compilado Por: Esmail Henriques Apresentação por gráficos. Estas formas de apresentar dados, permitem sintetizar grandes quantidades de dados, tornando mais fácil a compreensão do carácter em estudo e permitindo uma futura análise. f) Análise e interpretação dos dados - é a mais importante e delicada do estudo estatístico, pois é nesta fase que se tiram conclusões que ajudam o investigador a resolver o problema. Nesta fase, ainda é possível, por vezes, “arriscar” alguma generalização, a qual envolverá sempre algum grau de incerteza. Ao estudo estatístico interessam os fenómenos não deterministas cujos resultados envolvem alguma incerteza (inflação, resultados de uma eleição, …). Os fenómenos deterministas ou causais (queda de um móvel, a resistência a rotura de um material, …), para os quais existe uma lei matemática que os define, não serão naturalmente estudados em Estatística. 2.3. UM POUCO DE HISTORIA DA ESTATÍSTICA A origem de Estatística remota a tempos muito antigos da nossa história e começou por tratar de assuntos de Estado. A palavra Estatística tem origem na palavra em latim status, traduzida como o estudo do Estado e significava, originalmente, uma colecção de informação de interesse para o estado sobre população e economia. Essas informações eram colectadas objectivando o resumo de informações indispensáveis para os governantes conhecerem suas nações e para a construção de programas de governo Há indícios de que por volta do ano 3000 a.c. já se faziam censos na Babilónia, na China e no Egipto com o propósito de cobrar impostos e para fins militares. O livro quarto do Antigo Testamento refere que Moisés foi instruído pelo profeta a fazer um levantamento dos homens de Israel que estivessem aptos a guerrear. Na época do Imperador César Augusto foi ordenada a realização de um censo em todo o Império romano no primeiro ano da nossa era (na região entre Douro e Guadiana). Apesar da sua origem remota, é apenas no séc. XVII que a Estatística começa a ser considerada uma disciplina autónoma. Para esta autonomia, muito contribuiu a acção do alemão Herman Conring (1606 - 1681) ao introduzir o seu estudo na universidade de Helmstadt, no que foi continuado por Godofred Achenwall (1719-1772) e por Schlozer (1735-1809). P á g i n a 6 | 44 Compilado Por: Esmail Henriques No Séc. XVII, surge também a escola inglesa. John Graunt (1620-1674) e William Petty (1623- 1687) dois dos seus mais destacados representantes, preocuparam-se com o estudo numérico dos fenómenos sociais e políticos numa primeira tentativa de determinarem leis quantitativas capazes de exemplificarem tais fenómenos. A Graunt se deve a primeira investigação estatística sobre a mortalidade, como consta de uma memória queapresentou á Real Sociedade de Londres, em 1661. Nesse estudo, Graunt concluiu que nasciam mais crianças do sexo masculino do que do sexo feminino, que as mulheres tendiam a viver mais tempo do que os homens e que o número de mortes (excepto durante as epidemias) se mantinha sensivelmente constante de ano para ano. Na Alemanha, o Pastor Sussmilch (1707-1767) conduziu um estudo sobre Demografia, que colocou como o precursor da Estatística enquanto meio indutivo de investigação. O passo decisivo para a fundamentação teórica da inferência estatística encontra se associado ao desenvolvimento do cálculo das probabilidades. 2.4. IMPORTÂNCIA DA ESTATÍSTICA Nos nossos dias, a Estatística assume uma importância decisiva a diversos níveis. A importância da Estatística pode ser vista através da sua utilização ao nível do Estado, de Organizações Sociais e profissionais, do Cidadão comum e ao nível científico. Ao nível do Estado, hoje em dia quase todos as decisões importantes que se tomam são acompanhadas de estudos estatísticos e o mesmo se pode dizer relativamente á justificação da adequação ou não das políticas seguidas por diferentes governos. O grau de importância atribuído a Estatística, neste caso, é tão grande que praticamente todos os países possuem organismos oficiais destinados a realização de estudos estatísticos - Instituto Nacional de Estatística (INE). No que respeita as organizações sociais e Profissionais, tem se vindo a assistir a um aumento do uso da Estatística. Relativamente as Organizações Sociais, empresas, sindicatos, organizações de assistência social, etc. Todas elas conduzem a sua acção recorrendo mais ou menos a Estatística. Por exemplo, uma empresa quando lança um novo produto indaga pessoas acerca desse produto com o fim de determinar índices de potenciais compradores. No que concerne aos grupos profissionais, são também cada vez maiores as exigências na utilização de Estatística. Muitas vezes tal utilização acompanha diversas fases do seu trabalho, que vão desde a planificação passando pela execução e terminando na análise dos resultados. P á g i n a 7 | 44 Compilado Por: Esmail Henriques Destaca-se, ao nível das organizações, o aparecimento recente e o grande incremento de empresas e profissões ligadas a publicidade e técnicas de marketing, nas quais a Estatística desempenha um papel central. A Estatística é também responsável pelo desenvolvimento científico em geral. Para além da sua aplicabilidade nas Ciências Naturais, na Medicina, na Agronomia e na Economia, a Estatística constitui um suporte de cientificidade para as ciências humanas e sociais. É assim que ciências como a Sociologia, a Psicologia, a História e a Pedagogia têm beneficiado de consideráveis desenvolvimentos e de aumento de credibilidade pública com a utilização de meios estatísticos. Exercícios 1. Descreve o objecto de estudo de estatística; 2. Dê pelo menos dois exemplos de utilização de estatística no seu dia-a-dia 3. Que procedimentos devem ser observados num estudo estatístico? 4. Numa página, fundamente a importância do estudo da Estatística na sua área\especialidade? P á g i n a 8 | 44 Compilado Por: Esmail Henriques 3. CONCEITOS BÁSICOS DA ESTATÍSTICA ESTATÍSTICA – é uma técnica que trata da COLETA, APRESENTAÇÃO, TRATAMENTO E ANÁLISE DOS DADOS, tendo como objectivo a GERAÇÃO DE INFORMAÇÃO para a tomada de decisão ou para a compreensão do fenómeno. DADOS INFORMAÇÃO 12 12 15 15 17 17 17 18 18 18 18 19 19 19 19 19 19 20 20 21 Média Mediana Moda Quartil, Decil e Percentil Noção Popular da Estatística Gráficos e Tabelas Campo que organiza e descreve os dados experimentais. Campo que refere a análise e interpretação. (Relação entre Estatística Descritiva e Estatística Inferencial): Para analisar e interpretar é preciso organizar e descrever. Por isso a Estatística subdivide-se em: Estatística Descritiva Estatística Indutiva (Inferencial) A Estatística Descritiva (dedutiva): consiste em métodos para organizar e resumir informação ou ainda, é a parte da estatística que procura somente descrever e analisar um certo grupo, sem tirar conclusões ou inferências sobre um grupo maior. Estatística descritiva ou dedutiva inclui a construção de gráficos, quadros, tabelas, e o cálculo de várias medidas descritivas como média, variação, moda, mediana, variância, desvio padrão, quartís, decís, percentís, etc. A Estatística Indutiva (estatística Inferencial)refere-se o estudo de técnicas que possibilitam a extrapolação (ilação ou inferência), a um grande conjunto de dados, das informações e conclusões obtidas a partir dos subconjuntos de valores, usualmente de dimensão muito menor. A P á g i n a 9 | 44 Compilado Por: Esmail Henriques inferência estatística só se aplica para casos em que partimos do estudo duma amostra para tirar conclusões sobre a população. Como essa inferência não pode ser absolutamente certa, a linguagem da probabilidade é muitas vezes usada, no estabelecimento das conclusões. Relação entre Estatística descritiva e estatística indutiva Quase sempre é necessário invocar técnicas da estatística descritiva para organizar e resumir a informação obtida de uma amostra antes de levar a cabo uma análise inferencial. Além disso, a análise descritiva preliminar de uma amostra revela frequentemente as características que conduzem a escolha (ou para reconsideração da escolha) do método de inferência apropriado. 3.1. CONCEITOS DE POPULAÇÃO E AMOSTRA População ou Universoé a totalidade dos objectos concebíveis de uma certa classe em consideração. Unidade Estatística - é a designação dada a cada elemento que constitui a população. Amostra são os objectos seleccionados da população. Se esses objectos são seleccionados de tal maneira que cada objecto tem a mesma chance de ser seleccionado do que o outro, temos uma amostra aleatória. 3.1.1.Tipos de amostragem De uma maneira geral, os tipos de amostragem podem ser: aleatórias e não aleatória. O método de amostragem não aleatório consiste em seleccionarmos entidades através de escolha pessoal. As amostras não aleatórias incluem: 1) As de opinião quando as entidades são escolhidas porque compõem uma amostra representativa (os habitantes de duas freguesias podem ser usados como representativos dos eleitores de uma zona mais ampla do país, por exemplo); 2) As de conveniência quando escolhemos as entidades apenas estas estarem mais próximas de nós (escolhemos os alunos de uma turma quando pretendemos obter a opinião de todos os alunos de uma escola); 3) As de quota quando os elementos que compõem a amostra são de determinadas características (se soubermos que os consumidores de um determinado produto são 60% do sexo feminino, podemos dizer a um inquiridor que esteja à porta de um supermercado para P á g i n a 10 | 44 Compilado Por: Esmail Henriques entrevistar 60 pessoas do sexo feminino e 40 do sexo masculino, cabendo-lhe a decisão de escolher quem entrevista). Porque dependem de escolha pessoal, as amostras não aleatórias podem efectivamente não ser representativas de uma população, sendo difícil o cálculo do erro amostral. Para ultrapassarmos este problema, as amostras aleatórias deixam a escolha ao acaso, tendo em princípio cada elemento da população a mesma probabilidade de ser escolhido. Há quatro tipos de amostragens aleatórias. A primeira delas é a chamada amostra aleatória simples de tamanho n onde não só cada elemento da população tem as mesmas hipóteses de ser escolhido, como também qualquer conjunto de tamanho n pode ser escolhido. Exemplo: Pretende-se uma amostra de 20 alunos de uma escola, atribui-se um númeroa cada um dos alunos da escola e, seguidamente, escolhe-se ao acaso 20 desses números. O segundo tipo de amostragem é a amostragem estratificada. Neste tipo de amostragem, as entidades são agrupadas em estratos segundo características físicas ou materiais. Para assegurar que todos os estratos da população estudantil afectados por determinado diploma sejam considerados, escolhem-se, por exemplo, uma amostra aleatória de estudantes de cada um dos tipos de ensino: básico, secundário e superior. Uma única amostra aleatória simples não poderia garantir esta representação de estudantes dos três tipos de ensino. Exemplo: Na selecção de 30 alunos de uma escola, considerando cada ano de escolaridade como estrato, escolher-se-ia em cada um desses anos um determinado número de alunos por um dos processos anteriores. O número de alunos a escolher em cada ano, seja, em cada estrato deve ser proporcional ao número dos alunos desse ano. Se a escola, com 600 alunos, 150 são da ACV3EI, 100 são da ACV4EI e 50 são da ACV5EI poder-se-ia para amostra 15 Alunos da ACV3EI 10 Alunos da ACV4EI 5 Alunos da ACV5EI O que significa que em cada estrato tem se 10% de alunos P á g i n a 11 | 44 Compilado Por: Esmail Henriques Um terceiro tipo de amostragem é a chamada amostragem por cachos. Aqui, as entidades são classificadas em grupos ou cachos e é seleccionada uma amostra aleatória de cachos. Um censo (de toda a população) é então conduzido dentro dos cachos seleccionados. Por fim, que é quarta chama-se a amostra sistemática, os elementos da amostra, são escolhidos a partir de uma regra estabelecida. Exemplo: Para seleccionar uma amostra de 30 alunos de uma escola com 600 alunos, depois de numerados todos, pode-se escolher um aluno de 20 em 20 a partir do primeiro aluno seleccionado e escolhido ao acaso de entre o primeiro grupo de 20 alunos. Supondo que o número 3 foi seleccionado, tem-se para a amostra: 3, 23, 43, 63, ……, 563, 583. Censo- o estudo estatístico onde se trabalha com todos os elementos da população. Caso contrário denomina-se Sondagem. 3.2.TIPOS DE VARIÁVEIS Variável – é o atributo ou característica que se pretende estudar. Pode-se por exemplo, registrar a idade das pessoas ao casar, a estatura ou peso de indivíduos, o rendimento mensal dos trabalhadores de uma certa empresa, o número de empregados dispensados, por mês, numa grande empresa, etc. Conforme a natureza dos dados as variáveis estatísticas podem ser: Qualitativas e Quantitativas. Qualitativas: as que exprimem uma qualidade, não podendo ser mensuráveis. E podem ser: Ordinais: é uma variável qualitativa na qual a ordem das categorias faz sentido. Exemplo, estudantes podem avaliar a efectividade dos professores, ordenando nas categorias de, mau, médio, bom ou excelente. Aqui uma categoria é superior que a imediatamente anterior. Outros exemplossão: comportamento, Aproveitamento Pedagógico Nominais: é uma variável qualitativa na qual não é possível estabelecer uma ordem natural entre os dados. Exemplo: as variáveis como Turma (A ou B), sexo (masculino ou feminino), Fuma (sim ou não), o tipo de literatura preferida (romances, livros literários, etc.), o estado civil (solteiro, casado, viúvo e divorciado). A variável será qualitativa quando resultar de uma classificação por tipos ou atributos, como nos seguintes exemplos: P á g i n a 12 | 44 Compilado Por: Esmail Henriques a) População: Alunos de uma universidade, Variável: sexo (masculino ou feminino). b) População: Moradores de uma cidade, Variável: tipo de habitação (casa, apartamento, barco, etc.). c) População: Peças produzidas por uma máquina, Variável: qualidade (perfeita ou defeituosa). d) População: Óbitos em um hospital, nos últimos cinco anos, Variável: causa mortes (moléstia cardiovasculares, cânceres, etc). Quantitativas: as mensuráveis (que podem ser atribuídos números) e podem ser: Discretas: assumem um número finito ou infinito numerável de valores, isto é, é uma variável que assume valores pontuais. Exemplos: a ida ao médico, o número de irmãos, o número de sapato que uma pessoa calça, nº de defeitos (0, 1, 2, ...), etc. Contínuas (intervalo): assumem um número infinito não numerável de valores, isto é, variáveis estatísticas que podem assumir teoricamente qualquer valor entre duas observações. Exemplo: o tempo gasto para chegar a escola, a altura dos residentes de um bairro, o número de metros percorridos por um atleta durante certo período de tempo em uma pista circular, X não será certamente uma variável quantitativa discreta, etc. Alguns exemplos de variáveis quantitativas discretas são: a) População: habitações de uma cidade, Variável: número de banheiros. b) População: casais residentes em uma cidade, Variável: número de filhos. c) População: aparelhos produzidos em uma linha de montagem, Variável: número de defeitos por unidade. d) População: Bolsa de valores de São Paulo, Variável: número de acções negociadas. Alguns exemplos de variáveis quantitativas contínuas são: a) População: estação meteorológica de uma cidade, Variável: precipitação pluviométrica durante um mês. b) População: pregos produzidos por uma máquina, Variável: comprimento. c) População: propriedades agrícolas do Brasil, Variável: produção de algodão. d) População: indústrias de uma cidade, Variável: índice de liquidez. e) População: pessoas residentes em uma cidade. Variável: idade. P á g i n a 13 | 44 Compilado Por: Esmail Henriques EXERCÍCIOS: 1. Defina População. 2. Mencione 4 exemplos de população que pode ser estudado numa pesquisa. 3. Em palavras breves explica a diferença entre variáveis qualitativas e as quantitativas. 4. Em palavras breves explica a diferença entre variáveis quantitativas discretas e variáveis quantitativas contínuas. 5. Abaixo apresenta-se uma lista de variáveis, classifique-as: a) O valor monetário indicado num talão de depósito. b) O aproveitamento pedagógico dos alunos de uma escola. c) O meio de comunicação usado por uma Universidade para publicitar os seus serviços. d) A dívida de uma pessoa ao banco. e) Vida média dos televisores produzidos na China. f) Comprimento de 100 parafusos produzidos por uma fábrica. g) Quantidade de trigo que é gasto na confecção dum bolo. h) As cores dos autocarros da TCO. i) Número de filhos do Castigo. 6. Explique com um exemplo prático porquê a amostragem sem reposição é preferível do que a amostragem com reposição. 7. Defina ou explique os seguintes conceitos: a) Estatística descritiva. b) Estatística Inferencial. c) Amostra. d) Censo. e) Sondagem. 8. Supondo que ia fazer um estudo sobre cada um dos temas indicados, diga, justificando, em quais deles utilizaria uma amostra: a) Controlo de qualidade da educação oferecida pelas escolas privadas moçambicanas; b) Aproveitamento dos alunos da turma 10ª A de uma Escola; c) Análise do mercado para lançamento de uma nova pasta de dentes; d) Estado sanitário dos ovos existentes num armazém; e) Tipo de borboletas existentes num Paí P á g i n a 14 | 44 Compilado Por: Esmail Henriques 3. Considerar a sequência do seguinte estudo: a) Define-se uma amostra dos elementos de população; b) Descrevem-se as variáveis para o estudo; c) Toma-se nota, para cada variável, do valor correspondente a cada elemento da amostra; d) Utilizam-se diversos métodos científicos e analisam-se os dados, obtendo-se diversas estatísticas; f) Qual dos passos referidos está dentro da Inferência Estatística? 4.Um promotor de vendas quer saber a opinião de mulheres empregadas sobre uma nova política do governo que prevê escolaridade obrigatória até 7ª classe. Ela tem uma lista de todas as mulheres que pagam quotas a um dos sindicatos. Ela envia um questionário a 100 destas mulheres escolhidas aleatoriamente. Destas, 68 preenchem e devolvem o questionário.a) Qual é, neste caso, a população e amostra? b) Acha que a amostra é representativa? Justifique. 5.Uma empresa está interessada em testar a eficácia da propaganda de um novo comercial de televisão. Como parte do teste, o comercial é mostrado em um programa de notícias locais, as 18h30min. Dois dias mais tarde, uma firma de pesquisa de mercados realizou um levantamento telefónico para obter informações sobre os índices de respostas (percentagem de espectadores que responderam vendo o comercial) e impressões sobre o comercial. a) Qual é a população desse estudo b) Qual é a amostra para esse estudo c) Porque se usaria uma amostra nessa situação? P á g i n a 15 | 44 Compilado Por: Esmail Henriques 4. DISTRIBUIÇÃO DE FREQUÊNCIAS E GRÁFICOS OBJECTIVOS Recolher dados num estudo estatístico; Organizar dados estatísticos; Apresentar dados estatísticos numa tabela e num gráfico de distribuição de frequências usando o pacote estatístico Excel ou Spss; Analisar e interpretar os dados descrevendo-os e tirar conclusões; Elaborar um relatório preliminar sobre o fenómeno estatístico observado. 4.1. TABELA DE FREQUÊNCIAS Vamos dar em seguida, particular atenção a organização e apresentação dos dados, nomeadamente `a elaboração de tabelas e gráficos Para organizar e representar dados, usam-se tabelas e gráficos. 4.2. DISTRIBUIÇÃO DE FREQUÊNCIAS Para que uma informação recolhida seja divulgada é necessário que esta seja organizada de modo a ser percebida pelos leitores ou outros investigadores. De uma geral uma distribuição de frequência é um tipo de tabela que condensa uma colecção de dados conforme as repetições de seus valores. Dados brutos - são os dados originais que ainda não estão numericamente organizados. É difícil formar uma ideia exacta do comportamento do fenómeno, a partir de dados não ordenados. Exemplo: Os dados a seguir correspondem ao consumo de energia de uma determinada família num período de um ano (em Kw/h). X = {145, 141, 142, 141, 142 143, 144, 141, 146, 150, 146, 150}. Rol estatístico ou ROL – é uma lista em que os valores ou dados numéricos são ordenados de forma crescente ou decrescente. X - Rol = {141, 141, 141, 142, 142, 143, 144, 145, 146, 146, 150, 150} Como se pode observar da nova série de dados de consumo de energia, já pode-se distinguir qual é o valor mínimo bem como o consumo máximo. Amplitude Total ou Range (At) – é a diferença entre o maior e o menor valor da série estatística ou a diferença positiva entre os extremos do Rol estatístico. P á g i n a 16 | 44 Compilado Por: Esmail Henriques Quando os dados brutos se resumem, frequentemente costuma – se distribuir em classes ou categorias e determina – se o número de casos pertencentes a uma das classes ou o número de repetições de um determinado valor denominado frequência de classe ou do valor. Uma apresentação em forma de tabela de dados categorizados ou com intervalo de classe e as respectivas frequências é conhecida por distribuição de frequências. Há dois tipos de distribuição de frequências: De dados não classificados ou não agrupados e de dados ou valores classificados em classe. As distribuições de frequências não agrupadas são utilizadas quando temos poucas observações ou dados e o número de valores ou modalidade apresenta repetições. Se o número de dados observados for elevado é conveniente agrupar os dados em classes. Tabela de frequências para dados simples (não agrupados em classes) Suponhamos que numa turma da ACV4EI do instituto industrial e comercial da beira pretendíamos fazer um estudo estatístico sobre as idades (em anos) dos formandos/as. E neste caso registamos: 16, 13, 15, 16, 14, 13, 14, 15, 15, 14, 15, 17, 14, 15, 15, 15, 14, 16, 15, 14, 14, 15, 17. A variável estatística idade (em anos), é discreta e toma os valores 13, 14, 15, 16 e 17. Tabela 1: Distribuição das idades da turma Idade (em anos) Xi Contagem Frequência absoluta fi 13 // 2 14 //// // 7 15 //// //// 9 16 /// 3 17 // 2 Total - 23 A tabela acima representa a frequência absoluta ou efectivo (fi) de um valor Xi da variável, pois indica o número de vezes que esse valor foi observado. Sabemos da tabela que 7 formandos da turma têm 14 anos, 3 formandas têm 16 anos, etc. A partir da frequência absoluta (fi), podemos calcular outras frequências tais como: Frequência relativa (fri) de um valor Xida variável, é o quociente entre a frequência absoluta do valor Xi da variável e o número total de observações. P á g i n a 17 | 44 Compilado Por: Esmail Henriques ��� = �� � Frequência relativa em percentagem (fri%) de um valor X da variável, é o quociente entre a frequência absoluta do valor Xi da variável e o número total de observações vezes 100%. ��� = �� � × ���% Frequência absoluta acumulada (Fi) é a soma das frequências absolutas de todos valores anteriores a Xi com frequência absoluta de Xi. Frequência relativa acumulada (Fri) do valor Xi, é a soma das frequências relativas de todos valores anteriores a Xi com frequência relativa de Xi. Frequência relativa acumulada em percentagem (Fri%) é a soma das frequências relativas de todos valores anteriores a Xi com frequência relativa de Xi Vezes 100%. Tabela 2: Distribuição das frequências das idades da turma Idade (em anos) Xi Frequência Absoluta if Frequência relativa ��� = �� � Frequência relativa em percentagem (fri%) Frequência Absoluta Acumulada iF Frequência Relativa Acumulada iFr Frequência relativa acumulada em percentagem (Fri%) 13 2 2 23 = 0,09 9% 2 0.09 9% 14 7 7 23 = 0,30 30% 9 0.39 39% 15 9 9 23 = 0,39 39% 18 0.78 78% 16 3 3 23 = 0,13 13% 21 0.91 91% 17 2 2 23 = 0,09 9% 23 1 100% Total N = 23 23 23 = 1 100% ______ _____ _____ P á g i n a 18 | 44 Compilado Por: Esmail Henriques Nesta tabela, encontram-se respostas para as seguintes questões: 1. Qual é o número de alunos com idade inferior ou igual a 14 anos? Resp: Há 9 formandos com 14 anos ou menos; 2. Qual é a percentagem de formandas com 15 anos? Resp: há 39% de alunos com 15 anos; 3. Quantos formandos têm 17 anos? Resp: há 2 formandas com 17 anos; 4. Qual é a percentagem de formandos com idade inferior a 16 anos? Resp: 78% das formandas têm menos de 16 anos; 5. Qual é a percentagem de formandos com mais de 15 anos? Resp - 22% (13% + 9%) das formandas da turma têm mais de 15 anos; 6. Qual é o número total das formandas da turma? Resp: o número total das formandas da turma é 23 Tabela de frequências para dados agrupados ou tabulados em classes Se no lugar de estudarmos a variável idade dos alunos, fossemos estudar a variável altura dos alunos e tivéssemos: 1,62 1,71 1,50 1,62 1,69 1,59 1,48 1,52 1,64 1,57 1,49 1,661,73 1,53 1,61 1,63 1,56 1,55 1,57 1,64 1,60 1,51 1,68 Também pode-se usar o agrupamento de dados em classes de variáveis discretas se tivermos tantos valores diferentes para variável Xi. Não existe nenhuma fórmula universalmente aceite para determinar o número de classes a considerar. A tabela de Truman L. Kelley que estabelece o número de classes (k) em função do número total de observações (n) pode constituir uma ajuda. N 5 10 25 50 100 200 500 1000 K 2 4 6 8 10 12 15 15 No caso das alturas podemos considerar 6 classes, pois n = 23. P á g i n a 19 | 44 Compilado Por: Esmail Henriques Todas as classes devem ter a mesma amplitude e para isso calcula-se: 1º Amplitude total = limite superior (Ls) - limite inferior (Li) = 1,73-1,48 = 0,25. 2º 042,0 6 25,0 classe de Amplitude k LiLs Pode, então, considerar – se 0,05 como amplitude de cada classe e 1,45 como limite inferior da primeira classe. Obs: Se considerássemos a amplitude de 0,04 e 1,48 (menor valor observado)como limite inferior da primeira classe verificava-se que o valor 1,73 não se incluía em qualquer classe. Deste modo, a definição da amplitude das classes e do limite inferior da primeira classe devem ser estabelecidos para que cada valor da variável estatística pertença exactamente a uma classe. Uma outra maneira de determinar o número de classes é a regra sugerida por Sturgos. K=1+3,3log (n) e ainda, nk , sendo n, o número de observações. Tabela 3: Distribuição das alturas dos alunos Alturas (em m) Contagem Fi [1,45; 1,50[ // 2 [1,50; 1,55[ //// 4 [1,55; 1,60[ //// 5 [1,60; 1,65[ //// // 7 [1,65; 1,70[ /// 3 [1,70; 1,75[ // 2 Total ____ N= 23 P á g i n a 20 | 44 Compilado Por: Esmail Henriques Tabela 4: Distribuição de frequências das alturas dos alunos Alturas (em m) Classes Frequência Absoluta if Frequência relativa ��� = �� � Frequência relativa em percentagem (fri%) Frequência Absoluta Acumulada iF Frequência Relativa Acumulada iFr Frequência relativa acumulada em percentagem (Fri%) [1,45; 1,50[ 2 2 23 = 0,09 9% 2 0,09 9% [1,50; 1,55[ 4 4 23 = 0,17 17% 6 0.26 26% [1,55; 1,60[ 5 5 23 = 0,22 22% 11 0.48 48% [1,60; 1,65[ 7 7 23 = 0,30 30% 18 0,78 78% [1,65; 1,70[ 3 3 23 = 0,13 13% 21 0.91 91% [1,70; 1,75[ 2 2 23 = 0,09 9% 23 1 100% Total N= 23 23 23 = 1 100% ______ ________ _________ Nesta tabela encontram-se as respostas para as seguintes questões: 1 Qual é o número de alunos com alturas maiores ou iguais a 1,65m? Resp: Há 5 alunos com altura de 1,65m ou mais. 2. Qual é a percentagem dos alunos maiores ou iguais a 1,55m? Resp: 74% dos alunos têm alturas iguais a 1,55 ou mais; 3. Quantos alunos têm alturas iguais a 1,50m ou compreendidas entre 1,50m e 1,55m? Resp: há 4 alunos com alturas iguais a 1,50m ou compreendidas entre 1,50m e 1,55m; 4. Qual é a percentagem dos alunos que têm uma altura de 1,60m ou compreendida entre 1,60m e 1,65m? Resp: 30% dos alunos têm altura de 1,60m ou compreendida entre 1,60m e 1,65m. Compilado Por: Esmail Henriques 5. GRÁFICOS DE DISTRIBUIÇÃO DE FREQUÊNCIAS Os gráficos constituem uma outra forma de representar dados. Comparativamente as tabelas, os gráficos são mais atractivos e facilitam a Existe uma grande variedade de gráficos estatísticos com o fim de responder `as mais variadas situações. Neste estudo referir gráfico circular. Gráficos de Barras Os gráficos de barras utilizam gráficos são empregue muita No caso de variável discreta é usual desenhar gráficos: de barras, circular ou pictograma. A partir dos dados da tabela de frequências das idades dos comercial da beira, vamos construir o gráfico de barr Histograma ou diagrama em colunas Os histogramas usam se para dados agrupados em classes. A sua construção é semelhante `a do gráfico de barras. Não há qualquer espaço entre as barras. No eixo das abcissas representam-se as classes e no eixo das ordenadas formandos Esmail Henriques GRÁFICOS DE DISTRIBUIÇÃO DE FREQUÊNCIAS constituem uma outra forma de representar dados. Comparativamente as tabelas, os gráficos são mais atractivos e facilitam a apreensão da mensagem. Existe uma grande variedade de gráficos estatísticos com o fim de responder `as mais variadas situações. Neste estudo referir-se-ão: gráficos de barras, histograma, polígono de frequência áficos de barras utilizam-se essencialmente para dados simples empregue muita das vezes para estabelecer comparações. No caso de variável discreta é usual desenhar gráficos: de barras, circular ou pictograma. s dados da tabela de frequências das idades dos formandos/as do instituto industrial e , vamos construir o gráfico de barras. Histograma ou diagrama em colunas Os histogramas usam se para dados agrupados em classes. A sua construção é semelhante `a do gráfico de barras. Não há qualquer espaço entre as barras. No eixo das abcissas se as classes e no eixo das ordenadas (vertical) as frequências. 0 1 2 3 4 5 6 7 8 9 13 14 15 16 17 Idade(Xi) formandos Idade dos formandos de ACV4EI P á g i n a 21 | 44 constituem uma outra forma de representar dados. Comparativamente as tabelas, os Existe uma grande variedade de gráficos estatísticos com o fim de responder `as mais variadas ão: gráficos de barras, histograma, polígono de frequência se se essencialmente para dados simples (não agrupados). Estes No caso de variável discreta é usual desenhar gráficos: de barras, circular ou pictograma. formandos/as do instituto industrial e Os histogramas usam se para dados agrupados em classes. A sua construção é semelhante `a do gráfico de barras. Não há qualquer espaço entre as barras. No eixo das abcissas (horizontal) (vertical) as frequências. Compilado Por: Esmail Henriques Polígono de Frequências Consta de uma poligonal, cujos vértices são obtidos pela intersecção de cada ponto médio da classe e sua respectiva frequência absoluta simples Gráficos Circulares (sectograma) Um gráfico circular é representado por um círculo que está dividido em sectores cujas amplitudes são proporcionais `a frequência correspondente. O gráfico circular costuma (normalmente menor ou igual a seis comparações entre diferentes valores do atributo em estudo. A amplitude de cada sector é Na tabela seguinte foram observadas 54 pessoas relativamente a cor dos olhos. Cor dos olhos Efectivos 0 2 4 6 8 [1,45; 1,50[ N ú m er o s d e f o rm an d o s Distribuicão das Alturas dos formandos da ACV 0 2 4 6 8 [1,45;1,50[ [1,50 Distribuicão das Alturas dos formandos da ACV Esmail Henriques Consta de uma poligonal, cujos vértices são obtidos pela intersecção de cada ponto médio da classe e sua respectiva frequência absoluta simples correspondente (no histograma). Gráficos Circulares (sectograma) Um gráfico circular é representado por um círculo que está dividido em sectores cujas amplitudes são proporcionais `a frequência correspondente. O gráfico circular costuma-se utilizar quando o número de categorias para a variável é pequeno (normalmente menor ou igual a seis-6) e, é especialmente adequado para estabelecer comparações entre diferentes valores do atributo em estudo. sector é determinada pela frequência relativa. Na tabela seguinte foram observadas 54 pessoas relativamente a cor dos olhos. Cor dos olhos Azul Verde Cinzenta Cinzenta Efectivos 10 5 19 20 [1,45; 1,50[ [1,50; 1,55[ [1,55; 1,60[ [1,60; 1,65[ Alturas Distribuicão das Alturas dos formandos da ACV4EI 50; 1,55[ [1,55; 1,60[ [1,60; 1,65[ [1,65; 1,70[ Distribuicão das Alturas dos formandos da ACV4 P á g i n a 22 | 44 Consta de uma poligonal, cujos vértices são obtidos pela intersecção de cada ponto médio da (no histograma). Um gráfico circular é representado por um círculo que está dividido em sectores cujas amplitudes quando o número de categorias para a variável é pequeno 6) e, é especialmente adequado para estabelecer Na tabela seguinte foram observadas 54 pessoas relativamente a cor dos olhos. Cinzenta [1,65; 1,70[ [1,70; 1,75[ [1,65; 1,70[ [1,70; 1,75[altura 4EI P á g i n a 23 | 44 Compilado Por: Esmail Henriques Vamos fazer uma tabela que nos permite calcular a percentagem e o ângulo correspondente a cada classificação. Cor dos olhos Efectivos (fi) Percentagem Ângulos (amplitude em graus) Azul `10 10/54=0,185… ou 18,5% 0,185x360o=66,66…=67º Verde 5 5/54=0,093 …ou 9,30% 0,093x360o = 33,33=33º Cinzenta 19 19/54=0,352… ou 35,2% 0,352x360o=126,66...=127º … Castanha 20 20/54=0,370 …ou 37,0% 0,370x360o = 1360o =133,33º …=133º N=54 Total = 360º Distribuição da cor dos olhos de 54 pessoas Exercícios 1. Considera a seguinte distribuição de frequências, relativas as comissões ganhas no último mês pelos vendedores de uma dadaempresa: Comissões (em centenas de contos) [0;2[ [2;4[ [4;6[ [6;8[ [8;10[ [10;12[ [12;14[ No de trabalhadores 2 3 7 16 7 3 2 Construa o histograma, o polígono de frequências e polígono de frequências acumuladas. Azul 19% Verde 9% Cinzenta 35% castanha 37% Cor dos olhos de 54 pessoas P á g i n a 24 | 44 Compilado Por: Esmail Henriques 2. Inquéritos realizados em 20 residências de diversas universidades de um determinado país trevelaram os seguintes valores para o número de estudantes de gestão por residência: No de estudantes [0-10 [ [10-20 [ [20-30 [ [30-40 [ No de Residências 2 4 9 5 a) Encontre as frequências absoluta, relativa, absoluta acumulada e relativa acumulada; b) Construa o histograma; 3. Os vencimentos mensais, em mil meticais, dos 40 funcionáriosde uma empresa são os seguintes: 18 18 20 22 21 18 19 20 23 18 19 20 21 18 17 19 20 18 22 19 18 24 20 18 19 18 22 21 20 19 17 18 21 18 18 19 18 18 18 18 a) Indique a população, a variável e a unidade estatística desta distribuição; b) Elabore um quadro de distribuição de frequências; c) Construa um gráfico de barras que defina esta distribuição; d) Elabore um relatório de 2 linhas sobre esta distribuição. P á g i n a 25 | 44 Compilado Por: Esmail Henriques 6. MEDIDAS DE TENDÊNCIA CENTRAL Apesar das tabelas estatísticas e das representações gráficas nos darem uma ideia clara da distribuição de frequências da variável estudada, torna-se necessária simplificar ainda mais o conjunto de dados, de forma a caracterizar a distribuição por um número reduzido de medidas (parâmetros) que evidenciem o que demais significativo existe no conjunto. Estes parâmetros podem agrupar-se em três tipos: Medidas de posição ou de localização (ou de tendência central); Medidas de dispersão ou de variabilidade; Vamos estudar em primeiro lugar as medidas de posição ou de localização. Essas medidas indicam-nos valores típicos a volta dos quais os dados se distribuem. Essas subdividem-se em duas partes, que são: Medida de tendência central – Média, Moda e Mediana. Medida de separação (ou medidas de ordem) – os quartis e decís. MEDIDA DE TENDÊNCIA CENTRAL 1. Média Aritmética ( x ) A média aritmética, ou daqui para diante simplesmente média, é a medida de tendência central mais utilizada, porque, além de ser fácil de calcular, tem uma interpretação familiar e propriedades estatísticas que a tornam muito útil nas comparações entre populações e outras situações que envolvem inferências. Uma vantagem da média é que ela leva em conta todos os valores no seu cálculo, uma desvantagem é que ela é afetada por valores extremos. a) Média Aritmética - dados não agrupados numa tabela Sejam x1, x2, x3, ..., xn, portanto, “n” valores da variável X. A média aritmética simples de X representada por x é definida por: n x n xxxx x n i i n 1321 ... Ou simplesmente n x x Exemplo: Calcular a média aritmética simples do conjunto de números seguinte: X = {3, 6, 9, 12, 15, 18} Resolução: MEDIDAS DE TENDÊNCIA CENTRAL P á g i n a 26 | 44 Compilado Por: Esmail Henriques 5,10 6 63 6 181512963 x b) Média Aritmética – dados agrupados numa tabela Sejam x1, x2, x3, ..., xk, os valores da variável X associados as suas frequências absolutas f1, f2, f3, ..., fk, respectivamente. A média aritmética ponderada de X representada por x é definida por: n fx n fxfxfxfx x k i ki kk 1332211 ... Ou simplesmente n fx x ii Exemplo: Determinar a média aritmética dos dados constantes da seguinte tabela: ix if ii fx Resolução: Olhando para a fórmula n fx x ii , podemos fazer o cálculo da média aritmética acrescentando uma coluna na tabela (coluna dos produtos aii fx ), depois adicionamos e substituímos na fórmula teremos: 59,6 17 112 n fx x a 3 6 18 5 4 20 10 5 50 12 2 24 Total 17 112 2. Moda ( oM ou ^ X ) a) Moda para dados não - agrupados numa tabela de classes Numa distribuição de frequncias, Moda é o valor que apresenta maior frequência, seja ela absoluta simples ou relativa simples. Exemplo 1: Xi 3 5 10 12 Total fi 6 4 5 5 17 Mas existem casos em que numa tabela de frequência existem dois ou mais valores que apresentam maior frequência, neste caso estamos perante duas ou mais modas, que são os valores que apresentam esta maior frequência. P á g i n a 27 | 44 Compilado Por: Esmail Henriques Exemplo 2: Considere a série de dados: 9, 8, 7, 10, 12, 11, 10, 13, 10, 15, 10 Rol: 7, 8, 9, 10, 10, 10, 11, 12, 13, 15 Amodal – serie de dados sem valores repetidos. 7, 8, 9, 10, 11, 13, 15, 18, 20, 21 Unimodal – com apenas uma moda. Um único valor repete-se mais vezes. 7, 8, 9, 10, 10, 10, 11, 12, 13, 15 Bimodal – com apenas duas modas. Dois valores repetem-se mais vezes. 7, 8, 9, 10, 10, 10, 11, 11, 11, 15 Trimodal – com pelo menos três modas. 9, 9, 9, 10, 10, 10, 11, 11, 11, 15 Exemplo 3: ix if Nessa distribuição, verificamos que o elemento 3 e o elemento 10 apresentam fi=8 que por sinal é a maior frequência, logo estamos perante duas modas 3 e 10. 3 8 5 5 10 8 12 2 Total 23 Se uma distribuição não apresenta nenhuma moda (caso em que todas as fi são iguais) diz-se que estamos perante uma distribuição amodal. No caso em que temos uma, duas ou mais modas diz-se que estamos perante uma distribuição unimobal, bimodal ou multimodal, respectivamente. b) Moda para dados agrupados numa tabela de classes Já vimos anteriormente que para dados não agrupados numa tabela de classes, moda é o valor que apresenta maior frequência, seja ela absoluta ou relativa. O termo moda foi utilizado pela primeira vez por Karl Pearson em 1895. Para a determinação da moda para dados agrupados numa tabela de classes iremos nos basear na fórmula de Czuber. P á g i n a 28 | 44 Compilado Por: Esmail Henriques iio hLM . 21 1 Onde: Li – Limite inferior da classe modal (classe que apresenta maior frequência absoluta ou maior correcção se as classes tiverem amplitudes diferentes). 1 - diferença entre a frequência absoluta da classe modal ( mof ) e a frequência absoluta da classe imediatamente anterior a classe modal ( antf ). 2 - diferença entre a frequência absoluta da classe modal ( mof ) da frequência absoluta da classe imediatamente posterior ( postf ). hi– amplitude da classe modal. Nota Importante: esta não é a única fórmula para determinação da moda para dados agrupados numa tabela de classes. Tarefa: pesquise as outras fórmulas. Exemplo 1: Determine a moda para a seguinte distribuição: Classes aif Observando a tabela, nota-se que a classe modal é [15, 20[ visto que apresenta maior frequência. 57,18 7 25 15 5* 25 5 155* )68()38( )38( 15. 21 1 iio hLM [5, 10[ 5 [10, 15[ 3 [15, 20[ 8 [20, 25[ 6 [25, 30[ 5 [30, 35[ 4 31 Se as classes da tabela tivessem amplitudes diferentes, 1 e 2 significarão respectivamente, diferença entre a correcção da classe modal ( moq ) e a correcção da imediatamente classe anterior a classe modal ( antq ) e diferença entre a correcção da imediatamente classe posterior a classe modal ( postq ) e correcção da classe modal ( moq ). P á g i n a 29 | 44 Compilado Por: Esmail Henriques Correcção ( iq ) É o quociente entre frequência absoluta ( aif ) e a amplitude da classe ( ih ), i. e., i ai i h f q Exemplo 2: Determine a moda dos dados constantes da seguinte tabela: Classes aif iq [5, 10[ 5 15 5 [10, 14[ 3 75,04 3 [14, 19[ 8 6,15 8 [19, 25[ 9 5,16 9 [25, 32[ 5 57143,07 4 [32, 36[ 4 14 4 34 Para encontrar a moda nesta distribuição temosque calcular as correcções. Estes cálculos podem ser efectuados directamente na tabela (veja na tabela acima, 3ª coluna). Depois de preencher a coluna das correcções, identificamos a classe modal (aquela que apresenta maior correcção). Neste caso a classe modal é [14, 19[. Agora vamos aplicar a fórmula para determinar a moda: 47,18 95,0 25,4 145* 1,085,0 85,0 145* )5,16,1()75,06,1( )75,06,1( 14. 21 1 iio hLM 3. Mediana ( dM ou ~ x ) Mediana é o valor que ocupa a posição central, dividindo os dados em duas partes iguais, correspondendo a cada uma 50% dos dados. a) Determinação da Mediana para dados não agrupados numa tabela de classes Exemplo: para os dados 2, 6, 8, 2, 9, 12, 2, 6, 8, 6, 9, 12, 9 É importante saber que para determinarmos a mediana primeiro temos que fazer o ROL (colocar os dados em ordem crescente ou decrescente). Rol: P á g i n a 30 | 44 Compilado Por: Esmail Henriques Posição 1ª 2ª 3ª 4ª 5ª 6ª 7ª 8ª 9ª 10ª 11ª 12ª 13ª Elemento 2 2 2 6 6 6 8 8 9 9 9 12 12 Neste exemplo, vê-se que as duas setas apontam paro mesmo elemento, logo 8 ~ x Mas, veja agora para este exemplo: Considere os dados 2, 6, 8, 2, 9, 12, 2, 6, 9, 6, 9, 12, 9, 13. Determine a mediana. Posição 1ª 2ª 3ª 4ª 5ª 6ª 7ª 8ª 9ª 10ª 11ª 12ª 13ª 14ª Elemento 2 2 2 6 6 6 8 9 9 9 9 12 12 13 Neste exemplo, considera-se mediana como a média aritmética dos dois valores centrais, isto é, 5,8 2 98~ x Mas às vezes trabalha-se com um número muito elevado de valores, onde temos que organizar os dados numa tabela. Exemplo 1: Determine a mediana para a distribuição de frequências seguinte: ix if Olhando para esses dados torna-se difícil dizer qual é a mediana. Mostraremos alguns procedimentos para a determinação da mediana. 3 8 5 5 10 8 12 2 Total 23 Para determinar a mediana temos que ter em consideração as seguintes fórmulas: 1º caso: se n for par, 2 1~ 22 nn xx x onde 2 nx e 1 2 n x lêem-se, valor que ocupa a posição 2 n e 1 2 n respectivamente. 2º caso: se n for ímpar, 2 1 ~ nXx onde 2 1nX lê-se, valor que ocupa a posição 2 1n . Veja que há uma diferença entre 1 2 n e 2 1n . Para o último exemplo acima (tabela), temos n=23 ímpar, logo a fórmula a usar será,: P á g i n a 31 | 44 Compilado Por: Esmail Henriques ix if Fac 2 1 ~ nXx mas para encontrar o valor que ocupa a posição 2 1nX que é o mesmo que dizer 12 2 24 2 123 XXX , ou seja, é o 12º valor. Com base neste valor, vamos completar a coluna das Fac para identificar a 1ª Fac maior ou igual a 12 e a partir dessa Fac indicamos o valor de xi correspondente a Mediana. Logo 5 ~ x 3 8 8 5 4 12 10 8 20 12 3 23 Total 23 Tarefa: Determine a mediana para a distribuição de frequências seguinte: ix if 3 8 5 4 10 7 12 5 Total 24 3.1. Determinação da Mediana para dados agrupados numa tabela de classes Já vimos como determinar a mediana para dados isolados, ou seja, dados não agrupados em classes. Agora veremos como determinar a mediana para dados agrupados em classes. Para a determinação da mediana para dados agrupados numa tabela de classes, segue-se os seguintes procedimentos: 1. determinar 2 n 2. Identifica-se a classe mediana a partir das frequências absolutas acumuladas (a classe que apresenta primeira 2 n fac , isto é, identificar a primeira 2 n fac ). 3. Aplicar a fórmula: i i ac i h f F n Lx *2 1 ~ Onde: Li – Limite inferior da classe mediana. P á g i n a 32 | 44 Compilado Por: Esmail Henriques 1 acf - Frequência absoluta acumulada até a classe anterior a classe mediana. ih - Amplitude da classe mediana. if - Frequência absoluta da classe mediana. Exemplo 1: Determinar a mediana da seguinte distribuição: Classes aif acf [5, 10[ 5 5 [10, 15[ 3 8 [15, 20[ 8 16 [20, 25[ 6 22 [25, 30[ 5 27 [30, 35[ 4 31 31 Para a determinação de valores separatrizes (Mediana, Quartís, Decís, Centís ou Percentís) temos que preencher na tabela uma coluna das frequências absolutas acumuladas. (3ª coluna da tabela acima). Implementação dos passos: 1º Passo- 5,15 2 31 2 n 2º Passo - olhando para a coluna das acf de cima para baixo, observa-se que o primeiro valor maior que 5,15 2 n é o 16. Este 16 está na linha onde aparece a classe [15, 20[, esta é a nossa classe mediana. 3º Passo - Aplica-se da fórmula 81 acf e 8aif 69,196875,19 8 5,37 155* 8 5.7 155* 8 85,15 15*2 1 ~ i ai ac i h f f n Lx P á g i n a 33 | 44 Compilado Por: Esmail Henriques MEDIDASDE DISPERSÃO Nesta lição, você deverá prestar muita atenção aos seguintes termos econceitos: Tabela de cálculos auxiliares Desvio-médio, variância, desvio-padrão e coeficientes de variação Desvio - médio Para dados não agrupados n xx Dm n i i 1 Para dados agrupados e ponderados n xxfi Dm m i i 1 N.B. quanto maior for o desvio- médio, maior é o afastamento dos valores observados em relação à média ou seja, maior é a dispersão dos dados. Exemplo: Seja x= 20,15,8,5,2 , calcular Dm. 10 5 2015852 n xi x 6 5 10201015108105102 Dm Variância Os matemáticos procuram uma fórmula que nos permite avaliar a dispersão relativamente à média sem que aparecesse o símbolo do valor absoluto; isto é, uma fórmula em que o aparecimento de números negativos foi resolvido com «o elevar ao expoente 2»; isto é: (xi- x )2. A variância de um conjunto de dados x1, x2,...., xn, representa se por 2 ou S2 , quando se refere a população e amostra respectivamente. E calcula-se: Para dados não agrupados População: 21 2 1 2 2 x n x n xxi n i i n i ; Amostra: 11 1 2 12 1 2 2 n n xi xi n xxi S n i n i n i P á g i n a 34 | 44 Compilado Por: Esmail Henriques Para dados agrupados e ponderados População: 2 1 2 1 2 2 ** x n xfi n xxifi m i i m i ; Amostra: 1 * * 1 * 1 2 12 1 2 2 n n xifi xifi n xxifi S m i m i m i DESVIO- PADRÃO É a raiz quadrada positiva da variância e representa-se por ou S, para população e amostra respectivamente. Para dados não agrupados População: 21 2 1 2 x n xi n xxi n i n i Amostra: 1 )( 1 1 1 2 2 1 2 n n xi xi n xxi S n i n i n i Para dados ponderados e agrupados em classe População: 21 2 1 2 ** x n xifi n xxifi m i m i Amostra: 1 * * 1 * 1 2 12 1 2 n n xifi xifi n xxifi S m i m i m i O desvio- padrão é a medida de dispersão mais usada. Para grande valor (n>30) não há praticamente diferença entre as duas definições de 2 e S2. quando necessária melhor estimativa use sempre S2 para variância e S para o desvio -Padrão. P á g i n a 35 | 44 Compilado Por: Esmail Henriques Coeficiente de variação A variação ou dispersão real, determinada a partir do desvio-padrão, ou qualquer outra medida de dispersão, é denominada dispersão absoluta. Dispersão relativa Media oabsolutaaDispers~ Se a dispersão absoluta é o desvio-padrão e a média é a aritmética x , a dispersão relativa é denominada coeficiente de variação de Pearson (CVp) ou de dispersão, dado por: %100 x CVp ou %100 x S CVp É mais utilizado quando desejamos comparar diversas grandezas com unidades de medidas que podem ser iguais ou diferentes. Ou ainda quando apresentam médias diferentes, embora suas unidades de medidas sejam iguais. Exemplo: Suponha que determinado que determinadofornecedor A, de parafusos tenha enviado ao Departamento de compras de uma empresa uma amostra de 2000 parafusos, com medidas de seu comprimento em mm variando entre 101 e 113mm.O Departamento de compras efectuou uma análise em suas médias e calculou seu respectivo desvio-padrão, encontrando as seguintes especificações: Comprimento médio do parafuso: 107,9mm Desvio-padrão do comprimento do parafuso: 2,72mm Admitindo-se um fornecedor B, que apresentou um lote deste mesmo parafuso com o mesmo número de peças, com média mmx 108 e desvio-padrão S=1,08mm, qual é o lote que você escolheria se fosse o comprador? Resolução: Fornecedor A: Fornecedor B: %52,20252,0 9,107 72,2 mm mm CVp %00,101,0 108 08,1 mm mm CVp Resp: iria escolher o lote do fornecedor B que apresenta menor dispersão relativa do que o lote do fornecedor A. P á g i n a 36 | 44 Compilado Por: Esmail Henriques 7. Quartís ( cQ ) c=1, 2, 3 Definição: são valores separatrizes que dividem os dados em quatro (4) partes iguais, correspondendo a cada uma 25%. Já vimos como determinar os quartís para dados isolados, ou seja, dados não agrupados em classes. Agora nos interessa determinar os quartís para dados agrupados numa tabela de classes. Q1 = 1º quartil, deixa abaixo de si 25% dos elementos. Q2 = 2º quartil, coincide com a mediana, deixa abaixo de si, 50% dos elementos. Q3 = 3º quartil, deixa abaixo de si, 75% dos elementos. Para a determinação dos quartís para dados agrupados numa tabela de classes, segue-se os seguintes procedimentos: 1º - determinar 4 nc 2º - Identifica-se a classe mediana a partir das frequências absolutas acumuladas (a classe que apresenta primeira 4 nc fac , isto é, identificar a primeira 4 nc fac ). 3º - Aplicar a fórmula: i ai ac ic h f f nc LQ *4 1 Onde: Li – Limite inferior da classe Quartil desejado. 1 acf - Frequência absoluta acumulada até a classe anterior a classe quartil. ih - amplitude da classe Quartil (Qc). aif - Frequência absoluta da classe Quartil (Qc). Exemplo: Determinar o primeiro quartil (Q1) e o terceiro quartil (Q3) dos dados constantes da tabela acima: Resolução Determinação de Q1 (c=1) 1º Passo: 75,7 4 31 4 n 2º Passo: O primeiro valor das facmaior que 7,75 é 8. Então a classe [10, 15[ é a classe Q1. P á g i n a 37 | 44 Compilado Por: Esmail Henriques 3º Passo: Aplica-se a fórmula: i ai ac i h f f n LQ *4 1 1 58,145833333,14 3 75,13 105* 3 575,7 10*4 1 1 i ai ac i h f f n LQ Determinação de Q3 (c=3) 1º Passo: 25,23 4 313 4 3 n 2º Passo: O primeiro valor das facmaior que 23,25 é 27. Então a classe [25, 30[ é a classe Q3. 3º Passo: Aplica-se a fórmula: i ai ac i h f f n LQ *4 3 1 3 25,2625,1255* 5 2225,23 25*4 3 1 3 i ai ac i h f f n LQ Este valor significa que 75% dos dados estão abaixo de 26,25 visto que quartís dividem os dados duma distribuição em quatro (4) partes iguais. Tarefa: Leitor determine Q2. Compare o resultado obtido com a mediana dos dados da mesma tabela. 8. Decís ( cD ) c = 1, 2, 3, ..., 9 Definição: são valores separatrizes que dividem os dados em Dez (10) partes iguais, correspondendo a cada uma 10%. Como você já deve ter percebido, a fórmula neste caso também é semelhante às separatrizes anteriores. Ei-la: 1º Passo: Calcula-se 10 nc em que c = 1, 2, 3, 4, 5, 6, 7, 8 e 9. 2º Passo: Identifica-se a classe Dc pela fac. 3º Passo: Aplica-se a fórmula: i ai ac ic h f f nc LD *10 1 P á g i n a 38 | 44 Compilado Por: Esmail Henriques Exemplo: Determinar o terceiro Decil (D3) dos dados constantes na tabela acima: 1º Passo: Calcula-se 3,9 10 313 10 3 n 2º Passo: O primeiro valor das facmaior que 9,3 é 16. Então a classe [15, 20[ é a classe D3. 3º Passo: Aplica-se a fórmula: i ai ac i h f f n LD *10 3 1 3 81,158125,15 8 5,6 155* 8 83,9 15*10 3 1 3 i ai ac i h f f n LD Este valor significa que 30% dos dados estão abaixo de 15,81. Tarefa: Leitor determine D1, D5, D7. Compare o resultado de D5 com o valor da mediana. Diga o que observou? 9. Centís ou Percentís ( cD ) c = 1, 2, 3, ..., 9 Definição: são valores separatrizes que dividem os dados em cem (100) partes iguais, correspondendo a cada uma 1%. Como você já deve ter percebido, a fórmula neste caso também é semelhante às separatrizes anteriores. Ei-la: 1º Passo: Calcula-se 100 nc em que c = 1, 2, 3, ...,99. 2º Passo: Identifica-se a classe Pc pela fac. 3º Passo: Aplica-se a fórmula: i ai ac ic h f f nc LP *100 1 Exemplo: Determinar o sexagésimo quarto Percentil (P64) dos dados constantes na tabela acima: P á g i n a 39 | 44 Compilado Por: Esmail Henriques 1º Passo: Calcula-se 84,19 100 3164 100 64 n 2º Passo: O primeiro valor das facmaior que 19,84 é 22. Então a classe [20, 25[ é a classe P64. 3º Passo: Aplica-se a fórmula: i ai ac i h f f n LP *100 64 1 64 2,23 6 2,19 205* 6 84,3 205* 6 1684,19 20*100 64 1 64 i ai ac i h f f n LP Este valor significa que 64% dos dados estão abaixo de 23,2. Tarefa: Leitor determine P35, P50, P75. Compare os resultados de P50 e Q2, P75 e Q3. Diga o que observou? Caros estudantes\Formandos resolvam as avaliações e trabalhos apresentados no anexo P á g i n a 40 | 44 Compilado Por: Esmail Henriques 7. ANEXOS 7.1. AUTO AVALIAÇÃO UNIVERSIDADE CATÓLICA DE MOÇAMBIQUE INSTITUTO DE ENSINO À DISTÂNCIA 1º ANO - CURSO DE BIOLOGIA / 2022 1ª ACTIVIDADE DE ESTATÍSTICA O instituto Nacional de Estatística(INE) levou a cabo pela primeira vez no ano 2020, uma actividade de fixação de placas informativas sobre o número de habitantes a cada ProvÍncia e principal fronteiras, no âmbito de divulgação dos resultados finais do IV recenseamento Geral da População e habitação 2017. A populacao projectada por sexo em todo pais em 2021 foi num total de 30.832.244 habitantes dos quais 14.885.787 Sexo Masculino e 15.946.457 do sexo Feminino. (FONTE: ine.gov.mz) Proque a estatistica é uma ciência que faz parte em tudo que envolve a nossa vida pessoal e profissional de um modo geral. “Porque estudar estatistica na Biologia” Parte I: 1. -Numa página, fundamente a importância do estudo da Estatística no Curso de Biologia. 2. - Apresente alguns exemplos da sua aplicabilidade na prática das actividades no cotidiano. 3. Em quantas partes se divide a estatística e quais são as áreas de estudo de cada uma delas? 4. Com base na afirmação divulgada pelo INE referente aos números de habitantes feita acima, identifique o tipo de estudo feito segundo as características variáveis estudadas. 5. Dê 2 exemplos de cada, para Estatística Variável Quantitativa Discreta e contínua 6. Quais sãos as Medidas de tendência Central e Medidas de Dispersão Parte II: 1. De uma pauta onde estavam registadas os resultados de um teste de estatística e cuja as notas atribuidas variam de 7 a 14, registaram se as seguintes classificações: 11, 8, 11,8, 12, 14, 9, 11, 10, 13, 12, 9, 11, 10, 9, 8, 11 ,8 , 18, 10, 10, 10. P á g i n a 41 | 44 Compilado Por: Esmail Henriques a) Calcule a Moda, Média, Mediana, Variação e desvio padrão b) Determine a tabela de frequências (absoluta, relativa, absoluta acumulada e relativa acumulada. c) Contrua o histograma 2. O quadro de distribuição abaixo representa as alturas de 200 jovens, Altura Xi (em cm) ni 160-165 8 165-170 15 170-175 10 175-180 40 180-185 90 185-190 20 190-19515 195-200 2 b) Classe da Mediana c) Classe Modal d) Ponto médio da classe e) Amplitude da classe Epifania Chaves Abril de 2022 P á g i n a 42 | 44 Compilado Por: Esmail Henriques Instituto de Ciências de Saúde de Nampula A.C.S1 de Introdução de Bioestatística Curso: SMI - Nivel Médio Turma: 6 Docente: dr. Tocoloa Data: 20/05/2009 ===================================================================== 1) Considere a seguinte afirmação: “Um grupo de 300 jogadores de andebol foi aleatoriamente escolhido em todas as províncias de Moçambique, para estudar o problema de lesões.” a) Indique a população, amostra e a unidade estatística. b) Indique como seria feita a amostra casual simples. 2) As idades dos funcionários de uma escola são as seguintes: 32 54 34 45 45 35 54 32 54 45 32 35 45 54 45 35 a) A partir destes dados, construam uma tabela de frequências de dados simples. b) Construir um gráfico de barras. 3) Registou-se o número de bebes nascidos na maternidade de um hospital em cada um dos dias do mês de Agosto, tendo-se obtido os seguintes valores. Com log�� 30 = 1,477. 3 1 2 3 0 2 4 3 4 2 3 2 1 2 2 0 4 3 1 1 4 3 3 2 1 3 2 0 3 2 a) Construa uma tabela de frequência em classe. b) Faça o respectivo histograma. 4) Interrogaram-se 16 casais acerca do seu número de filhos, tendo-se obtido os seguintes valores: 1 0 2 1 3 2 1 2 3 4 0 1 1 2 2 4 a) Calculem a média aritmética. b) Calculem a mediana. c) Indique a moda. Fim Boa sorte P á g i n a 43 | 44 Compilado Por: Esmail Henriques UNIVERSIDADE CATÓLICA DE MOÇAMBIQUE Instituto de Ensino à Distancia Curso de Educação Física 2020 1º Trabalho de Estatística PARTE I Com base em conhecimentos relativos a estatística, responde as seguintes questões 1. Explique: 1.1.A importância do estudo de estatística no curso de Educação Física. (0,75) 1.2. A importância de uso de tabela e gráficos na estatística. (0,75) 1.3. A importancia da sondagem e, de um exemplo concreto para área de Educação Física. (0,75) 2. Diferencie: 2.1. Amostragem aleatória e Amostragem estratificada. (0,75) 2.2. Estatatística Descritiva e Estatística Inferencial. (0,75) 2.3. Variável ordinal e variável discreta. (0,75) 2.4. Variável contínua e variável nominal. (0,75) PARTE II 1. Na tabela abaixo, estão contidas amostras de notas de três estudantes do curso de Educação Física. A 10 13 9 12 5 17 B 10 10 13 11 11 11 C 18 12 9 05 20 02 1.1. Determine a média, o desvio padrão e o coeficiente de variação das notas de cada candidato. (2,0) 1.2. Qual é o candidato com notas mais homogêneas? (0,75) P á g i n a 44 | 44 Compilado Por: Esmail Henriques PARTE III Alturas (em cm) Fi 1. Os dados ao lado são referentes a altura de uma parte de estudantes do curso de Educação Física. 1.1. Construir a tabela (1,5) 1.2. Qual é a percentagem de estudantes com menos de 175cm? (0,5) 1.3. Qual é a percentagem de estudantes com altura maior ou igual a 175 cm? (0,5) 1.4. Determine a média, a mediana e a moda (czuber). 3,0) 1.5. Qual é o valor de Q2, D8 e P90. (1,5) 1.6. Determine o desvio padrão e o coeficiente de variação dos pesos dos estudantes. (2,0). [160; 165[ 3 [165; 170[ 12 [170; 175[ 13 [175; 180[ 10 [180; 185[ 4 [185; 190[ 2 [190; 195[ 2 Elaborado por: Nilton Maumane