Prévia do material em texto
Título do Módulo: Resolver problemas de Estatística Código: MO HG 03 4002, Nível do QNQP: 04, Número de Créditos: 2. Qualificação: Gestão Financeira e Patrimonial, Turma: Única, Ano Letivo 2021, II Semestre. Resultado de Aprendizagem: Representa e Analisa um Conjunto de Dados Estatísticos. Critérios de desempenho: a) Organiza dados estatísticos em tabelas ou diagramas;’ b) Calcula frequências absolutas e relativas; c) Interpreta dados estatísticos organizados em tabela ou diagrama. 1. Conceito de Estatística. A Estatística é um ramo da Matemática que estuda características de uma população com vista a permitir tirar conclusões sobre um conjunto de dados e sugerir tomada de decisões baseada nas análises realizadas. Por isso, usa métodos científicos de recolha, organização, classificação, apresentação e interpretação de dados. A palavra Estatística deriva etimologicamente do substantivo latino status que significa Estado que aparece pela primeira vez no século XVIII e foi sugerida pelo alemão Gottfried Achemmel (1719 – 1772) A origem desta palavra está relacionada com o fato de por terem sido os estados e os governos a sentirem a necessidade de mandar elaborar registos da população, de nascimentos, de casamentos, de impostos, etc., com objetivo de melhor conhecer as características de sua população de forma a determinar leis sobre impostos, número de homens disponíveis para a guerra, necessidade de implantação de serviços de educação, saúde, segurança, etc. Atualmente, estatística não se limita ao estudo Demográfico ou da Economia, o seu campo de aplicação alarga-se à análise de dados em Biologia, Medicina, Física, Psicologia, Indústria, Comercio, Meteorologia, etc. A Estatística subdivide-se em três áreas: descritiva, probabilística e inferencial. A estatística descritiva, como o próprio nome já diz, se preocupa em descrever os dados. A estatística inferencial, fundamentada na teoria das probabilidades, se preocupa com a análise destes dados e sua interpretação. A palavra estatística tem mais de um sentido. No singular se refere à teoria estatística e ao método pelo qual os dados são analisados enquanto que, no plural, se refere às estatísticas descritivas que são medidas obtidas de dados selecionados. A estatística descritiva, cujo objetivo básico é o de sintetizar uma série de valores de mesma natureza, permitindo dessa forma que se tenha uma visão global da variação desses valores, organiza e descreve os dados de três maneiras: por meio de tabelas, de gráficos e de medidas descritivas. Conceitos Básicos e definições de Estatística. População: conjunto de elementos que tem pelo menos uma característica em comum. Esta característica deve delimitar corretamente quais são os elementos da população que podem ser animados ou inanimados. Amostra: subconjunto de elementos de uma população. Este subconjunto deve ter dimensão menor que o da população e seus elementos devem ser representativos da população. A seleção dos elementos que irão compor a amostra pode ser feita de várias maneiras e irá depender do conhecimento que se tem da população e da quantidade de recursos disponíveis. A estatística inferencial é a área que trata e apresenta a metodologia de amostragem. Em se tratando de conjuntos-subconjuntos, estes podem ser: Finitos: possuem um número limitado de elementos. Infinitos: possuem um número ilimitado de elementos. No processo de aquisição da amostra, distinguem-se três tipos de amostras: · Amostra aleatória – os elementos da amostra são escolhidos ao acaso, por sorteio. Todos os elementos da população têm as mesmas probabilidades (chance) de integrarem na amostra. · Amostra sistemática – os elementos da amostra são escolhidos por um processo pré-estabelecido. · Amostra estratificada – utiliza-se quando a população é constituída por grupos diferentes (raça, idades, habilidades literais, condições económicas, etc.). o número de elementos da amostra deve ser proporcional, mas não precisa ser igual a cada estrato. Exemplo 01: Uma formadora tem 20 exemplares de um documento que dever distribuir para 100 formandos, para isto, ela deverá escolher um grupo de 20 formandos que, inicialmente puderam adquirir e fornecer aos colegas para a reprodução. Se usar o processo de amostragem, anteriormente referido, teremos as seguintes escolhas: · Amostra aleatória: poderá, por exemplo, colocar em 100 papéis individuais, a identificação de cada formando, dobra-los, mistura-los e, de seguida retirar 20 desses papéis; · Amostra sistemática: poderá, por exemplo, atribuir a cada um dos alunos números de 1 a 100 (sem repetição) e, em seguida, escolher aqueles a quem foi atribuído um número que seja múltiplo de 5; · Amostra estratificada: poderá por exemplo, atribuir a 20 alunos com maiores carências económicas, que de outra forma teriam dificuldades em adquirir a cópia do documento. Na seleção de uma amostra deve-se ter os seguintes cuidados: · Imparcialidade – todos os elementos devem ter a mesma oportunidade de fazer parte da amostra; · Representatividade – deve conter em proporção, tudo o que a população possui tanto qualitativos como quantitativos. · Tamanho – deve ser suficientemente alargado para que as características da amostra se aproximem, tanto quanto possível, das características da população. Unidade Estatística é cada unidade individual ou elemento que faz parte da população ou da amostra. Variável ou carácter estatístico: é a característica que vai ser observada, medida ou contada nos elementos da população ou da amostra e que pode variar, ou seja, assumir um valor diferente de elemento para elemento. A variável é classificada em: Variável qualitativa: é uma variável que assume como possíveis valores, atributos ou qualidades. Também são denominadas variáveis categóricas. Variável quantitativa: é uma variável que assume como possíveis valores, números. Este tipo de variável classifica-se em: Variável quantitativa discreta: é uma variável que assume como possíveis valores números, em geral inteiros, formando um conjunto finito ou enumerável. Exemplo 03: número de reprovas, por módulo, dos formandos da qualificação de Construção Civil no IPOMA, que pode assumir os valores: 0, 1, 2, … Variável quantitativa contínua: é uma variável que assume como possíveis valores números, em intervalos da reta real e, em geral, resultantes de mensurações. Exemplo 04: peso, altura, massa, etc. 2. Organização de dados em tabelas e gráficos. 2.1. Tabela A tabela é um quadro que resume um conjunto de observações, cujo objetivo é o de produzir uma impressão mais rápida e viva do fenômeno em estudo. Os dados na forma em que foram coletados não permitem, de maneira fácil e rápida, que se extraia informações. Torna-se difícil detetar a existência de algum padrão. É necessário “trabalhar os dados para transformá-los em informações, para compará-los com outros resultados, ou ainda para julgar sua adequação a alguma teoria tabelas e apresentações de dados bem constituídos são essenciais ao bom julgamento estatístico, porque permitem focar as características importantes dos dados ou ter visão acerca do tipo de modelo que deveria ser usado na solução do problema em questão. Elementos de uma tabela: Os elementos fundamentais da tabela são: título, cabeçalho, coluna indicadora e corpo. O título aponta o fenômeno, época e local de ocorrência; o cabeçalho explica o conteúdo das colunas; a coluna indicadora detalha as linhas; o corpo mostra os dados. Complementarmente, tem-se: fonte, notas e chamadas. A fonte cita o informante (caracterizando a confiabilidade dos dados); as notas esclarecem o conteúdo e indicam a metodologia adotada na obtenção ou elaboração da informação; as chamadas clarificam pontos específicos da tabela. Figura 01: Esquema de apresentação de uma tabela As tabelas podem ser classificadas em: tabelas simples e as distribuições de frequências. 2.1.1. Tabelas simples. Uma tabela simples contém as diferentes categorias observadas de uma variável qualitativa e suas respetivas contagens, denominadas frequênciasabsolutas. A contagem refere-se ao número de ocorrências de cada categoria e é realizada utilizando-se, por exemplo, a ficha de registo de dados ou o banco de dados. Quanto à classificação, uma tabela simples pode ser temporal quando as observações são feitas levando-se em consideração o tempo; geográfica quando os dados referem-se ao local de ocorrência; específica (ou categórica) quando tempo e local são fixos; e comparativa quando a tabela resume informações de duas ou mais variáveis. A tabela comparativa é também denominada tabela cruzada ou de dupla ou mais entradas. Exemplo de tabela temporal Tabela 01: Mês de nascimento dos 80 formandos inquiridos no IPOMA, no II Semestre do ano letivo 2021. Mês de Nascimento Nº de Formandos Janeiro 5 Fevereiro 4 Março 10 Abril 12 Maio 11 Junho 7 Julho 0 Agosto 6 Setembro 10 Outubro 5 Novembro 6 Dezembro 4 Total 80 Exemplos de tabelas geográficas Tabela 02: Bairro de residência dos 80 formandos inquiridos no IPOMA, no II Semestre do ano letivo 2021. Bairro Nº de Formandos Carrupeia 4 Marrere 21 Muahivire 11 Muatala 7 Muhala 4 Murrapaniua 1 Mutauanha 8 Namicopo 3 Namutequeliua 5 Napipine 2 Natikiri 14 Total 80 Tabela 03: Naturalidade dos 80 formandos inquiridos no IPOMA, no II Semestre do ano letivo 2021. Naturalidade Nº de Formandos Cabo-Delgado 3 Inhambane 1 Manica 1 Maputo-Prov. 1 Nampula 58 Niassa 2 Sofala 3 Tete 2 Zambézia 9 Total 80 Exemplos de tabelas específicas ou categóricas. Tabela 04: Género dos 80 formandos inquiridos no IPOMA, no II Semestre do ano letivo 2021. Género Nº de Formandos Masculino 51 Feminino 29 Total 80 Tabela 05: Meio de locomoção usado pelos 80 formandos inquiridos no IPOMA, no II Semestre do ano letivo 2021, para vir/ir às aulas. Tipo de meio Nº de Formandos A pé 27 Chapa 45 Táxi-mota 8 Total 80 Tabela 06: Subsistema de ensino feito pelos 80 formandos inquiridos no IPOMA, no II Semestre do ano letivo 2021, para vir/ir às aulas, antes de ingressas no referido instituto. Tipo de meio Nº de Formandos Geral básico 40 Geral médio 25 Técnico básico 15 Total 80 Tabela 07: Setor de trabalho dos encarregados dos 80 formandos inquiridos no IPOMA, no II Semestre do ano letivo 2021. Encarregado Nº de Formandos Camponês 9 Comerciante 8 Conta-própria 13 Estado 36 Privado 14 Total 80 Tabela 08: Rede móvel de preferência dos 80 formandos inquiridos no IPOMA, no II Semestre do ano letivo 2021. Encarregado Nº de Formandos Mcel 3 Movitel 33 Vodacom 44 Total 80 2.1.2. Distribuições de frequências Organização de dados em rol. É o ordenamento de dados numéricos (quantitativos), que pode ser por ordem crescente ou por ordem decrescente. Amplitude total Corresponde à diferença entre o maior valor e o menor valor observado em um conjunto de dados e notaremos por A. Distribuição de frequência pontual – sem perda de informação. Num estudo estatístico, apos a recolha dos dados em questão, deve-se proceder a sua organização por meio, por exemplo de tabelas de frequências, onde podem surgir as seguintes representações: a) A Frequência Absoluta de um valor de uma variável estatística (qualitativa ou quantitativa discreta) é o número de vezes que esse valor ocorre e representa-se por . b) A frequência Relativa de um valor de uma variável estatística é o quociente entre a frequência absoluta e o número total de observações n e pode ser representado por , isto é: c) A frequência Relativa Percentual corresponde a frequência relativa expressa em percentagem, isto é: d) As frequências acumuladas são a soma da frequência de um dado valor da variável com as frequências dos valores que o antecedem. No caso da frequência absoluta acumulada representa-se por e a frequência relativa acumulada pode ser representada por . Exemplos de distribuições de Frequências Pontuais Tabela 08: Idade dos 80 formandos inquiridos no IPOMA, no II Semestre do ano letivo 2021. Idade () Freq. Absoluta () Freq. Absoluta Acumulada () Freq. Relativa () Freq. Relat. Acum. () Freq. Relat. Perc. () 15 3 3 0,04 0,04 3,8 16 4 7 0,05 0,09 5,0 17 12 19 0,15 0,24 15,0 18 15 34 0,19 0,43 18,8 19 12 46 0,15 0,58 15,0 20 7 53 0,09 0,66 8,8 21 8 61 0,10 0,76 10,0 22 8 69 0,10 0,86 10,0 23 4 73 0,05 0,91 5,0 24 2 75 0,03 0,94 2,5 25 3 78 0,04 0,98 3,8 28 1 79 0,01 0,99 1,3 31 1 80 0,01 1,00 1,3 Total 80 1,00 100,0 Tabela 09: Número de agregado familiar dos 80 formandos inquiridos no IPOMA, no II Semestre do ano letivo 2021. Nº de Agregado () Freq. Absoluta () Freq. Absoluta Acumulada () Freq. Relativa () Freq. Relat. Acum. () Freq. Relat. Perc. () 2 4 4 0,05 0,05 5,0 3 3 7 0,04 0,09 3,8 4 14 21 0,18 0,26 17,5 5 14 35 0,18 0,44 17,5 6 16 51 0,20 0,64 20,0 7 15 66 0,19 0,83 18,8 8 9 75 0,11 0,94 11,3 9 2 77 0,03 0,96 2,5 10 2 79 0,03 0,99 2,5 12 1 80 0,01 1,00 1,3 Total 80 1,00 100,0 Distribuição de frequência em classes – com perda de informação. A distribuição de frequências em classes é apropriada para apresentar dados quantitativos contínuos ou discretos com um número elevado de possíveis valores. É necessário dividir os dados em intervalos ou faixas de valores que são denominadas classes. Uma classe é uma linha da distribuição de frequências. O menor valor da classe é denominado limite inferior () e o maior valor da classe é denominado limite superior (). O intervalo ou classe pode ser representado das seguintes maneiras: a) onde o limite inferior da classe é incluído na contagem da frequência absoluta, mas o superior não; b) onde o limite superior da classe é incluído na contagem, mas o inferior não; c) onde tanto o limite inferior quanto o superior são incluídos na contagem; d) onde os limites não fazem parte da contagem. Apresenta os seguintes critérios para a determinação do número de intervalos, denotado por k: 1. Raiz quadrada: ; 2. Logaritmo decimal (Sturges): ; 3. Logaritmo natural (Milone): ; 4. . Onde n é o número de elementos da amostra, A é a amplitude total dos dados e d é o número de decimais de seus elementos. Para este módulo, aplicaremos, na determinação de número de classes, o critério da raiz quadrada. Em seguida determina-se a amplitude de cada classe (h): . É também necessário determinar o valor do centro de classe : . Exemplos de distribuições de Frequências em Classes Tabela 10: Altura dos 80 formandos inquiridos no IPOMA, no II Semestre do ano letivo 2021. , classes, Classe Centro 147,5 6 6 0,075 0,08 7,5 152,5 7 13 0,088 0,16 8,8 157,5 22 35 0,275 0,44 27,5 162,5 9 44 0,113 0,55 11,3 167,5 20 64 0,250 0,80 25,0 172,5 9 73 0,113 0,91 11,3 177,5 3 76 0,038 0,95 3,8 182,5 3 79 0,038 0,99 3,8 187,5 1 80 0,013 1,00 1,3 Total 1,000 100,0 2.2. Gráficos. Gráfico é um recurso visual da Estatística utilizado para representar um fenômeno. Sua utilização em larga escala nos meios de comunicação social, técnica e científica, devem-se tanto à sua capacidade de refletir padrões gerais e particulares do conjunto de dados em observação, como à facilidade de interpretação e a eficiência com que resume informações dos mesmos. Todo gráfico, em sua versão final deve primar pela simplicidade, clareza e veracidade nas informações. Para atingir tal objetivo, a construção de um gráfico exige muito trabalho e cuidados. Ao incluir um gráfico em um trabalho, sua identificação deve aparecer na parte inferior, precedido pela palavra Gráfico seguida de seu número de ordem de ocorrência no texto (algarismos arábicos), de seu respetivo título e/ou legenda explicativa de maneira breve e clara (dispensando a leitura do texto) e da fonte de onde se extraiu os dados. Uma regra básica paraa elaboração adequada do título de qualquer gráfico, é verificar se o mesmo responde a três exigências: o quê, onde e quando. 2.2.1. Gráfico da variável qualitativa. Gráfico de barras. É um gráfico formado por retângulos horizontais de larguras iguais, onde cada um deles representa a intensidade de uma modalidade ou atributo. É recomendável que cada coluna conserve uma distância entre si de aproximadamente 2/3 da largura da base de cada barra, evidenciando deste modo, a não continuidade na sequência dos dados. O objetivo deste gráfico é de comparar grandezas e é recomendável para variáveis cujas categorias tenham designações extensas. Exemplos: Gráfico 01: bairro de residência dos 80 formandos inquiridos no IPOMA, no II Semestre do ano letivo 2021. Gráfico 02: mês de nascimento dos 80 formandos inquiridos no IPOMA, no II Semestre do ano letivo 2021. Gráfico 03: naturalidade dos 80 formandos inquiridos no IPOMA, no II Semestre do ano letivo 2021. Gráfico 04: setor de trabalho do encarregado dos 80 formandos inquiridos no IPOMA, no II Semestre do ano letivo 2021. Gráfico de colunas. É o gráfico mais utilizado para representar variáveis qualitativas. Difere do gráfico de barras por serem seus retângulos dispostos verticalmente ao eixo das abscissas sendo mais indicado quando as designações das categorias são breves. Também para este tipo de gráfico deve ser preservada a distância entre cada retângulo de, aproximadamente, 2/3 da largura da base de cada coluna. O número de colunas ou barras do gráfico não deve ser superior a 12 (doze). Gráfico de setores. Tipo de gráfico onde a variável em estudo é projetada num círculo, de raio arbitrário, dividido em setores com áreas proporcionais às frequências das suas categorias. São indicados quando se deseja comparar cada valor da série com o total. Recomenda-se seu uso para o caso em que o número de categorias não é grande e não obedecem a alguma ordem específica. Exemplos: Gráfico 05: setor de trabalho do encarregado dos 80 formandos inquiridos no IPOMA, no II Semestre do ano letivo 2021. 2.2.2. Gráfico da variável quantitativa. Gráfico da variável quantitativa discreta Gráfico de bastões Este gráfico é formado por segmentos de retas perpendiculares ao eixo horizontal (eixo da variável), cujo comprimento corresponde à frequência absoluta ou relativa de cada elemento da distribuição. Suas coordenadas não podem ser unidas porque a leitura do gráfico deve tornar claro que não há continuidade entre os valores individuais assumidos pela variável em estudo. Exemplos: Gráfico 06: idade dos 80 formandos inquiridos no IPOMA, no II Semestre do ano letivo 2021. Tabela 10: Nota média de passagem dos 80 formandos inquiridos no IPOMA, no II Semestre do ano letivo 2021. Nota () Freq. Absoluta () 10 6 11 18 12 33 13 14 14 2 15 6 16 1 Total 80 Gráfico 07: nota média de passagem dos 80 formandos inquiridos no IPOMA, no II Semestre do ano letivo 2021. Gráfico da variável quantitativa contínua. Histograma É um gráfico de colunas justapostas que representa uma distribuição de frequência para dados contínuos ou uma variável discreta quando esta apresentar muitos valores distintos. No eixo horizontal são dispostos os limites das classes segundo as quais os dados foram agrupados enquanto que o eixo vertical corresponde às frequências absolutas ou relativas das mesmas. Gráfico 08: altura dos 80 formandos inquiridos no IPOMA, no II Semestre do ano letivo 2021, (com ). Cabo-Delgado Inhambane Manica Maputo-Prov. Nampula Niassa Sofala Tete Zambézia 3 1 1 1 58 2 3 2 9 Provincia Número de formandos Camponês Comerciante Conta-própria Estado Privado 9 8 13 36 14 Encarregado Número de formandos Camponês Comerciante Conta-própria Estado Privado 9 8 13 36 14 Carrupeia Marrere Muahivire Muatala Muhala Murrapaniua Mutauanha Namicopo Namutequeliua Napipine Natikiri 4 21 11 7 4 1 8 3 5 2 14 Bairro Númrto de formandos Janeiro Fevereiro Março Abril Maio Junho Julho Agosto Setembro Outubro Novembro Dezembro 5 4 10 12 11 7 0 6 10 5 6 4 Mês Número de formandos 2