Baixe o app para aproveitar ainda mais
Prévia do material em texto
GUARDIÃO CONCURSOS PMMG 2018 1 CONCEITOS BÁSICOS DE ESTATÍSTICA Todas as ciências têm suas raízes na história do homem. A estatística não se limita somente a compilar tabelas de dados e os ilustrar graficamente. Ela é, hoje em dia, um instrumento útil e, em alguns casos, indispensável para tomadas de decisão em diversos campos: científico, econômico, social, político... Todavia, antes de chegarmos à parte de interpretação para tomadas de decisão, há que proceder a um indispensável trabalho de recolha e organização de dados, sendo elas feitas através de recenseamentos (ou censos ou levantamentos estatísticos) ou sondagens. Em linhas gerais a Estatística fornece métodos que auxiliam o processo de tomada de decisão através da análise dos dados que possuímos. Podemos ainda dizer que a Estatística é: Divisão da estatística - Estatística Descritiva: coleta, organização e descrição dos dados. Ela preocupa-se com a forma pela qual podemos apresentar um conjunto de dados em tabelas e gráficos, e também resumir as informações contidas nestes dados mediante a utilização de medidas estatísticas. - Estatística Indutiva ou Inferencial: análise e interpretação desses dados. A inferência estatística baseia-se na teoria das probabilidades para estabelecer conclusões sobre todo um grupo (chamado população), quando se observou apenas uma parte (amostra) representativa desta população. Método Estatístico Atualmente quase todo acréscimo de conhecimento resulta da observação e do estudo. A verdade é que desenvolvemos processos científicos para seu estudo e para adquirirmos tais conhecimentos, ou seja, desenvolvemos maneiras ou métodos para tais fins. Podemos destacar dois métodos: - Método experimental: consiste em manter constantes todas as causas (fatores), menos uma, e variar esta causa de modo que o pesquisador possa descobrir seus efeitos, caso existam. Muito utilizado no estudo da Física, da Química, etc. - Método estatístico: diante da impossibilidade de manter as causas constantes, admite todas essas causas presentes variando-as, registrando essas variações e procurando determinar, no resultado final, que influências cabem a cada uma delas. Fases do método estatístico - Coleta de dados: após cuidadoso planejamento e a devida determinação das características mensuráveis do fenômeno que se quer pesquisar, damos início à coleta de dados numéricos necessários à sua descrição. A coleta pode ser: Direta: quando é feita sobre elementos informativos de registro obrigatório (nascimento, casamentos e óbitos, importação e exportação de mercadorias), dados coletados pelo próprio pesquisador através de inquéritos e questionários, como por exemplo o censo demográfico. A coleta direta de dados pode ser classificada em fator do tempo: (I) contínua (registro) – quando feita continuamente. (II) periódica – quando feita em intervalos constantes de tempo (exemplo o censo de 10 em 10 anos, etc.). (III) ocasional – quando feita extemporaneamente, a fim de atender uma conjuntura ou a uma emergência (caso de epidemias). Indireta: quando é indeferida de elementos conhecidos (coleta direta) e/ou de conhecimento de outros fenômenos relacionados com o fenômeno estudado. Exemplo: pesquisas de mortalidade infantil, que é feita através de dados colhidos por uma coleta direta (número de nascimentos versus números de obtidos de crianças). - Crítica dos dados: depois de obtidos os dados, os mesmos devem ser cuidadosamente criticados, à procura de possíveis falhas e imperfeições, a fim de não incorrermos em erros grosseiros ou de certo vulto, que possam influir sensivelmente nos resultados. A crítica é externa quando visa às causas dos erros por parte do informante, por distração ou má interpretação das perguntas que lhe foram feitas. A crítica é interna quando visa observar os elementos originais dos dados da coleta. - Apuração dos dados: soma e processamento dos dados obtidos e a disposição mediante critérios de classificação, que pode ser manual, eletromecânica ou eletrônica. - Exposição ou apresentação de dados: os dados devem ser apresentados sob forma adequada (tabelas ou gráficos), tornando mais fácil o exame daquilo que está sendo objeto de tratamento estatístico. - Análise dos resultados: realizadas anteriormente (Estatística Descritiva), fazemos uma análise dos resultados obtidos, através dos métodos da Estatística Indutiva ou 1. Amostragem x Amostra; Qualitativa). É a ciência que se ocupa de coletar, organizar, analisar e interpretar dados para que se tomem decisões. Método é um conjunto de meios dispostos convenientemente para se chegar a um fim que se deseja. GUARDIÃO CONCURSOS PMMG 2018 2 Inferencial, que tem por base a indução ou inferência, e tiramos desses resultados conclusões e previsões. Outros conceitos Mais alguns conceitos devem ser aprendidos para darmos continuidade ao nosso entendimento sobre Estatística. - Variáveis: conjunto de resultados possíveis de um fenômeno. As variáveis podem ser: 1) Qualitativas – quando seus valores são expressos por atributos: sexo (masculino ou feminino), cor da pele, entre outros. Dizemos que estamos qualificando. 2) Quantitativas – quando seus valores são expressos em números (salários dos operários, idade dos alunos, etc.). Uma variável quantitativa que pode assumir qualquer valor entre dois limites recebe o nome de variável contínua; e uma variável que só pode assumir valores pertencentes a um conjunto enumerável recebe o nome de variável discreta. - População estatística ou universo estatístico: conjunto de entes portadores de, pelo menos, uma característica comum. Exemplos: estudantes (os que estudam), concurseiros (os que prestam concursos), ... Podemos ainda pesquisar uma ou mais características dos elementos de alguma população, as quais devem ser perfeitamente definidas. É necessário existir um critério de constituição da população, válido para qualquer pessoa, no tempo ou no espaço. - Amostra: é um subconjunto finito de uma população. NOTA: A Estatística Indutiva tem por objetivo tirar conclusões sobre as populações, com base em resultados verificados em amostras retiradas dessa população. É preciso garantir que a amostra possua as mesmas características da população, no que diz respeito ao fenômeno que desejamos pesquisar. Censo: é uma avaliação direta de um parâmetro, utilizando-se todos os componentes da população. Principais propriedades: - Admite erros processual zero e tem 100% de confiabilidade; - É caro; - É lento; - É quase sempre desatualizado (visto que se realizam em períodos de 10 em 10 anos); - Nem sempre é viável. Estimação: é uma avaliação indireta de um parâmetro, com base em um estimador através do cálculo de probabilidades. Principais propriedades: - Admite erro processual positivo e tem confiabilidade menor que 100%. - É barata. - É rápida. - É atualizada. - É sempre viável. Dados brutos: é uma sequência de valores numéricos não organizados, obtidos diretamente da observação de um fenômeno coletivo. Quando observamos ou fazemos n perguntas as quais nos dão n dados ou respostas, obtemos uma sequência de n valores numéricos. Rol: é uma sequência ordenada dos dados brutos. Exemplo: Um aluno obteve as seguintes notas no ano letivo em Matemática: 5,5; 7; 6,5; 9. Os dados brutos é a sequência descrita acima Rol: 5,5 – 6,5 – 7 – 9 (ordenação crescente das notas). Referências CRESPO, Antônio Arnot – Estatística fácil – 18ª edição – São Paulo - Editora Saraiva: 2002 SILVA, Ermes Medeiros, Elio Medeiros...- Estatística para os cursos de: Economia, Administração, Ciências Contábeis - 3ª edição – São Paulo – Editora Atlas S. A: 1999 TAVARES, Prof. Marcelo – Estatística Aplicada à Administração – SistemaUniversidade Aberta do Brasil- 2007 Reis, Marcelo Menezes - Estatística aplicada à administração / Marcelo Menezes Reis. –Florianópolis: Departamento de Ciências da Administração /UFSC, 2008. Questões 01. (Câmara Munic. Itatiba/SP – Analista de Recursos Humanos – VUNESP) Em estatística, a técnica que nos permite fazer inferências sobre uma população, a partir da análise de uma parte dela, denomina-se (A) dedução. (B) amostragem. (C) probabilidade. (D) descrição. (E) extração. 02. (EBSERH – Analista Administrativo – Estatística (HE-UFSCAR) – INSTITUTO AOCP) Que parte da estatística se preocupa apenas em descrever determinada característica da população? (A) Regressão estatística. (B) Estatística contínua. (C) Estatística descritiva. (D) Estatística amostral. (E) Estatística inferencial. 03. (EBSERH – Médico do Trabalho – IADES) “Costuma ser encontrada com maior frequência em jornais, revistas ou relatórios. Essa parte da estatística utiliza números para descrever fatos. Seu foco é a representação gráfica e o resumo e organização de um conjunto de dados, com a finalidade de simplificar informações.” O texto faz referência à: (A) Estatística inferencial (B) Estatística de probabilidade (C) Estatística por amostragem (D) Estatística descritiva (E) Média aritmética 04. (ANS – Ativ. Téc. de Complexidade Intelectual - Administração – FUNCAB) A estatística descritiva: (A) permite descrever os fenômenos aleatórios, ou seja, aqueles em que está presente a incerteza; estuda as técnicas que possibilitam a extrapolação, a um grande conjunto de dados, das informações e conclusões obtidas a partir da amostra. (B) é um conjunto de técnicas que permite, de forma sistemática, organizar, descrever, analisar e interpretar dados oriundos de estudos ou experimentos, realizados em qualquer área do conhecimento. (C) é a etapa inicial da análise, utilizada para descrever e resumir os dados, que foi revigorada pela disponibilidade de uma grande quantidade de dados e de métodos computacionais muito eficientes. (D) é a etapa conclusiva da análise, utilizada para descrever e resumir os dados e permite descrever os fenômenos aleatórios ou seja, aqueles em que está presente a incerteza GUARDIÃO CONCURSOS PMMG 2018 3 . (E) é a etapa inicial da análise, utilizada para descrever e resumir dados; estuda as técnicas que possibilitam a extrapolação, a um grande conjunto de dados, das informações e conclusões obtidas a partir da amostra. Gabarito 01.B / 02.C / 03.D / 04.C Comentários 01. Resposta: B. A Estatística Indutiva tem por objetivo tirar conclusões sobre as populações, com base em resultados verificados em AMOSTRAS retiradas dessa população. Logo a técnica é AMOSTRAGEM. 02. Resposta: C. Estatística Descritiva: coleta, organização e descrição dos dados. 03. Resposta: D. Idem resposta 02. 04. Resposta: C. A estatística descritiva preocupa-se com a forma pela qual podemos apresentar um conjunto de dados em tabelas e gráficos, e também resumir as informações contidas nestes dados mediante a utilização de medidas estatísticas. AMOSTRAGEM Amostragem é uma técnica especial para recolher amostras, que garante, tanto quanto possível, o acaso na escolha. Probabilística (aleatória): A probabilidade de um elemento da população ser escolhido é conhecida. Cada elemento da população passa a ter a mesma chance de ser escolhido. Os seus métodos são: - Amostra casual simples; - Amostra sistemática; - Amostra estratificada; - Amostra por conglomerado. Não-probabilística (não aleatória): Não se conhece a probabilidade de um elemento ser escolhido para participar da amostra. Os seus métodos são: - Amostra por cotas; - Amostra por julgamento; - Amostra por conveniência. AMOSTRAGEM PROBABILÍSTICA Amostragem casual ou aleatória simples: este tipo de amostragem se assemelha ao sorteio lotérico. Ela pode ser realizada numerando-se a população de 1 a n e sorteando-se, a seguir, por meio de um dispositivo aleatório qualquer, k números dessa sequência, os quais serão pertentes à amostra. Exemplo: 15% dos alunos de uma população de notas entre 8 e 10, serão sorteados para receber uma bolsa de estudos de inglês. Vantagens Desvantagens - Facilidade de cálculo - Requer listagem da estatístico; população; - Probabilidade elevada de - Trabalhosa em compatibilidade dos dados populações elevadas; da amostra e da população. - Custos elevados se a dispersão da amostra for elevada. Amostragem sistemática: escolher cada elemento de ordem k. Assemelha-se à amostragem aleatória simples, porque inicialmente enumeram-se as unidades da população. Mas difere da aleatória porque a seleção da amostra é feita por um processo periódico pré-ordenado. Os elementos da população já se acham ordenados, não havendo necessidade de construir um sistema de referência. Exemplo: Amostra de 15% dos alunos com déficit de atenção diagnosticado. Sorteia-se um valor de 1 a 5. Se o sorteado for o 2, incluem- se na amostra o aluno 2, o 7, o 12 e assim por diante de cinco em cinco. Amostragem proporcional estratificada: muitas vezes a população se divide em subpopulações – estratos, então classificamos a população em, ao menos dois estratos, e extraímos uma amostra de cada um. Podemos determinar características como sexo, cor da pele, faixa etária, entre outros. Exemplo: Supondo que dos noventa alunos de uma escola, 54 sejam meninos e 36 sejam meninas vamos obter a amostra proporcional estratificada de 10% desta população. Temos dois estratos: sexo masculino e feminino. Sexo População 10% Amostra M 54 10𝑥54 100 = 5,4 5 F 36 10𝑥36 100 = 3,6 4 Total 90 10𝑥90 100 = 9,0 9 Numeramos os alunos de 01 a 90, sendo que de 01 a 54 correspondem aos meninos e de 55 a 90, as meninas. Para amostragem muito grande também fazemos o uso da Tabela de Números Aleatórios, elaborada a fim de facilitar os cálculos, que foi construída de modo que os dez algarismos (0 a 9) são distribuídos ao acaso nas linhas e colunas. Vantagens Desvantagens - Pressupõe um erro de amostragem menor; - Assegura uma boa representatividade das variáveis estratificadas; - Podem empregar-se metodologias diferentes para cada estrato; - Fácil organização do trabalho de campo. - Necessita de maior informação sobre a população; - Cálculo estatístico mais complexo. Amostragem por conglomerado: é uma amostra aleatória de agrupamentos naturais de indivíduos (conglomerados) na população. Dividimos em seções a área populacional, selecionamos aleatoriamente algumas dessas seções e tomamos todos os elementos das mesmas. Exemplo: GUARDIÃO CONCURSOS PMMG 2018 4 O mapa mostra os conglomerados selecionados (neste caso os municípios), que apresentaram a maior proporção de casos de dengue confirmados no Estado de São Paulo até março de 2015. Erros de amostragem Diferença randômica(aleatória) entre a amostra e população da qual a amostra foi retirada. O tamanho do erro pode ser medido em amostras probabilísticas, expressa como “erro padrão” (ou precisão) de média, proporção entre outros. Erro padrão da média: é usado para estimar o desvio padrão da distribuição das médias amostrais, tanto para populações finitas ou infinitas (será abordado em medidas de dispersão). Referências CRESPO, Antônio Arnot – Estatística fácil – 18ª edição – São Paulo - Editora Saraiva: 2004. SILVA, Ermes Medeiros, Elio Medeiros...- Estatística para os cursos de: Economia, Administração, Ciências Contábeis - 3ª edição – São Paulo – Editora Atlas S. A: 1999. DORA, Filho U – Introdução à Bioestatística para simples mortais – São Paulo – Elsevier: 1999. AMOSTRAGEM NÃO-PROBABILÍSTICA Amostragem por cotas: consiste emuma amostragem por julgamento que ocorre em suas etapas. Em um primeiro momento, são criadas categorias de controle dos elementos da população e, a seguir, selecionam-se os elementos da amostra com base em um julgamento. Amostragem por julgamento: quando o pesquisador seleciona os elementos mais representativos da amostra de acordo com seu julgamento pessoal. Essa amostragem é ideal quando o tamanho da população é pequeno e suas características, bem conhecidas. Amostragem por conveniência: é uma amostra composta de indivíduos que atendem os critérios de entrada e que são de fácil acesso do investigador. Para o critério de seleção arrolamos uma amostra consecutiva. Exemplo: Em uma pesquisa sobre dengue, arrolar os 200 pacientes que receberam diagnostico em um hospital. Vantagens Desvantagens - Mais econômica; - Maior erro de amostragem - Fácil administração; que em amostras aleatórias; - Não necessita de listagem - Não existem metodologias da população. válidas para o cálculo do erro de amostragem; - Limitação representativa; - Maior dificuldade de controle de trabalho de campo Tamanho da Amostra O tamanho da amostra deve ser determinado antes de se iniciar a pesquisa. Deve-se usar a maior amostra possível, pois quanto maior a amostra, maior a representatividade da população. Amostras menores possuem resultados menos precisos. É muito importante usarmos amostras de tamanhos adequados, para que os dados tenham maior confiabilidade e precisão. Consideramos: Questões 01. (TRT/MG – Analista Judiciário – FCC) O objetivo de uma pesquisa era o de se obter, relativamente aos moradores de um bairro, informações sobre duas variáveis: nível educacional e renda familiar. Para cumprir tal objetivo, todos os moradores foram entrevistados e arguídos quanto ao nível educacional, e, dentre todos os domicílios do bairro, foram selecionados aleatoriamente 300 moradores para informar a renda familiar. As abordagens utilizadas para as variáveis nível educacional e renda familiar foram, respectivamente, (A) censo e amostragem por conglomerados. (B) amostragem aleatória e amostragem sistemática. (C) censo e amostragem casual simples. (D) amostragem estratificada e amostragem sistemática. (E) amostragem sistemática e amostragem em dois estágios. 02. (EPE – Analista de Pesquisa Energética – CESGRANRIO) Considere um planejamento amostral para uma população de interesse no qual é feita uma divisão dessa população em grupos idênticos à população alvo, como uma espécie de microcosmos da população, e, em seguida, seleciona-se aleatoriamente um dos grupos e retira-se a amostra do grupo selecionado. A técnica de amostragem descrita acima é definida como: (A) amostragem aleatória simples (B) amostragem por conglomerados (C) amostragem estratificada (D) amostragem sistemática (E) amostragem por cotas 03. (MTur – Estatístico – ESAF) Com relação à amostragem, pode-se afirmar que: (A) na amostragem por quotas, tem-se uma amostra não probabilística na qual divide-se a população em subgrupos e determina-se uma quota (proporcional) a cada subgrupo. A seleção dos objetos individuais obedece o critério de uma amostra sistemática. (B) na amostragem estratificada, divide-se a população em grupos (ou classes, ou estratos), de modo que os elementos pertencentes ao mesmo estrato sejam o mais heterogêneos possível com respeito à característica em estudo. Para cada grupo toma-se uma subamostra pelo procedimento a.a.s., e a amostra global é o resultado da combinação das subamostras de todos os estratos Amostras grandes: n > 100 Amostras médias: n > 30 Amostras pequenas: n < 30 Amostras muito pequenas: n < 12 Vantagens Desvantagens - Não existem listagem de toda a população; - Concentra os trabalhos de campo num número limitado de elementos da população. - Maior erro de amostragem; - Cálculo estatístico mais complexo na estimação do erro de amostragem. GUARDIÃO CONCURSOS PMMG 2018 5 (C) na amostragem por conglomerados, seleciona-se primeiro, ao acaso, grupos (conglomerados) de elementos individuais da população. A seguir, toma-se ou todos os elementos ou uma subamostra de cada conglomerado. Nos conglomerados, as diferenças entre eles devem ser tão grandes quanto possível, enquanto as diferenças dentro devem ser tão pequenas quanto possível. (D) na amostragem por quotas, tem-se uma amostra probabilística na qual divide-se a população em subgrupos e determina-se uma quota (proporcional) a cada subgrupo. A seleção dos objetos individuais é por sorteio. (E) na amostragem sistemática, toma-se cada k-ésima unidade da população previamente ordenada, em que k é a razão de amostragem. O procedimento deve começar ao acaso, sorteando-se um número entre 1 e k. 04. (TJ-ES – Analista Jurídico – CESPE) No que concerne aos planos amostrais, julgue os itens a seguir. Tanto na amostragem estratificada quanto na amostragem por conglomerados, a população é dividida em grupos. Na amostragem por conglomerados, de cada grupo seleciona-se um conjunto de elementos; na amostragem estratificada, devem-se selecionar quais estratos serão amostrados e, desses, observar todos os elementos. ( ) Certo ( ) Errado Respostas 01. Resposta: C. Vide a definição apresentada em nosso material. 02. Resposta: B. Amostragem por conglomerado: é uma amostra aleatória de agrupamentos naturais de indivíduos (conglomerados) na população. Dividimos em seções a área populacional, selecionamos aleatoriamente algumas dessas seções e tomamos todos os elementos das mesmas. 03. Resposta: E. Escolher cada elemento de ordem k. Assemelha-se à amostragem aleatória simples, porque inicialmente enumeram-se as unidades da população. Mas difere da aleatória porque a seleção da amostra é feita por um processo periódico pré-ordenado. Os elementos da população já se acham ordenados, não havendo necessidade de construir um sistema de referência. 04. Resposta: Errado. As definições de amostragem estratificada e por conglomerados estão invertidas. SERIES ESTATÍSTICAS A Estatística tem objetivo sintetizar os valores que uma ou mais variáveis possam assumir, para que tenhamos uma visão global da variação dessa ou dessas variáveis. Esses valores irão fornecer informações rápidas e seguras. Tabela: é um quadro que resume um conjunto de observações. Uma tabela compõe-se de: 1) Corpo – conjunto de linhas e colunas que contém informações sobre a variável em estudo; 2) Cabeçalho – parte superior da tabela que especifica o conteúdo das colunas; 3) Coluna indicadora – parte da tabela que especifica o conteúdo das linhas; 4) Linhas – retas imaginárias que facilitam a leitura, no sentido horizontal; 5) Casa ou célula – espaço destinado a um só número; 6) Título – Conjunto de informações, as mais completas possíveis, que satisfazem as seguintes perguntas: O quê? Quando? Onde? localizando-se no topo da tabela. Elementos complementares: de preferência colocados no rodapé. - Fonte; - Notas; - Chamadas. Séries Estatísticas: toda tabela que apresenta a distribuição de um conjunto de dados estatísticos em função da época, do local ou da espécie. Observamos três elementos: - tempo; - espaço; - espécie. Conforme varie um dos elementos da série, podemos classifica-la em: - Histórica; - Geográfica; - Específica. - Séries históricas, cronológicas, temporais ou marchas: Os valores da variável são descritos em, determinado local, em intervalos de tempo. GUARDIÃO CONCURSOS PMMG 2018 6 Fonte: IBGE - Séries geográficas, espaciais, territoriais ou de localização: valores da variável, em determinado instante, discriminados segundo regiões. - Séries específicas ou categóricas: aquelas que descrevem valores da variável, em determinado tempo e local,segundo especificações ou categorias. Dados absolutos e dados relativos Aos dados resultantes da coleta direta da fonte, sem manuseio senão contagem ou medida, são chamados dados absolutos. Não é dado muito importância a estes dados, utilizando-se de os dados relativos. Dados relativos são o resultado de comparações por quociente (razões) que estabelecem entre dados absolutos e têm por finalidade facilitar as comparações entre quantidades. Os mesmos podem ser traduzidos por meio de percentagens, índices, coeficientes e taxas. - Percentagens: Considerando a série: MATRÍCULAS NAS ESCOLAS DA CIDADE B - 2016 CATEGORIAS NÚMERO DE ALUNOS 1º grau 2º grau 3º grau 19.286 1.681 234 Total 21.201 Dados fictícios. Calculando os percentagens dos alunos de cada grau: - Séries conjugadas – Tabela de dupla entrada: utilizamos quando temos a necessidade de apresentar, em uma única tabela, variações de mais de uma variável. Com isso 1º 𝑔𝑟𝑎u → 2º 𝑔𝑟𝑎𝑢 → 3º 𝑔𝑟𝑎𝑢 → 19.286𝑥100 21.201 = 90,96 = 91,0 1.681𝑥100 21.201 = 7,92 = 7,9 234𝑥100 21.201 = 1,10 = 1,1 conjugamos duas séries em uma única tabela, obtendo uma tabela de dupla entrada, na qual ficam criadas duas ordens de classificação: uma horizontal e uma vertical. Formamos com os dados uma nova coluna na série em estudo: MATRÍCULAS NAS ESCOLAS DA CIDADE B - 2016 CATEGORIAS NÚMERO DE ALUNOS % 1º grau 19.286 91,0 2º grau 1.681 7,9 3º grau 234 1,1 Total 21.201 100,0 Dados fictícios. GUARDIÃO CONCURSOS PMMG 2018 7 Esses novos valores nos dizem que, de cada 100 alunos da cidade B, 91 estão matriculados no 1º grau, 8 (aproximadamente) no 2º grau e 1 no 3º grau. - Índices: razões entre duas grandezas tais que uma não inclui a outra. Exemplos: 412457 𝑬𝒔𝒕𝒂𝒅𝒐 𝑩: 𝑇𝑎𝑥𝑎 𝑑𝑒 𝑒𝑣𝑎𝑠ã𝑜: 436127 = 0,945727𝑥100 = 94,57268 𝑠𝑢𝑏𝑡𝑟𝑎𝑖𝑚𝑜𝑠 𝑑𝑒 100 = 5,4% 𝑖𝑑𝑎𝑑𝑒 𝑚𝑒𝑛𝑡𝑎𝑙 𝑄𝑢𝑜𝑐𝑖𝑒𝑛𝑡𝑒 𝑖𝑛𝑡𝑒𝑙𝑒𝑡𝑢𝑎𝑙 = 𝑖𝑑𝑎𝑑𝑒 𝑐𝑟𝑜𝑛𝑜𝑙ó𝑔𝑖𝑐𝑎 𝑥100 𝑝𝑜𝑝𝑢𝑙𝑎çã𝑜 𝐷𝑒𝑛𝑠𝑖𝑑𝑎𝑑𝑒 𝑑𝑒𝑚𝑜𝑔𝑟á𝑓𝑖𝑐𝑎 = 𝑠𝑢𝑝𝑒𝑟𝑓í𝑐𝑖𝑒 Econômicos: 𝑃𝑟𝑜𝑑𝑢çã𝑜 𝑝𝑒𝑟 𝑐𝑎𝑝𝑖𝑡𝑎 = 𝑣𝑎𝑙𝑜𝑟 𝑡𝑜𝑡𝑎𝑙 𝑑𝑎 𝑝𝑟𝑜𝑑𝑢çã𝑜 𝑝𝑜𝑝𝑢𝑙𝑎çã𝑜 𝑟𝑒𝑐𝑒𝑖𝑡𝑎 𝑅𝑒𝑐𝑒𝑖𝑡𝑎 𝑝𝑒𝑟 𝑐𝑎𝑝𝑖𝑡𝑎 = 𝑝𝑜𝑝𝑢𝑙𝑎çã𝑜 - Coeficientes: razões entre o número de ocorrências e o número total (ocorrências e não ocorrências). Exemplos: 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑛𝑎𝑠𝑐𝑖𝑚𝑒𝑛𝑡𝑜𝑠 MEDIA ARITMÉTICA Considere um conjunto numérico A = {x1; x2; x3; ...; xn} e efetue uma certa operação com todos os elementos de A. Se for possível substituir cada um dos elementos do conjunto A por um número x de modo que o resultado da operação citada seja o mesmo diz – se, por definição, que x será a média dos elementos de A relativa a essa operação. MÉDIA ARITMÉTICA SIMPLES 𝐶𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑛𝑎𝑡𝑎𝑙𝑖𝑑𝑎𝑑𝑒 = 𝐶𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑚𝑜𝑟𝑡𝑎𝑙𝑖𝑑𝑎𝑑𝑒 = Educacionais: 𝑝𝑜𝑝𝑢𝑙𝑎çã𝑜 𝑡𝑜𝑡𝑎𝑙 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 ó𝑏𝑖𝑡𝑜𝑠 𝑝𝑜𝑝𝑢𝑙𝑎çã𝑜 𝑡𝑜𝑡𝑎𝑙 A média dos elementos do conjunto numérico A relativa à adição é chamada média aritmética. - Cálculo da média aritmética Se x for a média aritmética dos elementos do conjunto numérico A = {x1; x2; x3; ...; xn}, então, por definição: 𝐶𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑒𝑣𝑎𝑠ã𝑜 𝑒𝑠𝑐𝑜𝑙𝑎𝑟 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑎𝑙𝑢𝑛𝑜𝑠 𝑒𝑣𝑎𝑑𝑖𝑑𝑜𝑠 = 𝑛ú𝑚𝑒𝑟𝑜 𝑖𝑛𝑖𝑐𝑖𝑎𝑙 𝑑𝑒 𝑚𝑎𝑡𝑟í𝑐𝑢𝑙𝑎𝑠 - Taxas: coeficientes multiplicados por um potência de 10 (10,100, 1000, ...) para tornar o resultado mais inteligível. Exemplos: Taxa de mortalidade = coeficiente de mortalidade x 1000. Taxa de natalidade = coeficiente de natalidade x 1000. 1) Em cada 200 celulares vendidos, 4 apresentam defeito. Coeficiente de defeitos: 4/200 = 0,02 Exemplos: 1) Calcular a média aritmética entre os números 3, 4, 6, 9, e 13. Se x for a média aritmética dos elementos do conjunto (3, 4, 6, 9, 13), então x será a soma dos 5 elementos, dividida por 5. Assim: Taxa de defeitos = 2% (0,02 x 100) Questão 𝑥 = 3 + 4 + 6 + 9 + 13 5 ↔ 𝑥 = 35 5 ↔ 𝑥 = 7 01. O estado A apresentou 733.986 matriculas no 1º ano no início de 2009 e 683.816 no final do ano. O estado B apresentou, respectivamente, 436.127 e 412.457 matriculas. Qual estado apresentou maior evasão escolar? Resposta 01. Resposta: Evasão estado A: 6,8% e Evasão estado B: A média aritmética é 7. 2) Os gastos (em reais) de 15 turistas em Porto Seguro estão indicados a seguir: 65 – 80 – 45 – 40 – 65 – 80 – 85 – 90 75 – 75 – 70 – 75 – 75 – 90 – 65 Se somarmos todos os valores teremos: 5,5%. 683816 𝑥 = 65 + 80 + 45 + 40 + 65+, , , +90 + 65 15 = 1075 15 = 71,70 𝑬𝒔𝒕𝒂𝒅𝒐 𝑨: 𝑇𝑎𝑥𝑎 𝑑𝑒 𝑒𝑣𝑎𝑠ã𝑜: 733986 = 0,931647𝑥100 = 93,16472 𝑠𝑢𝑏𝑡𝑟𝑎𝑖𝑚𝑜𝑠 𝑑𝑒 100 = 6,8% Assim podemos concluir que o gasto médio do grupo de turistas foi de R$ 71,70. A média aritmética(x) dos n elementos do conjunto numérico A é a soma de todos os seus elementos, dividida pelo número de elementos n. Central (4.01. Média Aritmética, simples e Propriedades da Média GUARDIÃO CONCURSOS PMMG 2018 8 Questões 01. (Câmara Municipal de São José dos Campos/SP – Analista Técnico Legislativo – Designer Gráfico – VUNESP) Na festa de seu aniversário em 2014, todos os sete filhos de João estavam presentes. A idade de João nessa ocasião representava 2 vezes a média aritmética da idade de seus filhos, e a razão entre a soma das idades deles e a idade de João valia (A) 1,5. (B) 2,0. (A) 4. (B) 8. (C) 12. (D) 16. (E) 20. 01. Resposta: E. Foi dado que: J = 2.M Respostas (C) 2,5. (D) 3,0. (E) 3,5. 02. (TJ/SC - Técnico Judiciário - Auxiliar TJ-SC) Os censos populacionais produzem informações que permitem conhecer a distribuição territorial e as principais características das pessoas e dos domicílios, acompanhar sua evolução ao longo do tempo, e planejar adequadamente o uso sustentável dos recursos, sendo imprescindíveis para a definição de políticas públicas e a tomada de decisões de investimento. Constituem a única fonte de referência sobre a situação de vida da população nos municípios e em seus recortes internos – distritos, bairros e localidades, rurais ou urbanos – cujas realidades socioeconômicas dependem dos resultados censitários para serem conhecidas. http://www.ibge.gov.br/home/estatistica/populacao/censo2010/default.sh tm (Acesso dia 29/08/2011) 𝐽 = 𝑎+𝑏+⋯+𝑔 = 2. 𝑀 ( I ) 7 Foi pedido: 𝑎 +𝑏+⋯+𝑔 = ? 𝐽 Na equação ( I ), temos que: 7 = 𝑎+𝑏+⋯+𝑔 𝐽 7 = 𝑎+𝑏+⋯+𝑔 2 𝑀 𝑎 + 𝑏 + ⋯ + 𝑔 𝑀 = 3,5 02. Resposta: E. [30, 34] = 600, somatória de todos os homens é: 300+400+600+500+200= 2000 Um dos resultados possíveis de se conhecer, é a distribuição entre homens e mulheres no território brasileiro. A seguir parte da pirâmide etária da população brasileira 600 300+400+600+500+200 03. Resposta: D. = 600 = 0,3 . (100) = 30% 2000 disponibilizada pelo IBGE. Do enunciado temos m = h + 8 (sendo m = mulheres e h = homens). A média da turma é 7,5, sendo S a soma das notas: 𝑆 = 𝑚+ℎ http://www.ibge.gov.br/censo2010/piramide_etaria/index.php (Acesso dia 29/08/2011) O quadro abaixo, mostra a distribuição da quantidade de 7,5 → 𝑆 = 7,5(𝑚 + ℎ) A média das mulheres é 8, sendo S1 8 → 𝑆1 = 8𝑚 a soma das notas: 𝑆 1 = 𝑚 homens e mulheres, por faixa etária de uma determinada cidade. (Dados aproximados) Considerando somente a população masculina dos 20 aos 44 anos e com base no quadro abaixo a frequência relativa, dos homens,da classe [30, 34] é: (A) 64%. (B) 35%. (C) 25%. (D) 29%. (E) 30%. 03. (EsSA - Sargento - Conhecimentos Gerais - Todas as Áreas – EB) Em uma turma a média aritmética das notas é 7,5. Sabe-se que a média aritmética das notas das mulheres é 8 e das notas dos homens é 6. Se o número de mulheres excede o de homens em 8, pode-se afirmar que o número total de alunos da turma é A média dos homens é 6, sendo S2 a soma das notas: 𝑆 2 = 6 ℎ → 𝑆2 = 6ℎ Somando as notas dos homens e das mulheres: S1 + S2 = S 8m + 6h = 7,5(m + h) 8m + 6h = 7,5m + 7,5h 8m – 7,5m = 7,5h – 6h 0,5m =1,5h 𝑚 = 1,5ℎ 0,5 𝑚 = 3ℎ h + 8 = 3h 8 = 3h – h 8 = 2h → h = 4 m = 4 + 8 = 12 Total de alunos = 12 + 4 = 16 MÉDIA ARITMÉTICA PONDERADA A média dos elementos do conjunto numérico A relativa à adição e na qual cada elemento tem um “determinado peso” é chamada média aritmética ponderada. http://www.ibge.gov.br/home/estatistica/populacao/censo2010/default.sh http://www.ibge.gov.br/censo2010/piramide_etaria/index.php GUARDIÃO CONCURSOS PMMG 2018 9 - Cálculo da média aritmética ponderada Se x for a média aritmética ponderada dos elementos do conjunto numérico A = {x1; x2; x3; ...; xn} com “pesos” P1; P2; P3; ...; Pn, respectivamente, então, por definição: P1 . x + P2 . x + P3 . x + ... + Pn . x = = P1 . x1 + P2 . x2 + P3 . x3 + ... + Pn . xn ↔ (P1 + P2 + P3 + ... + Pn) . x = = P1 . x1 + P2 . x2 + P3 . x3 + ... + Pn . xn e, portanto, Observe que se P1 = P2 = P3 = ... = Pn = 1, então � = �1; �2; �3; …; ��: que é a média aritmética simples. � Exemplos: 1) Calcular a média aritmética ponderada dos números 35, 20 e 10 com pesos 2, 3, e 5, respectivamente. Se x for a média aritmética ponderada, então: proporção de 3 partes de L1 para cada 5 partes de L2 A densidade da mistura final, em g/l, será (A) 861,5. (B) 862. (C) 862,5. (D) 863. 02. (TJM-SP – Oficial de Justiça – VUNESP) Ao encerrar o movimento diário, um atacadista, que vende à vista e a prazo, montou uma tabela relacionando a porcentagem do seu faturamento no dia com o respectivo prazo, em dias, para que o pagamento seja efetuado. PORCENTUAL DO FATURAMENTO PRAZO PARA PAGAMENTO (DIAS) 15% À vista 20% 30 35% 60 20% 90 10% 120 O prazo médio, em dias, para pagamento das vendas efetuadas nesse dia, é igual a (A) 75. (B) 67. (C) 60. (D) 57. (E) 55. 𝑥 = 2 .35 + 3 .20 + 5 .10 2 + 3 + 5 ↔ 𝑥 = ↔ 𝑥 = 18 70 + 60 + 50 10 ↔ 𝑥 = 180 10 03. (SEDUC/RJ - Professor – Matemática – CEPERJ) Uma loja de roupas de malha vende camisetas com malha de três qualidades. Cada camiseta de malha comum custa R$15,00, de A média aritmética ponderada é 18. 2) Em um dia de pesca nos rios do pantanal, uma equipe de pescadores anotou a quantidade de peixes capturada de cada espécie e o preço pelo qual eram vendidos a um supermercado em Campo Grande. malha superior custa R$24,00 e de malha especial custa R$30,00. Certo mês, a loja vendeu 180 camisetas de malha comum, 150 de malha superior e 70 de malha especial. O preço médio, em reais, da venda de uma camiseta foi de: (A) 20. (B) 20,5. (C) 21. (D) 21,5. (E) 11. Respostas Vamos determinar o preço médio do quilograma do peixe vendido pelos pescadores ao supermercado. Considerando que a variável em estudo é o preço do quilo do peixe e fazendo a leitura da tabela, concluímos que foram pescados 18 kg de peixe ao valor unitário de R$ 3,00, 10 kg de peixe ao valor unitário de R$ 5,00 e 6 kg de peixe ao valor de R$ 9,00. Vamos chamar o preço médio de p: 01. Resposta: C. 3.800+5.900 = 2400+4500 = 6900 = 862,5 3+5 8 8 02. Resposta: D. Média aritmética ponderada: multiplicamos o porcentual pelo prazo e dividimos pela soma dos porcentuais. .0+20.30+35.60+20.90+10.120 = 15+20+35+20+10 𝑝 = 18𝑥3,00 + 10𝑥5,00 + 6𝑥9,00 18 + 10 + 6 = = 4,65 𝑟𝑒𝑎𝑖𝑠 54 + 50 + 54 34 = 158 34 = 6 00+2100+1800+1200 = 100 = 5700 = 57 100 Neste caso o fator de ponderação foi a quantidade de peixes capturadas de cada espécie. Questões 01. (EPCAR – Cadete – EPCAR) Um líquido L1 de densidade 800 g/l será misturado a um líquido L2 de densidade 900 g/l Tal mistura será homogênea e terá a 03. Resposta: C. Também média aritmética ponderada. 180.15+150.24+70.30 = 180+150+70 = 2700+3600+2100 = 400 = 8400 = 21 400 A média aritmética ponderada dos n elementos do conjunto numérico A é a soma dos produtos de cada elemento multiplicado pelo respectivo peso, dividida pela soma dos pesos. A palavra média, sem especificações (aritmética ou ponderada), deve ser entendida como média aritmética. Tipo de peixe Quilo de peixe pescado Preço por quilo Peixe A 18 R$ 3,00 Peixe B 10 R$ 5,00 Peixe C 6 R$ 9,00 GUARDIÃO CONCURSOS PMMG 2018 10 MEDIANA E MODA A moda e a mediana são utilizados para resumirem um conjunto de valores dado uma série estatística. Vamos ver os conceitos de cada uma delas: A mediana, é uma medida de localização do centro da distribuição dos dados. A moda, é o valor que aparece com maior frequência, ou seja, podemos dizer que é o termo que está na “moda”. Exemplo: Em um time de futebol temos as seguintes altura dos atletas: (Fonte: http://geniodamatematica.com.br) Ache o valor da mediana e da moda. Resolução: Primeiramente precisamos colocar os dados de forma ordenada, ou seja, montar o rol: Altura Frequência 1,48 1 1,52 1 1,60 1 1,61 1 1,62 1 1,64 1 1,66 3 1,68 1 1,69 1 Para acharmos a mediana precisamos ver se a quantidade de valores, se for ímpar a mediana é o valor que ocupa a posição central, se for par a mediana corresponde à média aritmética dos dois valores centrais. No nosso caso temos que é ímpar: Altura Frequência 1º 1,48 1 2º 1,52 1 3º 1,60 1 4º 1,61 1 5º 1,62 1 6º 1,64 1 7º 1,66 3 8º 1,68 1 9º 1,69 1 Então a mediana é o valor que está na 5ª linha: 1,62 E a moda é 1,66, que é o valor que aparece com maior frequência. Questões 01. (SESP/MT – Perito Oficial Criminal - Engenharia Civil/Engenharia Elétrica/Física/Matemática – FUNCAB/2014) Determine a mediana do conjunto de valores (10, 11, 12, 11, 9, 8, 10, 11, 10, 12). (A) 8,5 (B) 9 (C) 10,5 (D) 11,5 (E) 10 02. (IF/GO – Assistente de Alunos – UFG/2014) A tabela a seguir apresenta o índice de desenvolvimento humano (IDH) de alguns países da América Latina referente ao ano 2012. Países IDH Argentina 0,811 Bolívia 0,645 Brasil 0,730 Chile 0,819 Colômbia 0,719 Cuba 0,780 México 0,775 Uruguai 0,792 Venezuela 0,758 Dentre os países listados, aquele cujo IDH representa a mediana dos dados apresentados é: (A) Brasil (B) Colômbia (C) México (D) Venezuela 03. (Polícia Militar/SP – Aluno – Oficial – VUNESP/2014) Na tabela, as letras q, p e m substituem as alturas, relacionadas em ordem crescente, de seis alunos do Curso de Formação de Oficiais da Polícia Militar avaliados em um exame biométrico, sendo que, nessa tabela, letras iguais correspondem a alturas iguais. Nome Altura (em centímetros) Gonçalves q Camargo q Pacheco q Mendes p Santos m Ferreira m Sabendo-se que a moda, a mediana e a média aritmética das alturas desses alunos são, respectivamente, 173 cm, 174,5 cm e 175,5 cm, pode-se concluir que a altura do aluno Ferreira é igual, em centímetros, a (A) 177. (B) 178. (C) 179. (D) 180. (E) 182. (SEFAZ/RJ – ANALISTA DE CONTROLE INTERNO – CEPERJ/2013) Observe os números relacionados a seguir, e responda às questões de números 04 e 05. 4 7 3 9 6 8 8 7 8 04. A mediana desses valores vale: (A) 6 (B) 6,5 (C) 7 (D) 7,5 (E) 8 GUARDIÃO CONCURSOS PMMG 2018 11 � � 05. A moda desses valores vale: (A) 8 (B) 7 (C) 6 (D)5 (E) 4 Respostas 01. Resposta: C. Coloquemos os valores em ordem crescente: 8, 9, 10, 10, 10, 11, 11, 11, 12, 12 Como a Mediana é o elemento que se encontra no meio dos valores colocados em ordem crescente, temos que: 10 + 11 21 𝑀 = 2 = 2 = 10,5 02. Resposta: C. MÉDIA ARITMÉTICA ( 𝒙) A média aritmética é o quociente da divisão da soma dos valores da variável pelo número deles. Anteriormente tratamos a média para dados não agrupados, agora veremos para dados agrupados. 1) Sem intervalo de classe: considerando a distribuição relativa a 34 famílias de quatro filhos, e tomando como variável o número de filhos do sexo masculino, teremos a seguinte tabela: Vamos colocar os números em ordem crescente: 0,645 0,719 0,730 0,758 0,775 0,780 0,792 0,811 0,819 O número que se encontra no meio é 0,775 (México). 03. Resposta: C. * Se a moda é 173 cm, então q = 173 cm (Gonçalves, Camargo e Pacheco). * Se a mediana é 174,5 cm, então (q + p) / 2 = 174,5. q + p = 174,5 . 2 q + p = 349 cm * Se a média aritmética é 175,5 cm, então: 3. 𝑞 + 𝑝 + 2. 𝑚 As frequências são números indicadores da intensidade de cada valor da variável, elas funcionam como fatores de ponderação, o que nos leva a calcular a média aritmética ponderada, dada por: 𝚺 𝒙𝒊𝒇𝒊 𝒙 = 𝚺𝒇𝒊 O método mais prático de resolvermos é adicionarmos mais uma coluna para obtenção da média ponderada: 𝑀 = 6 = 17 2. 𝑞 + 𝑞 + 𝑝 + 2. 𝑚 6 = 175,5 2.173 + 349 + 2.m = 175,5 . 6 346 + 349 + 2.m = 1053 2.m = 1053 – 695 m = 358 / 2 Aplicando a fórmula temos: m = 179 cm 04. Resposta: C. Colocando em ordem crescente: 𝑥 = Σ𝑥𝑖𝑓𝑖 Σ𝑓 = 78 34 = 2,29 → 𝑥 = 2,3 𝑚𝑒𝑛𝑖𝑛𝑜𝑠 3; 4; 6; 7; 7; 8; 8; 8; 9 São 9 elementos, então a mediana é o quinto elemento(9+1/2) Mediana 7 05. Resposta: A. Moda é o elemento que aparece com mais frequência: 8 MEDIDAS DE POSIÇÃO – CENTRALIDADE As medidas de posição visam localizar com maior facilidade onde está a maior concentração de valores de uma dada distribuição, podendo estar ela no início, meio ou fim; e também se esta distribuição está sendo feita de forma igual. As medidas de posição mais importantes são as de tendência central (veremos aqui para dados agrupados): - Média; - Moda; - Mediana. E temos ainda as medidas de posição denominadas separatrizes, que englobam: - a própria mediana - os quartis; - os percentis. Nota: quando a variável apresenta um valor 2 meninos, 3 décimos de meninos, como devemos interpretar o resultado? Como o valor médio 2,3 meninos sugere (para este caso) que o maior número de famílias tem 2 meninos e 2 meninas, sendo uma tendência geral, certa superioridade numérica em relação ao número de meninos. 2) Com intervalos de classe: convencionamos que todos os valores incluídos em um determinado intervalo de classe coincidam com seu ponto médio. Determinamos a média ponderada através da fórmula: Σ 𝑥𝑖𝑓𝑖 𝑥 = Σ𝑓 , 𝑜𝑛𝑑𝑒 𝑥𝑖 é 𝑜 𝑝𝑜𝑛𝑡𝑜 𝑚é𝑑𝑖𝑜 𝑑𝑎 𝑐𝑙𝑎𝑠𝑠𝑒. Exemplo: i Estaturas (cm) fi 1 150 ├ 154 4 2 154 ├ 158 9 3 158 ├ 162 11 4 162 ├ 166 8 5 166 ├ 170 5 6 170 ├ 174 3 ∑ = 40 Vamos abrir uma coluna para os pontos médios e outra para os produtos: Nº de meninos fi 0 2 1 6 2 10 3 12 4 4 ∑ = 34 Nº de meninos fi xi.fi 0 2 0 1 6 6 2 10 20 3 12 36 4 4 16 ∑ = 34 ∑ = 78 APOSTILAS OPÇÃO 12 Onde: 𝒍 ∗ +𝑳 ∗ 𝑴𝒐 = 𝟐 ∑xifi = 6440, ∑fi = 40 e 𝑥 = Σ 𝑥𝑖𝑓𝑖 Σ𝑓𝑖 l* → limite inferior da classe modal L* → limite superior da classe modal Exemplo: Aplicando: 6440 𝑥 = 40 = 161 → 𝑥 = 161 𝑐𝑚 Observe que a classe com maior frequência é a de i = 3, nela temos que l* = 158 e o L* = 162, aplicando na fórmula: 𝑀𝑜 = 𝑙 ∗ +𝐿 ∗ 2 = 158 + 162 2 = = 160𝑐𝑚 320 2 = 160, 𝑙𝑜𝑔𝑜 𝑎 𝑀𝑜 Existem ainda outros métodos mais elaborados para encontramos a moda, um deles seria a fórmula de Czuber, onde: 𝑫𝟏 Onde temos: 𝑴𝒐 = 𝒍 ∗ + 𝟏 + 𝑫𝟐 . 𝒉 ∗ MODA (Mo) A moda é o valor que aparece com maior frequência em uma série de valores. Podemos dizer é o valor que “está na moda”. - Para dados não agrupados: ela é facilmente reconhecida, pois observamos o valor que mais se repete, como dito na definição. Exemplo: A série: 7,8,9,10,11, 11, 12, 13, 14 tem moda igual a 10. l*→ limite inferior da classe modal h* → amplitude da classe modal D1 → f* - f(ant) D2 → f* - f(post) f*→ frequência simples da classe modal f(ant)→ frequência simples da classe anterior à classe modal f(post) → frequência simples da classe posterior à classe modal. Aplicando a fórmula ao exemplo anterior temos: - Para dados agrupados 1) Sem intervalo de classe: para determinarmos a moda basta observamos a variável com maior frequência. Vejamos o exemplo: Nº de meninos fi 0 2 1 6 2 10 3 12 4 4 ∑ = 34 Observamos que a maior frequência(fi) é 12, que corresponde ao valor de variável 3, logo: Mo = 3 2) Com intervalo de classe: a classe que apresenta maior frequência é denominada classe modal. A moda é o valor dominante que está compreendido entre os limites da classe modal. O método mais simples para o cálculo é tomar o ponto médio da classe modal. A este valor damos o nome de moda bruta. Gráficos da moda Observe que a moda é o valor correspondente, no eixo das abcissas, ao ponto de ordenada máxima. Assim temos: Observações: - Quando uma série não apresenta valor modal, ou seja, quando nenhum valor aparece com frequência, dizemos que ela é AMODAL. - Quando uma série tiver mais de um valor modal, dizemos que é BIMODAL (dois valores modas), TRIMODAL, etc. Vantagens e desvantagens da média 1. É uma medida de tendência central que, por uniformizar os valores de um conjunto de dados, não representa bem os conjuntos que revelam tendências extremas. 2. Não necessariamente tem existência real, isto é, nem sempre é um valor que faça parte do conjunto de dados, para bem representá-lo, embora pertença obrigatoriamente ao intervalo entre o maior e o menor valor. 3. É facilmente calculada. 4. Serve para compararmos conjuntos semelhantes. � i Estaturas (cm) fi xi xi.fi 1 150 ├ 154 4 152 608 2 154 ├ 158 9 156 1404 3 158 ├ 162 11 160 1760 4 162 ├ 166 8 164 1312 5 166 ├ 170 5 168 840 6 170 ├ 174 3 172 516 ∑ = 40 ∑ = 6440 i Estaturas (cm) fi 1 150 ├ 154 4 2 154 ├ 158 9 3 158 ├ 162 11 4 162 ├ 166 8 5 166 ├ 170 5 6 170 ├ 174 3 ∑ = 40 13 Observando os exemplos dados: - Para n = 9, temos 𝑛+1 = 9+1 = 10 = 5, a mediana é o 5º A moda é utilizada: - Quando desejamos obter uma medida rápida e aproximada de posição; - Quando a medida de posição deve ser o valor mais típico da distribuição. 2 2 2 temo, que é Md = 10. - Para n = 8, temos 8/2 = 4 e 8/2 + 1 = 4 + 1 = 5. Logo a mediana é a média aritmética do 4º e 5º termo: 10 + 12 / 2 = 22 / 2 = 11 → Md = 11 MEDIANA (Md) Como o próprio nome sugere, a mediana é o valor que se encontra no centro de uma série de números, estando estes dispostos segundo uma ordem. É o valor situado de tal forma no conjunto que o separa em dois subconjuntos de mesmo número de elementos. - Para dados não agrupados: para identificarmos a mediana, precisamos ordenar os dados (crescente ou decrescente) dos valores, para depois identificarmos o valor central. Exemplo: Dada a série de valores: 5, 13, 10, 2, 18, 15, 6, 16, 9, vamos ordenar os valores em ordem crescente: 2, 5, 6, 9, 10, 13, 15, 16,18; como temos uma sequência de 9 números precisamos identificar aquele que divide o conjunto em 2 subconjuntos com a mesma quantidade de elementos. Neste caso o valor é 10, pois temos a mesma quantidade de elementos tanto a esquerda quanto a direita: - Paradados agrupados: o cálculo da mediana se processa de modo semelhante ao dos dados não agrupados, implicando na determinação prévia das frequências acumuladas. 1) Sem intervalo de classe: neste caso basta identificarmos a frequência acumulada imediatamente superior à metade da soma da frequências. A mediana será o valor da variável que corresponde a tal frequência acumulada. Exemplo: Nº de meninos fi Fa 0 2 2 1 6 8 2 10 18 3 12 30 4 4 34 ∑ = 34 Nota: - Caso exista uma frequência acumulada (Fa ou Fi), tal que: 𝐹𝑖 = Σfi, a mediana será dada por: 2 𝑀𝑑 = 𝑥𝑖 + 𝑥𝑖+1 2 Md=10 Neste caso como a série tem número ímpar de termos, ficou fácil identificarmos a mediana. Porém se a série tiver número par, a mediana será, por definição, qualquer dos números compreendidos entre dois valores centrais desta série, ao qual utilizaremos o ponto médio entre as duas. Exemplo: 2, 6, 7, 10, 12, 13, 18, 21 (8 termos), vamos utilizar os valores mais centrais que neste caso são o 4º e o 5º termo. Então a mediana será: 2 Ou seja, a mediana será a média aritmética entre o valor da variável correspondente a essa frequência acumulada e a seguinte. Exemplo: 10 + 12 22 𝑀𝑑 = 2 = 2 = 11 Temos: 8/2 = 4 = F3 Vantagens e Desvantagens da Moda 1) Não depende de todos os valores da série, nem de sua ordenação, podendo mesmo não se alterar com a modificação de alguns deles. 2) Não é influenciada por valores extremos (grandes) da série. 3) Sempre tem existência real, ou seja, sempre é representada por um elemento do conjunto de dados, excetuando o caso de classes de frequências, quando trabalhamos com subconjuntos (dados agrupados) e não com cada elemento isoladamente. Notas: - O valor da mediana pode coincidir ou não com um elemento da série. Se for ímpar há coincidência, se for par já não há; - A mediana e a média aritmética não têm necessariamente, o mesmo valor; - A mediana depende da posição dos elementos e não dos valores dos elementos na série ordenada. Essa é uma diferença marcante entre mediana e a média; - A mediana também pode ser chamada de valor mediano. xi fi Fi 12 14 1 2 1 3 15 16 1 2 4 6 17 20 1 1 7 8 ∑ = 8 14 Então: 15 + 16 31 𝑀𝑑 = 2 = 2 = 15,5 1) Com intervalo de classe: precisamos, neste caso, determinar o ponto do intervalo em que está compreendido a mediana. Para tal, precisamos determinar a classe mediana, que será aquela correspondente à frequência acumulada imediatamente superior a Σ fi . Fazendo isso podemos 2 interpolar os dados (inserção de uma quantidade de valores entre dois números), admitindo-se que os valores se distribuam uniformemente em todo o intervalo de classe. Exemplo: i Estaturas (cm) fi Fi 1 150 ├ 154 4 4 2 154 ├ 158 9 13 3 158 ├ 162 11 24 4 162 ├ 166 8 32 5 166 ├ 170 5 37 6 170 ├ 174 3 40 ∑ = 40 A classe destaca é a classe mediana. Temos que: Posição relativa da Média, Mediana e Moda Quando a distribuição é simétrica, as 3 medidas coincidem; porém a assimetria torna elas diferentes e essa diferença é tanto maior quanto é a assimetria. Com isso teremos um distribuição em forma de sino: = Md = Mo → curva simétrica Σfi 40 2 = 2 = 20 Como há 24 valores incluídos nas três primeiras classes de distribuição e como pretendemos determinar o valor que ocupa o 20º lugar, a partir do início da série, vemos que este deve estar localizado na terceira classe (i = 3), supondo que as frequências dessa classe estejam uniformemente distribuídas. Como existe 11 elementos nesta classe (fi) e o intervalo da classe (i) é 4, devemos tomar, a partir do limite inferior, a distância: Mo < Md < → curva assimétrica positiva; < Md < Mo → curva assimétrica negativa. Em resumo aplicamos os seguintes passos: Referência CRESPO, Antônio Arnot – Estatística fácil – 18ª edição – São Paulo - Editora Saraiva: 2002 Baseado no exemplo anterior temos: l* = 158 ; F(ant) = 13 ; f* = 11 e h* = 4 Empregamos a mediana quando: - Desejamos obter o ponto que divide a distribuição em partes iguais; - Há valores extremos que afetam de uma maneira acentuada a média; - A variável em estudo é salário. OUTLIERS Os outliers são dados que se diferenciam drasticamente de todos os outros, são pontos fora da curva. Em outras palavras, um outlier é um valor que foge da normalidade e que pode (e provavelmente irá) causar anomalias nos resultados obtidos por meio de algoritmos e sistemas de análise. Entender os outliers é fundamental em uma análise de dados por pelo menos dois aspectos: 1. os outliers podem visar negativamente todo o resultado de uma análise; 2. o comportamento dos outliers pode ser justamente o que está sendo procurado. Os outliers possuem diversos outros nomes, como: dados discrepantes, pontos fora da curva, observações fora do comum, anomalias, valores atípicos, entre outros. A seguir elencamos algumas situações comuns em que os outliers surgem na análise de dados e apontamos sugestões de como lidar com eles em cada caso. Como identificar quais são os dados outliers? Encontrar os outliers utilizando tabelas [ 𝟐 − 𝑭(𝒂𝒏𝒕)] 𝒉 2º - Calculamos ∑fi 2; Vantagens e Desvantagens da Mediana 1) Não depende de todos os valores do conjunto de dados, podendo mesmo não se alterar com a modificação. 2) Não é influenciada por valores extremos (grandes) do conjunto de dados. 3) Quando há valores repetidos, a interpretação do valor mediano não é tão simples. 15 A forma mais simples de encontrar dados outliers é olhar diretamente para a tabela ou planilha de dados – o dataset, como chamam os cientistas de dados. O caso da tabela a seguir exemplifica claramente um erro de digitação, ou seja, de input dos dados. O campo da idade do indivíduo Antônio Silveira certamente não representa a idade de 470 anos. Olhando para a tabela é possível identificar o outlier, mas fica difícil afirmar qual seria a idade correta. Existem várias possibilidades que podem se referir a idade certa, como: 47, 70 ou ainda 40 anos. Em uma pequena amostra a tarefa de encontrar outliers com o uso de tabelas pode ser fácil. Porém, quando a quantidade de observações passa para a casa dos milhares ou milhões fica impossível de encontrar quais são os dados que destoam do geral. Essa tarefa fica ainda mais difícil quando muitas variáveis (as colunas da planilha) são envolvidas. Questões 01. (TRT-8ª – Analista Judiciário – CESPE/2016) Com relação à definição das medidas de tendência central e de variabilidade dos dados em uma estatística, assinale a opção correta. (A) A moda representa o centro da distribuição, é o valor que divide a amostra ao meio. (B) A amplitude total, ou range, é uma medida de tendência central pouco afetada pelos valores extremos. (C) A mediana é o valor que ocorre mais vezes, frequentemente em grandes amostras. (D) A variância da amostra representa uma medida de dispersão obtida pelo cálculo da raiz quadrada positiva do valor do desvio padrão dessa amostra. (E) A média aritmética representa o somatório de todas as observações dividido pelo número de observações. (SESP/MT – Perito Oficial Criminal - Engenharia Civil/Engenharia Elétrica/Física/Matemática – FUNCAB/2014) Determine a mediana do conjunto de valores (10, 11, 12, 11, 9, 8, 10, 11, 10, 12). (A) 8,5 (B) 9 (C) 10,5 (D) 11,5 (E) 10 (A) 05. (Pref. Guarujá/SP – SEDUC – Professor de Matemática – CAIPIMES/2014) As massas de 5 amigos são 63,5; 70,3; 82,2; 59 e 71,5 quilogramas. A média e a mediana das massas são, respectivamente: (A) 69,3 e 70,3 quilogramas. (B) 172,25 e 82,2 quilogramas. (C) 69,3 e 82,2quilogramas. (D) 172, 70,3 quilogramas. Respostas 01. Resposta: E. Pela definições apresentadas a única que responde de forma correta a questão é sobre a média. 02. Resposta: A. Pela definição temos que esta medida é a Mediana. 03. Resposta: A. Reordenando temos: 0,0,1,1,2,2,3,3,3 Fica evidente o valor da moda, Mo = 3 A mediana é o meio, como é uma sequência com 9 números temos: n+1/2 → 9 +1 / 2 → 10/2 → 5, logo a mediana será o 5º termo, então Md = 2 A média é a somatória de todos os valores, dividido pela quantidade 1+1+2+2+3+3+3 = 15, 15/9 = 1,66 Logo: média < mediana < moda 04. Resposta: C. Coloquemos os valores em ordem crescente: 8, 9, 10, 10, 10, 11, 11, 11, 12, 12 Como a Mediana é o elemento que se encontra no meio dos valores colocados em ordem crescente, temos que: 10 + 11 21 𝑀 = = = 10,5 2 2 03. (SSP/AM – Técnico de Nível Superior – FGV/2015) A sequência a seguir mostra o número de gols marcados pelo funcionário Ronaldão nos nove últimos jogos disputados pelo time da empresa onde ele trabalha: 2, 3, 1, 3, 0, 2, 0, 3, 1. Sobre a média, a mediana e a moda desses valores é verdade que: (A) média < mediana < moda; (B) média < moda < mediana; (C) moda < média < mediana; (D) mediana < moda < média; (E) mediana < média < moda. 16 DISTRIBUIÇÃO DE FREQUÊNCIA Usamos a distribuição de frequência para organizarmos os dados estatísticos resultantes de variáveis quantitativas (as que usam os números para expressar-se) e fazemos a tabulação dos dados, ou seja, a colocação dos dados de forma ordenada em uma tabela, para assim melhor interpreta-los. Distribuição de frequência sem intervalo de classe Quando temos variáveis discretas (possuem número finito de valores entre quaisquer dois valores) a sua variação é relativamente pequena, cada valor pode ser tomado como um intervalo de classe. Exemplo: Uma professora organizou as notas que seus 25 alunos obtiveram em uma de suas provas, da seguinte forma: Observe que ela já ordenou os dados brutos (rol) o que ajuda a fazermos a tabulação dos dados. Tabulando teremos: O número de vezes que um dado aparece é chamado de FREQUÊNCIA ABSOLUTA representado por f ou fi (varia de acordo com a bibliografia estudada). Também podemos representar a frequência em forma de porcentagem, a esta damos o nome de FREQUÊNCIA RELATIVA (fr). Ela é o quociente entre a frequência absoluta e o número de elementos da população total. Podemos ainda através desta tabulação encontrar a FREQUÊNCIA ABSOLUTA ACUMULADA (fa, Fa ou Fi), na qual é a soma da frequência absoluta com a do anterior. Observe que a última linha da Frequência Absoluta Acumulada é SEMPRE IGUAL ao somatório total dos dados. Temos ainda a FREQUÊNCIA RELATIVA ACUMULADA (fra), que é a razão entre a frequência absoluta acumulada e a frequência absoluta acumulada total de dados, é a forma percentual de representarmos esses dados. O exemplo acima mostra a distribuição de frequência para dados não agrupados. Quando trabalhamos com uma quantidade grande de dados, a melhor forma é agrupa-los, afim de ganharmos simplicidade, mesmo que perdemos os pormenores. Distribuição de frequência para dados agrupados Para melhor entendimento vamos acompanhar um exemplo e assim destacaremos os elementos desse tipo de distribuição e os meios de montarmos sua tabela. Exemplo: Uma pesquisa feita com 40 alunos de uma escola C, revelou os seguintes dados sobre a estatura de seus alunos (estaturas dadas em cm): Observe que os dados não estão ordenados, então devemos organiza-los para assim conseguirmos analisarmos, montando assim o nosso Rol: 5. Análise e Interpretação Matemática de Gráficos Colunas; 5.02. Gráfico Setores; 5.04. Gráfico de Linhas). Nota: Muitas bibliografias tendem a definir os termos de seus elementos estatísticos de formas variadas, dando nome aos seus elementos de formas diferentes. Porém devemos levar em consideração o princípio de cada um, o seu uso e relevância dentro do tratamento dos dados. Colocamos aqui algumas dessas definições para o mesmo elemento para que você possa estar contextualizado sobre o assunto. 17 Com isso já fica evidente qual a menor (150 cm) e a maior (173 cm) estatura deste grupo de alunos, e sua concentração está entre 160 e 165 cm. Se montássemos uma tabela semelhante a do exemplo anterior, exigiria muito espaço, mesmo a nossa amostra tendo uma quantidade de valores razoável (40 alunos). Então convém agruparmos esses valores em vários intervalos. Com isso teremos a seguinte tabela de distribuição de frequência com intervalo de classes. ESTATURA DOS 40 ALUNOS DA ESCOLA C ou amplitude do nosso intervalo, para isso precisaremos de mais algumas informações. - Amplitude amostral ou total (AA): diferença entre o valor máximo e o valor mínimo da amostra. AA = x (máx.) – x (min.) Sabemos que o menor valor da nossa amostra é 150 e o maior 173, aplicando teremos: AA = 173 – 150 = 23 cm - Amplitude das classes (h): é a divisão entre a amplitude total e o número de classes. O valor desta divisão só poderá ser arredondado para mais. 𝑨𝑨 𝒉 = 𝒌 Para nosso exemplo temos: 𝐴𝐴 23 ℎ = 𝑘 → ℎ = 6 = 3,83 ≅ 4 Para montarmos uma tabela com tal agrupamento, precisamos saber algumas definições: - Classes de frequência ou classes: são intervalos de variação da variável. Elas são simbolicamente representadas por i, sendo i = 1,2,3, ..., k (onde k é o número total de classes da distribuição). Por exemplo o intervalo 158 ├- 162 define a 3ª classe (i = 3), de um total de 6 classes, k = 6. Depois aplicamos a fórmula de Sturges (regra do Logaritmo) dada por: Aplicando no nosso exemplo temos: k = 1 + 3,3 .log 40 → k = 1 + 3,3 .1,60 → k = 1 + 5,28 → k = 6,28, arredondando temos k = 6. Assim agruparemos os dados de 4 em 4: 150 ao 154; 154 ao 158, ..., 170 ao 174, completando nossas 6 classes. Lembrando que como utilizamos o símbolo “├- “não estamos considerando o valor final, por isso o repetimos no intervalo seguinte. Com isso, conseguimos chegar a nossa tabela inicial. Tome Nota: Podemos chamar a amplitude de classes também como Amplitude de um intervalo de classe ou intervalo de classe (hi) que é a medida do intervalo que define a classe. Obtemos ela através da diferença do limite superior e inferior de cada classe. Uma vez que conhecemos e temos os intervalos podemos encontra-la facilmente. hi = Li – li Outras informações são importantes e relevantes ao nosso estudo, como meio de chegarmos a outras análises. Vejamos: - Limite de classe: são os extremos de cada classe. O menor chamamos de limite inferior da classe (li) e o maior, o limite superior da classe (Li). Tomando como exemplo a 3ª classe, temos: l3 = 158 e L3 = 162 Dica Quantidade de classes x quantidade de dados - Amplitude total da distribuição (AT): é a diferença entre o limite superior da última classe e o limite inferior da última classe. AT = L (máx.) – l (mín.) Em nosso caso temos: AT = 174 – 150 = 24 cm Quando as classes Observação: A amplitude total da distribuição (AT) JAMAIS coincide com a amplitude amostral (AA). Já sabemos que vamos precisar de 6 classes para agruparmos nossos dados. Agora precisamos descobrir quantos dados vamos agrupar juntos, ou seja, qual o tamanho - Ponto médio de uma classe (xi): é o ponto que divide o intervalo de classe em duas partes iguais. É o valor que a representa. Para sua obtenção calculamos a média aritmética entre os limites da classe (superior e inferior). Fique por dentro! O símbolo ├- , indica uma inclusão do valor de li (limite inferior) e exclusão do valor de Li (limite superior). O símbolo ├-┤, indica uma inclusão tanto do valor de li (limite inferior)como do valor de Li (limite superior). O símbolo -┤, , indica uma exclusão do valor de li (limite inferior) e inclusão do valor de Li (limite superior). 18 Exemplo: 𝒙𝒊 = 𝒍𝒊 + 𝑳𝒊 𝟐 01. Resposta: A. Respostas O ponto médio da 4ª classe é: f_r=f_i/N f_i=0,25∙72=18 𝑥4 = 𝑙4 + 𝐿4 2 → 𝑥4 = 162 + 166 2 → 𝑥4 = Questões 328 2 → 𝑥4 = 164 𝑐𝑚 02. Resposta: B. Pela pesquisa 45 alunos estão na faixa de 16 a 20 São 10 do sexo masculino, portanto são 45-10=35 do sexo feminino. 01. (ESCOLA DE SARGENTO DAS ARMAS – COMBATENTE/LOGÍSTICA – TÉCNICA/AVIAÇÃO – EXÉRCITO BRASILEIRO) Identifique a alternativa que apresenta a frequência absoluta (fi) de um elemento (xi) cuja frequência relativa (fr) é igual a 25 % e cujo total de elementos (N) da amostra é igual a 72. (A) 18. (B) 36. (C) 9. (D) 54. (E) 45. 02. (BNDES – TÉCNICO ADMINISTRATIVO – CESGRANRIO) Em uma faculdade, uma amostra de 120 alunos foi coletada, tendo-se verificado a idade e o sexo desses alunos. Na amostra, apurou-se que 45 estão na faixa de 16 a 20 anos, 60, na faixa de 21 a 25 anos, e 15 na faixa de 26 a 30 anos. Os resultados obtidos encontram-se na Tabela abaixo. Quais são, respectivamente, os valores indicados pelas letras P, Q, R e S? (A) 40 ; 28 ; 64 E 0 (B) 50 ; 28 ; 64 E 7 (C) 50 ; 40 ; 53,3 E 7 (D) 77,8 ; 28 ; 53,3 E 7 (E) 77,8 ; 40 ; 64 E 0 03. (IMESC – OFICIAL ADMINISTRATIVO – VUNESP) Na tabela a seguir, constam informações sobre o número de filhos dos 25 funcionários de uma pequena empresa. Com base nas informações contidas na tabela, é correto afirmar que o número total de filhos dos funcionários dessa pequena empresa é necessariamente (A) menor que 41. (B) igual a 41. (C) maior que 41 e menor que 46. (D) igual a 46. (E) maior ou igual a 46. 70---100% 35----P P=50% 70---100% Q---40% Q=28 35+28+S=70 S=7 Pela última coluna(% de sexo masculino): 20+R+16=100 R=64 P=50; Q=28; R=64; S=7 03. Resposta: E. 1 filho: 7 pessoas -7 filhos 2 filhos: 5 pessoas – 5.2=10 filhos 3 filhos: 3 pessoas – 3.3=9 Já são 26 filhos. Temos mais 5 pessoas que tem mais de 3 filhos, o número mínimo são 4 filhos. 5.4=20 26+20=46 filhos no mínimo. TABELAS E GRÁFICOS O nosso cotidiano é permeado das mais diversas informações, sendo muito delas expressas em formas de tabelas e gráficos, as quais constatamos através do noticiários televisivos, jornais, revistas, entre outros. Os gráficos e tabelas fazem parte da linguagem universal da Matemática, e compreensão desses elementos é fundamental para a leitura de informações e análise de dados. A parte da Matemática que organiza e apresenta dados numéricos e a partir deles fornecer conclusões é chamada de Estatística. Tabelas: as informações nela são apresentadas em linhas e colunas, possibilitando uma melhor leitura e interpretação. Exemplo: Fonte: SEBRAE Observação: nas tabelas e nos gráficos podemos notar que a um título e uma fonte. O título é utilizado para evidenciar a principal informação apresentada, e a fonte identifica de onde os dados foram obtidos. Tipos de Gráficos Gráfico de linhas: são utilizados, em geral, para representar a variação de uma grandeza em certo período de tempo. 19 Marcamos os pontos determinados pelos pares ordenados (classe, frequência) e os ligados por segmentos de reta. Nesse tipo de gráfico, apenas os extremos dos segmentos de reta que compõem a linha oferecem informações sobre o comportamento da amostra. Exemplo: Gráfico de setores: são utilizados, em geral, para visualizar a relação entre as partes e o todo. Dividimos um círculo em setores, com ângulos de medidas diretamente proporcionais às frequências de classes. A medida α, em grau, do ângulo central que corresponde a uma classe de frequência F é dada por: 360° Onde: Ft = frequência total Exemplo: 𝛼 = 𝐹𝑡 . 𝐹 Preferência por modalidades esportivas Esportes Número de praticantes (F) Frequência relativa Futebol 160 40% Vôlei 120 30% Basquete 60 15% Natação 40 10% Outros 20 5% Total (Ft) 400 100% Gráfico de barras: também conhecido como gráficos de colunas, são utilizados, em geral, quando há uma grande quantidade de dados. Para facilitar a leitura, em alguns casos, os dados numéricos podem ser colocados acima das colunas correspondentes. Eles podem ser de dois tipos: barras verticais e horizontais. - Gráfico de barras verticais: as frequências são indicadas em um eixo vertical. Marcamos os pontos Dados fictícios Para acharmos a frequência relativa, podemos fazer uma regra de três simples: 400 --- 100% 160 --- x x = 160 .100/ 400 = 40% , e assim sucessivamente. Aplicando a fórmula teremos: determinados pelos pares ordenados (classe, frequência) e os ligamos ao eixo das classes por meio de barras verticais. Exemplo: −𝐹𝑢𝑡𝑒𝑏𝑜𝑙: 𝛼 = 360° 𝐹 360° . 𝐹 → 𝛼 = 400 . 160 → 𝛼 = 144° −𝑉ô𝑙𝑒𝑖: 𝛼 = 360° 𝐹𝑡 360° . 𝐹 → 𝛼 = 400 . 120 → 𝛼 = 108° −𝐵𝑎𝑠𝑞𝑢𝑒𝑡𝑒: 𝛼 = 360° 𝐹𝑡 360° . 𝐹 → 𝛼 = 400 . 60 → 𝛼 = 54° −𝑁𝑎𝑡𝑎çã𝑜: 𝛼 = 360° 𝐹𝑡 360° . 𝐹 → 𝛼 = 400 . 20 → 𝛼 = 18° - Gráfico de barras horizontais: as frequências são indicadas em um eixo horizontal. Marcamos os pontos determinados pelo pares ordenados (frequência, classe) e os ligamos ao eixo das classes por meio de barras horizontais. Exemplo: Observação: em um gráfico de colunas, cada barra deve ser proporcional à informação por ela representada. Como o gráfico é de setores, os dados percentuais serão distribuídos levando-se em conta a proporção da área a ser representada relacionada aos valores das porcentagens. A área representativa no gráfico será demarcada da seguinte maneira: Com as informações, traçamos os ângulos da circunferência e assim montamos o gráfico: 20 Pictograma ou gráficos pictóricos: em alguns casos, certos gráficos, encontrados em jornais, revistas e outros meios de comunicação, apresentam imagens relacionadas ao contexto. Eles são desenhos ilustrativos. Exemplo: Histograma: o consiste em retângulos contíguos com base nas faixas de valores da variável e com área igual à frequência relativa da respectiva faixa. Desta forma, a altura de cada retângulo é denominada densidade de frequência ou simplesmente densidade definida pelo quociente da área pela amplitude da faixa. Alguns autores utilizam a frequência absoluta ou a porcentagem na construção do histograma, o que pode ocasionar distorções (e, consequentemente, más interpretações) quando amplitudes diferentes são utilizadas nas faixas. Exemplo: Polígono de Frequência: semelhante ao histograma, mas construído a partir dos pontos médios das classes. Exemplo: Gráfico de Ogiva: apresenta uma distribuição de frequências acumuladas, utiliza uma poligonal ascendente utilizando os pontos extremos. Cartograma: é uma representação sobre uma carta geográfica. Este gráfico é empregado quando o objetivo é de figurar os dados estatísticos diretamente relacionados com áreas geográficas ou políticas. Interpretação de tabelas e gráficos Para uma melhor interpretação de tabelas e gráficos devemos ter em mente algumas considerações: - Observar primeiramente quais informações/dados estão presentes nos eixos vertical e horizontal, para então fazer a leitura adequada do gráfico; - Fazer a leitura isolada dos pontos. - Leia com atenção o enunciado e esteja atento ao que pede o enunciado. Exemplos: (Enem 2011) O termo agronegócio não se refere apenas à agricultura e à pecuária, pois as atividades ligadas a essa produção incluem fornecedores de equipamentos, serviços para a zona rural, industrialização e comercialização dos produtos. O gráfico seguinte mostra a participação percentual doagronegócio no PIB brasileiro: Centro de Estudos Avançados em Economia Aplicada (CEPEA). Almanaque abril 2010. São Paulo: Abril, ano 36 (adaptado) Esse gráfico foi usado em uma palestra na qual o orador ressaltou uma queda da participação do agronegócio no PIB brasileiro e a posterior recuperação dessa participação, em termos percentuais. Segundo o gráfico, o período de queda ocorreu entre os anos de A) 1998 e 2001. B) 2001 e 2003. C) 2003 e 2006. D) 2003 e 2007. E) 2003 e 2008. Resolução: Segundo o gráfico apresentado na questão, o período de queda da participação do agronegócio no PIB brasileiro se deu no período entre 2003 e 2006. Esta informação é extraída através de leitura direta do gráfico: em 2003 a participação era de 28,28%, caiu para 27,79% em 2004, 25,83% em 2005, 21 chegando a 23,92% em 2006 – depois deste período, a participação volta a aumentar. Resposta: C (Enem 2012) O gráfico mostra a variação da extensão média de gelo marítimo, em milhões de quilômetros quadrados, comparando dados dos anos 1995, 1998, 2000, 2005 e 2007. Os dados correspondem aos meses de junho a setembro. O Ártico começa a recobrar o gelo quando termina o verão, em meados de setembro. O gelo do mar atua como o sistema de resfriamento da Terra, refletindo quase toda a luz solar de volta ao espaço. Águas de oceanos escuros, por sua vez, absorvem a luz solar e reforçam o aquecimento do Ártico, ocasionando derretimento crescente do gelo. Com base no gráfico e nas informações do texto, é possível inferir que houve maior aquecimento global em A)1995. B)1998. C)2000. D)2005. E)2007. Resolução: O enunciado nos traz uma informação bastante importante e interessante, sendo chave para a resolução da questão. Ele associa a camada de gelo marítimo com a reflexão da luz solar e consequentemente ao resfriamento da Terra. Logo, quanto menor for a extensão de gelo marítimo, menor será o resfriamento e portanto maior será o aquecimento global. O ano que, segundo o gráfico, apresenta a menor extensão de gelo marítimo, é 2007. Resposta: E Mais alguns exemplos: 1) Todos os objetos estão cheios de água. Qual deles pode conter exatamente 1 litro de água? (A) A caneca (B) A jarra (C) O garrafão (D) O tambor O caminho é identificar grandezas que fazem parte do dia a dia e conhecer unidades de medida, no caso, o litro. Preste atenção na palavra exatamente, logo a resposta está na alternativa B. 2) No gráfico abaixo, encontra-se representada, em bilhões de reais, a arrecadação de impostos federais no período de 2003 a 2006. Nesse período, a arrecadação anual de impostos federais: (A) nunca ultrapassou os 400 bilhões de reais. (B) sempre foi superior a 300 bilhões de reais. (C) manteve-se constante nos quatro anos. (D) foi maior em 2006 que nos outros anos. (E) chegou a ser inferior a 200 bilhões de reais. Analisando cada alternativa temos que a única resposta correta é a D. Questões 01. (Pref. Fortaleza/CE – Pedagogia – Pref. Fortaleza/2016) “Estar alfabetizado, neste final de século, supõe saber ler e interpretar dados apresentados de maneira organizada e construir representações, para formular e resolver problemas que impliquem o recolhimento de dados e a análise de informações. Essa característica da vida contemporânea traz ao currículo de Matemática uma demanda em abordar elementos da estatística, da combinatória e da probabilidade, desde os ciclos iniciais” (BRASIL, 1997). Observe os gráficos e analise as informações. 22 A partir das informações contidas nos gráficos, é correto afirmar que: (A) nos dias 03 e 14 choveu a mesma quantidade em Fortaleza e Florianópolis. (B) a quantidade de chuva acumulada no mês de março foi maior em Fortaleza. (C) Fortaleza teve mais dias em que choveu do que Florianópolis. (D) choveu a mesma quantidade em Fortaleza e Florianópolis. 02. (DEPEN – Agente Penitenciário Federal – CESPE) Ministério da Justiça — Departamento Penitenciário Nacional — Sistema Integrado de Informações Penitenciárias – InfoPen, Relatório Estatístico Sintético do Sistema Prisional Brasileiro, dez./2013 Internet:<www.justica.gov.br> (com adaptações) A tabela mostrada apresenta a quantidade de detentos no sistema penitenciário brasileiro por região em 2013. Nesse ano, o déficit relativo de vagas — que se define pela razão entre o déficit de vagas no sistema penitenciário e a quantidade de detentos no sistema penitenciário — registrado em todo o Brasil foi superior a 38,7%, e, na média nacional, havia 277,5 detentos por 100 mil habitantes. Com base nessas informações e na tabela apresentada, julgue o item a seguir. Em 2013, mais de 55% da população carcerária no Brasil se encontrava na região Sudeste. ( )certo ( ) errado 03. (TJ/SP – Estatístico Judiciário – VUNESP) A distribuição de salários de uma empresa com 30 funcionários é dada na tabela seguinte. Salário (em salários mínimos) Funcionários 1,8 10 2,5 8 3,0 5 5,0 4 8,0 2 15,0 1 Pode-se concluir que: (A) O total da folha de pagamentos é de 35,3 salários. (B) 60% dos trabalhadores ganham mais ou igual a 3 salários. (C) 10% dos trabalhadores ganham mais de 10 salários. (D) 20% dos trabalhadores detêm mais de 40% da renda total. (E) 60% dos trabalhadores detêm menos de 30% da renda total. 04. (TJ/SP – Estatístico Judiciário – VUNESP) Considere a tabela de distribuição de frequência seguinte, em que xi é a variável estudada e fi é a frequência absoluta dos dados. xi fi 30-35 4 35-40 12 40-45 10 45-50 8 50-55 6 TOTAL 40 Assinale a alternativa em que o histograma é o que melhor representa a distribuição de frequência da tabela. (A) (B) (C) (D) (E) 05. (SEJUS/ES – Agente Penitenciário – VUNESP) Observe os gráficos e analise as afirmações I, II e III. I. Em 2010, o aumento percentual de matrículas em cursos tecnológicos, comparado com 2001, foi maior que 1000%. II. Em 2010, houve 100,9 mil matrículas a mais em cursos tecnológicos que no ano anterior. III. Em 2010, a razão entre a distribuição de matrículas no curso tecnológico presencial e à distância foi de 2 para 5. http://www.justica.gov.br/ 23 É correto o que se afirma em (A) I e II, apenas. (B) II, apenas. (C) I, apenas. (D) II e III, apenas. (E) I, II e III.
Compartilhar