Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 ESTATÍSTICA DESCRITIVA Petrucio Barros petrucio.barros@gmail.com (82) 9971-2828 Bibliografia Recomendada • CRESPO, Antonio Arnot .Estatística Fácil. Ed. Saraiva. • MORETTIN, Luiz Gonzaga. Estatística Básica – Probabilidade e Inferência. Ed. Perason. • TIBONI, Conceição Gentil Rebelo. Estatística Básica para os cursos de Administração, Ciências Contábeis, Tecnológicos e de Gestão. Ed. Atlas. • VIEIRA, Sônia. Princípios de estatística. • LAPPONI, Juan Carlos. Estatística usando Excel. Ed, Campus. • MAGALHAÊS, Marcos Nascimento. Probabilidade e variáveis aleatórias. Ed. Edusp . • FREUND, Jonh A. Estatística Aplicada. ESTATÍSTICA • A Estatística está presente em todas as áreas da ciência que envolva a coleta e análise de dados e sua consequente transformação em informação. • A Estatística fornece técnicas e métodos de análise de dados que auxiliam o processo de tomada de decisão nos mais variados problemas onde existe incerteza. CONTEXTO HISTÓRICO • As ciências têm suas raízes na história do homem. • A matemática, que é considerada “a ciência que une a clareza do raciocínio à síntese da linguagem”, originou-se do convívio social, das trocas, da contagem, com caráter prático, utilitário e empírico. • Desde a antiguidade, vários povos já registravam o número de habitantes, de nascimentos, de óbitos, faziam estimativas das riquezas individual e social, distribuíam equitativamente terras ao povo, cobravam impostos. Em guerras, era de suma importância avaliar os números de guerreiros disponíveis no seu exercito e no do adversário. CONTEXTO HISTÓRICO • A partir do século XVI começaram a surgir as primeiras análises sistemáticas de fatos sociais, como batizados, casamentos, funerais originando as primeiras tábuas e tabelas. • No século XVIII o estudo de tais fatos foi adquirindo, aos poucos, feição verdadeiramente científica. • As tabelas tornaram-se mais completas, surgiram as representações gráficas e o cálculo das probabilidades. Com base no desenvolvimento da teoria das probabilidades, verificou-se que a estatística poderia ser utilizada para tirar conclusões e tomar decisões baseadas em analise de dados. ESTATÍSTICA • Na atualidade, a estatística é uma ciência moderna, imprescindível para entender os aspectos e problemas em todas áreas do conhecimento. • Pode ser definida como: “um conjunto de métodos e processos quantitativos que servem para estudar e medir os fenômenos coletivos”. 2 • Estatística Descritiva - consiste na coleta, apresentação, análise e interpretação de dados numéricos através da criação de instrumentos adequados: tabelas, gráficos, medidas de resumo. • Estatística Indutiva - também é chamada de inferência estatística. É o estudo de técnicas que possibilitam a extrapolação, a um grande conjunto de dados, das informações e conclusões obtidas a partir de subconjuntos de valores, usualmente de dimensão muito menor. • Probabilidade – teoria matemática utilizada para estudar a incerteza oriunda de fenômenos de caráter aleatórios. ESTATÍSTICA População: � Conjunto da totalidade de indivíduos que apresentam uma característica comum, cujo comportamento se quer analisar. � A população pode ser constituída por pessoas, animais, minerais, vegetais, etc. � Quanto ao número de elementos, a população pode ser: � Finita � Infinita. DEFINIÇÕES BÁSICAS Amostra: � É um subconjunto da população. � É constituída de elementos extraídos da população. � Embora seja constituída por parte de uma população, a amostra deve permitir a obtenção de dados representativos da população. DEFINIÇÕES BÁSICAS Variáveis: • É uma característica identificada sobre a qual queremos obter informação. • As variáveis tem naturezas diferentes no que tange aos possíveis valores que podem assumir. • É qualquer quantidade ou característica que pode assumir diferentes valores DEFINIÇÕES BÁSICAS Exemplos de variáveis: • Um questionário de uma pesquisa contém as seguintes perguntas: DEFINIÇÕES BÁSICAS Pergunta Variável Qual a sua idade? Idade Qual o número de pessoas de sua família? Tamanho da família Qual a renda familiar? Renda familiar Qual é o seu estado civil? Estado civil Você tem emprego fixo? Emprego Qual o tempo de trabalho na empresa? Tempo de trabalho TIPO DE VARIÁVEIS 3 Qualitativa: quando seus valores são expressos por atributos. São classificadas em nominal ou ordinal. • Nominal: Os indivíduos são classificados em categorias segundo uma característica. Exemplo: cor dos olhos, sexo, estado civil, religião. • Ordinal: Os indivíduos são classificados em categorias que possuem algum tipo inerente de ordem. Neste caso, uma categoria pode ser "maior" ou "menor" do que outra. • Exemplo: grau de instrução; classe social; Faixa etária. • Outros exemplos: • a) O conceito de um estudante em uma disciplina da PG pode ser ótimo (4), bom (3), regular (2), ruim (1); • b) Presença de albumina na urina, indicada por: 0, +, ++, +++. TIPO DE VARIÁVEIS Quantitativa: quando seus valores são expressos em números. Esta por sua vez pode ser classificada em discreta ou contínua. • Discreta: é a variável que só pode assumir valores pertencentes a um conjunto enumerável. Normalmente resulta de enumerações ou contagens. Exemplos: número de funcionários; número acidentes de trabalho ocorrido durante um mês. • Contínua: é a variável que pode assumir infinitos valores dentro de um intervalo finito. Resulta, em geral, de medições. Exemplos: Medidas de altura e peso; idade. TIPO DE VARIÁVEIS Discretas: - Não pode assumir qualquer valor. - Exemplo: - Quantos irmãos você tem? - A variável discreta nós contamos! Contínuas: - Assume qualquer valor dentro de um intervalo. - Exemplo: - Quantos quilos você pesa? - A variável contínua nós medimos! VARIÁVEIS ESTATÍSTICAS VARIÁVEIS ESTATÍSTICAS Nominal - Quando não é possivel estabelecer uma ordem natural. - Exemplo: � Sexo ( M, F ) � Fuma ( S, N ). . Ordinal - Intensidade crescente de realização. - Exemplo: � Tamanho (P,M,G) � Classe social (baixa. Media, alta). - Arredondamento de dados: Norma NBR 5891 da Associação Brasileira de Normas Técnicas(ABNT) • Quando o primeiro algarismo a ser abandonado no arredondamento é 0, 1, 2, 3,ou 4 fica inalterado o último algarismo a permanecer. � 25,732 � 25,73; � 409,04 � 409,0; � 3,79021 � 3,7902 DEFINIÇÕES BÁSICAS Arredondamento de dados: Norma NBR 5891 da Associação Brasileira de Normas Técnicas(ABNT) • Quando o primeiro algarismo a ser abandonado no arredondamento é 6, 7, 8 ou 9, aumenta-se uma unidade ao algarismo a permanecer. � 7,348 � 7,35; � 1,2734 � 1,3; � 5,5256 � 5,53 DEFINIÇÕES BÁSICAS 4 Arredondamento de dados: Norma NBR 5891 da Associação Brasileira de Normas Técnicas(ABNT) • Quando o primeiro algarismo a ser abandonado no arredondamento é 5: � Se após o algarismo 5 seguir em qualquer casa um número diferente de zero, aumenta-se em uma unidade o algarismo que antecede o 5. � 237,85001 � 237,9 � 5,5256 � 5,53 DEFINIÇÕES BÁSICAS Arredondamento de dados: Norma NBR 5891 da Associação Brasileira de Normas Técnicas(ABNT) • Quando o primeiro algarismo a ser abandonado no arredondamento é 5: � Quando não existir, depois do 5, um número diferente de zero, aumenta-se uma unidade se o numero for impar, e deixar como está se for par. � 247,235 � 247,24 � 1349,85 � 1349,8 � 12,1250 � 12,12 � Excel e calculadoras: � 247,235 � 247,24 ; 1349,85 � 1349,9 ; 12,1250 � 12,13 DEFINIÇÕES BÁSICAS Cálculo de Porcentagem • Porcentagens são razões em que um valor total está associado a uma quantidade de 100% e, por meio de uma regra de três, podemos estabelecer a correspondência entre uma parcela do valor totale o seu percentual. • Total � 100 % • Parcela � x % • 16,6% + 19,3% + 12,3% + 29,6% + 22,2% = 100,1 % • 16,6% + 19,1% + 12,3% + 29,6% + 22,2% = 99,9 % • Arredondando para inteiro: • 17% + 19% + 12% + 30% + 22% = 100 % DEFINIÇÕES BÁSICAS MÉTODOS ESTATÍSTICOS • A estatística fornece métodos para a coleta, organização, descrição e intepretação de dados. Os resultados podem ser utilizados para planejamentos, tomadas de decisões ou formulação de soluções. • O método estatístico é um conjunto de meios que, conduzidos e dispostos convenientemente, permite que se canalize as informações para um determinado objetivo. • Fases dos Métodos Estatísticos: 1) Definição do problema; 2) Planejamento; 3) Coleta dos dados; 4) Crítica dos dados; 5) Apuração dos dados; 6) Exposição dos resultados; 7) Análise dos resultados. Estatística e os Métodos Estatísticos 1) DEFINIÇÃO DO PROBLEMA: • Formular corretamente o problema; • Examinar outros levantamentos realizados no mesmo campo e análogos; • Saber exatamente aquilo que se pretende pesquisar. Estatística e os Métodos Estatísticos 5 2) PLANEJAMENTO: • Determinar os procedimentos necessários para resolver o problema, em especial, como levantar informações sobre o assunto objeto do estudo; • Planejar o trabalho tendo em vista o objetivo a ser atingido; • Escolher e formular corretamente as perguntas; • Definir o tipo de levantamento: Censitário ou por Amostragem; • Definir o cronograma de atividades, custos envolvidos, delineamento da amostra, etc. Estatística e os Métodos Estatísticos 3) COLETA DE DADOS:. • É o registro sistemático de dados, com um objetivo determinado; • Coleta Direta: feita sobre elementos de registro obrigatório ou feita pelo próprio pesquisador através de inquéritos e questionários; • Coleta Indireta: Quando é inferida da coleta direta ou do conhecimento de outros fenômenos relacionados. Estatística e os Métodos Estatísticos 4) CRÍTICA DOS DADOS: • Observar os dados à procura de falhas e imperfeições, visando eliminar erros grosseiros. • Pode ser externa ou interna: • Externa quando visa às causas dos erros por parte do informante; • Interna quando visa observar os elementos originais dos dados da coleta. Estatística e os Métodos Estatísticos 5) APURAÇÃO DOS DADOS: • Resumo dos dados através de sua contagem e agrupamento. • É a consolidação e tabulação de dados. Estatística e os Métodos Estatísticos 6) EXPOSIÇÃO DOS DADOS: • A apresentação tabular, ou seja, é uma apresentação numérica dos dados em linhas e colunas distribuídas de modo ordenado. • A apresentação gráfica dos dados numéricos constitui uma apresentação geométrica permitindo uma visão rápida e clara do fenômeno. Estatística e os Métodos Estatísticos 7) ANÁLISE DOS RESULTADOS: • Cálculo de medidas e coeficientes, cuja finalidade principal é descrever o fenômeno (estatística descritiva). • Na estatística indutiva a interpretação dos dados se fundamenta na teoria da probabilidade. Estatística e os Métodos Estatísticos 6 Quais são as preferências musicais dos estudantes brasileiros ? • População: todos os estudantes brasileiros; • Amostra: grupo reduzido de estudantes; • Unidade Estatística: cada um dos estudantes. POPULAÇÃO E AMOSTRA • População: é o conjunto de elementos, indivíduos ou objetos que se pretende estudar. [N: número de indivíduos que constituem uma população]. • Amostra: é qualquer subconjunto de elementos de uma população. [n: número de indivíduos que constituem uma amostra]. • Unidade: qualquer indivíduo, elemento ou objeto que faça parte do conjunto a ser estudado. Podem ser pessoas, domicílios, escolas, creches, células ou qualquer outra unidade. População • Finitas: São populações limitadas em seu tamanho. Exemplos: alunos de uma sala de aula; produtos de um supermercado. • Infinitas: Consistem tipicamente em processos que geram itens. Exemplos: extrações com reposição de bolas de uma urna; obtenção de caras ou coroas no lançamento de uma moeda. População Existem técnicas adeaquadas para recolher amostras, de forma a garantir (tanto quanto possivel) o sucesso da pesquisa e dos resultados. Técnicas de Amostragem • CENSO: Em um censo são observados todos os indivíduos da população relativamente aos diferentes atributos que estão sendo objetos de estudo. • AMOSTRAGEM: Numa amostragem, o estudo estatístico baseia-se numa parte da população, isto é, numa amostra que deve ser representativa dessa população. CENSO E AMOSTRAGEM 7 • Uma amostra pode ser mais atualizada do que a população, os resultados de um censo podem ser demorados e não mais representar a população. • Testes Destrutivos – os itens examinados são destruídos quando testados – lâmpadas, munição, sistema de segurança, etc. • Custo – o custo de se fazer um censo pode ser proibitivo. • Precisão – a amostragem envolve menor número de coletores de dados, diminuindo a chance de erros. • Problemas de custo e de tempo podem conduzir a uma limitação do censo a apenas uma ou poucas características por item. VANTAGENS DA AMOSTRAGEM • A população pode ser tão pequena que o custo e o tempo de um censo sejam pouco maiores que para uma amostra. • Se o tamanho da amostra é grande em relação ao da população, o esforço adicional requerido por um censo pode ser pequeno. • Exemplo: quando há bastante variabilidade entre os itens da população, uma amostra deverá ser bastante grande para ser representativa. • Se for exigido uma precisão completa nos resultados – neste caso o censo é o único método aceitável. • Exemplo: um banco não faria uma amostragem de suas agências para saber o montante de dinheiro disponível. • Ocasionalmente, já se dispõe de informação completa, de modo que não há necessidade de uma amostra. VANTAGENS DO CENSO • Principais esquemas amostras: AMOSTRAGEM Amostragem aleatória (casual) simples Utilizada quando a população for homogênea em relação à variável que se deseja estudar. Geralmente, atribui-se uma numeração a cada indivíduo da população, e através de um sorteio aleatório os elementos que vão compor a amostra são selecionados. Todos os elementos da população têm a mesma probabilidade de pertencer à amostra. Exemplo: • amostrar um número de pessoas que estão fazendo um determinado concurso com n inscritos. Como a população é finita, devemos enumerar cada um dos n candidatos e sortear n deles. Equivalente a um sorteio lotérico. AMOSTRAGEM Amostragem sistemática • Utilizada quando os elementos da população se apresentam ordenados. A seleção dos elementos será feita por um sistema ou regra criada pelo pesquisador. • Exemplos: prontuários médicos de um hospital, os prédios de uma rua, uma linha de produção etc. • A variável de interesse não pode apresentar ciclos de variação coincidente com os ciclos de retirada, pois este fato tornará a amostragem não aleatória. AMOSTRAGEM Amostragem Estratificada Quando a variável de interesse apresenta uma heterogeneidade na população e esta heterogeneidade permite a identificação de grupos homogêneos, dividir a população em grupos (estratos) e fazer uma amostragem dentro de cada estrato, garantindo, assim, a representatividade de cada estrato na amostra. Exemplo: pesquisas eleitorais. • Dividir a população em grupos (estratos) que são homogêneos. • Definir a proporção do estrato em relação à população. • Proporção do estrato h será igual ao número de elementos presentes neste estrato (Nh) dividido pelo tamanho da população (N) � (Nh/N). • Multiplicar o tamanho total da amostra (n) pela proporção de cada estrato na população (Nh/N), obtendo um tamanho de amostra em cada estrato, proporcional ao tamanho do estrato em relação à população.• Dentro de cada estrato usar amostragem aleatória simples. AMOSTRAGEM 8 Amostragem Estratificada AMOSTRAGEM Amostragem por conglomerados • É uma alternativa a amostragem estratificada quando falta de informações sobre a população para fazer a estratificação. Os conglomerados são definidos em função da experiência do gestor ou pesquisador. • Geralmente, os conglomerados são definidos por fatores geográficos, como por exemplo, bairros e quarteirões, possibilitando uma redução significativa do custo do processo de amostragem. • Um conglomerado é um subgrupo da população, que individualmente reproduz a população, ou seja, individualmente os elementos que o compõem são muito heterogêneos entre si. Este tipo de amostragem é muito útil quando a população é grande, por exemplo, no caso de uma pesquisa em nível nacional. • Definimos o conglomerado e assim dividimos a população nos conglomerados. Sorteamos os conglomerados por meio de um processo aleatório e avaliamos todos os indivíduos presentes no conglomerado. AMOSTRAGEM Amostragem por conglomerados AMOSTRAGEM Amostragem Não Probabilística • Quando trabalhamos com a amostragem não probabilística, não conhecemos a priori a probabilidade que um elemento da população tem de pertencer à amostra. • Utilizamos, geralmente, a amostragem não probabilística por simplicidade ou por impossibilidade de se obter uma amostra probabilística, como seria desejável. • Os principais tipos de amostragem não probabilística que temos são amostragem sem norma ou a esmo, intencional e por cotas. AMOSTRAGEM Amostragem a Esmo • Os elementos são escolhidos para compor a amostra de um determinado tamanho sem nenhuma norma ou a esmo. • Exemplo: Considere uma caixa com 1.000 parafusos. A enumeração destes parafusos ficaria muito difícil, e a amostragem aleatória simples se torna inviável. Então, em situações deste tipo, supondo que a população de parafusos seja homogênea, escolhemos a esmo a quantidade relativa ao tamanho da amostra. Quanto mais homogênea for a população, mais podemos supor a equivalência com uma AAS. AMOSTRAGEM Amostragem intencional • A amostragem intencional corresponde àquela em que o amostrador deliberadamente escolhe certos elementos para pertencer à amostra, por julgar tais elementos bem representativos da população. • Um exemplo deste tipo de amostragem corresponde à situação em que se deseja saber a aceitação em relação a uma nova marca de whisky a ser inserida no mercado de uma cidade. Somente entrarão para compor a amostra pessoas que façam uso da bebida e que tenham condições financeiras de comprar esta nova marca. AMOSTRAGEM 9 Amostragem por cotas • Neste tipo de amostragem, a população é dividida em grupos, e seleciona-se uma cota proporcional ao tamanho de cada grupo. Entretanto, dentro de cada grupo não é feito sorteio, e sim os elementos são procurados até que a cota de cada grupo seja cumprida. • Em pesquisas eleitorais, a divisão de uma população em grupos (considerando, por exemplo, o sexo, o nível de escolaridade, a faixa etária e a renda) pode servir de base para a definição dos grupos, partindo da suposição de que estas variáveis definem grupos com comportamentos diferenciados no processo eleitoral. Pode-se recorrer a pesquisas feitas anteriormente por entidades, como por exemplo o IBGE (Instituto Brasileiro de Geografia e Estatística). AMOSTRAGEM AGRUPAMENTO DE DADOS • Quando se vai fazer um levantamento de uma população, um dos passos é retirar uma amostra desta população e obter dados relativos à variável desejada nesta amostra. • Cabe à Estatística sintetizar estes dados na forma de tabelas e gráficos que contenham, além dos valores das variáveis, o número de elementos correspondentes a cada variável. A este procedimento está associado o conceito de: • Dados brutos: É o conjunto de dados numéricos obtidos e que ainda não foram organizados. • Rol: É o arranjo dos dados brutos ordenados. • Amplitude (A): É a diferença entre o maior e o menor dos valores observados. AGRUPAMENTO DE DADOS • Dados brutos: • Rol de dados: • Amplitude: 10,0 – 3,5 = 6,5 Notas da disciplina Estatistica - Ano 2010 8,5 7,0 9,0 7,5 5,5 9,5 10,0 8,5 6,0 6,0 3,5 4,5 10,0 6,5 9,0 6,5 Notas da disciplina Estatística - Ano 2010 10,0 10,0 9,5 9,0 9,0 9,5 8,5 8,5 7,5 70,0 6,5 6,5 6,0 6,0 4,5 3,5 Séries Estatísticas As tabelas são recursos utilizados pela estatística, com o objetivo de organizar e facilitar a visualização dos dados. As tabelas permitem uma visão geral dos valores assumidos pelas variáveis. ORGANIZAÇÃO DOS DADOS Dependendo dos dados que se possui, é possível realizar estudos organizando-os das seguintes maneiras: • Dados seccionais (Cross Section): Variáveis estáticas no tempo representando uma ou mais unidades do grupo a ser estudado. A ordem das observações é irrelevante para a análise. • Séries temporais: É uma coleção de observações feitas sequencialmente ao longo do tempo. A ordem dos dados é fundamental. • Dados em painel: São informações acompanhadas ao longo do tempo. Resulta da combinação de dados seccionais e temporais. REPRESENTAÇÃO TABULAR Consiste em dispor os dados em linhas e colunas distribuídas de modo ordenado. • Representação esquemática 10 ELEMENTOS DE UMA TABELA • Título: Título da tabela. • Cabeçalho: parte da tabela na qual é designada a natureza do conteúdo de cada coluna. • Corpo: parte da tabela composta por linhas e colunas. • Linhas: parte do corpo que contém uma sequência horizontal de informações. • Colunas: parte do corpo que contém uma sequência vertical de informações. • Célula: parte da tabela formada pelo cruzamento de uma linha com uma coluna. • Rodapé: É o espaço aproveitado em seguida ao fecho da tabela, onde são colocadas as notas de natureza informativa (fonte, notas e chamadas). • Fonte: entidade que organizou ou forneceu os dados expostos. • Notas e chamadas: são esclarecimentos contidos na tabela. SÉRIE ESTATÍSTICA Uma série estatística é um conjunto de dados ordenados segundo uma característica comum, as quais servirão posteriormente para se fazer análises e inferências. • Série Temporal ou Cronológica: É a série cujos dados estão dispostos em correspondência com o tempo, ou seja, varia o tempo e permanece constante o fato e o local. Série Temporal Série Geográfica Série Especificativa Ano Produção 2002 245 2003 267 2004 168 2005 235 2006 345 2007 298 Tabela referente a produção de café na região ABC (em mil toneladas) Fonte: dados hipotéticos Região Produção A 300 B 289 C 168 D 198 E 256 F 309 Tabela referente a produção de café em algumas regiões de Estatiscolândia, no ano de 2004 (em mil toneladas) Fonte: dados hipotéticos Cereal Produção café 65 feijão 67 arroz 95 milho 87 lentilha 44 canjica 38 Tabela referente a produção de alguns cereais em Cacimbinhas em 2003 (em mil toneladas) Fonte: dados hipotéticos SÉRIE ESTATÍSTICA • Série Geográfica ou Territorial: É a série cujos dados estão dispostos em correspondência com o local, ou seja, varia o local e permanece constante a época e o fato. Série Temporal Série Geográfica Série Especificativa Ano Produção 2002 245 2003 267 2004 168 2005 235 2006 345 2007 298 Tabela referente a produção de café na região ABC (em mil toneladas) Fonte: dados hipotéticos Região Produção A 300 B 289 C 168 D 198 E 256 F 309 Tabela referente a produção de café em algumas regiões de Estatiscolândia, no ano de 2004 (em mil toneladas) Fonte: dados hipotéticos Cereal Produção café 65 feijão 67 arroz 95 milho 87 lentilha 44 canjica 38 Tabela referentea produção de alguns cereais em Cacimbinhas em 2003 (em mil toneladas) Fonte: dados hipotéticos SÉRIE ESTATÍSTICA • Série Específica ou Qualitativa: É a série cujos dados estão dispostos em correspondência com a espécie ou qualidade, ou seja, varia o fato e permanece constante a época e o local. Série Temporal Série Geográfica Série Especificativa Ano Produção 2002 245 2003 267 2004 168 2005 235 2006 345 2007 298 Tabela referente a produção de café na região ABC (em mil toneladas) Fonte: dados hipotéticos Região Produção A 300 B 289 C 168 D 198 E 256 F 309 Tabela referente a produção de café em algumas regiões de Estatiscolândia, no ano de 2004 (em mil toneladas) Fonte: dados hipotéticos Cereal Produção café 65 feijão 67 arroz 95 milho 87 lentilha 44 canjica 38 Tabela referente a produção de alguns cereais em Cacimbinhas em 2003 (em mil toneladas) Fonte: dados hipotéticos SÉRIE ESTATÍSTICA • Série Mista ou Composta: A combinação entre duas ou mais séries constituem novas séries denominadas compostas e apresentadas em tabelas de dupla entrada. O nome da série mista surge de acordo com a combinação de pelo menos dois elementos. • Exemplos de séries mistas: Série Especificativa-geográfica Série Geográfica-temporal CEREAL REGIÂO NORTE REGIÂO SUL Arroz 128 265 Feijão 147 128 Milho 257 78 Café 89 354 Tabela referente a produção de alguns cereais, em duas regiões de Cacimbinhas ( em mil toneladas), em 2002. Fonte: dados hipotéticos REGIÃO 2003 2004 A 141 178 B 237 235 C 189 154 Tabela referente a produção de milho, em algumas regiões de Estatiscolândia nos anos de 2003 e 2004 (em mil toneladas) Fonte: dados hipotéticos DISTRIBUIÇÃO DE FREQUÊNCIA • Após a realização de uma pesquisa em que os dados qualitativos foram coletados, é necessário organiza-los e classifica-los. Isso poderá ser feito utilizando uma tabela de distribuição de frequência. • Os dados são colocados em classes preestabelecidas, registrando a frequência de ocorrência. • É uma tabela onde se preocupa em fazer corresponder os valores (categorias) observados da variável em estudo e as respectivas frequências. 11 DISTRIBUIÇÃO DE FREQUÊNCIA a) Distribuição de Frequência Discreta ou Pontual: É uma série de dados agrupados na qual o número de observações está relacionado com um ponto real. • Exemplo 1: Notas da disciplina Estatística - Ano 2010 10,00 2 9,50 1 9,00 2 8,50 2 7,50 2 6,50 3 6,00 2 5,50 1 4,50 1 Soma 16 �� �� Fonte: Departamento de Ciência da computação da UFAL (2010). DISTRIBUIÇÃO DE FREQUÊNCIA • Exemplo 2: Estado civil de compradores de uma determinada loja de departamento. solteiro separado casado casado viúvo separado casado separado casado viúvo separado solteiro separado casado viúvo casado casado separado separado casado viúvo separado casado separado casado viúvo solteiro casado solteiro casado viúvo solteiro viúvo solteiro separado casado separado solteiro solteiro casado solteiro separado solteiro separado casado casado casado casado classe Estado civil Frequência i (xi) (fxi) 1 Solteiro 10 2 Casado 18 3 Viúvo 7 4 Separado 13 TIPOS DE FREQUÊNCIA • Frequência absoluta (���) corresponde ao numero de observações que temos em uma determinada classe ou em um determinado atributo de uma variável qualitativa. • Frequência relativa (��� ) corresponde à proporção do número de observações em uma determinada classe em relação ao total de observações que temos. • Frequência Acumulada ( �� � , ��� �) – corresponde à soma da frequência daquela classe às frequências de todas as classes abaixo dela. As frequências podem ser expressa em termos porcentuais. Para isto, basta multiplicar a frequência relativa obtida por 100. TIPOS DE FREQUÊNCIA • Frequência absoluta (���) corresponde ao numero de observações que temos em uma determinada classe ou em um determinado atributo de uma variável qualitativa. � = ∑ ��� = ��� +��� � � + ... + ��� • Frequência relativa (��� ) corresponde à proporção do número de observações em uma determinada classe em relação ao total de observações que temos. ���= ��� ∑ ��� � � • As frequências podem ser expressa em termos porcentuais. Para isto, basta multiplicar a frequência relativa obtida por 100. TIPOS DE FREQUÊNCIA • Frequência Acumulada ( �� � , ��� �) –corresponde à soma da frequência daquela classe às frequências de todas as classes abaixo dela. �� � = ∑ ��� � � = 1 ��� � = ∑ ��� � � = 1 DISTRIBUIÇÃO DE FREQUÊNCIA Elementos da distribuição de frequências: • Classe ou classe de Frequência (K): : é cada um dos grupos de valores (ou categorias) em que se subdivide os dados observados. • Limite de classe: são os valores que definem a classe. São conhecidos como limite superior e inferior de classe. • Amplitude do intervalo de classe: é o comprimento da classe, ou seja, a diferença entre os seus limites superior e inferior. • Ponto médio de classe: é o valor que representa a classe para efeito de cálculo de certas medidas. É obtido através da média aritmética entre os limites superior e inferior de classe. 12 DISTRIBUIÇÃO DE FREQUÊNCIA As classes são um artifício para condensar o número de elementos diferentes de uma amostra. Principais pré-requisitos para uma boa definição da quantidade e classes: a) As classes devem abranger todas as observações; b) O extremo superior de uma classe é o extremo inferior da classe subsequente; c) Cada valor observado deve enquadrar-se em apenas uma classe; d) As unidades das classes devem ser as mesmas dos dados; e) k ≤ 25, de um modo geral, sendo k o número de classes; e) Calcular a amplitude (A) do conjunto de valores observados; DISTRIBUIÇÃO DE FREQUÊNCIA f) Calculo do número de classes: • Fórmula de Sturges: K = 1 + 3,3322 log n Números de termos (n) k 3 a 5 3 6 a 11 4 12 a 22 5 23 a 46 6 47 a 90 7 91 a 181 8 182 a 362 9 ... DISTRIBUIÇÃO DE FREQUÊNCIA f) Calculo do número de classes: • K = � • Onde: • n ���� é o número de informações da população. • N ���� é o número de informações da amostra, que na maioria das vezes pode ser igual a n. • O pesquisador, a seu critério, poderá modificar o número de classes. Quando o resultado não for exato deve-se arredondar. g) Determinar a amplitude de cada classe. � = � � h) Determinar os limites superior e inferior; simbologia: ├ ─ ─, intervalo fechado à esquerda e aberto à direita; ─ ─ ─ |, intervalo fechado à direita e aberto à esquerda. i) Construir a tabela de frequência. DISTRIBUIÇÃO DE FREQUÊNCIA Exemplo 1. Produção diária de uma determinada fabrica. 230 232 244 245 248 249 250 255 257 260 264 271 278 280 280 280 281 284 289 292 292 293 294 294 296 299 299 299 302 305 308 309 309 310 311 312 314 315 316 318 318 320 321 324 326 333 335 335 337 337 339 341 342 342 342 348 356 360 365 369 Amplitude Total = 139 Número de classes = 6,925156 Amplitude das classes =20,07175 Intervalo de Classes fa fr fac frac 230 |--- 250 6 10,00% 6 10,00% 250 |--- 270 5 8,33% 11 18,33% 270 |--- 290 8 13,33% 19 31,67% 290 |--- 310 14 23,33% 33 55,00% 310 |--- 330 12 20,00% 45 75,00% 330 |--- 350 11 18,33% 56 93,33% 350 |--- 370 4 6,67% 60 100,00% 60 DISTRIBUIÇÃO DE FREQUÊNCIA Exemplo 1. Produção diária de uma determinada fabrica. 230 232 244 245 248 249 250 255 257 260 264 271 278 280 280 280 281 284 289 292 292 293 294 294 296 299 299 299 302 305 308 309 309 310 311 312 314 315 316 318 318 320 321 324 326 333 335 335 337 337 339 341 342 342 342 348 356 360 365 369 0% 20% 40%60% 80% 100% 120% 0 2 4 6 8 10 12 14 16 230 250 270 290 310 330 350 Mais Fr e q ü ê n ci a Bloco Histograma Bloco Freqüência % cumulativo 230 1 1,67% 250 6 11,67% 270 4 18,33% 290 8 31,67% 310 15 56,67% 330 11 75,00% 350 11 93,33% Mais 4 100,00% 0 2 4 6 8 10 12 14 16 230 250 270 290 310 330 350 Mais Fr e q ü ê n ci a Bloco Histograma Utilizando Excel REPRESENTAÇÃO GRÁFICA • Os gráficos são uma forma de apresentação visual dos dados. Normalmente, contém menos informações que as tabelas, mas são de mais fácil leitura. O tipo de gráfico depende da variável em questão. • Gráficos de Linhas 200.000 250.000 300.000 350.000 400.000 450.000 500.000 Produção de açúcar (sacos) 0 100.000 200.000 300.000 400.000 500.000 600.000 sa co s d e 5 0 k ilo s Produção de açúcar anos 2009 e 2010 Produção (2009) Produção (2010) 13 REPRESENTAÇÃO GRÁFICA Gráficos de colunas ou barras • Representação gráfica da distribuição de frequências. Este gráfico é utilizado para variáveis nominais e ordinais. 0 100.000 200.000 300.000 400.000 500.000 Produção de açúcar (sacos) REPRESENTAÇÃO GRÁFICA Gráficos de colunas ou barras • Representação gráfica da distribuição de frequências. Este gráfico é utilizado para variáveis nominais e ordinais. 0 100.000 200.000 300.000 400.000 500.000 Setembro Outubro Novembro Dezembro Janeiro Fevereiro Março Produção de açúcar (sacos) REPRESENTAÇÃO GRÁFICA Gráficos de colunas comparativas sobrepostas e justapostas. REPRESENTAÇÃO GRÁFICA Gráficos circulares ou de Setores ou Pizza • Representação gráfica da frequência relativa (percentagem) de cada categoria da variável. Este gráfico é utilizado para variáveis nominais e ordinais. É uma opção ao gráfico de barras quando se pretende dar ênfase à comparação das percentagens de cada categoria. A construção do gráfico de setores segue uma regra de 3 simples, onde as frequências de cada classe correspondem ao ângulo que se deseja representar em relação a frequência total que representa o total de 360°. REPRESENTAÇÃO GRÁFICA Gráficos circulares ou de Setores ou Pizza • Quando temos uma tabela de variável qualitativa, um tipo de gráfico adequado para apresentar os resultados corresponde ao gráfico de setores, também popularmente conhecido como gráfico tipo pizza. Sua construção é simples: sabe-se que o ângulo de 360º equivale a 100% da área da circunferência; assim, para obter-se o ângulo do setor cuja área representa uma determinada frequência, basta resolver uma regra de três simples, Sexo das pessoas de uma determinada empresa. REPRESENTAÇÃO GRÁFICA • As tabelas de distribuição de frequências são a única forma que temos para apresentar um conjunto de dados? • Os diferentes tipos de gráfico, (histogramas, polígonos de frequência, gráficos de setores e outros) permitem uma melhor visualização de resultados. • Estes gráficos podem ser obtidos utilizando planilhas eletrônicas, como por exemplo, o Excel. • Uma distribuição de frequência pode ser representada graficamente pelo Histograma, pelo polígono de frequência e pelo polígono de frequência acumulada. 14 REPRESENTAÇÃO GRÁFICA Histograma Histogramas: são constituídos por um conjunto de retângulos, com as bases assentadas sobre um eixo horizontal, tendo o centro da mesma no ponto médio da classe que representa, e cuja altura é proporcional à frequência da classe. • O histograma é uma forma gráfica de apresentar a distribuição de frequências de uma variável. • O histograma é um gráfico de barras verticais construído com os resultados da tabela de frequências. Histograma representativo da distribuição de frequência de uso de celular de uma determinada operadora. REPRESENTAÇÃO GRÁFICA 0 2 4 6 8 10 12 14 16 18 94,8 120,4 146,0 171,6 197,2 222,8 Fr e q u ê n ci as Consumo (mim) Histograma REPRESENTAÇÃO GRÁFICA Polígono de frequências � é um gráfico de análise no qual as frequências das classes são localizadas sobre perpendiculares levantadas nos pontos médios das classes. Histograma representativo da distribuição de frequência de uso de celular de uma determinada operadora. REPRESENTAÇÃO GRÁFICA 0 1 2 3 4 5 6 7 8 11 12 13 14 15 16 17 Fr eq u ên ci as a b so lu ta s Seleção Polígono de frequência REPRESENTAÇÃO GRÁFICA Polígono de frequência acumulada � O polígono de frequência acumulada é traçado marcando-se as frequências acumuladas sobre perpendiculares ao eixo horizontal, levantadas nos pontos correspondentes aos limites dos intervalos de classe. REPRESENTAÇÃO GRÁFICA 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% 94,8 120,4 146,0 171,6 197,2 222,8 Fr e q u ê n ci as a cu m u la d as Consumo (mim) Histograma 15 REPRESENTAÇÃO GRÁFICA 0% 20% 40% 60% 80% 100% 120% 0 2 4 6 8 10 12 14 16 18 69,2 94,8 120,4 146,0 171,6 197,2 222,8 Fr e q ü ê n ci a Consumo (min) Histograma combinado REPRESENTAÇÃO GRÁFICA A Curva de Frequência ( Curva polida): � Enquanto o polígono de frequência nos dá a imagem real do fenômeno estudado, a curva de frequência nos dá a imagem tendencial. O polimento (geometricamente, corresponde à eliminação dos vértices da linha poligonal) de um polígono de frequência nos mostra o que seria tal polígono com um número maior de dados em amostras mais amplas. fci = ( fant + 2 fi + fpost ) / 4 onde: • fci = frequência calculada da classe considerada (freq. polida) • fi = frequência simples da classe considerada • fant = frequência simples da classe anterior à da classe considerada • fpost = frequência simples da classe posterior à da classe considerada REPRESENTAÇÃO GRÁFICA Formas de Curva de Frequência: a) Simétricas ou em forma de sino. Caracterizam-se pelo fato das observações equidistantes do ponto central máximo terem a mesma frequência. Um exemplo importante é a curva normal. b) Moderadamente assimétricas ou desviadas. A cauda da curva de um lado da ordenada máxima é mais longa que do outro. Se o ramo mais alongado fica à direita, a curva é dita desviada para a direita, ou de assimetria positiva, enquanto que, se ocorre o inverso, diz-se que a curva é desviada para a esquerda ou de assimetria negativa. REPRESENTAÇÃO GRÁFICA Formas de Curva de Frequência: c) Na curva em forma de J, ou em J invertido, são distribuições assimétricas, caracterizadas por apresentarem o ponto de ordenada máxima ocorre em uma das extremidades. d) Uma curva de frequência em forma de U tem ordenadas máxima em ambas as extremidades. e) Uma curva de frequência bimodal tem dois máximos. f) Uma curva de frequência multimodal tem mais de dois máximos. Exercício • Exercício 1: tem-se a seguir o tempo em minutos de reuniões em um setor de uma empresa. • a) Construa a distribuição de frequências absoluta, relativa e acumulada; e • b) Determine o número de reuniões em que o tempo foi menor do que 50, a partir da distribuição de frequências. 45 50 50 46 42 60 41 54 52 52 51 58 44 57 41 58 50 60 46 51
Compartilhar