Prévia do material em texto
IFSULDEMINAS - EAD ���� Profa. Geslaine Frimaio da Silva Prof. Carlos Cezar da Silva � TÉCNICO EM ADMINISTRAÇÃO APOSTILA DE &TUBUÍTUJDB Básica Carlos Carlos Carlos Carlos Carlos SUMÁRIO 02 01. Introdução 03 02. Definições 04 2.1 Amostragem 04 03.Variáveis 06 04. Distribuição de Frequências 07 4.1 Elementos de uma distribuição de frequência (variável contínua) 07 05. Gráficos Analíticos 09 06. Erros Experimentais 13 6.1 Incertezas e os algarismos significativos 13 6.2 Conversão de unidades 14 6.3 As incertezas nos cálculos 14 6.4 Erros em medidas experimentais 14 07. Medidas Estatísticas 16 7.1 Medidas de tendência central ou de posição para dados não agrupados 16 7.2 Medidas de variabilidade ou dispersão para dados não agrupados 17 7.3 Medidas de tendência central e dispersão para dados agrupados sem classes 20 08. Indicadores 20 8.1 O método dos mínimos quadrados 22 8.2 Coeficiente de correlação linear 23 09. Indicadores dos ícones 24 10. Referências Bibliográficas 25 Curso Técnico em Administração 03 Caro aluno, Na Estatística, os dados são o organizados em tabelas e/ou gráficos. Essa forma de organização agiliza e facilita a compreensão do fenômeno estudado. Por que precisamos conhecer métodos estatísticos? Apresentar e tratar as informações (dados) de forma adequada; Obter conclusões de um universo estatístico (população), utilizando somente uma parte da população (amostra); Fazer previsões confiáveis a partir do comportamento das variáveis de interesse (dados). Caro aluno, nesta unidade você irá aprender: 1 Algumas definições e conceitos necessários ao estudo dos Métodos Estatísticos; 2 Classificar variáveis; 3 Organizar os dados e construir tabelas; 4 Gráficos. 1�-�Introdução Saiba mais Você sabia que 82% dos jovens e crianças que acessam a internet navegam por celular? E que os trabalhos escolares são a segunda atividade mais feita na internet, com 68% dos jovens admitindo que usam a rede para ajudar nos estudos (EBC, 2015) Imagem: Freepik.com Imagem: Freepik.com O técnico em Administração realiza a maior parte de suas atividades em um escritório. Faz parte de seu trabalho realizar análises estatísticas, efetuar e comparar histórico de dados. Curso Técnico em Administração 4FNBOBT�� F 2 04 População ou universo estatístico Entende-se por população ou universo estatístico o conjunto completo de todos os elementos (pessoas, objetos, medidas, entre outros) que apresentam uma ou mais características em comum. Essas características podem ser mensuráveis, ordenáveis ou comparáveis. Enfim, é a totalidade dos itens ou elementos considerados na pesquisa estatística. População finita É aquela possível de enumerar todos os elementos que a constitui. População infinita É aquela que não é possível enumerar os elementos que a constitui. Amostra É um subconjunto da população. É a parte representativa da população selecionada para a análise. Exemplo 1: Queremos saber qual o percentual de jovens do Brasil que utilizam a internet. Todos os jovens do Brasil que utilizam internet.População: Apenas uma parte selecionada dos jovens do Brasil que utilizam internet.Amostra: Exemplo 2: Queremos obter informações sobre os elementos da Tabela Periódica que possuem número atômico acima de 76. Todos os elementos químicos que compõem a Tabela Periódica.População: Somente alguns elementos químicos da tabela periódica que possuem Amostra: número atômico acima de 76. Ouro (Au), Chumbo (Pb), Polônio (Po), Radônio(Rn) e Dúbnio (Db). 2.1 Amostragem A amostragem é um conjunto de técnicas pelas quais se retira a amostra da população. Existem muitas técnicas de amostragem: aleatória simples, sistemática, estratificada proporcional, entre outras. Você já pensou se, como amostra, utilizássemos somente as notas mais altas obtidas? Chegaríamos à conclusão de que todos os alunos tiveram bom desempenho, e essa é uma conclusão errada! Para que não ocorram erros dessa natureza, devemos sempre utilizar uma amostra representativa, que, nesse caso, seria utilizar as médias de desempenho da mais baixa até a mais alta, ou seja, as médias de desempenho variadas. Vamos ver um exemplo de técnica de amostragem estratificada? 2�-�Definições População Amostra Atenção: P a r a r e a l i z a r u m a p e s q u i s a estatística, é necessário definir precisamente o problema a ser estudado, determinar a população envo lv ida e qua l amost ra da população irá utilizar. Caro aluno, a amostragem deve ser sempre representativa. Imagine que queiramos fazer um estudo do desempenho dos alunos do curso Técnico em Administração. Curso Técnico em Administração 05 Uma pesquisa sobre o índice de gripe em alunos das escolas públicas de uma pequena cidade do interior de São Paulo é mostrada na Tabela abaixo: Baseando-se nos dados da tabela, vamos estratificar uma amostra cujo total de alunos seja 310. Para determinarmos o número de alunos da amostra, devemos considerar o total de alunos das escolas da cidade, que corresponde a 1.500. Como queremos uma amostra com 310 alunos de todas as escolas da cidade, logo o total da amostra é 310. Para determinar o número de alunos que devemos entrevistar da escola A, procede-se da seguinte forma: Utilizado a regra de três, relacionamos o total de alunos do universo estatístico (1.550) com o número total de estudantes da escola A (500), e o número total da amostra (310) com a quantidade de alunos que queremos saber para que possamos entrevistá-los. Exemplo: Realizando o mesmo procedimento para as escolas B, C e D, nossa tabela ficará da seguinte forma: Não deixe de consultar o material de apoio 2. Lá você encontrará explicações detalhadas, exemplos e exercícios resolvidos. Curso Técnico em Administração 06 Caro aluno, toda pesquisa estatística sempre visa responder alguma pergunta. Você já imaginou sobre quantas pesquisas você já ouviu falar? Pesquisa para candidato a presidente, pesquisa do aumento da cesta básica, pesquisa do número de pessoas que acessam a internet, pesquisa sobre o número de indivíduos infectados com o vírus HIV. Como você pode perceber, existem e podem ser realizadas uma infinidade de pesquisas, não é mesmo? Mas note que elas apresentam características diferentes. Essas características são denominadas variáveis aleatórias. As variáveis aleatórias são classificadas em: Quantitativas - que são variáveis numéricas. Qualitativas - são variáveis não numéricas, que podem representar características ou qualidades. As variáveis quantitativas podem conter Dados discretos: são dados numéricos, obtidos por contagens, em que somente um número inteiro pode ser obtido como resposta. Exemplos: número de pacientes atendidos, número de filhos, número de peças produzidas por uma máquina. Dados contínuos: são dados numéricos, geralmente obtidos em processos de medições e, por isso, podem ser expressos em números decimais. Sendo assim, ele pode assumir qualquer valor dentro de um intervalo. Exemplos: altura dos alunos, temperatura corporal, índice de humidade relativa do ar. As variáveis qualitativas podem conter: • Dados ordinais: são variáveis que assumem uma ordenação natural, geralmente de forma crescente. Exemplo: meses observados (janeiro, fevereiro, março,...) período (manhã, tarde, noite). • Dados nominais: são variáveis em que não é possível estabelecer uma ordenação. Exemplos: cor dos olhos, sexo, cidade onde reside. Abaixo é apresentado um esquema sintetizado das variáveis. 3�-�Variáveis Curso Técnico em Administração 07 Caro aluno, note quantas variáveis podemos retirar de uma população ou amostra Exemplo: População - Funcionários de um determinado departamento de uma empresa. Variável 1 - Estatura dos funcionários (VariávelContínua); Variável 2 - Peso dos funcionários (Variável Contínua); Variável 3 - Número de dependentes que cada funcionário possui (Variável Discreta); Variável 4 - Salário de cada funcionário (Variável Contínua); Variável 5 - Número de funcionários casados (Variável Discreta) Caro aluno, a distribuição de frequência é uma técnica utilizada para apresentar os valores dos dados amostrais em cada classe. Trata-se de agrupar os dados em classes, exibindo os números ou percentuais em cada classe, procurando ordená-los de modo a facilitar sua leitura e interpretação. No entanto, há uma diferença entre a distribuição de frequência entre dados discretos e contínuos, que veremos no decorrer desta aula. Consideremos uma pesquisa realizada em uma escola X, cuja coleta de dados relativos às estaturas de 20 alunos é mostrada na tabela abaixo. Que conclusões podemos tirar desses dados? Nota-se que os dados não possuem nenhuma organização ou tratamento, apenas foram inseridos na tabela. Esse tipo de tabela, cujos elementos não foram numericamente organizados, denominamos tabela primitiva. A distribuição de frequência, com os dados ordenados, é chamada de Tabela de Distribuição de Frequência, onde os dados podem ser ordenados de forma crescente ou decrescente. Esse procedimento dá origem ao que chamamos de rol dos dados. Notem como fica o rol da tabela acima: 4.1 Elementos de uma distribuição de frequência (variável contínua) Classe: são intervalos (abertos, fechados ou semiabertos) de variação da variável. É representado por i, sendo i = 1,2,3,...,k (onde k é o nro total de classes da distribuição). Limites de classe: são os extremos de cada classe. Amplitude do intervalo da classe: É a diferença entre o limite superior (L e o limite inferior (l ) dessa classe, i) i indicada por h. Assim, h = L – l .i i i Amplitude amostral (AA): É a diferença entre o valor máximo e o valor mínimo da amostra: AA= L(máx) – l(min). 4�-�Distribuição�de�Frequências Curso Técnico em Administração 08 Ponto médio de uma classe (x):i É o valor que divide o intervalo de classe em duas partes iguais. É obtido calculando-se a média aritmética dos limites superior e inferior da classe. Frequência simples ou absoluta: ou simplesmente frequência de classe ou de um valor individual é o número de observações correspondentes a essa classe ou a esse valor. Ela é simbolizada por fi. Frequências relativas (fr ):i são os valores das razões (divisões) entre as frequências simples f e a i frequência total . Logo fr Se quisermos as frequências relativas percentuais (fr %), basta i i multiplicar o valor de f por 100.r Frequências acumuladas (F):i é o total de todos os valores inferiores ao limite superior do intervalo de uma dada classe. Logo, F = f + f +...+f .1 1 2 k Frequências acumuladas relativas (F ):ri é a frequência acumulada da classe dividida pela frequência total da distribuição. F Se quisermos o valor da frequência acumulada percentual, basta ri multiplicarmos o resultado de f por 100.acr Número de classes (i) : não há fórmula exata para o cálculo de número de classes. I – Se i = 5 para n 25 e i = para n . Sendo n o número total de elementos da amostra. II – Fórmula do Matemático Sturges: i = 1 + 3,3.log n.10 III – Para calcularmos a amplitude da classe (h) basta dividirmos a amplitude amostral (AA) pelo número de classes (i). i Logo, h =i Desta forma, a tabela inicial de altura dos 40 alunos da escola X fica apresentada da seguinte forma: De acordo com a tabela construída, responda: 1) Quantos alunos não ultrapassam a estatura de 162 cm? 2) Quantos alunos possuem pelo menos 158 cm de altura? 3) Qual o número de alunos que estão entre 154 cm (inclusive) e 170 cm (exclusive)? 4) Qual o percentual de alunos que ultrapassam a estatura de 166 cm (inclusive)? 5) Qual o percentual de alunos que estão abaixo de 170 cm de altura? 6) Até que classe estão incluídos 60% da estatura dos alunos? Você percebeu que, com a organização dos dados, conseguimos extrair muito mais informações? 100%= 40 Imagem: Freepik.com Curso Técnico em Administração 09 5�-�Gráfiicos Os gráficos são representações visuais. É um recurso que pode fornecer informações de forma mais rápida do que, por exemplo, ao se fazer uma leitura. Os gráficos podem representar informações qualitativas ou quantitativas. Por meio deles é possível realizar observações, efetuar comparações e tirar conclusões. Assim como os mapas meteorológicos são capazes de mostrar onde está chovendo ou surgindo um furação e para onde ele está se dirigindo, da mesma forma os gráficos mostram informações estatísticas sobre um determinado fato. Existe uma grande variedade de gráficos e cada um transmite determinada informação de maneira mais clara e objetiva. Entre os diferente tipos, podemos destacar o de colunas, barras, setores, linha, área e rede. Gráficos de colunas: é aquele cuja coluna apresenta a frequência de uma só variável. São úteis principalmente para fazer comparações. Os dados são indicados na posição vertical, enquanto as variáveis qualitativas são expressas no eixo horizontal. Exemplo: Organizamos uma tabela que relaciona a cidade e a quantidade (em toneladas) de resíduos sólidos urbanos (RSU) coletadas em cada uma. Gráfico de barras: tem as mesmas aplicações e sua confecção é semelhante ao gráfico de colunas. O que muda são os eixos coordenados. As variáveis são representadas por retângulos na posição horizontal, sua base está localizada no eixo vertical (ordenadas) e o comprimento de cada retângulo é proporcional à frequência relativa. Exemplo: Hipoteticamente, veremos a quantidade de gols do campeonato dos seis melhores times de futebol do IFSULDEMINAS. Tabela Curso Técnico em Administração 10 Gráfico de linhas: no gráfico de linhas, cada ponto (x, y) é representado no sistema cartesiano e, em seguida, são ligados por segmentos de retas. Por meio da linha poligonal podemos observar o comportamento do fenômeno estudado. Exemplo: O Produto Interno Bruto Real (PIB Real) é o produto interno bruto do país dividido pelo número de habitantes desse país. Vejamos o PIB Real do Brasil nos anos de 2012 a 2016, conforme a tabela abaixo, e como fica a construção do gráfico em linhas. Gráfico de área: são gráficos onde os valores são representados pelo espaço hachurado ou colorido do gráfico. Exemplo: Utilizando o mesmo exemplo do PIB Real acima, vejamos como fica representado o gráfico de área. Gráfico de setores: é utilizado quando queremos saber o comportamento de uma série de dados em relação à sua totalidade. O gráfico de setores é representado por um círculo. Cada setor do círculo representa uma parcela, em percentual, do total. Como o círculo tem 360 graus, logo está relacionado com 100% e, assim, cada percentual tem um valor proporcional a uma medida angular. A medida angular para cada valor da série é dada por: Curso Técnico em Administração 11 Exemplo: Em uma escola foram entrevistados 80 alunos e lhes foi perguntado sobre o esporte que praticam. Os resultados podem ser observados na tabela abaixo: Vamos calcular, com uma simples regra de três, o percentual de alunos que escolheram a modalidade de Voleibol: % alunos 100 80 x 21 logo temos: 80x = 2.100 x = 26,25% E assim, sucessivamente, para cada modalidade. Desta forma obtemos: Basquete: 49,5% Futebol: 193,5% Handebol: 22,5% Para conferir, some todos os valores obtidos e verifique se o resultado é 360. Como tivemos decimais após a vírgula, iremos arredondar esses valores, caso a primeira casa após a vírgula seja 5, a casa anterior à vírgula será arredondada acrescentando um número a mais. Caso o valor seja inferior a 5, a casa anterior à vírgula permanece como está, assimtemos: Voleibol: 26% Basquete: 14% Futebol: 54% Handebol: 6% Caro aluno, agora vamos calcular a medida angular (ou cada ângulo) que corresponde à modalidade do voleibol: Caro aluno, tente fazer os cálculos E confira os resultados: Basquete: 49,5 graus Futebol: 193,5 graus Handebol: 22,5 graus Vamos conferir se os valores dos ângulos estão corretos? 94,5 + 49,5 + 193,5 + 22,5 = 360. Agora é só utilizar o transferidor centrando o meio no centro do círculo e começar a marcar o primeiro ângulo e, depois, os demais. Não se esqueça que o próximo ângulo começa onde termina o anterior. Curso Técnico em Administração 12 Um tipo de gráfico muito utilizado nos métodos estatísticos é o histograma, ou polígono de frequências. Sua função é mostrar a distribuição de frequência dos dados obtidos. Trata-se de um gráfico em que as colunas são justapostas (uma colada à outra), usando os intervalos de classes com suas respectivas frequências absolutas. Histograma: para traçá-lo, basta determinar (marcar) os pontos médios nas barras que foram determinadas pelos intervalos de classe (xi), com suas respectivas frequências absolutas, e traçar uma linha unindo todos os pontos. Fácil, não é? Créditos da imagem: https://pt.wikipedia.org/wiki/Histograma Caro aluno, não deixe de acessar o material de apoio, onde você encontrará todas as informações detalhadas. Curso Técnico em Administração 13 Caro aluno, você já reparou quantas medidas estão a sua volta todos os dias? A distância que você percorre até sua escola, as quantidades de farinha, água e fermento que são utilizados na fabricação do pão, a medida da pressão arterial, de seus batimentos cardíacos. Nesta unidade, você irá aprender: Erros experimentais; Medidas estatísticas. 6.1 Incertezas e os algarismos significativos Nas atividades em laboratório você irá se deparar com muitas medidas obtidas por meio de experimentos realizados. E cada uma dessas medidas é acompanhada de incertezas. A incerteza vai quantificar o quanto um resultado é confiável, ou seja, o quanto ele está próximo do seu valor real. Quanto menor a incerteza, maior será a confiabilidade das medições. Alguns fatores podem causar incertezas, eles estão associados, principalmente, à calibração dos instrumentos de medição. Todos os instrumentos seguem um padrão internacional de referência e, nem sempre, a calibração de um instrumento está perfeitamente alinhada com seu valor de referência. Até mesmo o simples fato de transportar uma balança do armário para a bancada pode ocasionar algum dano e afetar as medições. No laboratório podem ocorrer dois tipos de incertezas: 1 – aquela em que o ponteiro fica se alterando em torno de um valor (erro indeterminado); e 2 – aquela cujo resultado será diferente da massa real. Podendo ser maior ou menor. Quando surge algum número 0 (zero), temos que tomar alguns cuidados: Zero à esquerda: 010,5 – Não é um algarismo significativo. Ele apenas expressa a ordem de grandeza. Zero no meio do número (203,6 g): sempre é significativo; Zero à direita: (203,0) só é significativo se for resultante de medida experimental executada em balança técnica. Nesse caso deve permanecer dessa maneira. 6�-�Erros�Experimentais Saiba mais Que grande parte dos erros de um analista pode estar na conversão de unidades? Vale a pena checar as conversões de pesos e volumes. Caro aluno, realizou-se uma medida em laboratório e o resultado da balança técnica digital apontou 203,6 gramas. Todos os algarismos são significativos, pois expressam a massa do elemento. No entanto, a balança apresenta incerteza de + 0,1 g. Logo, indica que a incerteza está na primeira casa decimal e os valores da massa variam entre 203,5g e 203,7g. O número 6 é denominado ‘duvidoso’, por causa da incerteza determinada na primeira casa após a vírgula (primeira casa decimal). Curso Técnico em Administração 4FNBOBT 3 e 4 14 6.2 Conversão de Unidades Seja qual for o tipo utilizado de conversão de unidades, todos os algarismos significativos devem ser preservados, até mesmo o duvidoso. Exemplo: No caso da miligrama (204600), os dois últimos zeros não são significativos porque não são resultantes de uma medida experimental e sim de uma conversão. Assim como no quilograma (0,2046), o algarismo zero, que aparece antes da vírgula, também não é significativo pelo mesmo motivo. Caro aluno, se a medida fosse realizada em uma balança analítica, onde a incerteza é de 0,0001 g, a massa obtida seria 204,6000. Note que agora a medida apresenta sete algarismos, todos eles significativos. 6.3 As incertezas nos cálculos Caro aluno, muitas vezes, as medidas obtidas em um experimento não são suficientes para expressar a informação que você deseja. Para chegar ao resultado desejado você irá precisar de uma das quatro operações básicas (adição, subtração, divisão e multiplicação). Adição e subtração: quando utilizar uma dessas operações, o resultado deve ter o mesmo número de casas decimais que a medida que apresenta também o menor número de casas decimais. Exemplo: Um frasco contém 250,0 gramas de um determinado sal. Foram adicionadas mais 25,420 gramas. Qual é a massa que há dentro do frasco? 250,0 25,420 275,420 Como a massa deve ter o mesmo número de casas decimais que a medida de menor certeza (250,0), logo, a massa do frasco é de 275,4. Como o número da segunda casa decimal é 2, e 2 é menor do que 5, ignoram-se as casas decimais após o número 4. Por exemplo: se fosse alterada para 25,459 de massa a ser adicionada. Nesse caso, o último número significativo seria acrescido de uma unidade. Dessa forma, a massa do frasco seria 275,5. Multiplicação e divisão: Tanto na multiplicação como na divisão, o resultado tem que apresentar o mesmo número de casas decimais que a medida do elemento que apresenta o menor número de casas (menor certeza). 6.4 Erros em medidas experimentais As fontes de erros são todos os possíveis fatores que podem interferir para que o resultado das medições se distanciem do seu valor verdadeiro Uma fonte de erro pode estar associada aos . Eles podem ocorrer quando o analista não erros pessoais domina a técnica de manipular algum aparelho, pela falta de observação de algum dos resultados, pela medida incorreta, entre outros. Atenção: Não se esqueça que todos os algarismos resultantes de uma medida experimental são significa- tivos. ____+ Curso Técnico em Administração 15 Os erros também podem estar associados ao . Nesse caso, é preciso estar atento aos método interferentes contidos na amostra, que vão reagir da mesma forma que o analito. O indicador utilizado também pode ser uma fonte de erro, desviando os resultados do valor verdadeiro. Os erros instrumentais podem ocorrer pela falta de calibração dos aparelhos utilizados, afetando, dessa forma, as medidas. Existem dois tipos de erros: 1 – Erro absoluto: que é a diferença entre o resultado da medição e o valor verdadeiro. Lembre-se: só podemos adicionar ou subtrair coisas iguais, logo, a unidade dos valores utilizados tem que ser a mesma. ERRO ABSOLUTO = VALOR DA MEDIÇÃO – O VALOR VERDADEIRO 2 – Erro relativo: é a razão entre o erro e o valor verdadeiro. Nesse caso, as unidades do erro e do valor verdadeiro podem ser distintas (diferentes). Exemplo: Para verificar a precisão de três balanças técnicas do laboratório, um analista utilizou 50 g de água e realizou a pesagem, cinco vezes em cada balança. Os resultados obtidos podem ser observados na tabela abaixo. Vamos calcular a Média Aritmética de cada balança. As pesagens da balança 1 apresentam maior dispersão das pesagens, pois os valores variam de 48,77 a 51,20. A média aritmética corresponde a 49,88 g, valor abaixo de 50. Já nas pesagens realizadas na balança 2, podemos verificar que os valores variam de 48,62 a 49,87. Nota-se que a dispersão dos valores é menor do que a balança 1. Você pode pensar que esses valores são mais confiáveis,ou seja, que estão mais próximo do valor real, mas é somente ilusão, pois a média aritmética aponta que, embora haja menor dispersão, a média aritmética dos valores da balança 2 (49,53) é menor do que a média aritmética dos valores da balança 1 (49,88). As pesagens da balança 3 apresentam média aritmética igual ao valor verdadeiro (50), no entanto, os valores são bem dispersos. Caro aluno, as incertezas devem ser calculadas mesmo quando não é conhecido o valor real, o valor de referência, por esse motivo, a incerteza tem mais aplicabilidade do que o erro. Atenção: Replicata é a denominação para medidas repetidas em duplicatas, triplicatas, entre outras. Triplicata são medidas realizadas em três porções da mesma amostra, submetidas às mesmas condições. Curso Técnico em Administração 16 Existem dois tipos de erros: 1- Erros indeterminados ou aleatórios: são aqueles em que os resultados obtidos orbitam em torno da média. Esses erros não podem ser identificados e nem sequer mensurados, por isso necessitam de métodos estatísticos aplicados à uma série de observações. 2 . Erros determinados ou sistemáticos: são aqueles em que a média aritmética é maior ou menor do que o valor real. Como são possíveis de serem mensurados, podem ser descontados ou até mesmo evitados em medidas experimentais. Podem ser classificados em: instrumentais, pessoais e de método. Para detectar erros determinados, você pode utilizar-se de algumas ferramentas: Branco Analítico: Consiste em preparar uma solução idêntica à amostra, ou seja, com todos os reagentes adicionados na mesma medida que a amostra, exceto um. Você irá substituir o reagente que foi retirado pela mesma medida de solvente e submeter à análise, utilizando o mesmo procedimento realizado na amostra. Dessa forma, a medida do branco, devido aos solventes e reagentes, deverá ser descontada do valor de referência obtido na amostra. Padrão de Referência: consiste em preparar uma solução padrão do analito, de forma criteriosa, realizar todos os processos de análise e comparar com a solução padrão. Se o resultado apontar alguma discrepância, significa a existência de erro. Se não apresentar erros, não significa que não existam erros, pois o que está sendo utilizado como padrão de referência é o analito, e não a matriz. As medidas estatísticas são medidas matemáticas que avaliam numericamente o comportamento da variável numa distribuição de frequências, extraindo e resumindo as principais características de um conjunto de dados. Inicialmente estudaremos as mais importantes, que são as medidas de tendência central ou posição, e as medidas de variabilidade ou dispersão. 7.1 Medidas de tendência central ou de posição para dados não agrupados a) Média Aritmética: é dada por, onde xi = variável e n = número de elementos que compõem a amostra. b) Mediana (Md): é o valor que divide a distribuição em duas partes iguais. Seja a reta abaixo esteja representando, linearmente, todos os elementos igual à Mediana igual à Mediana Para o cálculo da Mediana devemos ter um rol de distribuição, cujos dados devem ser colocados em forma crescente, e verificar se a quantidade (n) de dados amostrais são: *Ímpares: nesse caso, a Mediana será o elemento central da distribuição. Exemplo: Sejam os números de elementos que compõem a amostra: 1 3 5 7 9, como o número de elementos é ímpar, a Mediana (Md) será o número 5. 7�-�Medidas�Estéticas Curso Técnico em Administração 17 *Pares: A Mediana será a média aritmética entre os dois valores que se encontram no centro da distribuição. Exemplo: Sejam os números de elementos que compõem a amostra: 1 3 5 7 8 9, notamos que os elementos que estão no centro da amostra são 5 e 7. Logo Md 6. Logo Md = 6. A Mediana também pode ser determinada usando uma equação cujo resultado fornecerá sua . A posição equação é dada por: . Exemplo: dada a amostra: 1 3 4 5 7 8 9, vamos calcular a posição da Mediana Posição da Mediana: Posição da Mediana: 4, logo, a Mediana está na 4a posição. Md = 5 Caro aluno, observe agora os elementos 1 3 4 5 7 8 Posição da Mediana: 3,5. Logo, a Mediana está entre a 3ª e a 4ª posição. Logo, a Mediana será a média aritmética entre esses dois valores 3,5. No entanto, caro aluno, você pode se deparar com a dúvida: Qual medida utilizar, a Média ou a Mediana? Vamos verificar no exemplo: Ítalo trabalha numa loja de calçados e nos primeiros 10 dias do mês de abril vendeu as seguintes quantidades: 24 25 26 27 28 29 30 32 33 120 Calculando a média temos: 37,4. Calculando a média temos: 28,5. Caro aluno, note a diferença entre os valores médios obtidos. Nesse momento você pode se perguntar: Qual dessas medidas reflete melhor a quantidade de vendas diárias de sapatos que Ítalo vendeu no mês de abril? Sendo que a Média é 37,4 e a Mediana é 28,5? Nesse caso, devemos utilizar a Mediana, porque ela não é afetada pelos extremos (no caso 120). Por isso ela reflete melhor a quantidade de vendas de sapatos que Ítalo vende por dia, e a partir daí podemos estimar aproximadamente quantos pares de sapatos o Ítalo pode vender em um mês ou um ano. c) Moda (Mo): é o elemento mais frequente da distribuição (o que mais se repete). Exemplo: 1 3 3 5 5 5 7 7 8 9, podemos verificar que a Moda (Mo) é 5, pois é o elemento que aparece na distribuição a maior quantidade de vezes. Classificação da Moda: Amodal - quando não tem moda ( Ex.: 1 3 5 7 8 9); Unimodal - possui apenas uma moda ( Ex.: 1 3 5 5 5 7 8 9); Bimodal - possui duas modas ( ex.: 1 3 3 5 5 8 9); Trimodal - possui três modas (Ex.: 1 1 3 5 5 7 9 9); Polimodal - acima de três modas (>3). ( Ex.: 1 1 1 2 3 3 5 5 5 7 7 7 8 9 9 9 ). 7.2 Medidas de variabilidade ou dispersão para dados não agrupados Amplitude total (AT): é a diferença entre o maior e o menor elemento amostral. AT = x(máximo) – x (mínimo) Curso Técnico em Administração 18 2 Variância: (s ): é dada pela equação: onde: x = variáveli = média aritmética n = números de elemento que compõem a amostra Desvio padrão (s): é a raiz quadrada (positiva) da variância; Coeficiente de Variação (CV): é dado por: onde: s = desvio padrão; = média aritmética Zona de Normalidade (ZN): região que compreende: a) um intervalo que compreende a diferença entre a média aritmética e o desvio padrão; b) um intervalo que compreende a média aritmética mais um desvio padrão. Logo, ZN = Exemplo: Abaixo são fornecidos os valores pagos, semanalmente, por uma empresa a 6 funcionários: Pagamento: R$600,00; R$650,00; R$650,00; R$700,00; R$700,00; R$810,00 Vamos determinar: 1. A média paga diariamente 2. O valor mediano pago Md = 675 3. O salário modal dos homens e das mulheres: Homens: 650 e 700 (bimodal) Atenção: É na zona de normalidade são encontrados, teoricamente, 68% dos dados amostrais Curso Técnico em Administração 19 4. A amplitude total do pagamentos efetuados AT =[810-600] = 210H 5. A variância dos pagamentos efetuados: 6. O desvio padrão: s = 7. O coeficiente de variação: 8. A zona de normalidade: ZN = [685 - 71,76; 685 + 71,76] ZN = [613,24;756,76] Curso Técnico em Administração 20 Caro aluno, entramos na última semana da disciplina “Métodos Estatísticos”. Espero que você tenha aprendido coisas novas e possa aplicá-las em suas práticas diárias. Nesta semana você irá estudar: Medidas de tendência Central e dispersão para dados agrupados sem classes. Método dos Mínimos Quadrados Regressão linear 7.3 Medidas de tendência Central e dispersão para dados agrupados sem classes Média Aritmética é dada por: onde: Mediana (Md) 1) Dividir o somatório da frequência simples por 2: que indicará onde seencontra a posição da mediana na frequência acumulada 2) Localizada a posição da mediana na frequência acumulada, procura-se a variável correspondente, que será a mediana. Moda (Mo) Localizar a maior frequência simples e, na linha correspondente, procurar sua variável que será a moda. Amplitude Total (AT) A amplitude total é a diferença entre o maior elemento amostral (maior ) e o menor elemento amostral (menor ). Desvio Padrão A variância é dada por onde: Desvio Padrão É a raiz quadrada da variância s Coeficiente de Variação(CV) (percentual) Zona de Normalidade: é construída da mesma forma que nos dados não agrupados. Saiba mais Que foi muito bom ter estado com você durante esse tempo? Espero que você tenha gostado também. Obrigado por sua presença aqui! Curso Técnico em Administração 4FNBOB�� 21 7.4 Medidas de tendência central ou posição e de variabilidade ou dispersão para dados agrupados com classes a) Média aritmética: onde: b) Mediana (Md) Dividir o somatório da frequência simples por 2: que indicará onde se encontra a posição da mediana na frequência acumulada Localizada a posição da mediana na frequência acumulada, seu cálculo será dado por: onde: c) Moda (Mo) Para determinar a Moda, você deve localizar a maior frequência simples na tabela, que corresponde à linha da classe modal. Após localizar a classe modal, o cálculo será dado por: d) Amplitude total (AT) A ampltude total é a diferença entre o maior limite superior da última classe e o limite inferior da primeira classe Curso Técnico em Administração 22 e) Variação : onde: f) Desvio padrão (s): raiz quadrada positiva da variância; g) Coeficiente de variação (CV): h) Zona de normalidade: é idêntica à curva dos dados não agrupados. 8.1 O método dos mínimos quadrados O método dos mínimos quadrados é o mais utilizado quando queremos ajustar os pontos de uma amostra a uma reta. Esse método vai ajustar uma reta para os dados que foram inseridos e que, nem sempre, estão dispostos dessa maneira. Observando o exemplo que você verá logo abaixo, é possível verificar que os pontos não estão em linha reta, mas uma reta é ajustada, baseada em todos os pontos Para o ajuste, cada ponto (x,y) dado, o valor de x não se altera, no entanto, y sofre uma variação. Por exemplo: o ponto é ajustado na reta como ou seja, o seu valor anterior mais um desvio. Esses desvios podem ser positivos (quando estão situados acima da reta), ou negativos (quando situados abaixo da reta). Uma das vantagens de utilizar esse método é conhecer a lei de formação da função da reta. A lei de formação da função permite, por exemplo, prever o comportamento dos dados ao longo do tempo. É importante saber que o analista pode escolher qualquer tipo função que irá se ajustar melhor aos dados da amostra, e não somente a reta. Podendo ser: polinomial, logarítmica, exponencial, entre outras. Curso Técnico em Administração 23 8.2 Coeficiente de correlação linear O coeficiente de correlação linear é um indicador que irá mostrar o quanto a reta (ou outra função) está ajustada aos dados da amostra, ou seja, o quanto o analista poderá confiar na função que foi descrita. O coeficiente de correlação linear, após calculado, indicará valores dentro de um intervalo que varia de -1 até 1, e a partir desses valores ele é classificado da seguinte forma: Caro aluno, você pode verificar que quanto mais próximo de 1 ou -1 for o resultado, mais confiável ele será. Não deixe de acessar o material de apoio, lá você encontrará detalhadamente como utilizar o Excel para realizar o ajuste de retas, a lei de formação da função e como determinar o índice de correlação. Curso Técnico em Administração 9�-�Indicadores�dos�ícones 24 Curso Técnico em Administração 25 10�-�Referências�Bibliográficas ALMADOVA, J. Introdução à estatística geral. Estrutura, 1978. BEIGUELMAN, B. Curso prático de bioestatística. 5.ed. Ribeirão Preto: Funpec Editora, 2002. CALLEGARI-JACQUES, S. Bioestatística: princípios e aplicações. Porto Alegre: ARTMED, 2007. FREEPIK. Disponível em: Fundo vetore desenhado por Ibrandify - Freepik.com. Acesso em: 12.10.2017. __________Disponível em: Negócio vetore desenhado por Alekksall - Freepik.com. Acesso em: 12.10.2017. __________Disponível em: Negócio fotografia desenhado por Ijeab - Freepik.com. Acesso em: 12.10.2017. __________Disponível em:Negócio vetore desenhado por Alekksall - Freepik.com. Acesso em: 12.10.2017. Curso Técnico em Administração Página 1 Página 2 Página 3 Página 4 Página 5 Página 6 Página 7 Página 8 Página 9 Página 10 Página 11 Página 12 Página 13 Página 14 Página 15 Página 16 Página 17 Página 18 Página 19 Página 20 Página 21 Página 22 Página 23 Página 24 Página 25 Página 26