Baixe o app para aproveitar ainda mais
Prévia do material em texto
04/05/2020 Ead.br https://anhembi.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 1/45 ESTATÍSTICA E PROBABILIDADEESTATÍSTICA E PROBABILIDADE APLICADAAPLICADA CONCEITOS BÁSICOSCONCEITOS BÁSICOS DE ESTATÍSTICADE ESTATÍSTICA Autor: Me. Raimundo Almeida R e v i s o r : H u g o E s t e v a m D e S a l e s C â m a ra I N I C I A R 04/05/2020 Ead.br https://anhembi.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 2/45 introduçãoIntrodução Nesta unidade, vamos trabalhar com os conceitos básicos da estatística descritiva: a distribuição de frequências e histogramas, análise de grá�cos e tabelas, além de medidas de tendência central e dispersão. A partir desse conteúdo você conseguirá analisar grá�cos de relatórios analíticos, compreender diagramas especí�cos da engenharia e ciências a�ns e resumir bases de dados através de grá�cos e tabelas. No �m dessa unidade, você já terá os conceitos básicos para o desenvolver-se na disciplina, realizar os trabalhos acadêmicos ao longo do seu curso e para seu desenvolvimento pro�ssional. Aproveite seu tempo para resolver bastante e aprofundar seus conhecimentos através de pesquisas e outras leituras. Bom estudo! 04/05/2020 Ead.br https://anhembi.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 3/45 Antes de iniciarmos nossos estudos, vamos a alguns conceitos que serão importantes para a nossa trajetória. Dados são conjuntos de observações (gênero, respostas de pesquisas, medidas, dentre outros); Estatística é a ciência que descreve procedimentos para coletar, organizar, resumir, analisar e apresentar dados; População é o conjunto de todos os indivíduos sob investigação (pessoas, medidas, escores, dentre outros); Censo é o conjunto dos dados obtidos de todos os membros da população; Amostra é o subconjunto de todas as medidas da população. Na tabela a seguir, você encontrará duas importantes classi�cações dos dados. Ambas serão muito utilizadas ao longo desta e das demais unidades. Conceitos BásicosConceitos Básicos da Estatísticada Estatística 04/05/2020 Ead.br https://anhembi.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 4/45 Quadro 1.1 - Classi�cação de dados Fonte: Elaborado pelo autor. CLASSIFICAÇÃO 1 DEFINIÇÃO EXEMPLO QUANTITATIVOS Números que representam contagens ou medidas. As idades em anos. QUALITATIVOS Nomes ou rótulos que não são números que representem contagens ou medidas. Estados da Região Nordeste do Brasil; Classi�cação da estatura de uma pessoa em alta, média ou baixa. 04/05/2020 Ead.br https://anhembi.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 5/45 Quadro 1.2 - Classi�cação de dados Fonte: Elaborado pelo autor. A classi�cação das variáveis será utilizada nesta e nas unidades posteriores. É a partir dela que de�niremos os métodos apropriados para tratamento das informações. CLASSIFICAÇÃO 2 DEFINIÇÃO EXEMPLO DADOS DISCRETOS Valores exatos. Número de ovos que uma galinha bota dentro um período. DADOS CONTÍNUOS Qualquer valor entre dois limites quaisquer. Questões que envolvem renda, gasto, vendas, faturamento, dentre outras, que podem assumir qualquer valor em um intervalo contínuo. 04/05/2020 Ead.br https://anhembi.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 6/45 praticarVamos Praticar Na tabela a seguir estão descritas informações sobre um grupo de quatro amigos. Para cada uma das variáveis, re�ita se estas são qualitativas ou quantitativas e, para o caso das quantitativas, se são discretas ou contínuas. 04/05/2020 Ead.br https://anhembi.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 7/45 Radio Radio Radio Radio Radio Tabela - Base de dados Fonte: Elaborada pelo autor a) Idade é uma variável quantitativa contínua. Feedback: alternativa incorreta, Variáveis quantitativas contínuas são dadas em de números reais. Observe que as idades apresentadas na tabela são números inteiros. b) Peso é uma unidade quantitativa discreta. Feedback: alternativa incorreta, As pessoas, no formato dado na tabela, são números decimais (e, portanto, reais). Logo, é uma variável quantitativa contínua. c) Cidade é uma variável quantitativa. Feedback: alternativa incorreta, Cidade é uma variável qualitativa, uma vez que seus valores são dados em nomes (variável qualitativa nominal). d) Sexo é uma variável quantitativa discreta. Feedback: alternativa incorreta, Sexo é uma variável qualitativa, uma vez que seus valores são dados em nomes (variável qualitativa nominal). e) Idade é uma variável quantitativa discreta. NOME IDADE SEXO PESO (Kg) CIDADE Alessandra 39 FEMININO 59,7 RECIFE Maurício 42 MASCULINO 80,3 SALVADOR Jéssica 35 FEMININO 65,8 NATAL Thiago 28 MASCULINO 75,4 RECIFE 04/05/2020 Ead.br https://anhembi.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 8/45 Feedback: alternativa correta, Idade é uma variável quantitativa discreta, uma vez que seus valores foram dados no conjunto dos números inteiros. 04/05/2020 Ead.br https://anhembi.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 9/45 Ao se trabalhar com uma grande massa de dados, é comum categorizá-los e organizá-los em classes. Uma distribuição de frequências é uma tabela que indica a frequência absoluta (número de registros) ou a frequência relativa (percentual de registros) de cada classe. Para exempli�car, considere o conjunto de 30 registros de idades de familiares do professor Paulo Andrade: Distribuição deDistribuição de FrequênciasFrequências 04/05/2020 Ead.br https://anhembi.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 10/45 Tabela 1.1 - Registros de idades de familiares do prof. Paulo Andrade Fonte: Elaborada pelo autor. Para o exemplo, consideramos agrupar os dados em 5 classes. Sendo assim, o primeiro passo consiste em calcular a amplitude de classe: Para o nosso exemplo: Determinaremos os limites de classe, iniciando como valor mínimo e somando, sucessivamente, a amplitude de classe. Esses limites servirão para delimitar cada uma das classes da nossa distribuição. Limite 1: 0 Limite 2: 0 + 20 = 20 Limite 3: 20 + 20 = 40 15 16 22 40 50 80 97 30 30 32 32 32 0 65 7 15 16 22 38 50 80 100 30 30 32 32 32 3 7 8 Amplitude de classe = (valor m ximo) − (valor m nimo)á í n mero de classesú Amplitude de classe = = 20100 − 0 5 04/05/2020 Ead.br https://anhembi.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 11/45 Limite 4: 40 + 20 = 60 Limite 5: 60 + 20 = 80 Limite 6: 80 + 20 = 100 A partir dos limites, poderemos escrever cada uma das classes: Classe 1: [ 0 , 20 ] Classe 2: ( 20 , 40 ] Classe 3: ( 40 , 60 ] Classe 4: ( 60 , 80 ] Classe 5: ( 80 , 100 ] O intervalo (20 , 40 ] anterior corresponde ao conjunto de valores compreendidos entre 20 e 40, incluindo o 40 e não incluindo o 20. Essa notação é comum na representação de intervalos reais. De modo geral, podemos de�nir matematicamente o intervalo ( a , b ] como: ( a ,b ] = {x ∈R | a<x≤b}. Por �m, contamos a frequência de cada uma das classes, que corresponde ao número de valores que estão situados em cada uma das classes em questão. 04/05/2020 Ead.br https://anhembi.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 12/45 Tabela 1.2 - Distribuição de frequência absoluta da Idade de 30 familiares do prof. Paulo Fonte: Elaborada pelo autor. Uma outra tabela comum no universo da Estatística Descritiva é a Distribuição de Frequência Relativa, que consiste em tabular a proporção de dados em cada classe. No exemplo anterior, a frequência relativa associada à classe ( 20 , 40 ] é dada por: Realizando os cálculos das frequências relativaspara as demais classes, podemos organizar a distribuição desejada. Classe Frequência Absoluta [ 0 , 20 ] 9 ( 20 , 40 ] 14 ( 40 , 60 ] 2 ( 60 , 80 ] 3 ( 80 , 100 ] 2 Total 30 frequ ncia relativa = ê frequ ncia de classeê soma das frequ ncias de todas as classes ê = = 0, 467 = 46, 714 9 + 14 + 2 + 3 + 2 04/05/2020 Ead.br https://anhembi.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 13/45 Tabela 1.3 - Distribuição de frequência relativa da idade de 30 familiares do prof. Paulo Fonte: Elaborada pelo autor. Uma última tabela bastante conhecida é a Distribuição de Frequência Acumulada. Para cada classe, associamos o somatório da frequência daquela classe com as frequências das classes anteriores. No exemplo das idades, a classe possui frequência acumulada igual a 83,3% (que é a soma das frequências 30,0%, 46,7% e 6,7%). Sendo assim, observe a distribuição acumulada �nal: Classe Frequência Relativa [ 0 , 20 ] 30,0% ( 20 , 40 ] 46,7% ( 40 , 60 ] 6,7% ( 60 , 80 ] 10,0% ( 80 , 100 ] 6,7% Total 100,0% 04/05/2020 Ead.br https://anhembi.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 14/45 Tabela 1.4 - Distribuição de frequência acumulada das idades de 30 familiares do prof. Paulo Fonte: Elaborada pelo autor. A seguir, trabalharemos com histogramas, que consiste em um modelo de grá�co utilizado para representar distribuições de frequência. Classe Frequência Acumulada [ 0 , 20 ] 30,0% ( 20 , 40 ] 76,7% ( 40 , 60 ] 83,3% ( 60 , 80 ] 93,3% ( 80 , 100 ] 100,0% 04/05/2020 Ead.br https://anhembi.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 15/45 Histograma Um histograma é um grá�co que tem por objetivo visualizar o comportamento de uma distribuição de frequências. Para ilustrar, considere o exemplo a seguir. Uma rede de fábricas produz parafusos para distribuição nas cidades da região Norte do Brasil. A seguir, você pode veri�car o número médio de caixas de produtos produzidas diariamente por cada uma das 20 fábricas da rede. saibamaisSaiba mais Uma ferramenta muito útil e essencial no dia a dia de qualquer pro�ssional da área de exatas é o Excel. De modo bastante simples, podemos tabular dados e representá-los gra�camente. No site você encontrará um tutorial para representação de grá�cos utilizando o Excel. Aproveite para aprimorar suas habilidades! ACESSAR https://www.techtudo.com.br/dicas-e-tutoriais/noticia/2016/08/como-criar-graficos-no-excel.html 04/05/2020 Ead.br https://anhembi.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 16/45 Tabela 1.5- Distribuição do número médio de caixas produzidas por dia em cada fábrica Fonte: Elaborada pelo autor. A partir da tabela anterior, categorizaremos os 20 dados em 8 classes com amplitude igual a 5 caixas. 17 32 24 0 40 24 33 25 12 15 3 16 30 18 30 7 25 25 31 19 04/05/2020 Ead.br https://anhembi.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 17/45 Tabela 1.6 - Distribuição de frequência do número médio de caixas produzidas por dia em cada fábrica Fonte: Elaborada pelo autor. A partir do diagrama de frequências, construímos o histograma: Classes Frequência Absoluta Frequência Relativa [ 0 , 5 ] 2 10% ( 5 , 10 ] 1 5% ( 10 , 15 ] 2 10% ( 15 , 20 ] 4 20% ( 20 , 25 ] 5 25% ( 25 , 30 ] 2 10% ( 30 , 35 ] 3 15% ( 35 , 40 ] 1 5% Total 20 100% 04/05/2020 Ead.br https://anhembi.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 18/45 A seguir, você encontrará outros histogramas para auxiliar na compreensão. Para cada exemplo, tente identi�car o número de classes, a amplitude de cada classe, os limites inferiores e superiores de cada classe e a classe que possui maior frequência. Exemplo 1 Figura 1.1 - Distribuição do número de caixas de parafusos produzidas por cada uma das 20 fábricas. Fonte: Elaborada pelo autor. 04/05/2020 Ead.br https://anhembi.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 19/45 Esse histograma representa a distribuição da temperatura média diária da câmara de um frigorí�co, as quais foram divididas em 6 classes de amplitude igual a 2ºC. Exemplo 2 Figura 1.2 - Distribuição da temperatura média diária da câmara de um frigorí�co da cidade de Natal - RN - Abril de 2018 (ºC). Fonte: Elaborada pelo autor. Figura 1.3 - Distribuição dos salários dos 132 funcionários da empresa FTW em janeiro de 2020 Fonte: Elaborada pelo autor. 04/05/2020 Ead.br https://anhembi.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 20/45 Histograma de 5 classes representando a frequência dos salários dos 132 funcionários da empresa FTW em janeiro de 2020. praticarVamos Praticar Agora é sua vez de praticar! Utilizando papel milimetrado ou Excel, construa um histograma de frequências absolutas para o conjunto a seguir, utilizando o agrupamento dos dados em 3 classes. 3 3 6 9 12 14 15 18 18 18 18 04/05/2020 Ead.br https://anhembi.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 21/45 Grá�cos e tabelas estão presentes constantemente em nosso dia a dia. Seja nos jornais, na TV ou revistas cientí�cas, o uso dessas ferramentas estatísticas facilita a nossa compreensão quanto à informação que se deseja passar. Representar gra�camente signi�ca construir um desenho que compile, de maneira clara, o comportamento e a relação das variáveis em estudo. Para esboçá-los, podemos elaborar tabelas que nos forneçam os valores que estarão presentes na representação. A seguir, você verá uma sequência de tipos de grá�cos e uma recomendação quanto ao seu uso. Polígono de Frequência Grá�cos e TabelasGrá�cos e Tabelas 04/05/2020 Ead.br https://anhembi.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 22/45 É obtido ao ligarmos os pontos médios das classes de um histograma. O exemplo a seguir corresponde ao polígono de frequência obtido a partir do exemplo dos 30 parentes de Andrade (2018), apresentado anteriormente. Polígono de Frequência Relativa É uma variação do polígono de frequência no qual utilizamos a frequência relativa no eixo vertical. Muito útil quando queremos comparar mais de um dado. Nesse caso, é sugerido esboçar os polígonos no mesmo plano. Ogiva Figura 1.4 - Polígono de frequência da idade de 30 parentes do prof. Paulo Andrade em julho de 2018 Fonte: Elaborada pelo autor. Figura 1.5 - Polígono de Frequência Relativa da idade de 30 parentes do prof. Paulo Andrade em julho de 2018 Fonte: Elaborada pelo autor. 04/05/2020 Ead.br https://anhembi.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 23/45 Dessa vez, no eixo horizontal, consideramos o limite superior das classes do histograma e, no eixo vertical, consideramos as frequências acumuladas. Na �gura a seguir, por exemplo, concluímos que 25 dos parentes de Andrade (2018) têm idade inferior a 60 anos. Gráficos de Barras Usado para representação da frequência de dados qualitativos. Esses dados qualitativos são listados no eixo vertical e a frequência no eixo horizontal. Nesses casos, a frequência pode ser absoluta (número inteiro) ou relativa (em dados percentuais). Gráficos de Colunas Figura 1.6 - Ogiva de Frequência Relativa da idade de 30 parentes do prof. Paulo Andrade em julho de 2018 Fonte: Elaborada pelo autor. Figura 1.7 - Número de Médicos por mil habitantes por região do Brasil - 2012 Fonte: Elaborada pelo autor. 04/05/2020 Ead.br https://anhembi.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 24/45 Análogo ao grá�co de barras, porém, com dados qualitativos no eixo horizontal. A frequência deve ser indicada no eixo vertical. Nesses casos, a frequência pode ser absoluta (número inteiro) ou relativa (em dados percentuais), conforme ilustra ográ�co. Gráfico de Setores (ou de Pizza) Representa frequências de dados qualitativos a partir de setores de um círculo. Cada setor possui área proporcional à frequência relativa de cada um dos dados. Na �gura acima, por exemplo, podemos concluir que aproximadamente metade dos médicos do Brasil estava na região Sudeste em 2012. Figura 1.8 - Número de Médicos por mil habitantes por região do Brasil - 2012 Fonte: Elaborada pelo autor. Figura 1.9 - Número de Médicos por região do Brasil - 2012. Fonte: Elaborada pelo autor. 04/05/2020 Ead.br https://anhembi.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 25/45 Diagrama de Dispersão reflitaRe�ita Em muitas situações, desejamos deixar os grá�cos mais interessantes e atrativos para o leitor, de modo que desperte nele um interesse maior pelo conteúdo que se está sendo transmitido. Nesses casos, podemos optar pelo uso de infográ�cos, que consistem em grá�cos nos quais são inseridos elementos visuais mais elaborados. Por exemplo, em alguns casos, o autor troca os elementos do grá�co por ícones com design mais divertido, insere imagens de fundo e, até mesmo, combina vários formatos de grá�cos em um só. Re�ita sobre tal assunto. Fonte: Elaborado pelo autor. 04/05/2020 Ead.br https://anhembi.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 26/45 Grá�co utilizado para representação de dados quantitativos, no qual, em cada um dos eixos, representamos uma das variáveis. Os pares de dados são representados por pontos no grá�co. Esse tipo de grá�co é muito útil quando queremos veri�car a existência de relação entre duas variáveis. No exemplo acima, podemos perceber a existência de uma relação quadrática entre as variáveis tempo e altura. praticarVamos Praticar O condomínio Viver Bem realizou uma pesquisa de intenção de votos para os candidatos (X e Y) para síndico. Na �gura a seguir, você veri�cará o número de condôminos que possuem intenção de voto para cada um dos candidatos. Figura 1.10 - Dados experimentais de tempo e altura de um corpo em um lançamento vertical para cima Fonte: Elaborada pelo autor. 04/05/2020 Ead.br https://anhembi.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 27/45 Radio Radio Radio Radio Avalie as asserções a seguir e a relação existente entre elas. I. O grá�co apresentado está incorreto. PORQUE II. É inadequado para representação dos dados de intenção de votos, uma vez que leva o eleitor a entender que o candidato X está com grande quantidade de votos acima do candidato Y. A respeito dessas asserções, assinale a alternativa correta. a) As asserções I e II são corretas, e II é uma justi�cativa da I. b) As asserções I e II são corretas, e II não é uma justi�cativa da I. c) A asserção I é falsa e a asserção II é verdadeira. d) A asserção I é verdadeira e a asserção II é falsa. Figura - Número de Moradores que Declararam Intenção de Voto por Candidato a Síndico do Condomínio VIVERBEM Fonte: Elaborada pelo autor. 04/05/2020 Ead.br https://anhembi.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 28/45 Radio e) As asserções I e II são falsas. 04/05/2020 Ead.br https://anhembi.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 29/45 As medidas estudadas nesta seção servem para descrever, de forma geral, nosso conjunto e dados. As medidas de tendência central resumem, em um só número, nosso conjunto. As medidas de dispersão servem para “quanti�car” a variação dos meus dados. Medidas de Tendência Central As medidas de tendência central são aquelas que buscam representar o ponto de equilíbrio dos dados. São números que resumem, de alguma forma, o nosso conjunto. As mais importantes medidas de tendência central são a média, a mediana e a moda. Média Medidas deMedidas de Tendência CentralTendência Central e Dispersãoe Dispersão 04/05/2020 Ead.br https://anhembi.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 30/45 A média aritmética é a mais utilizada das medidas para a representação de um conjunto de dados, podendo ser facilmente calculada conforme fórmula a seguir: Exemplo: Catarina realizou quatro provas de Espanhol no decorrer do ano em um curso de Idiomas, com as notas a seguir: 1ª prova = 8,0; 2ª prova = 7,7; 3ª prova = 9,0; 4ª prova = 6,3. Para encontrar a média aritmética simples, somamos todas as notas e dividimos pela quantidade de provas realizadas. Dessa forma, a média das notas de Catarina foi 7,75. Média Ponderada A média ponderada é baseada na multiplicação de um peso a cada observação do conjunto de dados dividido pela soma dos pesos, ou seja, pode ser encontrada através da seguinte fórmula: Exemplo: X = + +...+x1 x2 xN N X = = 7, 75 8,0 + 7,7 + 9,0 + 6,3 4 X = ( )+ ( )+...+ ( )x1 P1 x2 P2 xN PN + + ... + P1 P2 PN 04/05/2020 Ead.br https://anhembi.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 31/45 Roberto participou de um concurso onde foram realizadas provas de Português, Matemática, História e Inglês. Essas provas tinham peso 4, 3, 2 e 1, respectivamente. Sabendo que Roberto tirou 9,0 em Português, 8,5 em Matemática, 6,0 em História e 7,5 em Inglês, qual foi a média? Dessa forma, a média das notas de Roberto foi 8,1. Mediana A mediana é o valor que está no centro de um conjunto de valores ordenados. Dessa forma, 50% dos elementos da amostra são menores ou iguais à mediana e os outros 50% são maiores ou iguais à mediana. Se o número de elementos da amostra é ímpar, a mediana é dada pelo valor central do conjunto de dados ordenados. Por exemplo, o conjunto {6, 2, 3, 11, 1, 8, 13}. Devemos ordenar os elementos e, em seguida, determinar o ponto central. { 1, 2, 3, 6, 8, 11, 13} Logo, a mediana para este conjunto de elementos é igual a 6. Se o número de elementos da amostra é par, a mediana é dada pela média dos valores centrais. Considerado o conjunto de dados anterior, se acrescentarmos o valor 16, teremos os seguintes valores centrais: {1, 2, 3, 6, 8, 11, 13, 16} Logo, a mediana é dada por: Dessa forma, a mediana para este conjunto de elementos é igual a 7. X = = = 8, 1 9,0(4)+8,5(3)+6,0(2)+7,5(1) 4 + 3 + 2 + 1 36+25,5+12+7,5 10 M = = 7d 6 + 8 2 04/05/2020 Ead.br https://anhembi.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 32/45 Moda A última medida de tendência central a ser abordada neste capítulo é a moda. Moda é de�nida como o valor mais frequente de um conjunto de dados, ou seja, o valor de maior ocorrência dentre os valores observados. Caso não exista um valor mais frequente, o conjunto de dados é denominado amodal. A representação da moda é dada por Mo. Exemplos: Considere o conjunto de dados a seguir: A = {3, 25, 7, 3, 1} A moda para esse conjunto é: Mo = 3. É o número que aparece o maior número de vezes. B = {19, 25, 3, 25, 10, 19} Neste exemplo, a moda é: Mo = 19 ou 25. Dessa forma, podemos dizer que o conjunto B é bimodal, pois possui duas modas. Medidas de Dispersão Medidas de dispersão são parâmetros estatísticos usados para determinar o quanto nossos dados variam. Esse indicador nos permite analisar a amostra de uma forma mais assertiva, uma vez que as medidas de tendência central, em alguns casos, escondem o nível de variação dos dados. Por exemplo, para de�nir uma brincadeira adequada para uma festa de aniversário, não podemos considerar apenas a média de idade dos convidados, uma vez que a variação das idades pode ser grande, o que deve pesar no momento da escolha da diversão. As medidas de dispersão mais usadas são: amplitude, variância, desvio padrão, coe�ciente de variação, percentis e quartis. 04/05/2020 Ead.br https://anhembi.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 33/45 Amplitude Essa medida de dispersão é de�nida como a diferença entre a maior e a menorobservação de um conjunto de dados, isto é: A = Xmaior - Xmenor A amplitude é a medida de dispersão menos utilizada, uma vez que não leva em consideração os dados intermediários do conjunto. Exemplo: As notas do aluno Matheus no ano de 2019 foram 4,0; 5,0; 9,0 e 10,0. Sendo assim, a amplitude das notas deles é: A = Xmaior - Xmenor = 10,0 – 4,0 = 6,0 Variância e Desvio Padrão A variância consiste na média dos quadrados, das diferenças entre cada uma das observações e a média aritmética da amostra. Considere uma amostra representada por {x1, x2, …, xn} de n observações numéricas. Existem duas fórmulas para calcular a variância. A variância populacional é de�nida por: onde ▁X é a média aritmética da distribuição. Já a variância amostral é de�nida por: onde ▁X é a média aritmética da distribuição. V ar (x) = +... + ( − )x1 X −− 2 +( − )x2 X −− 2 ( − )xn X −− 2 n V ar (x) = +... + ( − )x1 X −− 2 +( − )x2 X −− 2 ( − )xn X −− 2 n − 1 04/05/2020 Ead.br https://anhembi.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 34/45 O desvio padrão é outra forma de analisar a regularidade de um conjunto de valores. O desvio padrão de uma população é dado pela raiz quadrada da variância. Coeficiente de Variação O coe�ciente de variação é utilizado para veri�car a variabilidade do nosso conjunto de dados, calculado através da fórmula: Onde: s = desvio padrão; = média dos dados. Medidas de Posição Relativa Percentis são medidas que dividem os dados em 100 grupos, cada um deles contendo cerca de 1% do conjunto. Por explicar, o décimo segundo percentil, , tem 12% dos dados abaixo dele. De modo geral, para calcular o percentil que corresponde ao valor x, você deve utilizar a seguinte fórmula: Ao aplicar a fórmula, arredonde o resultado para o inteiro mais próximo. Para converter um percentil em um valor de dado, utilizando a fórmula a seguir. =σ2 +... + ( − )x1 X −− 2 +( − )x2 X −− 2 ( − )xn X −− 2 n − −−−−−−−−−−−−−−−−−−−−− √ CV = . 100s X − X − P12 percentil do valor x = ⋅ 100 n mero de valores menores que xú n mero total de valoresú 04/05/2020 Ead.br https://anhembi.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 35/45 Em que: L= localizador que nos fornece a posição de um valor (ou seja, a posição do dado procurado, uma vez que ordenemos nossa base); = k-ésimo percentil; n= número total de valores do conjunto. Quartis L = ⋅ n k 100 Pk saibamaisSaiba mais Este vídeo é parte de uma série de aulas, que traz explicações sobre Estatística. Nele, você conhecerá os tópicos abordados nesta disciplina e entenderá as principais áreas da estatística. Para saber mais sobre o conteúdo dessa unidade, recomendo assistir o vídeo. Fonte: Elaborado pelo autor. ASS IST IR 04/05/2020 Ead.br https://anhembi.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 36/45 Quartis são medidas que dividem os dados em 4 grupos, cada um contendo cerca de 25% do conjunto. Os três números são denotados por , e . O primeiro quartil ( ) separa os 25% menores valores dos 75% maiores valores. O terceiro quartil ( ) separa os 75% menores valores dos 25% maiores valores. O segundo quartil ( ) sempre coincide com a mediana, pois separa o conjunto em dois grupos de tamanhos iguais. Para calcular algum quartil, aplique a fórmula de cálculo de um percentil, assumindo as seguintes igualdades: , e . praticarVamos Praticar Analise o conjunto de dados: Q1 Q2 Q3 Q1 Q3 Q2 =Q1 P25 =Q2 P50 =Q3 P75 2 3 5 5 7 7 9 9 12 12 13 13 15 16 18 18 22 23 24 24 26 26 30 32 35 04/05/2020 Ead.br https://anhembi.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 37/45 O conjunto de dados “a” contém 25 números listados já em ordem crescente. Utilizando os conceitos já estudados nessa unidade, calcule o valor do segundo quartil do conjunto de dados e assinale a alternativa correspondente: a) 7. b) 15. c) 18. d) 24. e) 26. 04/05/2020 Ead.br https://anhembi.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 38/45 indicações Material Complementar L I V R O Introdução à Estatística - Atualização da Tecnologia - Capítulos 1, 2 e 3. Mario F. Triola. Editora: LTC. ISBN: 9788521634256. Comentário: Neste livro, você encontrará outros exemplos e aplicações de todo o conteúdo trabalhado na unidade, além de inúmeros exercícios para fortalecer e �xar seu aprendizado. 04/05/2020 Ead.br https://anhembi.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 39/45 W E B Estatística - Ensinem Estatística antes de Cálculo. Ano: 2009. Comentário: Neste TedTalk, o professor Arthur Benjamin alerta para uma forma de tornar o aprendizado de Matemática essencial na vida das pessoas. Em sua crítica, ele ressalta o fato dos currículos dos cursos superiores em Ciências Exatas dedicarem seu conteúdo de matemática para os pilares que conduzem o Cálculo Diferencial e Integral. Em outras palavras, ele a�rma que o aprendizado de Estatística e Probabilidade é o caminho para um conhecimento mais moderno e alinhado com o que se espera dos pro�ssionais do futuro. A C E S S A R https://www.ted.com/talks/arthur_benjamin_teach_statistics_before_calculus?language=pt-br 04/05/2020 Ead.br https://anhembi.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 40/45 conclusão Conclusão A partir de agora, você já apto a trabalhar com distribuições de frequência, realizar a análise de grá�cos e tabelas, além de calcular média, mediana, moda e algumas medidas de dispersão. Para �xar de�nitivamente o conteúdo lido, é importante que você se dedique a realizar exercícios sobre os temas aqui trabalhados. Como toda disciplina da área de exatas, dedicação e aplicação são fundamentais para a otimização do seu aprendizado. Bons estudos! referências Referências Bibliográ�cas DEVORE, J. L. Probabilidade e estatística para engenharia e ciências. São Paulo: Pioneira Thomson Learning, 2006. 04/05/2020 Ead.br https://anhembi.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 41/45 MONTGOMERY, D. C., RUNGER, G. C. Estatística aplicada e probabilidade para engenheiros. Rio de Janeiro: LTC - Livros Técnicos e Cientí�cos, 2003. TRIOLA, M. F. Introdução à Estatística: atualização da tecnologia. 11. ed. Rio de Janeiro, LTC, 2013. 04/05/2020 Ead.br https://anhembi.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 42/45 04/05/2020 Ead.br https://anhembi.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 43/45 04/05/2020 Ead.br https://anhembi.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 44/45 04/05/2020 Ead.br https://anhembi.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller 45/45
Compartilhar