Prévia do material em texto
Imprimir INTRODUÇÃO Olá, estudante! Os métodos grá�cos e os métodos tabulares são ferramentas de muita importância dentro da estatística, pois analisam dados e mostram os resultados de forma mais acessível. Eles permitem representar informações, muitas vezes complexas, de forma clara, precisa e intuitiva, auxiliando a compreensão das tendências, dos padrões e das relações existentes entre as variáveis em questão. Com o auxílio dos métodos grá�cos, podemos explorar dados e identi�car possíveis tendências de qualquer tipo de variável que possa ser exposta nesse formato. Já os métodos tabulares nos trazem um resumo e uma organização nos dados com os quais estamos trabalhando. A compreensão dos métodos grá�cos, assim como dos métodos tabulares, é de grande importância para a interpretação de dados e variáveis, e suas informações auxiliam a tomada de decisões. Aula 1 ESTATÍSTICA DESCRITIVA Com o auxílio dos métodos grá�cos, podemos explorar dados e identi�car possíveis tendências de qualquer tipo de variável que possa ser exposta nesse formato. Já os métodos tabulares nos trazem um resumo e uma organização nos dados com os quais estamos trabalhando. 20 minutos ESTATÍSTICA APLICADA E PROBABILIDADE Aula 1 - Estatística descritiva Aula 2 - Distribuição amostral das médias e das proporções Aula 3 - Planejamento e análise de experimentos Aula 4 - Métodos de tomada de decisão Aula 5 - Revisão da unidade Referências 147 minutos 11/10/2024, 19:07 wlldd_232_u4_met_mat https://www.avaeduc.com.br/mod/url/view.php?id=3340524 1/53 Bons estudos! 11/10/2024, 19:07 wlldd_232_u4_met_mat https://www.avaeduc.com.br/mod/url/view.php?id=3340524 2/53 MÉTODOS GRÁFICOS E TABULARES Na estatística, precisamos utilizar algumas técnicas e métodos para melhor compreender, analisar e interpretar os dados de interesse. Alguns resultados numéricos são su�cientes, mas se analisados juntamente com grá�cos e tabelas, nos levam a tomar melhores decisões, uma vez que, desta forma, temos uma visão mais especí�ca e detalhada dos acontecimentos. Os métodos grá�cos são técnicas usadas na estatística para representar de forma visual dados estatísticos. Pode-se dizer que é a representação em forma de grá�cos de valores, números e outras referências da informação. Eles utilizam grá�cos para exibir informações de maneira clara e intuitiva, auxiliando a compreensão de certos padrões, tendências e relações de um conjunto de dados que está sendo analisado. Os métodos grá�cos mais comuns podem ser obtidos por uma série de ferramentas, sendo que a mais utilizada é o Excel. Com a inserção dos dados em planilha própria deste programa, podemos construir grá�cos como: histograma, grá�co de barras, de colunas, de linha, entre vários outros, sempre dependendo do objetivo pretendido ao expor aqueles dados. Os grá�cos são construídos, em geral, após a depuração e organização dos dados. A construção de cada tipo de grá�co segue uma sequência lógica, não podendo ser generalizada a construção dos vários tipos existentes. Na sequência, veremos os tipos mais utilizados e como são construídos. Porém é importante salientar que todos os grá�cos precisam ter: Título: ele é usado para identi�car o grá�co e fornecer informações sobre o que está representando. Eixos x e y: em alguns grá�cos, são usados para identi�car as variáveis dependentes e independentes. Rótulos de eixo: identi�cam a grandeza que cada eixo representa. Legenda: é usada para identi�car as diferentes séries de dados. Em um grá�co, é importante apresentarmos a maior quantidade de informações possível, sem poluir a imagem. Figura 1 | Exemplos de grá�cos 11/10/2024, 19:07 wlldd_232_u4_met_mat https://www.avaeduc.com.br/mod/url/view.php?id=3340524 3/53 Fonte: Pexels. Os métodos tabulares, por sua vez, são técnicas da estatística utilizadas para representar dados em forma de tabelas. É por meio delas que podemos resumir e organizar, de forma clara e com fácil compreensão, uma série de dados, números, nomes e os mais diversos tipos de variáveis. As tabelas podem resumir, de forma organizada, muitos dados que poderiam não ser bem compreendidos caso não estivessem organizados. Existem vários tipos de tabelas e com intencionalidades diferentes. Porém, é importante que todas elas tenham: Título: é usado para identi�car a tabela e fornecer informações sobre o que ela está representando. Linhas: separam a tabela, sendo verticais e horizontais. Rótulos: são usados para identi�car as informações referentes às linhas e às colunas. Totalizadores: usados para resumir os dados, podendo ser a soma deles. Estes elementos são importantes para a clareza e interpretação correta de uma tabela. Além disso, é importante que sejam formatados de maneira clara e legível, para que os dados possam ser lidos e compreendidos facilmente. Quadro 1 | Exemplo de tabela – Orçamento da Educação (MEC) em bilhões Ano Orçamento inicial Contingenciamento Orçamento �nal 2014 124.698,60 7% 115.969,70 11/10/2024, 19:07 wlldd_232_u4_met_mat https://www.avaeduc.com.br/mod/url/view.php?id=3340524 4/53 2015 139.747,10 8% 128.567,33 2016 137.863,00 4% 132.348,48 2017 144.307,50 4% 138.535,20 2018 143.656,70 2% 140.783,57 2019 149.735,90 3,9% 143.896,20 Fonte: adaptada pela autora a partir do Portal MEC. 11/10/2024, 19:07 wlldd_232_u4_met_mat https://www.avaeduc.com.br/mod/url/view.php?id=3340524 5/53 TIPOS DE GRÁFICOS E DE TABELAS Os grá�cos e as tabelas trazem à análise de dados estatísticos uma melhor compreensão das informações. Além disso, são formas claras e concisas de mostrar os resultados desejados. De uma forma didática, os grá�cos e tabelas nos trazem uma compreensão visual das variáveis analisadas estatisticamente. Existem várias formas de representar gra�camente um conjunto de dados estatísticos e cada um deles tem um propósito e uma forma adequada para ser usado. Vejamos alguns dos tipos mais conhecidos e utilizados: Grá�co de barras: podem ser barras horizontais ou verticais. Serve para comparar diferentes categorias ou grupos. Grá�co de linhas: é utilizado para demonstrar a ascensão ou o declínio de uma variável ao longo de um determinado tempo. Grá�co de dispersão: é utilizado para demonstrar a relação entre duas variáveis. Histograma: é um grá�co de barras justapostas, ou seja, de barras grudadas umas às outras e serve para representar uma distribuição de frequências em classes de dados quantitativos. Box plot: além de representar os dados quantitativos, também é utilizado para representar a média, a mediana e os quartis. Grá�co setorial: também conhecido como grá�co de pizza, por se assemelhar ao formato uma. É utilizado quando se deseja mostrar a proporção do grupo ou das classes em relação ao todo. Em geral, neste grá�co, se usa a porcentagem. Na Figura 2, você pode observar alguns dos grá�cos citados acima, como o grá�co setorial, de barras, de linhas e algumas outras variações. É importante que você saiba que todos estes grá�cos podem ser construídos por meio do Excel apenas com o fornecimento das informações na planilha de dados quantitativos. Figura 2 | Exemplos de grá�cos estatísticos 11/10/2024, 19:07 wlldd_232_u4_met_mat https://www.avaeduc.com.br/mod/url/view.php?id=3340524 6/53 Fonte: Wikimedia Commons. As tabelas, assim como os grá�cos, nos dão uma in�nidade de possibilidades quanto à compreensão dos dados, pois, nelas, estes dados estão melhor estruturados e organizados, permitindo ao leitor uma melhor análise e interpretação. Assim como os grá�cos, as tabelas possuem vários tipos. As principais e mais utilizadas são: Tabela de frequência: usada para mostrar o número de ocorrências de determinada variável. Tabela 2 | Exemplo de tabela de frequência – Quantidade de alunos nos cursos de uma faculdade Cursos Quantidade de alunos matriculados Engenharias 586 Pedagogia 238 Direito 750 Administração 423 Ciências Contábeis 128 Psicologia 435 11/10/2024, 19:07 wlldd_232_u4_met_matque 86,21% das amostras apresentam resistência variando entre 73N/mm² e 95N/mm²; isso nos indica uma grande concentração delas com pouca dispersão, uma vez que temos 1,62 desvios para um lado e 1,37 desvios para outro. Esses valores mostram uma estabilidade. Agora podemos comparar, entre os três tipos diferentes de materiais, se há diferença signi�cativa entre eles. Para isso, façamos o cálculo da ANOVA: z = x−μ σ z = 73−84,9 7,36 = − 1,62 z = 95−84,9 7,36 = 1,37 11/10/2024, 19:07 wlldd_232_u4_met_mat https://www.avaeduc.com.br/mod/url/view.php?id=3340524 47/53 Construindo a tabela com a soma dos valores e com a soma de seus quadrados: Quadro 1 | Tipos de Materiais material 1 y² material 2 y² material 3 y² 70 4900 85 7225 90 8100 75 5625 81 6561 91 8281 80 6400 83 6889 93 8649 72 5184 87 7569 94 8836 78 6084 84 7056 92 8464 79 6241 82 6724 91 8281 81 6561 88 7744 89 7921 80 6400 93 8649 88 7744 76 5776 95 9025 93 8649 73 5329 89 7921 95 9025 total 764 58500 867 75363 916 50 Fonte: elaborada pela autora. Realizando os cálculos: H0: não há diferença entre os três tipos de materiais em relação a resistência à tração; Ha: há diferença entre os três tipos de materiais em relação a resistência à tração. C = (764+867+916)² 30 = 216.240,3 SQT = (58500 + 75363 + 83950) − 216.240,3 = 1.572,7 SQTr = [ (764)² 10 + (867)² 10 + (916)² 10 ] − 216.240,3 = 1.203,8 SQR = 1. 527, 7 – 1. 203, 8 = 323, 9 QMTr = 1203,82 = 601,9 QMR = 323,9 27 = 12 F = 601,912 = 50,2 11/10/2024, 19:07 wlldd_232_u4_met_mat https://www.avaeduc.com.br/mod/url/view.php?id=3340524 48/53 Assim resulta a tabela ANOVA: Quadro 2 | Tabela ANOVA resultante Fonte de variação Soma dos quadrados Graus de liberdade médias Estatística F Tratamentos 1203,8 2 601,9 50,2Resíduo 3239 27 12 Total 1527,7 29 Fonte: elaborada pela autora. Consultando a tabela F para G.L 2 e 27 e signi�cância de 5%, temos que o valor crítico é de 19,46. Figura 6 | Tabela F Fonte: Costa (2011, p. 284). Como a estatística F é maior que o valor crítico (50,2 > 19,46), rejeitamos a hipótese nula (H0). Assim, concluímos que há diferenças entre as médias dos três tipos de materiais quanto a sua resistência à tração. Uma vez que existe diferenças entre a resistência nos três tipos de materiais analisados, o ideal seria promover um teste de hipótese com o tipo de material e sua amostra que possui a maior média de resistência entre as três para ter um processo resistente e con�ável. Assim, ao realizar (em Excel) o cálculo da média dos três tipos de materiais, veri�camos aquele que possui a média com menor desvio padrão. Usamos a amostra com menos variabilidade: Quadro 3 | Média e desvio padrão dos materiais material 1 material 2 material 3 Estatística F 11/10/2024, 19:07 wlldd_232_u4_met_mat https://www.avaeduc.com.br/mod/url/view.php?id=3340524 49/53 Média 76,4 86,7 91,6 50,2desvio padrão 3,806427 4,643993 2,2211108 Total 1527,7 29 Fonte: elaborada pela autora. Observe que o material 3 possui uma média de resistência maior e com uma variabilidade menor. Então este material poderia ser considerado ideal. Para nos certi�carmos disto, vamos realizar um teste de hipóteses. No caso, um teste t, pois a amostra total é 30. Para isso, devemos seguir os passos de um teste de hipóteses: 1º. H0: a média da resistência é igual a 84,9 (encontrada no início do problema). Ha: a média da resistência é maior 84,9 (comparando com a nova média encontrada de 91,6). 2º. O valor crítico na tabela z para 5% de signi�cância ou 95% de con�ança é +1,645, como já visto em exercício anterior. 3º. Construindo as regiões de aceitação e rejeição, temos: 1. H0: a média da resistência é igual a 84,9 (encontrada no início do problema). Ha: a média da resistência é maior 84,9 (comparando com a nova média encontrada de 91,6). 2. O valor crítico na tabela z para 5% de signi�cância ou 95% de con�ança é +1,645, como já visto em exercício anterior. 3. Construindo as regiões de aceitação e rejeição, temos: Figura 7 | Regiões de aceitação e rejeição Fonte: elaborada pela autora. 4. Calcular o teste z: 5. Como 3,02 > 1,645, então veri�camos o teste z sobre a região de rejeição e concluímos que H0 é falsa. z = 91,6−84,9 2,22 = 3,02 11/10/2024, 19:07 wlldd_232_u4_met_mat https://www.avaeduc.com.br/mod/url/view.php?id=3340524 50/53 Neste sentido, podemos a�rmar que, se utilizarmos apenas o material 3, esse nos fornecerá uma maior resistência à tração para a fabricação deste novo motor, descartando o uso dos outros dois tipos de materiais. Todo este estudo nos mostra a aplicação dos 4 principais temas vistos até aqui, suas conexões e a importância deles para a tomada de decisões. Adicionalmente, conheça mais um contexto de aplicação para os conceitos abordados. Em uma indústria de fabricação de peças de aço, a equipe de engenharia notou que a produtividade no processo de fabricação de uma determinada peça estava abaixo do esperado e que a qualidade do produto �nal não estava atendendo aos padrões de qualidade estabelecidos. Com o objetivo de melhorar o processo de fabricação, a equipe decidiu aplicar ferramentas estatísticas, tais como grá�cos, tabelas, distribuição normal, ANOVA e testes de hipóteses. Inicialmente, foi feita uma análise exploratória dos dados coletados do processo de fabricação, utilizando grá�cos e tabelas para identi�car possíveis pontos de melhoria. Foi constatado que a variabilidade nos dados era alta, o que sugeria que havia algum fator que estava causando instabilidade no processo. Em seguida, a equipe decidiu aplicar a distribuição normal para analisar a distribuição dos dados coletados. Com base nos resultados obtidos, foi possível identi�car que a distribuição dos dados seguia a curva normal, o que permitiu a aplicação da ANOVA para comparar os valores médios entre as diferentes etapas do processo de fabricação. Os resultados da ANOVA mostraram que havia diferença signi�cativa entre as etapas do processo de fabricação, sugerindo que a variação na qualidade do produto �nal poderia estar sendo causada por diferenças no processo em cada etapa. Com base nessa informação, a equipe decidiu investigar mais a fundo cada etapa do processo, a �m de identi�car possíveis causas da variabilidade. Para isso, foram realizados testes de hipóteses para comparar as médias de cada etapa do processo com a média geral do processo. Os testes de hipóteses mostraram que a média de uma das etapas do processo era signi�cativamente diferente da média geral do processo, o que sugeriu que essa etapa poderia estar causando a variabilidade observada nos dados. A equipe decidiu realizar uma análise detalhada dessa etapa do processo, identi�cando que a temperatura de um dos equipamentos estava oscilando muito. Isso estava afetando a qualidade do produto �nal. Foi realizada uma calibração no equipamento e, após essa mudança, a variação nos dados foi reduzida e a qualidade do produto �nal melhorou signi�cativamente. Por �m, a equipe de engenharia concluiu que a aplicação das ferramentas estatísticas permitiu uma análise mais detalhada do processo de fabricação, identi�cando possíveis pontos de melhoria e permitindo a tomada de decisão com base em evidências quantitativas! Decisões importantes como esta, se tomadas de forma errada, podem comprometer muitos processos e colocar, inclusive, vidas em riscos, como vimos no nosso estudo de caso. RESUMO VISUAL 11/10/2024, 19:07 wlldd_232_u4_met_mat https://www.avaeduc.com.br/mod/url/view.php?id=3340524 51/53 Fonte: elaborada pela autora. Aula 1 BONAFINI, F. C. (org.). Probabilidade e estatística. São Paulo: Pearson Education do Brasil, 2015. BUSSAB, W.; MORETTIN, P. Estatística Básica. São Paulo: Saraiva, 2002. COSTA, G. G. de O. Curso de Estatística básica: teoria e prática. São Paulo: Atlas, 2011. SPIEGEL, M. Estatística. São Paulo: Makron Books, 1993. Aula 2 BONAFINI, F. C. (org.). Probabilidade e estatística. São Paulo: PearsonEducation do Brasil, 2015. BUSSAB, W.; MORETTIN, P. Estatística Básica. São Paulo: Saraiva, 2002. COSTA, G. G. de O. Curso de Estatística básica: teoria e prática. São Paulo: Atlas, 2011. SPIEGEL, M. Estatística. São Paulo: Makron Books, 1993. REFERÊNCIAS 2 minutos 11/10/2024, 19:07 wlldd_232_u4_met_mat https://www.avaeduc.com.br/mod/url/view.php?id=3340524 52/53 Imagem de capa: Storyset e ShutterStock. Aula 3 BONAFINI, F. C. (org.). Probabilidade e estatística. São Paulo: Pearson Education do Brasil, 2015. BUSSAB, W.; MORETTIN, P. Estatística Básica. São Paulo: Saraiva, 2002. COSTA, G. G. de O. Curso de Estatística básica: teoria e prática. São Paulo: Atlas, 2011. SPIEGEL, M. Estatística. São Paulo: Makron Books, 1993. Aula 4 BONAFINI, F. C. (org.). Probabilidade e estatística. São Paulo: Pearson Education do Brasil, 2015. BUSSAB, W.; MORETTIN, P. Estatística Básica. São Paulo: Saraiva, 2002. Aula 5 BONAFINI, F. C. (org.). Probabilidade e estatística. São Paulo: Pearson Education do Brasil, 2015. BUSSAB, W.; MORETTIN, P. Estatística Básica. São Paulo: Saraiva, 2002. COSTA, G. G. de O. Curso de Estatística básica: teoria e prática. São Paulo: Atlas, 2011. DOWNING, D.; CLARK, J. Estatística Aplicada. 2ª ed. São Paulo: Saraiva, 2006. SPIEGEL, M. Estatística. São Paulo: Makron Books, 1993. 11/10/2024, 19:07 wlldd_232_u4_met_mat https://www.avaeduc.com.br/mod/url/view.php?id=3340524 53/53 https://storyset.com/ https://www.shutterstock.com/pt/https://www.avaeduc.com.br/mod/url/view.php?id=3340524 7/53 Total 2.460 Fonte: elaborada pela autora. Tabela de distribuição de frequência: usada para mostrar a contagem do número de frequências dos itens estudados; também pode comportar as frequências acumulada crescente, acumulada decrescente e a frequência relativa. Tabela 3 | Exemplo tabela de distribuição de frequência – Medidas dos diâmetros (em cm) de uma peça da produção da indústria Y CLASSES (cm) F 10 ├ 12 2 12 ├ 14 2 14 ├ 16 7 16 ├ 18 3 18 ├ 20 5 20 ├ 22 0 22 ├ 24 1 ⅀ 20 Fonte: elaborada pela autora. Tabela de contingência: usada para mostrar a relação existente entre duas ou mais variáveis. Tabela 4 | Exemplo de tabela de contingência – Número de pessoas em situação laboral de acordo com sua escolaridade Escolaridade Situação no mercado desempregado empregado apenas estudando Ensino médio completo 125 250 56 Ensino superior 123 270 42 11/10/2024, 19:07 wlldd_232_u4_met_mat https://www.avaeduc.com.br/mod/url/view.php?id=3340524 8/53 Pós-graduação 89 350 23 Fonte: elaborada pela autora. Há ainda a tabela cruzada, que é uma variação da tabela de contingência. Nela, são apresentadas informações sobre a distribuição de uma variável em relação à outra. Estes tipos de tabelas não são únicos, mas são os mais utilizados e possuem maior relevância nos estudos estatísticos. Cabe ressaltar que a escolha do tipo de tabela correta vai depender do tipo da variável a ser analisada, além do objetivo do estudo. As tabelas, quando bem elaboradas, confeccionadas e escolhidas de forma adequada, trazem uma grande riqueza de informações e auxiliam conclusões assertivas e tomada de decisões de grande êxito. Conhecer os principais tipos de tabelas e grá�cos é muito importante dentro da tomada de decisões. Dados bem apresentados fornecem informações com mais clareza. GRÁFICOS E TABELAS: O USO DO EXCEL A ideia de construir grá�cos e tabelas para representar dados estatísticos é utilizar uma ferramenta a mais de interpretação. É importante lembrar também que a escolha do grá�co e da tabela depende muito do objetivo da pesquisa. Podemos citar algumas aplicações em que mais se utilizam grá�cos e tabelas: Na análise exploratória de dados, na qual os grá�cos e as tabelas são úteis para visualizar e explorar os dados antes mesmo de serem feitas análises mais avançadas, propiciando ao pesquisador uma ideia mais precisa dos resultados encontrados. Na comunicação de resultados para um público não técnico; neste caso, os grá�cos e as tabelas são a forma mais indicada. Na modelagem de dados, os grá�cos e as tabelas possuem uma grande importância, pois fazem com que os dados mostrem e apresentem uma certa tendência, de modo que podemos visualizar a relação entre as variáveis, para então poder escolher o modelo estatístico que mais se adeque aos dados. No estudo de tendências, os grá�cos e as tabelas podem mostrar o comportamento das variáveis que estão sendo analisadas, pois provisionam valores futuros com base na análise dos dados daquilo que já aconteceu. Na comparação de grupos, os grá�cos e as tabelas mostram o comportamento de cada um deles e comparam-nos ao mesmo tempo. Na identi�cação de outliers, pois os grá�cos e tabelas podem auxiliar a identi�cação destes pontos fora da curva ou fora do comportamento padronizado ou de tendência, fazendo com que se possa detectar 11/10/2024, 19:07 wlldd_232_u4_met_mat https://www.avaeduc.com.br/mod/url/view.php?id=3340524 9/53 possíveis falhas ou erros dentro do processo. É importante salientar que grá�cos e tabelas devem ser construídos com o auxílio de softwares especí�cos para se obter os melhores e mais precisos resultados. O software mais utilizado para construir grá�cos é o Excel, que possui diversas possibilidades. Seu uso é auto sugestivo e possui ferramentas visuais e cálculos estatísticos disponíveis. Outros softwares como o libreO�ce Calc e o editor de planilhas eletrônicas do Google também são excelentes ferramentas gratuitas, embora pouco populares. A interface do Excel parece uma grande tabela pronta para ser preenchida, com disposição de linhas e colunas. Uma vez inseridos os dados para construir grá�cos, basta selecionar os dados e buscar o botão de inserir grá�cos, escolher o que mais se adeque às suas necessidades e solicitar a construção. Após a escolha do grá�co, é necessário dar um título a ele, construir as legendas e estabelecer os eixos, quando for o caso. Contudo, por ser uma ferramenta, o trabalho manual de inserir as informações de forma correta ainda é essencial para um bom resultado. Um exercício interessante é você, estudante, vivenciar essa criação de grá�co pelo Excel. Monte uma tabela com os seguintes dados: gastos com alimentação, transporte e diversão dos últimos 10 meses, coloque na planilha do Excel. Após preencher a planilha, selecione os dados e escolha a opção inserir e escolha um grá�co que seja capaz de mostrar a comparação dos gatos com estes três itens. Perceba que uma boa sugestão quanto ao formato do grá�co para isto é o de linhas, e que você pode usar vários formatos dele. Veja no exemplo 1 como �caria: Figura 3 | Simulação de tabela e grá�co dos gastos com alimentação, transporte e diversão, obtidos pelo Excel Fonte: captura de tela do Microsoft Excel. 11/10/2024, 19:07 wlldd_232_u4_met_mat https://www.avaeduc.com.br/mod/url/view.php?id=3340524 10/53 VIDEO RESUMO Você verá, neste vídeo, como os grá�cos e tabelas auxiliam de forma clara e concisa a depuração e interpretação de dados estatísticos. Uma boa análise estatística e a assertiva tomada de decisões depende de escolher bem um grá�co e uma tabela para representar os dados. Grá�cos e tabelas são formas de expressar dados quantitativos de maneira que possamos ter uma melhor compreensão do seu comportamento. Saiba mais Você conhece o Tableau Public? Trata-se de um software especialista em análise de dados, com possibilidade de criar grá�cos dinâmicos e estruturas nem sempre disponíveis no Excel. Con�ra-o e se aprofunde neste vasto campo. INTRODUÇÃO Olá, estudante! A distribuição amostral e a distribuição normal são conceitos fundamentais para a área da estatística. São elas que permitem generalizar, para dados populacionais, valores e resultados obtidos de forma amostral. Estas distribuições de probabilidade consideram todas as amostras possíveis de mesmo tamanho, tomadas sempre de uma mesma população. Com estas distribuições, podemos modelar muitos processos dentro da engenharia, por exemplo, além de melhor compreendê-los. Dentro das consideradas distribuições de probabilidade contínuas, a distribuição normal é a que merece o maior destaque. Sua importância está sobretudo por ter sua construção advinda de um histograma. Bons estudos! Aula 2 DISTRIBUIÇÃO AMOSTRAL DAS MÉDIAS E DAS PROPORÇÕES A distribuição amostral e a distribuição normal permitem generalizar, para dados populacionais, valores e resultados obtidos de forma amostral. 26 minutos 11/10/2024, 19:07 wlldd_232_u4_met_mat https://www.avaeduc.com.br/mod/url/view.php?id=3340524 11/53 https://public.tableau.com/app/discover DISTRIBUIÇÕES AMOSTRAIS E DISTRIBUIÇÃO NORMAL As técnicas de contagem são métodos matemáticos usados para contar o número de maneiras que determinados eventos podem ocorrer. Essas técnicas são usadas para resolver problemas envolvendo combinações e arranjos de objetos, probabilidade, teoria da contagem e outros campos da matemática e da estatística. Algumas das técnicas de contagem mais comuns incluem fórmulas de combinações, princípios de inclusão-exclusão, métodos de recorrência e probabilidade de Markov. Essas técnicas são amplamente utilizadas para resolver problemas envolvendo contagem e probabilidade na matemática, na estatística, na computação, na engenharia, na biologia e em outras áreas. A distribuição amostral é a distribuição dos valores de uma variável em uma amostra aleatória de dados. Em outras palavras, a distribuiçãoamostral representa a frequência com que determinados valores aparecem na amostra. Ela pode ser representada gra�camente por um histograma ou por uma função de densidade de probabilidade. É importante notar que a distribuição amostral é uma estimativa aproximada da distribuição verdadeira dos dados na população, e que a forma da distribuição amostral pode variar de amostra a amostra. Esta deve ser, obrigatoriamente, �el à população. Para representarem uma população, as amostras devem possuir as mesmas características que ela. A distribuição normal é uma das distribuições de probabilidade mais importantes e amplamente utilizadas na estatística. Ela é uma distribuição contínua de probabilidade que é simétrica em relação a uma média, denotada por μ, e com uma variância, denotada por σ² ou pelo desvio padrão, que é a raiz quadrada da variância. Além disso, a distribuição normal é unimodal, seu prolongamento horizontal vai de - ∞ até + ∞, sendo uma curva suave abaixo da qual se encontra uma probabilidade de ocorrência de evento de 100%. A distribuição normal é descrita por uma função de densidade de probabilidade, que pode ser representada por uma curva gaussiana ou curva de sino. A distribuição normal é importante porque muitos fenômenos naturais e sociais apresentam distribuições que se aproximam da curva normal. Além disso, a distribuição normal fornece uma base teórica para muitas técnicas estatísticas, como a inferência estatística e a modelagem. A grande maioria dos fenômenos, naturais ou não, podem ser representados por uma distribuição normal. Sua base ocorre por uma distribuição de frequências em classes, com a construção de um histograma de representação. Pode-se notar que muitas variáveis contínuas tendem a ter, em geral, um comportamento dito “normalizado”, justamente pelo seu comportamento unimodal, com média de referência, margem de erro e continuidade como características. Neste caso, este tipo de variável gera indicadores que encaminham a tomada de decisões. Figura 1 | Exemplo de curva normal 11/10/2024, 19:07 wlldd_232_u4_met_mat https://www.avaeduc.com.br/mod/url/view.php?id=3340524 12/53 Fonte: Wikimedia Commons. Nota-se que a curva normal tem o formato de sino, é suave, e unimodal. Seus parâmetros são a média – valor mais central – e o desvio padrão ou a variância. O centro, onde se encontram a média e a moda, é a parte mais alta da curva e, neste mesmo ponto, há a divisão da curva em duas partes simétricas. A CURVA NORMAL OU DE GAUSS Para melhor exempli�car como os dados contínuos podem ser interpretados e, assim, nos levar à tomada de decisões mais assertivas em relação ao comportamento destas variáveis, aprofundaremos o estudo da distribuição normal, também conhecida como curva de Gauss. A curva normal é chamada de “curva de Gauss” em homenagem ao matemático alemão Carl Friedrich Gauss (1777-1855). Gauss é considerado um dos maiores matemáticos de todos os tempos e fez importantes contribuições para a estatística, incluindo a teoria da distribuição normal. Ele foi um dos primeiros a compreender a importância da distribuição normal na representação de dados e na modelagem de fenômenos naturais e sociais com variáveis contínuas. Além disso, ele desenvolveu métodos para calcular probabilidades na distribuição normal, o que é amplamente utilizado até os dias de hoje. Gauss desenvolveu inúmeras formas de estabelecer a probabilidade de ocorrência de um certo evento com base no comportamento de dados “normalizados”, ou seja, que podem ser representados por meio de uma curva normal. Uma das maneiras mais simples de obter esta probabilidade é pelo cálculo do escore reduzido (z). Este valor é obtido pela fórmula representada na Figura 2. Depois, busca-se sua probabilidade correspondente na tabela, criada por Gauss, chamada de tabela z – escore reduzido. Figura 2 | Cálculo do escore reduzido z = x−μ σ 11/10/2024, 19:07 wlldd_232_u4_met_mat https://www.avaeduc.com.br/mod/url/view.php?id=3340524 13/53 Fonte: elaborada pela autora. As variáveis desta fórmula são: z = escore reduzido, valor a ser buscado na tabela. X = variável aleatória, valor cuja probabilidade até à média se deseja encontrar. μ = média aritmética amostral. σ = desvio padrão amostral. O cálculo do escore reduzido pode ser feito também por meio do cálculo de uma integral. A curva normal é classi�cada de acordo com duas características: a média (μ) e a desvio padrão (σ). A média representa o valor central dos dados, enquanto o desvio padrão representa a dispersão dos dados em relação à média. A classi�cação da curva normal é baseada na comparação dessas duas medidas, ou seja, se a média é alta ou baixa e se o desvio padrão é grande ou pequeno. Algumas das classi�cações mais comuns são: Curva normal padrão: é aquela em que a média vale zero e o desvio padrão vale um. Curva normal simétrica: é aquela que tem simetria em relação à média. Curva normal assimétrica: é aquela em que um dos lados não tem simetria em relação ao outro. Curva normal larga: é aquela em que, sendo a média a mesma, o desvio padrão é maior, havendo mais dispersão. Curva normal estreita: é aquela em que, sendo a média a mesma, o desvio padrão é menor, havendo menos dispersão. Também podemos estudar e classi�car a curva normal pela sua assimetria e pela sua curtose. Mas, o que são assimetria e curtose? Assimetria se refere à inclinação ou desequilíbrio de uma distribuição em relação à sua média. Uma distribuição é considerada assimétrica positiva se a cauda da direita é mais longa do que a da esquerda, e assimétrica negativa se a cauda da esquerda é mais longa do que a da direita. Figura 3 | Assimetria da curva normal 11/10/2024, 19:07 wlldd_232_u4_met_mat https://www.avaeduc.com.br/mod/url/view.php?id=3340524 14/53 Fonte: adaptada de Wikimedia Commons. Curtose é a medida do achatamento de uma distribuição. Uma distribuição pode ser classi�cada pelo seu achatamento em: Mesocúrtica (quando o cálculo da curtose é igual a 0,263). Platcicúrtica (quando o cálculo da curtose é maior que 0,263). Leptocúrtica (quando o cálculo da curtose é menor que 0,263). A curva normal tem uma assimetria próxima de zero e uma curtose próxima de três, o que signi�ca que é uma distribuição simétrica e relativamente achatada. As medidas de assimetria e curtose são importantes porque ajudam a descrever a forma da distribuição e a determinar se uma distribuição é anômala ou não. Figura 4 | Curva normal classi�cada pela sua curtose Fonte: Scribbr. ESCORE REDUZIDO 11/10/2024, 19:07 wlldd_232_u4_met_mat https://www.avaeduc.com.br/mod/url/view.php?id=3340524 15/53 Nos aprofundando um pouco mais no estudo da distribuição normal ou curva de Gauss, podemos, com seu conceito, estabelecer e conhecer um pouco mais sobre a forma com que trabalhamos com esta curva. A curva normal possui um formato particular, a partir de suas características, seus parâmetros e suas respectivas probabilidades de ocorrência. Figura 5 | Curva normal padronizada Fonte: Wikimedia Commons. Percebemos que, a partir do ponto mais central, onde se localizam a média e a moda, temos áreas simétricas. Quando, a partir da média, temos um desvio padrão para a direita e um desvio padrão para a esquerda, totalizamos uma probabilidade de ocorrência de evento de 68,26%. Já quando esta mesma situação ocorre com dois desvios para cada lado, a possibilidade de ocorrência do evento é de 95,44%. E, com três desvios padrão, as chances de ocorrência deste evento é de 99,74%. Observe que, quanto mais nos afastamos da média, maior é a probabilidade de ocorrência do evento. Mas como determinar estes percentuais? Por meio da tabela z do escore reduzido, com sua fórmula própria, como visto anteriormente. Após realizar o cálculo do escore reduzido, buscamos o valor na tabela z e determinamos, multiplicando por 100, o valor de probabilidade que nela consta, obtendo, assim, o percentual. Figura 6 | Tabela z: curva normal padronizada– unilateral 11/10/2024, 19:07 wlldd_232_u4_met_mat https://www.avaeduc.com.br/mod/url/view.php?id=3340524 16/53 Fonte: Costa (2011, p. 271). Note que, pela tabela, o valor na coluna da esquerda de 1,0 em encontro com o valor da linha superior no valor 0, nos fornece uma probabilidade de ocorrência de evento de 0,3413. Multiplicado por 100, geram-se os 34,13%, um desvio de dispersão da média. Dispersando um desvio para a direita e um para a esquerda e somando os dois valores, obtemos 6,26%, como observamos na Figura 5. Vejamos uma situação em que utilizaremos a curva normal. Imagine que uma empresa de produção de baterias quer determinar o tempo médio que uma de suas baterias dura. Eles realizam um experimento aleatório com 1000 baterias e, para todas elas, medem o tempo de vida de cada uma. Após realizar as medidas, constatam que a média de durabilidade de cada uma delas é de 200 horas com uma margem de erro, neste caso, um desvio padrão de 50 horas. 11/10/2024, 19:07 wlldd_232_u4_met_mat https://www.avaeduc.com.br/mod/url/view.php?id=3340524 17/53 Com base nestes dados, podemos construir uma curva normal para representar a distribuição de tempo de vida das baterias. Sabemos que a média é 200 horas e o desvio padrão é 50 horas, então podemos usar essas informações para encontrar a probabilidade de uma bateria durar menos de 150 horas. Para fazer isso, podemos usar a fórmula da curva normal para calcular o valor z associado a 150 horas e, em seguida, consultar uma tabela z para encontrar a probabilidade associada. Aplicando a fórmula do escore reduzido, teremos: Consultando a tabela z da curva normal, teremos o valor 0,3413 associado a este escore reduzido, que multiplicado por 100, gera uma probabilidade de 34,13% de chance de ocorrer baterias durando entre 150 e 200 horas, mas como se deseja saber a probabilidade de baterias durarem menos de 150 horas, devemos subtrair este resultado encontrado de 50%, o que nos fornece uma resposta �nal de 15,87%, que é a chance de que uma bateria tenha menos que 150 horas de duração. Mas por que devemos diminuir 50%? Como os cálculos com a curva normal sempre nos fornecem o valor da média até um valor aleatório qualquer, quando querermos menos que um valor que está à esquerda da média ou um valor superior a outro que esteja à direita da média, devemos subtrair da metade da curva o valor encontrado, para então obter o resultado que chamamos de valor de cauda. Figura 7 | Cálculo tabela z Fonte: elaborada pela autora. VÍDEO RESUMO Você verá, neste vídeo, a importância que as distribuições amostrais e de probabilidade exercem na estatística. Sobretudo, a distribuição normal ou curva de Gauss. A distribuição amostral e a distribuição normal são conceitos fundamentais para o entendimento da estatística e para a análise de dados em muitas áreas, incluindo ciências sociais, biomedicina, engenharia, entre outras. z = 150−200 50 = − 50 50 = −1 11/10/2024, 19:07 wlldd_232_u4_met_mat https://www.avaeduc.com.br/mod/url/view.php?id=3340524 18/53 Saiba mais Você conhece o Minitab? Ele é um software de análise estatística completo que possui uma série de ferramentas para trabalhar com curvas normais, incluindo grá�cos e cálculos de probabilidade. Con�ra todas as possibilidades estatísticas deste software. INTRODUÇÃO Olá, estudante! Um dos principais objetivos da estatística é trazer informações sobre processos, preferências e comportamentos. Além disso, a estatística é responsável por fornecer muitos dados para um setor dentro da área de produção, que é o da qualidade. Este setor, que teve seu auge nos anos de 1990, busca trazer métodos e formas de mostrar como os processos e produções podem ser controlados pelos seus aspectos de qualidade. Das várias formas existentes dentro da estatística para realizar este controle, temos uma das mais importantes, conhecidas como análise de variância ou, simplesmente, ANOVA. Veremos nesta aula, como a ANOVA pode ser uma arma poderosa para certo tipo de controle dentro da área da qualidade. Bons estudos! ANÁLISE ESTATÍSTICA Experimentos aleatorizados com um único fator são um tipo de experimento que busca avaliar o efeito de um único fator sobre uma variável resposta. Nesse tipo de experimento, o pesquisador manipula um único fator, enquanto mantém todos os outros constantes, e observa o efeito da variação dele na variável resposta. O objetivo é determinar se existe uma relação causal entre o fator manipulado e a variável resposta, bem como quanti�car a magnitude dessa relação. Esses experimentos são amplamente utilizados em diversas áreas da ciência, como medicina, psicologia, biologia, agronomia, entre outras. Aula 3 PLANEJAMENTO E ANÁLISE DE EXPERIMENTOS A estatística é responsável por fornecer muitos dados para um setor dentro da área de produção, que é o da qualidade. Este setor, que teve seu auge nos anos de 1990, busca trazer métodos e formas de mostrar como os processos e produções podem ser controlados pelos seus aspectos de qualidade. 27 minutos 11/10/2024, 19:07 wlldd_232_u4_met_mat https://www.avaeduc.com.br/mod/url/view.php?id=3340524 19/53 https://www.minitab.com/pt-br/products/minitab/free-trial/ Alguns exemplos de experimentos aleatorizados com um único fator são: Um experimento para determinar a e�cácia de diferentes medicamentos para reduzir a pressão arterial em pacientes com hipertensão. O fator em estudo é o tipo de medicamento, e os pacientes são randomizados para receber um dos medicamentos em estudo ou um placebo. Um experimento para determinar a e�cácia de diferentes fertilizantes na produção de uma determinada cultura. O fator em estudo é o tipo de fertilizante, e as parcelas de terra são randomizadas para receber um dos fertilizantes em estudo ou nenhum fertilizante. Existem várias técnicas para realizar experimentos aleatorizados com um único fator. Algumas das mais comuns incluem: Completamente aleatório: nesta técnica, os sujeitos são atribuídos aleatoriamente a cada tratamento. Blocos aleatórios: nesta técnica, os sujeitos são divididos em grupos semelhantes e depois são aleatoriamente designados para um tratamento dentro desse grupo. Casos pareados: nesta técnica, os sujeitos são pareados com base em alguma característica e depois cada par é aleatoriamente designado para um tratamento. Fatorial: nesta técnica, dois ou mais fatores são combinados e cada combinação é usada como um tratamento. Essas técnicas podem ser utilizadas em diversos tipos de estudos e pesquisas, permitindo que os pesquisadores avaliem o efeito de diferentes variáveis em uma determinada resposta. A ANOVA (análise de variância) é uma técnica estatística utilizada para realizar experimentos aleatorizados com um único fator. ANOVA é uma técnica estatística utilizada para comparar a média de três ou mais grupos independentes e determinar se existem diferenças signi�cativas entre essas médias. Ela compara a variação entre grupos com a variação dentro de cada grupo, para veri�car se ela é signi�cativamente maior do que a dentro dos grupos. Se a variação entre os grupos for signi�cativa, a hipótese nula de que todas as médias são iguais é rejeitada e conclui-se que pelo menos uma média é diferente das demais. A ANOVA pode ser usada em diversos contextos, como em estudos experimentais, em pesquisas de mercado, na análise de dados �nanceiros, entre outros. Alguns exemplos de aplicações são: Na pesquisa de mercado: usada para comparar a opinião dos consumidores sobre diferentes produtos ou marcas. No controle de qualidade: aplicada para comparar a qualidade de produtos fabricados em diferentes locais ou por diferentes fornecedores. Na agricultura: usada para comparar o desempenho de diferentes sementes ou tipos de culturas em diferentes condições climáticas. 11/10/2024, 19:07 wlldd_232_u4_met_mat https://www.avaeduc.com.br/mod/url/view.php?id=3340524 20/53 Na engenharia: aplicada para avaliar a in�uência de diferentes variáveisno desempenho de um produto, como a resistência de materiais em diferentes condições de teste. ANÁLISE DE VARIÂNCIA Sendo a ANOVA, uma ferramenta estatística tão importante para analisar se existe uma diferença signi�cante entre as médias, e sabendo que os fatores exercem in�uência nesta diferença, faz-se importante conhecer primeiramente os erros que devem ser levados em consideração, para que os resultados da análise sejam válidos. São eles: Ausência de dados discrepantes. Erros independentes. Variância constante. Distribuição dos erros normal. Estes pressupostos básicos devem ser levados em consideração para que a ANOVA e seus resultados tenham validade. A análise da variância só é feita se decompormos a variância total das observações em duas componentes: a variância dos tratamentos e a dos resíduos, também chamada de variância dos erros. Se a variância do tratamento for maior do que a calculada com os resíduos, podemos concluir que existe diferença signi�cativa entre as médias. Mas como calculamos a análise de variância? A tabela ANOVA para determinar se há diferença entre as médias de um grupo na análise de variância com um fator pode ser resumida no Quadro 1: Quadro 1 | ANOVA de um fator Fonte de variação Soma dos quadrados Graus de liberdade médias Estatística F Tratamentos SQTr k-1 QMTr QMTr/QMRResíduo SQR n-k QMR Total SQT n-1 Fonte: adaptada pela autora a partir de Costa (2011). Na qual: SQTr = é a soma dos quadrados dos grupos (tratamentos). SQR = é a soma dos quadrados dos resíduos, dentro dos grupos. 11/10/2024, 19:07 wlldd_232_u4_met_mat https://www.avaeduc.com.br/mod/url/view.php?id=3340524 21/53 SQT = SQTr + SQR (mede a variação geral de todas as observações). QMTr = média quadrada dos grupos. QMR = média quadrada dos resíduos (entre os grupos). No caso de haver dois fatores a serem analisados pela ANOVA, a tabela para cálculo seria a mesma, adicionando a soma e a média para os blocos. Os blocos encontram-se nas linhas e são variáveis de per�l in�uentes nas medidas do estudo, cujas categorias se comportam de forma heterogênea na população. Por este motivo, o experimento deve estrati�car estas categorias (COSTA, 2011). Assim �caria a tabela ANOVA para dois fatores: Quadro 2 | Tabela de cálculo da ANOVA para 2 fatores Fonte de variação Soma dos quadrados Graus de liberdade médias Estatística F Tratamentos SQTr k-1 QMTr QMTr/QMR Blocos SQB r-1 QMB Resíduo SQR n-k QMR Total SQT n-1 Fonte: adaptado COSTA, 2011. Suas respectivas fórmulas estão disponibilizadas na Tabela 3: Quadro 3 | Fórmulas para cálculo da ANOVA C (correção) SQT (soma de quadrado total) SQTr (soma dos quadrados de tratamentos ou dos grupos) SQR (soma dos quadrados dos resíduos, dentro dos grupos) QMTr (quadrado médio dos tratamentos) QMR (quadrado médio dos resíduos) F (estatística F) Fonte: elaborada pela autora. c = (∑ y)2 n SQT = ∑ y2 − c SQTr = ∑ T 2 r − c SQR = SQT − SQTr QMTr = SQTr k−1 QMR = SQR n−k F = QMTr QMR 11/10/2024, 19:07 wlldd_232_u4_met_mat https://www.avaeduc.com.br/mod/url/view.php?id=3340524 22/53 O passo a passo dos cálculos a serem realizados podem ser resumidos na seguinte sequência: 1. Estabelecer a hipótese nula e a hipótese alternativa. A hipótese nula é a suposição de que não há diferença signi�cativa entre as médias dos grupos, enquanto a hipótese alternativa é a suposição de que pelo menos uma das médias é diferente das demais. 2. Coletar os dados. Os dados devem ser coletados para cada grupo e organizados em um formato apropriado para a ANOVA. 3. Calcular as somas de quadrados. É necessário calcular as somas de quadrados entre grupos, dentro de grupos e total 4. Calcular os graus de liberdade. Os graus de liberdade são calculados para cada uma das somas de quadrados, sendo que os graus de liberdade total são iguais ao número total de observações menos um. 5. Calcular as médias quadráticas. As médias quadráticas são calculadas para cada uma das somas de quadrados, dividindo-se a soma de quadrados pelo seu respectivo grau de liberdade. 6. Calcular a estatística F. A estatística F é calculada como a razão entre a média quadrática entre grupos (MSB) e a média quadrática dentro de grupos (MSW). 7. Determinar o valor crítico. O valor crítico para a estatística F é determinado a partir da tabela F e dos graus de liberdade. 8. Comparar a estatística F com o valor crítico. Se a estatística F for maior do que o valor crítico, a hipótese nula é rejeitada e conclui-se que pelo menos uma das médias é diferente das demais. 9. Interpretar os resultados. Com base na análise estatística, é possível determinar se há diferenças signi�cativas entre as médias dos grupos e, em caso positivo, quais grupos apresentam médias signi�cativamente diferentes. Aprender sobre a ANOVA é importante porque ela é uma das técnicas mais utilizadas na pesquisa cientí�ca, especialmente em áreas como medicina, psicologia, biologia, agricultura, entre outras. Além disso, a ANOVA é uma ferramenta poderosa para identi�car fatores que in�uenciam uma determinada variável e entender como esses fatores se relacionam entre si. Portanto, dominar a ANOVA é essencial para conduzir estudos estatísticos robustos e con�áveis. O USO DA ANOVA Um dos estudos mais importantes que utilizou a ANOVA foi o realizado pelo estatístico Ronald A. Fisher, em 1925, no qual ele aplicou a ANOVA para avaliar as diferenças entre as colheitas de trigo em diferentes campos experimentais. Esse estudo é considerado um marco na história da estatística experimental e foi fundamental para o desenvolvimento da teoria da ANOVA e da metodologia experimental em geral. Desde então, a ANOVA tem sido amplamente utilizada em diversas áreas, como a medicina, a psicologia, a biologia, a economia, entre outras, para analisar as diferenças entre grupos de dados e avaliar a e�cácia de tratamentos e intervenções. 11/10/2024, 19:07 wlldd_232_u4_met_mat https://www.avaeduc.com.br/mod/url/view.php?id=3340524 23/53 Promover este estudo da ANOVA nos leva a gerar resultados entre grupos que nos permitem realizar excelentes tomadas de decisões. Para compreendermos melhor o uso da ANOVA e todas as suas possibilidades de análise, vejamos um exemplo dentro da área da engenharia. Exemplo 1) Um fabricante de ferramentas está investigando três métodos diferentes de tratamento térmico para suas brocas de aço. O objetivo é determinar se existe diferença na vida útil média das brocas tratadas por esses métodos. Para isso, o fabricante selecionou aleatoriamente 15 brocas e as dividiu igualmente entre os três métodos de tratamento térmico. A vida útil em horas de cada broca foi registrada. Os resultados estão no Quadro 4 a seguir: Quadro 4 | Resultado dos experimentos com as brocas MÉTODO 1 MÉTODO 2 MÉTODO 3 100 95 105 110 100 95 95 105 100 105 100 90 90 95 105 Fonte: elaborada pela autora. Para testar se existe diferença signi�cativa nas médias das três amostras, vamos realizar uma ANOVA e interpretar os resultados. Resolução: 1º) Formulação das hipóteses: H0: as médias das três amostras são iguais. Ha: pelo menos uma média é diferente das demais. 2º) Nível de signi�cância: Vamos adotar um nível de signi�cância de 5% (α = 0,05). 3º) Cálculo da ANOVA: Podemos realizar a ANOVA por meio de um software estatístico, como o SPSS, por planilha Excel, ou apenas fazendo o uso das fórmulas. Os resultados da ANOVA são mostrados no quadro abaixo: 11/10/2024, 19:07 wlldd_232_u4_met_mat https://www.avaeduc.com.br/mod/url/view.php?id=3340524 24/53 Quadro 5 | Resultado da ANOVA FONTE DE VARIAÇÃO SOMA DOS QUADRADOS GRAUS DE LIBERDADE MÉDIAS ESTATÍSTICA F TRATAMENTOS 3,33 2 1,665 0,040 RESÍDUOS 490 12 40,83 TOTAL 493,33 14 Fonte: elaborada pela autora. Para encontrar estes resultados sem uso de software especí�co, seria interessante calcular a tabela com os dados fornecidos: Quadro 6 | Tabela calculada com os dados fornecidos MÉTODO 1 Y² MÉTODO 2 Y² MÉTODO3 Y² 100 10000 95 9025 105 11025 110 12100 100 10000 95 9025 95 9025 105 11025 100 10000 105 11025 100 10000 90 8100 90 8100 95 9025 105 11025 TOTAL 500 50250 495 49075 495 49175 Fonte: elaborada pela autora. Agora observe o passo a passo: c = (∑ y) 2 n = (500+495+495)² 15 = 148.006,67 SQT = ∑ y2 − c = (50250 + 49075 + 49175) − 148.006,67 = 493,33 SQTr = ∑ T ² r − c = [ 5002 5 + 4952 5 + 4952 5 ] − 148.006,67 = 3,33 SQR = SQT – SQTr = 493, 33 – 3, 33 = 490 QMTr = SQTr k−1 = 3,33 3−1 = 1,665 QMR = SQR n−k = 490 15−3 = 40,83 11/10/2024, 19:07 wlldd_232_u4_met_mat https://www.avaeduc.com.br/mod/url/view.php?id=3340524 25/53 4º) Análise dos resultados: A estatística F é 0,040. Como 0,040 19,46, rejeitamos a hipótese nula de que as médias dos três grupos são iguais. Portanto, há evidências estatísticas de que há diferenças signi�cativas entre as médias de sabor dos produtos testados. 5º) Conclusão: Concluímos que a empresa pode escolher qualquer uma das formulações de sabor, porém haverá diferença nas preferências e o processo em relação à qualidade sensorial dos produtos pode ser comprometida. VIDEO RESUMO Você verá, neste vídeo, a importância que o estudo da ANOVA possui nos controles de qualidade, mais especi�camente quando precisamos comparar a média de três grupos ou mais. Aprender sobre a ANOVA é importante, porque ela é uma das técnicas mais utilizadas na pesquisa cientí�ca, especialmente em áreas como medicina, psicologia, biologia, agricultura, entre outras. Além disso, a ANOVA é uma ferramenta poderosa para identi�car fatores que in�uenciam uma determinada variável e entender como esses fatores se relacionam entre si. Saiba mais 11/10/2024, 19:07 wlldd_232_u4_met_mat https://www.avaeduc.com.br/mod/url/view.php?id=3340524 28/53 Você conhece o SPSS (Statistical Package for Social Sciences)? Ele é um software estatístico amplamente utilizado para análise de dados. Foi desenvolvido originalmente para análises estatísticas em ciências sociais, mas atualmente é usado em diversas áreas, incluindo negócios, saúde e educação. O SPSS possui uma interface grá�ca amigável que permite aos usuários importar dados, realizar análises descritivas, cálculo da ANOVA, testes de hipóteses, regressão e outros tipos de análises estatísticas. INTRODUÇÃO Olá, estudante! Os testes estatísticos são uma ferramenta fundamental para a tomada de decisões em diversas áreas, incluindo negócios, saúde, ciências sociais e muitas outras. Dois testes amplamente utilizados são os de uma e duas caudas, que ajudam a determinar se uma amostra de dados é estatisticamente diferente de um valor de referência. Também temos outros testes comuns, como o teste t e o teste z, que são usados para testar se a média de uma amostra é signi�cativamente diferente da média populacional ou de uma outra amostra. Esses testes são importantes para garantir que as conclusões tomadas a partir dos dados sejam precisas e con�áveis. Os testes de hipóteses fazem parte da área da inferência estatística, que é responsável por fazer inferências sobre uma população a partir de uma amostra aleatória. A inferência estatística envolve a utilização de métodos estatísticos para analisar os dados e tirar conclusões sobre uma população com base em informações limitadas disponíveis em uma amostra. Veremos, nesta aula, como os testes podem ser uma ferramenta poderosa para analisar dados e, sobretudo para a tomada de decisões. Bons estudos! TESTES DE HIPÓTESES Aula 4 MÉTODOS DE TOMADA DE DECISÃO Os testes estatísticos são uma ferramenta fundamental para a tomada de decisões em diversas áreas, incluindo negócios, saúde, ciências sociais e muitas outras. Os testes de hipóteses fazem parte da área da inferência estatística, que é responsável por fazer inferências sobre uma população a partir de uma amostra aleatória. 28 minutos 11/10/2024, 19:07 wlldd_232_u4_met_mat https://www.avaeduc.com.br/mod/url/view.php?id=3340524 29/53 https://spss.softonic.com.br/?psafe_param=1&utm_source=SEM&utm_medium=paid&utm_campaign=EN_PT_Brazil_DSA&gclid=CjwKCAjwvJyjBhApEiwAWz2nLZliOvsOe0gYpeRti_GtTJZ1hqYc_e6ALbGhy8U6tnniGWBratUjLRoCin4QAvD_BwE Os testes de hipóteses são ferramentas de relevante importância dentro da grande área estatística chamada inferência estatística. Os testes de hipóteses são utilizados em diversas áreas da ciência, tais como engenharia, medicina, psicologia, entre outras. Eles são aplicados para avaliar se uma determinada hipótese sobre uma população é plausível, a partir da análise de uma amostra da população em questão. Em outras palavras, os testes de hipóteses são utilizados para veri�car se uma a�rmação ou suposição sobre uma população é verdadeira ou não, com base em evidências estatísticas amostrais. Os resultados desses testes são importantes para tomadas de decisão em áreas como planejamento de experimentos, controle de qualidade, análise de dados, entre outras. Os testes de hipóteses são relevantes na estatística porque permitem veri�car se uma determinada a�rmação sobre uma população é estatisticamente válida ou não, com base em uma amostra dela. Isso é feito a partir da construção de uma hipótese nula, que é a a�rmação a ser testada, e uma hipótese alternativa, que é a negação da hipótese nula. Mas, por que é importante saber,entender e conhecer os testes de hipóteses? A importância de trabalhar com testes de hipóteses está em fornecer uma ferramenta estatística para tomada de decisão com base em evidências amostrais. Ao realizar um teste de hipóteses corretamente, é possível quanti�car o grau de incerteza associado a uma determinada a�rmação e avaliar se os dados observados são su�cientemente diferentes para rejeitar a hipótese nula. Além disso, os testes de hipóteses são amplamente utilizados em pesquisas cientí�cas, nas quais é necessário avaliar a signi�cância estatística de resultados experimentais ou observacionais. Isso é fundamental para garantir a validade dos resultados e evitar conclusões precipitadas ou enganosas. Testes de uma e duas caudas são tipos de testes de hipóteses estatísticas utilizados para avaliar se uma amostra de dados difere signi�cativamente de uma determinada população. No teste de uma cauda, a hipótese nula a�rma que a média da população é igual a um determinado valor, e a hipótese alternativa a�rma que a média da população é maior ou menor do que esse valor. Neste caso, trabalha-se só com um lado da cauda para realizar a análise. Figura 1 | Exemplo de teste de uma cauda 11/10/2024, 19:07 wlldd_232_u4_met_mat https://www.avaeduc.com.br/mod/url/view.php?id=3340524 30/53 Fonte: Fernandes et al. (2016). Já no teste de duas caudas, a hipótese nula a�rma que a média da população é igual a um determinado valor, e a hipótese alternativa a�rma que a média da população é diferente desse valor, ou seja, pode ser maior ou menor. Neste caso, trabalha-se com os dois lados da curva. Figura 2 | Exemplo de teste de duas caudas Fonte: Fernandes et al. (2016). Há que se destacar que, para realizar os testes de uma ou de duas caudas, é necessário que os dados sejam normalmente distribuídos. Os testes t e z são exemplos de testes de hipóteses que podem ser utilizados tanto em testes de uma cauda quanto de duas caudas. O teste t é utilizado quando a amostra é pequena (estatisticamente falando, amostras são consideradas pequenas quando são menores que 30) ou quando a variância populacional é desconhecida, 11/10/2024, 19:07 wlldd_232_u4_met_mat https://www.avaeduc.com.br/mod/url/view.php?id=3340524 31/53 enquanto o teste z é utilizado quando a amostra é grande (amostras são consideradas grandes na estatística quando o valor em questão é igual ou maior que 30) e a variância populacional é conhecida ou estimada. TESTE Z OU TESTE T Os testes t e z são amplamente utilizados na estatística inferencial para testar hipóteses sobre médias populacionais. Ambos os testes são úteis quando se deseja determinar se uma diferença observada entre duas amostras é estatisticamente signi�cativa ou se ela pode ter ocorrido apenas por acaso. Esses testes são particularmente úteis na pesquisa cientí�ca, na qual é comum coletar dados de amostras para fazer inferências sobre a população em geral. Mas, como calcular um teste de hipótese t ou teste de hipótese z? Basicamente, os passos para o cálculo dos dois tipos de teste é o mesmo, o que difere é o tamanho da amostra e o desvio padrão. Relembrando: Realizar teste t quando a amostra é pequena (na qualidade das peças produzidas. Outra aplicação seria em testes de resistência de materiais, com os quais se pode veri�car se a resistência média de um determinado material está de acordo com as especi�cações de projeto. 11/10/2024, 19:07 wlldd_232_u4_met_mat https://www.avaeduc.com.br/mod/url/view.php?id=3340524 35/53 Vejamos uma situação prática para o uso dos testes de hipóteses. Uma indústria de transformação de plásticos está buscando otimizar seu processo de produção, visando a reduzir custos e aumentar a e�ciência. A empresa suspeita que a média de tempo de processamento das peças em uma determinada máquina está acima do valor desejado e, para con�rmar essa suspeita, coletou uma amostra aleatória de 50 peças e registrou o tempo de processamento de cada uma delas. O valor médio encontrado na amostra foi de 38 minutos com desvio padrão de 8 minutos, mas a média desejada é de 35 minutos. Para saber se há diferença estatisticamente signi�cativa entre a média da amostra e a média desejada, o engenheiro responsável pela análise decidiu realizar um teste de hipótese. Use signi�cância de 5% (α = 0,05). Solução: 1º) Estabelecer H0 e Ha. A hipótese nula é de que a média real de tempo de processamento é igual a 35 minutos e a hipótese alternativa é de que a média real é maior que 35 minutos. Assim: H0: μ = 35 Ha: μ > 35 2º) Como a signi�cância é 5% = 0,05 e o teste é com a tabela z pois a amostra é grande (n>30), temos para valor crítico c = 1,645 OBS.: Como obter este valor na tabela z? No caso, como a con�ança é de (5% unilateral, signi�ca que toda a outra parte da curva corresponde a 50%, sobrando 45% = 0,4500. Procurando este valor no meio da tabela, encontramos apenas os valores que são 0,4495 com um z correspondente de 1,64 e 04505 com um valor de z correspondente de 1,64, não sendo nenhum deles o valor desejado. Este encontra-se justamente no meio dos dois, logo faz-se uma média aritmética simples entre os valores de 1,64 e 1,5, encontrando o valor de 1,645. Veja na �gura a seguir. Figura 5 | Tabela z – Curva Normal 11/10/2024, 19:07 wlldd_232_u4_met_mat https://www.avaeduc.com.br/mod/url/view.php?id=3340524 36/53 Fonte: Costa (2011, p. 271). 3º) Calcular o teste z Para realizar o teste, o engenheiro calculou a estatística de teste usando a fórmula: 4º) Estabelecer as regiões de aceitação e rejeição com o valor crítico. Figura 6 | Regiões de aceitação e rejeição com o valor crítico z = x−μ σ √n = 35−38 8 √50 = 2,65– 11/10/2024, 19:07 wlldd_232_u4_met_mat https://www.avaeduc.com.br/mod/url/view.php?id=3340524 37/53 Fonte: elaborada pela autora. 5º) Comparar o valor do cálculo do teste z com o valor crítico: Como z > c, ou seja, 2,65 > 1,645, veri�camos que o teste está na área de rejeição e, desta forma, não aceitaremos a hipótese nula. Com isso, rejeita-se a hipótese nula e concluiu que há evidências estatísticas para a�rmar que a média real de tempo de processamento das peças é maior que 35 minutos. Com essa informação em mãos, a empresa poderá realizar ajustes em seu processo de produção para atingir a média desejada de 35 minutos, aumentando assim a e�ciência e reduzindo custos. Perceba que foi cometido um erro neste teste, você saberia dizer qual é? A indústria já havia delimitado uma média inicial e estava con�ante de que esta era verdadeira, mas depois veri�cou com o teste estatístico que isto não estava acontecendo de fato na produção. Então rejeitamos H0 mesmo ela sendo verdadeira, por isso o erro cometido foi o TIPO 1: quando a hipótese nula é verdadeira, mas é rejeitada. Veja na Tabela 1. VIDEO RESUMO Você verá, neste vídeo, a importância que os testes de hipóteses, junto a outras ferramentas estatísticas, possuem e qual o peso deles e de seus resultados na tomada de decisão. Os testes de hipóteses têm uma grande importância na tomada de decisão, pois permitem avaliar a validade de uma a�rmação feita sobre uma população com base em uma amostra. Com base nessa análise, é possível tomar decisões mais embasadas em relação a um processo ou produto, por exemplo, e decidir se uma mudança na fabricação de um produto foi efetiva ou se os resultados obtidos são apenas fruto do acaso. Saiba mais 11/10/2024, 19:07 wlldd_232_u4_met_mat https://www.avaeduc.com.br/mod/url/view.php?id=3340524 38/53 Você sabia que os testes de hipótese podem ser calculados em várias plataformas? Existem diversos softwares estatísticos disponíveis para o cálculo de testes de hipóteses, incluindo: SAS (Statistical Analysis System); Excel; Minitab; Python (usando bibliotecas como SciPy e StatsModels). A escolha do software dependerá das suas necessidades especí�cas, bem como do nível de familiaridade e habilidade com cada programa. SAS Minitab ESTATÍSTICA APLICADA PARA A TOMADA DE DECISÕES Olá, estudante! Na era da informação, é cada vez mais comum a coleta de dados para auxiliar as decisões empresariais e institucionais. No entanto, ter dados em mãos nem sempre é su�ciente. É preciso saber interpretá-los de forma e�caz para que sejam transformados em informações úteis para a tomada de decisão. Nesse contexto, as ferramentas estatísticas, como grá�cos, tabelas, distribuição normal, ANOVA e testes de hipóteses ganham importância fundamental nas mais diversas áreas. Os grá�cos são ferramentas importantes para a análise de dados, pois possibilitam uma visualização rápida e intuitiva das informações coletadas. Através deles, é possível identi�car padrões, tendências e relações entre variáveis. Há diversos tipos de grá�cos que podem ser utilizados em diferentes situações, como o grá�co de barras, o de linhas, o de pizza, entre outros. Já as tabelas são fundamentais para a organização dos dados coletados. Elas permitem a visualização dos dados de forma ordenada e facilitam a análise e comparação entre diferentes variáveis. Além disso, as tabelas também podem ser utilizadas para cálculos estatísticos, como médias, desvios-padrão e correlações. A distribuição normal é uma ferramenta importante para a análise estatística de dados. Ela é uma distribuição de probabilidade que possui um grá�co semelhante a um sino e é utilizada para determinar a probabilidade de ocorrência de um determinado evento em uma amostra ou população. Essa distribuição é amplamente utilizada em diversas áreas, como a engenharia, a medicina e a economia, e permite a realização de cálculos estatísticos mais precisos. Aula 5 REVISÃO DA UNIDADE 44 minutos 11/10/2024, 19:07 wlldd_232_u4_met_mat https://www.avaeduc.com.br/mod/url/view.php?id=3340524 39/53 https://www.sas.com/pt_br/curiosity.html?utm_source=google&utm_medium=cpc&utm_campaign=brand-global&utm_content=GMS-158646-gbc-cf&gclid=CjwKCAjwvJyjBhApEiwAWz2nLQEES44L3gVTlTR5Ie-xG6yhtZPBE7oTOZkkHYfC9lprbd51wQ6ybRoCFAEQAvD_BwE https://www.minitab.com/pt-br/products/minitab/free-trial/?utm_campaign=BFO+-+Brazil+-+Portuguese+-+Branded&utm_medium=ppc&utm_term=minitab%20gratuito&utm_source=adwords&hsa_net=adwords&hsa_mt=p&hsa_ver=3&hsa_grp=78035232460&hsa_ad=381041252397&hsa_tgt=a A análise de variância (ANOVA) é uma técnica estatística utilizada para comparar a média de duas ou mais amostras independentes. Essa técnica é amplamente utilizada em pesquisas cientí�cas e na indústria, permitindo a comparação de diferentes tratamentos ou intervenções em uma determinada população. Por �m, os testes de hipóteses são ferramentas importantes para validar ou refutar uma hipótese a partir dos dados coletados. Eles permitem determinar se uma diferença observada entre duas amostras é real ou apenas fruto do acaso. Essa ferramenta é amplamente utilizada em diversas áreas, como a medicina, a psicologia e a engenharia, e permite a tomada de decisões mais embasada em dados concretos. É importante que você perceba que as ferramentas estatísticas são fundamentais para a análise de dados e para a tomada de decisões mais assertivas. Grá�cos e tabelas permitem uma organização visual dos dados coletados, enquanto aEducation do Brasil, 2015. BUSSAB, W.; MORETTIN, P. Estatística Básica. São Paulo: Saraiva, 2002. COSTA, G. G. de O. Curso de Estatística básica: teoria e prática. São Paulo: Atlas, 2011. SPIEGEL, M. Estatística. São Paulo: Makron Books, 1993. REFERÊNCIAS 2 minutos 11/10/2024, 19:07 wlldd_232_u4_met_mat https://www.avaeduc.com.br/mod/url/view.php?id=3340524 52/53 Imagem de capa: Storyset e ShutterStock. Aula 3 BONAFINI, F. C. (org.). Probabilidade e estatística. São Paulo: Pearson Education do Brasil, 2015. BUSSAB, W.; MORETTIN, P. Estatística Básica. São Paulo: Saraiva, 2002. COSTA, G. G. de O. Curso de Estatística básica: teoria e prática. São Paulo: Atlas, 2011. SPIEGEL, M. Estatística. São Paulo: Makron Books, 1993. Aula 4 BONAFINI, F. C. (org.). Probabilidade e estatística. São Paulo: Pearson Education do Brasil, 2015. BUSSAB, W.; MORETTIN, P. Estatística Básica. São Paulo: Saraiva, 2002. Aula 5 BONAFINI, F. C. (org.). Probabilidade e estatística. São Paulo: Pearson Education do Brasil, 2015. BUSSAB, W.; MORETTIN, P. Estatística Básica. São Paulo: Saraiva, 2002. COSTA, G. G. de O. Curso de Estatística básica: teoria e prática. São Paulo: Atlas, 2011. DOWNING, D.; CLARK, J. Estatística Aplicada. 2ª ed. São Paulo: Saraiva, 2006. SPIEGEL, M. Estatística. São Paulo: Makron Books, 1993. 11/10/2024, 19:07 wlldd_232_u4_met_mat https://www.avaeduc.com.br/mod/url/view.php?id=3340524 53/53 https://storyset.com/ https://www.shutterstock.com/pt/