Baixe o app para aproveitar ainda mais
Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original
Universidade Federal do Ceará - UFC Centro de Tecnologia Disciplina de Probabilidade e Estatística Semestre 2017.2 ANÁLISE ESTATÍSTICA Teorema do Limite Central Alunos (a): Alex de Olivindo Souza 400277 Gilvânia Lima da Silva 399695 Nicole Brito de Sena 397003 Nikolas Borges Nascimento de Araújo 404252 Renan Costa Pereira 397029 Curso: Engenharia Civil Professor: Manoel Mendonça de Castro Neto Fortaleza – CE SUMÁRIO 1.0 LISTA DE GRÁFICOS E TABELAS 2 2.0 PROBLEMA 3 3.0 OBJETIVO 3 4.0 MÉTODO DE COLETA 3 5.0 ANÁLISE E RESULTADOS 5 6.0 CONCLUSÃO 10 REFERÊNCIAS BIBLIOGRÁFICAS 11 LISTA DE GRÁFICOS E TABELAS Tabela 1 – Tabela com a Variável – Índice de Suicídios. Gráfico 1 – Histograma da distribuição dos dados amostrais. Gráfico 2 – Histograma da distribuição das médias com n = 5. Gráfico 3 – Histograma da distribuição das médias com n = 10. Gráfico 4 – Histograma da distribuição das médias com n = 20. Gráfico 5 – Histograma da distribuição das médias com n = 30. PROBLEMA Com o alto Índice de Suicídio recorrente no mundo é necessário estimar a quantidade anual esperada das taxas de suicídio e dessa forma, realizar uma distribuição apropriada que possa representar a população. OBJETIVO Analisar o comportamento da variável “Índice de Suicídio” para encontrar a distribuição populacional representada pela mesma e usá-la para estimar o índice de suicídio. Averiguar se o Teorema do Limite Central pode ser aplicado nessa coleta de dados com o fito de verificar se a média amostral pode representar bem a média populacional. MÉTODO DE COLETA Os dados sobre o Índice de Suicídio foram coletados no site da Organização Mundial da Saúde (OMS). Foram coletados os dados para as amostras de forma aleatória, por meio da função “Aleatório Entre” no programa Excel. A amostra em estudo é classificada como amostra aleatória simples. MÉTODO DE ANÁLISE Computar a média e a mediana, com o objetivo de compará-las, para que possa verificar se pode ser observada uma simetria nos gráficos plotados. Computar as medidas de dispersão (desvio padrão, variância e coeficiente de variação) e avaliar como os resultados desses dados se espalham em relação à média e estimar como poderia ser a forma do gráfico populacional. Elaborar o histograma para averiguar se o gráfico possui simetria para que assim pode ser aproximado à distribuição normal. Critérios adotados para verificar a distribuição de probabilidade: As medidas de tendência central - média e mediana – não podem variar mais que 10% em relação ao previsto pelo modelo da distribuição normal. Seguir os critérios adotados para avaliar se a distribuição de dados da amostra pode ser aproximada pela distribuição normal. Verificar se a distribuição amostral pode ser aproximada por uma distribuição normal, a fim de se verificar o Teorema do Limite Central a partir da análise do histograma com as médias obtidas em quatro experimentos distintos gerados mil vezes com grupo de 5, 10, 20 e 30 amostras da população obtidas de forma aleatória. ANÁLISE E RESULTADOS Dados Estatísticos da Amostra País Índice de Suicídio 1 Nova Zelândia 12,7 2 Estados Unidos 13 3 Irlanda 11,6 4 Canadá 12,7 5 Japão 24,3 6 Coréia do Sul 34,1 7 França 18,4 8 Finlândia 18,5 9 Reino Unido 7,7 10 República Checa 15 11 Estónia 18,3 12 Chipre 4,8 13 Lituânia 33,9 14 Chile 12 15 Seicheles 9,6 16 Malásia 5,4 17 Rússia 25,7 18 Albânia 5,3 19 Ucrânia 22,5 20 Bósnia Erzegovina 6 21 Irã 6,1 22 Geórgia 6,2 23 Belize 6,1 24 Jamaica 0,5 25 Argélia 3,4 26 China 9,8 27 El Salvador 12,2 28 Suriname 28,1 29 Bolívia 20,5 30 Paraguai 9,7 31 Iraque 2,6 32 Mongólia 32,9 33 Micronésia 11,2 34 Vietnã 7,1 35 Guiné 7,8 36 Camboja 11,2 37 Quênia 6,7 38 Bangladesh 6,3 39 Camarões 12 40 Mauritânia 5,5 41 Papua Nova Guiné 9,6 42 Nepal 6,6 43 Nigéria 4,7 44 Uganda 6,9 45 Haiti 9,6 46 Tanzânia 6,8 47 Sudão do Sul 6,9 48 Afeganistão 5,2 49 Etiópia 8 50 Chade 8 OBSERVAÇÕES ÍNDICE DE SUICÍDIO PARA CADA 100000 HABITANTES Tabela 1 Dados de análise Os dados a serem analisados foram obtidos no site da OMS (Organização Mundial da Saúde) e representam o índice de suicídio de 50 países para cada 100.000 habitantes, expostos na Tabela 1. Medidas de Tendências Centrais dos dados Média = 11,87 Mediana = 9,60 Moda = 9,60 Medidas de Dispersão dos dados Desvio Padrão = 8,24 Variância = 67,82 Coeficiente de variação = 69,37 % Análise do Histograma Gráfico 1. O histograma da distribuição dos dados amostrais não possui um formato aproximado de um sino. Além disso, o valor da mediana se distancia do valor da média em 19,12%. Portanto, o gráfico não faz referência à distribuição normal. Analisar distribuições das frequências da média amostral e testar a validade do teorema do limite central. Analisando os gráficos das médias (expostos abaixo), observa-se que suas formas são de, aproximadamente um sino, e conforme o tamanho da amostra é aumentado, percebe-se que há uma maior centralização em torno da média da população, ou seja, quanto maior o valor de “n” da amostra, maior a tendência de o histograma das distribuições das médias apresentar um comportamento normal. Além disso, o desvio padrão e a variância decrescem, em consonância com o previsto, e o valor do desvio padrão se aproxima do valor proposto (σ / ) seguindo, assim, os aspectos do teorema do limite central. N = 5 Média = 11,75 Desvio Padrão = 3,72 Gráfico 2. N = 10 Média = 11,76 Desvio Padrão = 2,52 Gráfico 3. N = 20 Média = 11,90 Desvio Padrão = 1,90 Gráfico 4. N = 30 Média = 11,72 Desvio Padrão = 1,45 Gráfico 5. CONCLUSÃO Através da análise dos dados que envolveram o comportamento da variável - Índice de Suicídio – verificou-se que a amostra em questão, quando tomada como a população dessa variável, não se aproxima do comportamento de uma distribuição normal, porquanto o gráfico histograma da distribuição dos dados amostrais não se assemelha a um sino, além disso a média não é próxima da moda e da mediana, com diferença de 19,12% o que gera assimetria no gráfico. Todavia, mediante a análise descritiva das informações que foram coletadas das amostras aleatórias geradas para n = 5, 10, 20, 30, comprovou-se que é válido o teorema do limite central para a população em questão. Além disso, nenhuma das médias para cada valor de “n” superou 10% da média dos dados amostrais referente aos valores do Índice de Suicídio. Ainda assim, foi verificado que quanto maior o valor de “n” da amostra, maior a tendência de o histograma das distribuições das médias apresentar um comportamento normal. Ademais, o aspecto do teorema para as variâncias foi validado, pois os valores decresceram à medida que o “n” da amostra aumentava. Portanto, com o estudo feito e o teorema em questão comprovado, confirma-se que a média amostral é o melhor estimador da média populacional. Logo, a previsão anual da quantidade de suicídios poderá ser realizada através de inferências estatísticas para o comportamento normal da população. REFERÊNCIAS BIBLIOGRÁFICAS TRIOLA, Mario F (2013). Introdução à Estatística: atualização da tecnologia. 11° edição. LTC Editora, Rio de Janeiro, RJ. Disponível em: < http://www.bertolo.pro.br/FinEst/Estatistica/index.html >. Acesso em: 29/09/2017.
Compartilhar