Prévia do material em texto
MÉTODOS ESTATÍSTICOS APLICADOS À ATUÁRIA II Aula 1 – Definições e Aleatoriedade Profº Lucas Schmidt Definição de Estatística Estatística é uma coleção de métodos para planejar experimentos, obter dados e organizá-los, resumi-los, analisá-los, interpretá-los e deles extrair conclusões (TRIOLA, 1998). Definição de Estatística É um método científico que engloba: • coleta, organização, resumo e análise de dados. • obtenção de conclusões (suporte à tomada de decisão). • apoio às outras áreas (ferramenta multidisciplinar). Objetivo da Estatística: desenvolver métodos para descobrir e expor os padrões de comportamento (regularidade) que estão escondidos nos dados. • Imprevisibilidade. Surgimento da palavra Estatística O termo “estatística” surgiu da palavra alemã Statistik, sendo traduzido pela primeira vez para o inglês em 1770 no livro Bielfield’s Elementary Universal Education, que afirmava que “a ciência chamada estatística nos ensina o arranjo político de todos os Estados modernos do mundo conhecido”. Em 1828, o tema já evoluíra de tal modo que o dicionário Webster definia a estatística como “uma coleção de fatos a respeito do estado da sociedade, a condição da população numa nação ou país, sua saúde, longevidade, economia doméstica, artes, propriedade e força política, o estado de seu país etc.” (Fonte: O Andar do Bêbado) Inferência Estatística Consiste em dar informação sobre o todo com base no conhecimento de uma parte. Pesquisas são feitas com amostras, mas o pesquisador quer estender os resultados que obteve para toda a população. Inferência: Conjunto de procedimentos estatísticos que tem por finalidade generalizar conclusões de uma amostra para uma população, informando o grau de precisão dos resultados. Exemplos do cotidiano: • Não é preciso beber toda a garrafa para saber que o vinho é bom • Exame de sangue • Provar se o alimento está bom de sal É a coleção completa de todos os elementos a serem estudados; É o conjunto de todas as unidades (elementos) de interesse que têm pelo menos uma característica em comum. A população pode ser finita ou infinita. Nem sempre são pessoas. Censo: coleta de todos os dados da população. Parâmetros: características e funções matemáticas da população. População • Inesgotável (lançamento de uma moeda, de um dado, loteria; compras de uma loja). As probabilidades de seleção de amostras podem ser contabilizadas e as probabilidades, conhecidas. • Probabilidades desconhecidas (casos práticos), pois não há acesso a população nem há estimativas. Tipos de População É a coleção de dados extraídos de uma parcela da população, tendo a finalidade de representá-la. A amostra pode ser obtida de forma aleatória ou não. Estatísticas: características e funções matemáticas da amostra. Amostragem: metodologia para obtenção de amostras Amostra Por que fazer amostragem? • População “infinita” • Alto custo de um censo • Obsolescência (mudança constante) • Minimizar perdas por medidas destrutivas (alimentos, bombas, fósforo) Quanto amostrar? Teoria defende que quanto maior o n, melhor • Devido a variabilidade dos dados e • Precisão requerida na estimação Prática aponta para o menor n possível • Tempo disponível • Custo de amostragem Riscos do uso de amostragem em comparação ao censo: • Tomar decisões com base em estatísticas envolve riscos, pois toma-se decisões sobre toda a população com base em apenas uma parte dela. • Entretanto, a teoria da probabilidade pode ser utilizada para fornecer uma ideia do risco envolvido, ou seja, do erro cometido na generalização dos resultados uma amostra. •“É melhor ter uma resposta aproximada à pergunta certa do que ter uma resposta exata à pergunta errada.” - JohnTukey (1915 – 2000) Leitura de hoje 1) Eventos aleatórios: consequências e aplicações no dia-a-dia; Espaço amostral, repetibilidade 2) Identificação de padrões mesmo sob aleatoriedade; Distribuição amostral 3) Percepção de aleatoriedade. Nível de significância Introdução ao pensamento Estatístico I. Eventos aleatórios: consequências e aplicações no dia-a-dia O livro “O Andar do Bêbado” traz a reflexão de que: Fenômenos que ocorrem no dia-a-dia podem ser vistos como resultados de eventos aleatórios. Diferente do que pensamos, os eventos não são determinísticos, pois inúmeros e incontroláveis fatores influenciam as escolhas, o curso e os resultados. O resultado do lançamento de um dado é um evento aleatório tanto quanto venha a ser o nosso sucesso de qualquer decisão que tomamos. Exemplo: escolha pelo curso de Ciências Atuariais. "Podemos melhorar nossa capacidade de tomar decisões e domar alguns dos vieses que nos levam a escolhas ruins e maus julgamentos (como por exemplo, julgar habilidade pelo sucesso), [...] ao tentar entender as qualidades de pessoas ou situações de maneira bastante independente dos resultados obtidos, e podemos aprender a julgar cada decisão com base no espectro de possíveis resultados que teria gerado, e não apenas no resultado particular que de fato ocorreu." Olhar eventos realizados não com determinismo, mas como eventos aleatórios que deram um resultado dentre diversos possíveis (caso tivéssemos repetido esse experimento diversas vezes). Devido ao acaso, sucesso e fracasso mal distribuídos Nem todo resultado é uma consequência direta dos nossos esforços: devemos entender o nosso papel e o papel do “acaso” (aprovação em concursos, entrevistas de emprego, etc), pois os eventos são imprevisíveis (aleatórios). “Acaso”: o que está fora do nosso controle e entendimento. Quanto há de mérito em: ganhar na mega-sena? Fazer um gol? Dentro o amplo espaço de possibilidades de um evento aleatório como o curso da vida, há aqueles favoráveis e desfavoráveis: “há justo que perece na sua justiça, e há perverso que prolonga os seus dias na sua perversidade.” Ações independentes agrupadas apresentam padrões II. Identificação de padrões mesmo sob aleatoriedade Capítulo 8. A ordem no caos: “De fato, um conjunto de pessoas atuando aleatoriamente frequentemente apresenta um comportamento tão consistente e previsível quanto o de um grupo de pessoas que tenham a intenção de atingir objetivos conscientes.” Como escreveu o filósofo alemão Immanuel Kant em 1784: ‘Cada um, segundo uma inclinação própria, segue um propósito próprio, muitas vezes em oposição aos demais; ainda assim, cada pessoa e cada povo, seguem em direção a um objetivo natural, mas desconhecido de todos; todos trabalham para alcançá-lo, muito embora, se o conhecessem, não lhe dariam muita importância.’ (pág 106) Ações independentes agrupadas apresentam padrões Comportamento consistente e previsível • vestibular ano a ano. Como um todo e de forma agrupada, as características que iremos estudar seguirão um padrão de comportamento, que poderá ser previsto. Embora vamos analisar resultados provindos de amostras aleatórias, perceberemos que, independe da amostra coletada, os resultados possíveis de serem encontrados (dentre os diversos resultados possíveis) apresentarão um padrão facilmente identificável. Alunos sendo “aleatórios” apresentarão um padrão. Experimento consistindo em cada aluno escolher um número de 1 a 6. Apresentar a distribuição dos números escolhidos. Alunos não sendo “aleatórios” apresentarão um padrão. Escolhas pessoais apresentam um padrão. Questão sobre interpretação do intervalo de confiança: em todos os semestres, cerca de 20% dos alunos erra essa questão. Ações independentes agrupadas apresentam padrões “Podemos encontrar regularidades análogas se examinarmos como as pessoas votam, compram ações, casam-se, etc – ou se lhes medirmos o comprimento das pernas, o tamanho dos pés, a circunferência das barrigas de chope. Ao vasculharem dados sociais tornados disponíveis havia pouco tempo, os cientistas do século XIX descobriram que, onde quer que procurassem, o caos da vida parecia produzir padrões quantificáveis e previsíveis. No entanto, não ficaram impressionados apenascom as regularidades, mas também com a natureza da variação. Como descobriram, os dados sociais frequentemente seguem a distribuição normal.” (pág 107) Ações independentes agrupadas apresentam padrões “Quételet havia se deparado com uma descoberta útil: os padrões de aleatoriedade são tão confiáveis que, em certos dados sociais, sua violação pode ser vista como uma prova de delitos.” (pág 113) Lei de Benford – primeiro dígito III. Percepção de aleatoriedade Capítulo 9. Ilusões de padrões e padrões de ilusão: “as pessoas têm uma concepção muito fraca da aleatoriedade; não a reconhecem quando a veem e não conseguem produzi-la ao tentarem”. “Em uma sequência de eventos, quanto maior a sequência, ou quanto maior o número de sequências observadas, maior é a probabilidade de que encontremos qualquer padrão imaginável – por mero acaso. Assim, uma série de bons ou maus acontecimentos não precisa ter nenhuma ‘causa’ específica. “A ideia de Spencer-Brown é que existe uma diferença entre a aleatoriedade de um processo e a aparência de aleatoriedade desse processo. A empresa Apple teve esse problema ao desenvolver o primeiro programa para embaralhar as músicas tocadas num iPod: a verdadeira aleatoriedade às vezes gera repetições, mas ao ouvirem uma música repetida, ou músicas do mesmo artista tocadas em sequência, os usuários acreditam que o embaralhamento não é aleatório. Assim, a companhia fez com que a função se tornasse ‘menos aleatória para que pareça mais aleatória’, nas palavras de seu fundador.” “O filósofo Hans Reichenbach, comentou sobre a percepção de padrões aleatórios, em 1934, que pessoas leigas em probabilidade teriam dificuldade em reconhecer uma série aleatória de eventos. Considere a seguinte sequência, supostamente aleatória, representando os resultados de 200 lançamentos de uma moeda, em que O representa cara e X representa coroa:” Imagine que esses acontecimentos sejam as vitórias e derrotas de seu time, ou qualquer evento repetitivo, independente e que possui dois desfechos: É fácil encontrar padrões nesses dados – por exemplo, os quatro Os seguidos por quatro Xs no começo, e a sequência de seis Xs perto do final. Leonard Koppett previu a alta ou queda do mercado de ações acertando 18 dos 19 anos : • acertou de 1979-1989; • falhou em 1990; • acertou até 1998. Método: se baseava nos resultados do Super Bowl: • se o campeão era da NFL, mercado em alta; • se o campeão era da AFL, mercado em queda. Conclusão: acontecimentos “evidentes” surgem devido ao acaso, sem causa específica interligada. Somos vítimas concepções equivocadas sobre aleatoriedade porque gostamos de exercer o controle sobre o ambiente: • Dirige tranquilo mesmo depois de beber; • Entra em pânico se o avião passa por uma leve turbulência. Falácia da boa fase: a impressão equivocada de que uma sequência aleatória se deve a um desempenho extraordinário. Quanto maior a exigência por ótimos resultados e o nosso comprometimento, maior será a ilusão de controle -> demissão de técnicos de futebol. Há um confronto entre nossa necessidade de sentir que estamos no controle e nossa capacidade de reconhecer a aleatoriedade: precisamos reconhecer que os resultados dependem de ambos. Revisão Zabala, 2017, pág 69-70: Inferência Estatística Clássica Zabala, pág 137-138: Uma breve introdução ao R e Rstudio Aleatoriedade: Geração números aleatórios (uniforme e bernoulli), simulações. Inferências básicas (probabilidade, outliers, média, variância) Leitura para a próxima aula: Capítulo 7, trechos destacados.