Buscar

Aula definições e aleatoridade


Prévia do material em texto

MÉTODOS ESTATÍSTICOS 
APLICADOS À ATUÁRIA II
Aula 1 – Definições e Aleatoriedade
Profº Lucas Schmidt
Definição de Estatística
Estatística é uma coleção de métodos para planejar 
experimentos, obter dados e organizá-los, resumi-los, 
analisá-los, interpretá-los e deles extrair conclusões 
(TRIOLA, 1998).
Definição de Estatística
É um método científico que engloba:
• coleta, organização, resumo e análise de dados.
• obtenção de conclusões (suporte à tomada de decisão).
• apoio às outras áreas (ferramenta multidisciplinar).
Objetivo da Estatística: desenvolver métodos para descobrir 
e expor os padrões de comportamento (regularidade) que 
estão escondidos nos dados.
• Imprevisibilidade.
Surgimento da palavra Estatística
O termo “estatística” surgiu da palavra alemã Statistik, sendo traduzido pela
primeira vez para o inglês em 1770 no livro Bielfield’s Elementary Universal
Education, que afirmava que “a ciência chamada estatística nos ensina o
arranjo político de todos os Estados modernos do mundo conhecido”. Em
1828, o tema já evoluíra de tal modo que o dicionário Webster definia a
estatística como “uma coleção de fatos a respeito do estado da sociedade, a
condição da população numa nação ou país, sua saúde, longevidade,
economia doméstica, artes, propriedade e força política, o estado de seu país
etc.” (Fonte: O Andar do Bêbado)
Inferência Estatística
Consiste em dar informação sobre o todo com base no conhecimento de
uma parte. Pesquisas são feitas com amostras, mas o pesquisador quer
estender os resultados que obteve para toda a população.
Inferência: Conjunto de procedimentos estatísticos que tem por
finalidade generalizar conclusões de uma amostra para uma população,
informando o grau de precisão dos resultados.
Exemplos do cotidiano:
• Não é preciso beber toda a garrafa para saber que o vinho é bom
• Exame de sangue
• Provar se o alimento está bom de sal
É a coleção completa de todos os elementos a serem estudados;
É o conjunto de todas as unidades (elementos) de interesse que 
têm pelo menos uma característica em comum.
A população pode ser finita ou infinita.
Nem sempre são pessoas.
Censo: coleta de todos os dados da população.
Parâmetros: características e funções matemáticas da população.
População
• Inesgotável (lançamento de uma moeda, de um dado, loteria; 
compras de uma loja). As probabilidades de seleção de amostras 
podem ser contabilizadas e as probabilidades, conhecidas.
• Probabilidades desconhecidas (casos práticos), pois não há acesso 
a população nem há estimativas.
Tipos de População
É a coleção de dados extraídos de uma parcela da população, 
tendo a finalidade de representá-la.
A amostra pode ser obtida de forma aleatória ou não.
Estatísticas: características e funções matemáticas da amostra.
Amostragem: metodologia para obtenção de amostras
Amostra
Por que fazer amostragem?
• População “infinita”
• Alto custo de um censo
• Obsolescência (mudança constante)
• Minimizar perdas por medidas destrutivas 
(alimentos, bombas, fósforo)
Quanto amostrar?
Teoria defende que quanto maior o n, melhor
• Devido a variabilidade dos dados e
• Precisão requerida na estimação
Prática aponta para o menor n possível
• Tempo disponível
• Custo de amostragem
Riscos do uso de amostragem em comparação ao censo:
• Tomar decisões com base em estatísticas envolve riscos, pois
toma-se decisões sobre toda a população com base em apenas
uma parte dela.
• Entretanto, a teoria da probabilidade pode ser utilizada para
fornecer uma ideia do risco envolvido, ou seja, do erro cometido
na generalização dos resultados uma amostra.
•“É melhor ter uma resposta aproximada à pergunta certa do que ter
uma resposta exata à pergunta errada.” - JohnTukey (1915 – 2000)
Leitura de hoje
1) Eventos aleatórios: consequências e aplicações no dia-a-dia;
Espaço amostral, repetibilidade
2) Identificação de padrões mesmo sob aleatoriedade;
Distribuição amostral
3) Percepção de aleatoriedade.
Nível de significância
Introdução ao pensamento Estatístico
I. Eventos aleatórios: consequências e aplicações no dia-a-dia
O livro “O Andar do Bêbado” traz a reflexão de que:
Fenômenos que ocorrem no dia-a-dia podem ser vistos como
resultados de eventos aleatórios. Diferente do que pensamos, os
eventos não são determinísticos, pois inúmeros e incontroláveis
fatores influenciam as escolhas, o curso e os resultados.
O resultado do lançamento de um dado é um evento aleatório tanto
quanto venha a ser o nosso sucesso de qualquer decisão que
tomamos.
Exemplo: escolha pelo curso de Ciências Atuariais.
"Podemos melhorar nossa capacidade de tomar decisões e domar
alguns dos vieses que nos levam a escolhas ruins e maus
julgamentos (como por exemplo, julgar habilidade pelo sucesso),
[...] ao tentar entender as qualidades de pessoas ou situações de
maneira bastante independente dos resultados obtidos, e
podemos aprender a julgar cada decisão com base no espectro de
possíveis resultados que teria gerado, e não apenas no resultado
particular que de fato ocorreu."
Olhar eventos realizados não com determinismo, mas como
eventos aleatórios que deram um resultado dentre diversos
possíveis (caso tivéssemos repetido esse experimento diversas
vezes).
Devido ao acaso, sucesso e fracasso mal distribuídos
Nem todo resultado é uma consequência direta dos nossos
esforços: devemos entender o nosso papel e o papel do “acaso”
(aprovação em concursos, entrevistas de emprego, etc), pois os
eventos são imprevisíveis (aleatórios).
“Acaso”: o que está fora do nosso controle e entendimento.
Quanto há de mérito em: ganhar na mega-sena? Fazer um gol?
Dentro o amplo espaço de possibilidades de um evento aleatório
como o curso da vida, há aqueles favoráveis e desfavoráveis: “há
justo que perece na sua justiça, e há perverso que prolonga os seus
dias na sua perversidade.”
Ações independentes agrupadas apresentam padrões
II. Identificação de padrões mesmo sob aleatoriedade
Capítulo 8. A ordem no caos: “De fato, um conjunto de pessoas
atuando aleatoriamente frequentemente apresenta um comportamento
tão consistente e previsível quanto o de um grupo de pessoas que
tenham a intenção de atingir objetivos conscientes.”
Como escreveu o filósofo alemão Immanuel Kant em 1784: ‘Cada um,
segundo uma inclinação própria, segue um propósito próprio, muitas
vezes em oposição aos demais; ainda assim, cada pessoa e cada povo,
seguem em direção a um objetivo natural, mas desconhecido de todos;
todos trabalham para alcançá-lo, muito embora, se o conhecessem, não
lhe dariam muita importância.’ (pág 106)
Ações independentes agrupadas apresentam padrões
Comportamento consistente e previsível
• vestibular ano a ano.
Como um todo e de forma agrupada, as características que
iremos estudar seguirão um padrão de comportamento, que
poderá ser previsto.
Embora vamos analisar resultados provindos de amostras
aleatórias, perceberemos que, independe da amostra
coletada, os resultados possíveis de serem encontrados
(dentre os diversos resultados possíveis) apresentarão um
padrão facilmente identificável.
Alunos sendo “aleatórios” apresentarão um padrão.
Experimento consistindo em cada aluno escolher um número de 1 a
6. Apresentar a distribuição dos números escolhidos.
Alunos não sendo “aleatórios” apresentarão um padrão.
Escolhas pessoais apresentam um padrão.
Questão sobre interpretação do intervalo de confiança: em todos os
semestres, cerca de 20% dos alunos erra essa questão.
Ações independentes agrupadas apresentam padrões
“Podemos encontrar regularidades análogas se examinarmos como
as pessoas votam, compram ações, casam-se, etc – ou se lhes
medirmos o comprimento das pernas, o tamanho dos pés, a
circunferência das barrigas de chope. Ao vasculharem dados sociais
tornados disponíveis havia pouco tempo, os cientistas do século XIX
descobriram que, onde quer que procurassem, o caos da vida
parecia produzir padrões quantificáveis e previsíveis. No entanto,
não ficaram impressionados apenascom as regularidades, mas
também com a natureza da variação. Como descobriram, os dados
sociais frequentemente seguem a distribuição normal.” (pág 107)
Ações independentes agrupadas apresentam padrões
“Quételet havia se deparado com uma descoberta útil: os padrões
de aleatoriedade são tão confiáveis que, em certos dados sociais,
sua violação pode ser vista como uma prova de delitos.” (pág 113)
Lei de Benford –
primeiro dígito
III. Percepção de aleatoriedade
Capítulo 9. Ilusões de padrões e padrões de ilusão: “as
pessoas têm uma concepção muito fraca da aleatoriedade;
não a reconhecem quando a veem e não conseguem
produzi-la ao tentarem”.
“Em uma sequência de eventos, quanto maior a sequência,
ou quanto maior o número de sequências observadas, maior
é a probabilidade de que encontremos qualquer padrão
imaginável – por mero acaso. Assim, uma série de bons ou
maus acontecimentos não precisa ter nenhuma ‘causa’
específica.
“A ideia de Spencer-Brown é que existe uma diferença entre
a aleatoriedade de um processo e a aparência de
aleatoriedade desse processo. A empresa Apple teve esse
problema ao desenvolver o primeiro programa para
embaralhar as músicas tocadas num iPod: a verdadeira
aleatoriedade às vezes gera repetições, mas ao ouvirem
uma música repetida, ou músicas do mesmo artista tocadas
em sequência, os usuários acreditam que o
embaralhamento não é aleatório. Assim, a companhia fez
com que a função se tornasse ‘menos aleatória para que
pareça mais aleatória’, nas palavras de seu fundador.”
“O filósofo Hans Reichenbach, comentou sobre a percepção de
padrões aleatórios, em 1934, que pessoas leigas em probabilidade
teriam dificuldade em reconhecer uma série aleatória de eventos.
Considere a seguinte sequência, supostamente aleatória,
representando os resultados de 200 lançamentos de uma moeda,
em que O representa cara e X representa coroa:”
Imagine que esses acontecimentos sejam as vitórias e derrotas de
seu time, ou qualquer evento repetitivo, independente e que possui
dois desfechos:
É fácil encontrar padrões nesses dados – por exemplo, os quatro Os
seguidos por quatro Xs no começo, e a sequência de seis Xs perto do
final.
Leonard Koppett previu a alta ou queda do mercado de ações
acertando 18 dos 19 anos :
• acertou de 1979-1989;
• falhou em 1990;
• acertou até 1998.
Método: se baseava nos resultados do Super Bowl:
• se o campeão era da NFL, mercado em alta;
• se o campeão era da AFL, mercado em queda.
Conclusão: acontecimentos “evidentes” surgem devido ao acaso,
sem causa específica interligada.
Somos vítimas concepções equivocadas sobre aleatoriedade porque
gostamos de exercer o controle sobre o ambiente:
• Dirige tranquilo mesmo depois de beber;
• Entra em pânico se o avião passa por uma leve turbulência.
Falácia da boa fase: a impressão equivocada de que uma sequência
aleatória se deve a um desempenho extraordinário.
Quanto maior a exigência por ótimos resultados e o nosso
comprometimento, maior será a ilusão de controle -> demissão de
técnicos de futebol. Há um confronto entre nossa necessidade de sentir
que estamos no controle e nossa capacidade de reconhecer a
aleatoriedade: precisamos reconhecer que os resultados dependem de
ambos.
Revisão
Zabala, 2017, pág 69-70: Inferência Estatística Clássica
Zabala, pág 137-138: Uma breve introdução ao R e Rstudio
Aleatoriedade: Geração números aleatórios (uniforme e 
bernoulli), simulações.
Inferências básicas (probabilidade, outliers, média, variância)
Leitura para a próxima aula: Capítulo 7, trechos destacados.

Continue navegando