MÓDULO 1 - Fundamentos da Estatistica

•

UNINASSAU

1

0

1

0

Victor Lacerda

11/05/2022

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 8 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 6, do total de 8 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Fundamentos da Estatística

3.847 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

MÓDULO 1 - Fundamentos da Estatística
OBJETIVOS DA ESTATÍSTICA
Teoria Estatística é definida em função de uma amostra em que a função por si mesma é única em relação à distribuição que gerou o evento. Esse termo é utilizado usualmente tanto para a função quanto para o valor numérico da função utilizada a uma dada amostra.
Estatística descritiva, preocupa-se em fazer a dissertação de dados obtidos através da pesquisa, formando, assim, uma tabela ou tabulação de todas as informações obtidas durante a fase de coleta.
Qual a forma mais rápida de apresentar o objeto em estudo de uma estatística? > GRÁFICOS
Na estatística, temos três grandes divisões:
· DESCRITIVA
· INFERENCIAL
· DE PROBABILIDADE
POPULAÇÃO E AMOSTRA
População: É o conjunto de pessoas ou itens quaisquer que compõe o universo a ser estudado. Essas pessoas ou itens precisam ter ao menos uma característica em comum, para que possamos delimitar nossa pesquisa.
Amostra: São os subconjuntos de uma população, que são adequados para estudar a característica de interesse da população. A seleção dos elementos que irão compor a amostra pode ser feita de várias maneiras e irá depender do conhecimento que se tem da população e da quantidade de recursos disponíveis.
AMOSTRA ALEATÓRIA
Podemos dizer que a amostragem aleatória é um dos principais métodos usados nas técnicas estatísticas e de probabilidade. Esse método é um dos mais populares e serve como base para todos outros métodos de coleta de dados para uma amostragem real e compatível com o fato estudado.
Podemos também definir outro tipo de amostragem, onde todos os elementos que fazem parte do conjunto amostral e estão interligados no espaço amostral têm a mesma probabilidade de serem usados para o evento.
Seria como realizar um sorteio entre os funcionários de um escritório: dar a cada funcionário um bilhete com um número de série, colocar os números em uma roleta e sortear um número ao acaso. Todos funcionários possuem esse bilhete dentro da urna-roleta e formam uma amostra. Na verdade, esses métodos podem ser realizados com o uso de computadores.
O que é melhor, usar a reposição ou não? Concluímos, então, que a amostragem aleatória e sem reposição é sempre melhor.
(Aqui no caso, diz respeito à "devolver" a pessoa à "urna" fazendo com que tenha a chance de ela ser selecionada novamente. Essa é a reposição. A não reposição é a não devolução.)
Portanto, o tamanho da amostra utilizada quando não usamos reposição é sempre menor em relação ao com reposição.
Se estamos utilizando a reposição e, por acaso, sorteamos um indivíduo mais de uma vez na mesma amostra, o fato é igual ao da redução do tamanho da amostra, onde vemos uma menor probabilidade de sortearmos indivíduos diferentes. Do mesmo jeito, se o nosso conjunto de dados é infinito, os dois métodos terão o mesmo valor, uma vez que a chance de selecionar o mesmo indivíduo duas vezes no mesmo evento tende a ser muito pequena ou quase infinita.
USANDO AMOSTRA ALEATÓRIA SIMPLES
· Com o uso de computadores cada vez mais avançados, é possível retratar uma amostra aleatória simples de forma rápida e totalmente confiável.
· A geração de números aleatórios mediante softwares (são números estritamente aleatórios) é cada vez mais confiável.
· Desta forma, ao utilizar MAS (mostra aleatória simples), asseguramos a obtenção de amostras representativas, de modo que uma das únicas chances de erro que poderá alterar nossos resultados será o azar adverso.
ASPECTOS NEGATIVOS DA AMOSTRA ALEATÓRIA SIMPLES
· Um dos aspectos negativos é a dificuldade de se aplicar nas pesquisas reais.
· Por essa técnica ser probabilística, é necessário um universo amostral considerando todos os participantes, em que todos possam ser selecionados para a amostra.
· O objetivo é de alto grau de dificuldade a ser cumprido, pois, na maioria dos estudos reais, nos obrigam a aplicar outros métodos.
EXEMPLIFICANDO:
· Imagine uma pesquisa para sabermos o time mais popular do estado de São Paulo.
· Se usarmos como base a pesquisa real, teremos de entrevistar todas as pessoas residentes no estado de São Paulo, o que, convenhamos, não é impossível, mas a dificuldade que teríamos seria enorme em relação à quantidade de pessoas entrevistadas.
· Portanto, apesar de não ser 100% confiável, devemos criar um espaço ou quantidade que possa representar com confiança nossa pesquisa, a fim de que possa representar uma grande porcentagem da realidade do fato a ser estudado.
FASES DO MÉTODO DE ANÁLISE ESTATÍSTICA
Para termos um bom trabalho estatístico, devemos ter em mente a seguinte problemática:
· a definição do problema visa determinar como a escolha de dados pode solucionar um problema,
· e a coleta de dados busca reunir dados após o planejamento do trabalho pretendido, bem como estabelecer a definição da periodicidade da coleta (contínua, periódica, ocasional ou indireta).
1. DEFINIÇÃO DO PROBLEMA
- Determinar como a recolha de dados pode solucionar um problema.
2. PLANEJAMENTO
- Elaborar como fazer o levantamento dos dados.
3. COLETA DE DADOS
- Reunir dados após o planejamento do trabalho pretendido, bem como definir a periodicidade da coleta.
4. CORREÇÃO DOS DADOS COLETADOS
- Conferir dados para afastar algum erro por parte da pessoa que os coletou.
5. CONFERÊNCIA DOS DADOS
- Organização e contagem dos dados.
6. DEMONSTRAÇÃO DOS DADOS
- Montagem de tabelas ou gráficos que demonstrem o resultado da coleta de dados.
7. ANÁLISE DOS DADOS
- Vista detalhada qualitativa, quantitativa e interpretação dos dados.
Para um melhor entendimento, devemos estudar alguns dos itens apresentados de forma um pouco mais efetiva.
Coletas de dados
· Organizar dados obtidos por meio de TABELAS
· Os dados que podemos usar precisam estar definidos, sejam eles primários ou secundários.
· Dados de pesquisa são os materiais comumente registrados e aceitos na comunidade científica como necessários para validar os resultados de pesquisas. Eles incluem fatos e estatísticas recolhidas para posterior referência ou análise.
Recenseamento
· Pesquisa que determina o número de habitantes de uma região, cidade, país etc., especificando-os por sexo, idade, religião, estado civil.
· Também pode ser a relação das pessoas que possuem as condições previstas pela lei para possuir certos cargos ou funções (como recenseamento eleitoral e recenseamento militar).
· É a ação de listar ou enumerar um tipo de população, podendo ser também gado ou outros animais.
Organização de dados
· Organizar os dados é uma atividade que tem como finalidade a melhor compreensão desses dados dando-lhes, ao mesmo tempo, uma finalidade de ser e uma análise correta.
· É analisar os dados de um problema e identificá-los.
Variável
· São características comuns aos elementos de uma população à qual atribuímos um número ou categoria, assumindo valores diferentes de unidade.
· Podemos chamar essa população como a variável que vamos estudar, pelo fato de que a população é formada pelos valores que a variável pode assumir ou ter.
· A esse método, que consiste em reconhecer uma observação de uma variável, damos o nome de experimento aleatório.
· Por exemplo: suponhamos que pretendemos estudar o número de celulares de cada família dos alunos que frequentam a escola XXX, no ano letivo 2017/2018. Podemos dizer que a nossa população é constituída por todos os resultados obtidos para o número de celulares das famílias dos referidos alunos. Quando se considera um desses alunos e se questiona quanto ao número de celulares, estamos a realizar uma experiência aleatória.
· Por esse fato, a variável tomará uma forma quantitativa, pois poderá ser medida, ou seja, poderá ser contada.
· Podemos ainda ter uma variável que poderá ser medida e contada, chamada de variável contínua.
· A variável será qualitativa se não for passível de medição ou contagem, mas unicamente de uma classificação, podendo assumir várias modalidades ou categorias.
DISTRIBUIÇÃO DE FREQUÊNCIA
Vamos calcular, agora, o tamanho amostral, ou seja, o número de observações obtidas na amostra.
Após umacoleta de dados, temos um conjunto de informações e devemos colocá-las em uma tabela de distribuição de frequência, ou simplesmente uma tabela de frequência.
Todos os dados dessa tabela serão divididos em classes predeterminadas, colocando-se a frequência de cada classe.
Portanto, uma tabela de frequência é um conjunto de dados agrupados de forma organizada e sequencial, a fim de que os dados sirvam de base para a construção de futuros gráficos.
1. FREQUÊNCIA ABSOLUTA
- É a frequência que leva em consideração a quantidade de eventos que temos em uma classe.
2. FREQUÊNCIA RELATIVA
- É o quociente entre a frequência absoluta e a soma de todas as frequências.
3. FREQUÊNCIA PERCENTUAL
- É a multiplicação da frequência relativa por 100.
4. FREQUÊNCIA ACUMULADA
- É a somatória de todas as classes.
5. DISTRIBUIÇÃO DE FREQUÊNCIA PONTUAL
- São os dados quantitativos.
- Usamos a distribuição de frequência pontual quando se trabalha com dados discretos. O melhor tipo de gráfico utilizado para representar esse tipo de distribuição de frequência é o gráfico de barras.
EXEMPLO: Em uma cidade, foram totalizados o número de pessoas com diabetes em 20 grupos de 1.000 pessoas cada. Nesse caso, obtemos os seguintes dados: 10, 12, 9, 11, 10, 8, 9, 10, 7, 10, 8, 9, 9, 10, 10, 11, 9, 11, 10, 10. Um possível resumo dos dados é desenvolvido na Tabela:
PESSOAS COM DIABETES
APURAÇÃO DOS GRUPOS
Nº DE GRUPOS
7
/
1
8
//
2
9
/////
5
10
////////
8
11
///
3
12
/
1
Portanto, a variável "quantidade de pessoas com diabetes" assume valores discretos, ou seja, inteiros: ...,7, 8, 9,... .
Com o exemplo da Tabela 2, temos a distribuição de frequências para esse conjunto de dados e o gráfico de barras.
NÚMERO DE PESSOAS COM DIABETES
FREQUÊNCIA (f i)
FREQUENCIA RELATIVA
FREQUÊNCIA PERCENTUAL
FREQUÊNCIA ACUMULADA
7
1
0,05
5
5
8
2
0,1
10
15
9
5
0,25
25
40
10
8
0,4
40
80
11
3
0,15
15
95
12
1
0,05
5
100
*cálculo da frequência relativa: divisão entre a frequência absoluta pela soma de todas as frequências. Ou seja: todas as frequências somadas = 20 (somar toda a segunda coluna), portanto, a primeira freqüência relativa se calcula dividindo o 1 sobre 20 que dá 0,05. E assim, por diante: 2/20 = 0,1; 5/20 = 0,25 etc.
INTERVALOS DE CLASSE
Intervalo de classe é a medida do intervalo que define a classe. A amplitude de uma classe é a diferença entre o maior e o menor valor de uma classe. Para um melhor entendimento, vamos estudar o assunto através de um exemplo.
Foram coletas as alturas de 20 atletas de voleibol de um certo clube e os dados foram colocados em um rol aleatório.
1,91-1,78-1,69-1,82-1,80-1,72-1,73-1,76-1,77-1,94-1,84-1,87-1,85-1,89-1,70-1,91-1,86-1,70-1,71-1,94
O ideal agora será colocar todas essas alturas em um rol crescente.
1,69 - 1,70 - 1,70 - 1,71 - 1,72 - 1,73 - 1,76 - 1,77 - 1,78 - (...) 1,94.
Vamos agora calcular os intervalos da seguinte forma
- Realizamos a subtração entre a maior e a menor altura: 1,94 – 1,69 = 0,25.
Para um melhor estudo e cálculos, devemos escolher um número de classes maior que quatro. Nesse exemplo, vamos escolher cinco intervalos de classe, dessa forma dividimos o intervalo total de alturas por cinco:
0,25:5 = 0,05. Veja os intervalos:
1,69 | 1,74(1,69+0,05)
1,74 1,79(1,74+0,05)
1,79 1,84(1,79+0,05)
1,84 1,89(1,84+0,05)
1,89 1,94(1,89+0,05)
OBS: IMPORTANTE - O SIMBOLO |
SIGNIFICA FECHADO À ESQUERDA E ABERTO À DIREITA, ISTO É, AS ALTURAS, 1,74 - 1,79 - 1,84 - 1,89, SERÃO USADAS APENAS UMA VEZ.
Tabela de frequências:
ALTURAS
FREQUÊNCIA ABSOLUTA
FREQUÊNCIA RELATIVA
RELATIVA PERCENTUAL
1,69 -> 1,74
6
6/20 = 0,30
30%
1,74 -> 1,79
3
3/20 = 0,15
15%
1,79 -> 1,84
2
2/20 = 0,10
10%
1,84 -> 1,89
4
4/20 = 0,20
20%
1,89 -> 1,94
5
5/20 = 0,25
25%
TOTAL
20

100%
Você pode também calcular o número de classe através de “K”, em que:
K= raiz quadrada de n
E em que n é a quantidade de dados coletados.
No nosso exemplo, a quantidade de dados foi 20. A raiz de 20 é igual a 4,472. Devemos arredondar para 5.
Histogramas e polígono de frequência
O histograma e o polígono de frequência são alguns dos meios de representar os dados recolhidos. Estes são os gráficos de melhor visualização de dados, que serão melhor abordados agora.
HISTOGRAMAS
· Um histograma é uma representação das distribuições de frequências através de uma forma gráfica, no formato de colunas ou de barras retangulares, de um conjunto de dados já divididos em classes.
· A base de cada retângulo irá representar uma classe
· e a altura de cada retângulo irá representar a frequência absoluta ou quantidade com o valor de sua respectiva classe, que ocorre no conjunto de dados.
· É de suma importância ressaltar que esse tipo de gráfico é uma ferramenta primordial para análises rápidas de dados em uma pesquisa.
· Exemplo de HISTROGRAMA
· Na elaboração de um histograma, devemos ficar atentos ao seguinte:
· Os dados devem ser agrupados por classes;
· No eixo horizontal são representados os intervalos de classe;
· No eixo vertical são representadas as frequências de classe;
· As barras são desenhadas verticalmente e não há qualquer espaço entre elas;
· A área de cada uma das barras é proporcional à respectiva frequência.
POLÍGONOS DE FREQUÊNCIAS
Os polígonos de frequências são usados, normalmente, para comparar duas distribuições de dados semelhantes. Para construirmos um polígono de frequência, primeiramente devemos construir o histograma, onde vamos achar o ponto médio do lado superior dos retângulos e uni-los.
Atenção: para que a área do polígono de frequências seja igual à somatória das áreas dos retângulos do histograma, parte-se do extremo esquerdo do polígono (ponto B) com o ponto médio (A) do dado anterior, de frequência nula, e procede-se do mesmo modo para o extremo direito do polígono.
FREQUÊNCIA ACUMULADA E RELATIVA
Em estatística, a frequência absoluta corresponde ao nome dado ao número de vezes que um valor aparece em um determinado conjunto de dados. A frequência acumulada é diferente: ela representa a soma de todas as frequências até o ponto atual no conjunto de dadoS.
CLASSIFICANDO UM CONJUNTO DE DADOS
1º Vamos iniciar fazendo um rol de todos os dados coletados, colocando todos esses dados em ordem crescente.
Exemplo: o conjunto de dados representam a quantidade de livros lidos por 8 alunos no decorrer do ano de 2017. Depois de classificar os valores, ele ficará da seguinte maneira: 3, 3, 5, 6, 6, 6, 8.
2º Calcule a frequência absoluta de cada valor. A frequência absoluta é a que representa quantas vezes ele aparece em seu rol (não confundir frequência absoluta com frequência acumulada).
Coloque no início da primeira coluna uma descrição para o que esse termo representa. Agora, escreva “frequência” no topo da segunda coluna. Complete a tabela com cada dado correspondente.
Exemplo: escreva “número de livros” no alto da primeira coluna e “frequência” no topo da segunda coluna. Na linha seguinte, escreva o primeiro valor sob “número de livros”: 3. Veja quantos 3 existem nos dados. Já que há dois 3, escreva 2 abaixo de “frequência”, na mesma linha. Esse procedimento deve ser repetido para cada valor, até o final da tabela.
3 ] F = 2
5 ] F = 1
6 ] F = 3
8 ] F = 1
3º Calcule a frequência acumulada do valor inicial. Essa frequência acumulada nos aponta a quantidade de vezes que aparece esse mesmo valor (ou um valor menor).
Comece sempre com o valor menor dos dados. Se por acaso não tivermos valores menores, a solução sempre será igual a frequência acumulada do mesmo valor.
Exemplo: o nosso valor mais baixo é 3. A quantidade de livros lidos foram 3 que é igual a 2. Ninguém leu menos do que isso, deste modo a frequência acumulada será 3. Coloque esse valor na primeira linha da tabela:
3 ] F = 2 | CF = 2
4º Calcule a frequência acumulada do valor seguinte. Acabamos de achar quantas vezes os menores aparecem. Para calcularmos a frequência acumulada desse valor,precisamos somar sua frequência absoluta ao total, ou seja, pegue a última frequência acumulada que você encontrou e some com a frequência absoluta do respectivo valor.
Isso se repete pelos demais valores!
Exemplo:
3 ] F = 2 | CF = 2
5 ] F = 1 | CF = 2 + 1 = 3
6 ] F = 3 | CF = 3 + 3 = 6
8 ] F = 1 | CF = 6 + 1 = 7
5º Faça uma conferência de seu trabalho. Quando finalizar, você terá somado o número de vezes que cada valor apareceu. A frequência acumulada final deve ser exatamente igual ao número total de pontos de valores em seu total de dados. Há dois modos de conferir o que foi feito:
Some todas as frequências individuais: 2 + 1 + 3 + 1 = 7, que é a nossa frequência acumulada.
Calcule a quantidade de pontos de dados. Como nosso rol era 3, 3, 5, 6, 6, 6, 8, temos 7 itens, sendo esse valor nossa frequência acumulada.
Frequência relativa
A frequência relativa é o quociente (divisão) da frequência absoluta da variável e o número de vezes que ela aparece. Deste modo, chamamos de frequência relativa de certa classe, calculando a frequência dessa classe através da soma das frequências das demais classes.
REPRESENTAÇÃO GRÁFICA
A representação gráfica nos permite uma visão e conclusão mais rápida de nossa pesquisa.