Buscar

Aula 1 - Bioestatística

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 3, do total de 10 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 6, do total de 10 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 9, do total de 10 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Prévia do material em texto

Aula 1
A Natureza e os Conceitos Fundamentais
da Estatística
Objetivo: Compreender a natureza da Estatística, as fases de um trabalho es-
tatístico, e seus conceitos fundamentais para uma interpretação conscienciosa dos
resultados do trabalho estatístico.
1 A Natureza da Estatística
Vivemos num mundo imerso em incertezas. A todo tempo somos bombardeados
por informações sobre pesquisas cientí…cas comprovando (estatisticamente) que tal
substância induz uma certa patologia, ou sobre pesquisas eleitorais, índices de rou-
bos, e outros conteúdos de forte caracterização probabilística. Num mundo assim,
é de fundamental importância possuir um espírito crítico para informações sujeitas
à incerteza a …m de poder dar inteligibilidade a elas e até mesmo poder distinguir
informações falsas de verdadeiras. Nessa medida, a Estatística é uma disciplina
crucial para todos os estudantes, e talvez aquela que mais atua na formação crítica
do cidadão, pois ela abarca diferentes áreas do conhecimento, tais como: Medic-
ina, Economia, Política, Psicologia, Tecnologia, Indústria (Controle de Qualidade),
Demogra…a (Censo), entre outras.
A raiz etimológica da palavra Estatística vem da palavra latina “status”
que signi…ca “estado” e signi…cava a contagem e gestão de dados do estado. Ao
longo da história da Estatística, essa vinculação ao estado foi se enfraquecendo e
hoje a estatística tem um caráter abrangente o bastante para lidar com sistemas do
conhecimento bem dissociados da noção de Estado.
No entanto, cabe ressaltar que hoje temos dois signi…cados para Estatística,
a saber: "Estatística" como Ciência e "estatística" como uma operação de dados
coletados em pesquisas. Por exemplo, uma média aritmética (que iremos mais tarde
estudar) é uma estatística também. O contexto nos auxiliará a distinguir o signi…-
cado veiculado pelo termo estatística.
Mas como ciência, o que é a Estatística, a…nal?
1
Estatística é a arte e a ciência de coletar, analisar, apresentar,
e interpretar dados, para que se tomem decisões sob incerteza.
Você deve estar surpreso com o uso da palavra "arte" na de…nição acima,
não? Mas a verdade é que sem julgamento, experiência e até mesmo uma forte intu-
ição é impossível analisar estatisticamente o comportamento de fenômenos incertos
ou aleatórios.
E o que entendemos por "fenômenos incertos"?
Fenômenos aleatórios (ou incertos) são aqueles cujos resultados
de interesse não podem ser aferidos com 100% de certeza.
Assim, onde há incerteza (e por conseguinte, variabilidade de resultados,
mesmo sob mesmas condições iniciais) aí deverá estar a Estatística para nos auxiliar
a dar ordem simbólica ao fenômeno.
Em geral o professor de Matemática conhece bem a natureza do raciocínio
matemático, mas quase sempre não foi instruído na sua formação acadêmica do
raciocínio estatístico. Qual a especi…cidade desses dois raciocínios e o que os difer-
encia?
O pensamento matemático baseia-se num raciocínio lógico em que as proposi-
ções são verdadeiras ou falsas. Além disso, preocupa-se com a descrição unívoca de
fenômenos da natureza a partir de modelos determinísticos.
A Estatística, por sua vez, lida com proposições que não podemos dizer
se são verdadeiras e tampouco falsas, situando-se numa situação de incerteza, que
pode ser quanti…cada através da probabilidade. É a ciência da variabilidade por
excelência e procura, através de dados experimentais aleatórios, extrair organização
do caos e tomar decisões sob incerteza.
Os pensamentos matemático e estatístico são construídos, respectivamente,
por sentenças matemáticas e sentenças estatísticas. Sentenças matemáticas são
aquelas que nos permitem garantir com 100% de certeza se a mesma é verdadeira
ou falsa. Exemplos de sentenças matemáticas: “Todos os números primos são ím-
pares” (sentença falsa, pois 2 é primo e par); “Todos os números primos maiores
que 2 são ímpares”(sentença verdadeira). Sentenças estatísticas são aquelas cuja
veracidade (ou falsidade) não possa ser garantida com 100% de certeza, mas apenas
nos permitem matematizar a probabilidade de erro da a…rmação. Por exemplo, a
sentença “uma moeda que, ao ser lançada 10 vezes, produz 8 caras não é honesta”
é uma sentença estatística, pois podemos apenas medir em que nível de con…abil-
idade tal a…rmativa pode ser considerada como verdadeira. Obviamente teremos
maior con…abilidade na a…rmação de uma sentença do tipo “uma moeda que, ao ser
lançada 50 vezes, produz 48 caras não é honesta”, pois há mais evidências contra a
honestidade da moeda no segundo caso do que no primeiro.
Como você deve ter percebido, em toda a…rmação estatística há um nível
de con…abilidade e uma probabilidade de erro ao a…rmarmos algo. Vejamos com
2
um exemplo esquemático como funciona uma tomada de decisão sob incerteza na
Estatística:
Suponha que dois medicamentos (A e B) serão testados quanto ao tempo de
cura para dor de cabeça. Para isso, selecionam-se n pessoas para o medicamento
A e n pessoas para o medicamento B. Suponha que a média do tempo de cura do
medicamento A tenha sido 2 minutos e do B de 4 minutos. Podemos dizer que as duas
médias são diferentes e que, portanto, o medicamento A é mais e…ciente do que o B?
Se estivermos imbuídos do raciocínio matemático, a duas respostas seriam “sim”,
pois 2 < 4. Entretanto, imbuídos do raciocínio estatístico, a resposta dependerá da
estrutura aleatória dos dados coletados. Vejamos dois cenários possíveis:
Cenário I: Os dados coletados nos dois grupos quando colocados em seus lugares
geométricos se comportam como a …gura 1 abaixo:
Figura 1
Neste cenário os dados coletados dos dois grupos são tão esparsos que se
sobrepõem um ao outro, e um teste estatístico adequado não validaria com alta
probabilidade a a…rmação de que o tratamento A é mais e…ciente do que o trata-
mento B, por ter gerado uma menor média.
Cenário II: Os dados coletados nos dois grupos quando colocados em seus
lugares geométricos se comportam como a …gura 2 abaixo:
Figura 2
3
Neste novo cenário os dados coletados dos dois grupos são tão coesos que se
distinguem um ao outro, e um teste estatístico adequado validaria com alta proba-
bilidade a a…rmação de que o tratamento A é mais e…ciente do que o tratamento B,
por ter gerado uma menor média.
Vemos com esses dois exemplos que uma tomada de decisão estatística deve
basear-se não apenas em valores pontuais de medida, mas também em estudos de
variabilidade dos dados para uma plena matematização das incertezas associadas às
a…rmações tecidas.
Vamos agora entender como se dão as fases de um trabalho estatístico. Para
isso, vejamos um caso concreto na pesquisa cientí…ca:
Um pesquisador deseja estudar o efeito de histórias infantis na prontidão
para a alfabetização de crianças, através de um teste de prontidão de leitura chamado
ABC. Para isso, ele seleciona sete crianças aleatoriamente para responderem ao teste
ABC sem o treinamento (pré-teste). Em seguida elas são estimuladas usando-se a
leitura e o comentário de histórias. Após o treinamento, as crianças respondem
novamente ao teste ABC (pós-teste). Ele deseja saber se o treinamento de fato
induz a prontidão na alfabetização.
Observe que esse estudo demanda a ferramenta Estatística, já que cada
amostra de sete alunos retirada trará resultados variáveis e desejamos concluir algo
sob incerteza. Com esse objetivo, como conduzir as fases da Estatística?
Fase 1 (Coleta dos Dados): o pesquisador selecionará as sete crianças, que
participarão do estudo e mensurará os testes antes e depois do treinamento.
Fase 2 (Exploração dos Dados): o pesquisador fará uma análise exploratória
dos dados coletados para comparar os valores obtidos antes e depois do teste, a …m
de poder concluir, com um certo nível de con…abilidade, se houve uma melhora na
alfabetização. Para isso, selecionará os métodos estatísticos adequados para testar
a hipótese de que otreinamento de fato induziu ou não à prontidão na leitura. Ele
deverá portanto analisar dados, conforme tabela e grá…cos abaixo, criados após a
coleta dos dados.
Escores no Teste ABC do Grupo Experimental
Indivíduos Pré-Teste Pós-Teste
1 6 20
2 9 11
3 13 12
4 10 14
5 8 10
6 4 7
7 6 6
4
PRE_TEST
POS_TEST
Bar/Column Plot (testeABC.STA 10v*7c)
0
4
8
12
16
20
24
Case 1 Case 2 Case 3 Case 4 Case 5 Case 6 Case 7
Pré-Teste x Pós-Teste
Fase 3 (Inferência dos Dados): a partir da análise exploratória, o pesquisador
matematizará as incertezas e a natureza dos dados, e tecerá hipóteses relevantes que
serão testadas à luz de algum teste estatístico apropriado para o caso em estudo.
Fase 4 (Interpretar os Dados e Apresentar os Dados): o pesquisador fará
interpretações claras e compreensíveis até para não-estatísticos, quanti…cando o nível
de incerteza de suas a…rmações e propondo medidas gerenciais, quando necessárias,
à luz de suas conclusões, de maneira a apresentar seus resultados adequadamente
em conferências, mídias ou periódicos cientí…cos.
Claro que o exemplo acima é posto apenas para que possamos entender emblem-
aticamente como se constrói um raciocínio estatístico para o tratamento de dados.
2 Conceitos Fundamentais da Estatística
Em todas as áreas da ciência, conceitos são fundamentais para a contrução de
uma teoria. É o que se costuma chamar na …loso…a da linguagem uma taxonomia.
Na Estatística, isso não é diferente. Como a Estatística é um ramo da Matemática,
ela traz as marcas da concisão matemática e estabelece de forma unívoca os seus
objetos e seus conceitos. Nesta seção, discutiremos os conceitos-chave do nosso curso,
para que possamos caminhar de forma concisa na construção teórica da Estatística.
Antes, porém, gostaríamos de retomar a ideia mais emblemática da fun-
cionalidade da Estatística nas ciências em geral:
A concepção mais emblemática da Estatística é aquela em que temos uma
população de interesse em estudo e, por algum motivo, não podemos acessá-la in-
tegralmente para medir uma certa propriedade da mesma. O que fazer então? A
ideia central da Estatística é obter de maneira conscienciosa uma amostra que traga
potencialmente a informação da população e, através dela, inferir os resultados para
a população. Como a amostra é apenas uma parte da população, haverá portanto
5
variabilidade nos resultados amostrais (cada amostra retirada gerará resultados di-
versos), e, portanto, tais resultados serão aleatórios e devem ser modelados proba-
bilisticamente. Na presença, portanto, de variabilidade de resultados, temos então
legitimado aí o uso da Estatística, pois devemos tomar nossas decisões e a…rmar
determinadas coisas sob incerteza. Observe que se pudéssemos acessar toda a pop-
ulação, a mensuração da propriedade em estudo deixaria de ser variável e incerta,
pois acederíamos ao valor exato, e assim não haveria necessidade, no sentido estrito,
do uso da Estatística... É claro que este exemplo supõe uma população …nita. Se
a população fosse in…nita, então por mais razão a Estatística seria a ferramenta
teórica por excelência para o tratamento do problema! Mas estamos nos adiantando
e precisamos de…nir ainda o que se entende por população, amostra, parâmetro e
estatística (ou estimador) dentro das chamadas Estatística Descritiva e Estatística
Inferencial.
População é a coleção de todos os elementos (pessoas, objetos, ou dados)
de interesse num particular estudo.
Amostra é um suconjunto da população da qual a informação é coletada.
Parâmetro é a descrição numérica de uma característica da população.
Estatística (ou Estimador) é a descrição numérica de uma característica
da amostra.
Estatística Descritiva é parte da Estatística que se ocupa em
resumir (sintetizar) e organizar a informação de um conjunto de dados.
Estatística Inferencial é parte da Estatística que se ocupa em estimar
e tirar conclusões sobre características de uma população à luz da amostra.
Assim, suponha que estejamos interessados em estudar a renda bruta média
mensal de todos os brasileiros assalariados no ano de 2011.
Qual é a nossa população nesse estudo? Todos os brasileiros com carteira
assinada em 2011.
Qual seria uma possível amostra? Por exemplo, os brasileiros assalariados
de 2011 do estado do Rio de Janeiro.
Qual é o nosso parâmetro de interesse? A média de todos os salários brutos
mensais de todos os brasileiros assalariados de 2011.
Qual é a nossa estatística? A média de todos os salários brutos mensais de
todos os brasileiros assalariados do estado do Rio de Janeiro de 2011.
A essa altura você já deve ter intuído que uma das ideias da Estatística é
usar a estatística (ou estimador) para a…rmar com um certo nível de con…abilidade
qual o valor do parâmetro em estudo.
Como dissemos anteriormente, para que a informação fornecida pela amostra
seja valiosa para a estimação de parâmetros, é necessário que amostra tenha sido
6
coletada de maneira conscienciosa da população. Embora haja toda uma teoria para
uma tecnologia de obtenção da amostra, gostaríamos apenas de caracterizar alguns
tipos aqui, pois o tratamento dessa teoria está fora dos objetivos desse curso:
� Amostra aleatória: Cada membro da população tem a mesma chance de ser
selecionado.
� Amostra aleatória simples: Todas as amostras de mesmo tamanho são
igualmente prováveis.
� Amostra aleatória estrati…cada: A população é dividida em grupos (es-
tratos) e uma amostra aleatória é selecionada de cada grupo. Os estratos
podem ser faixas etárias, gêneros ou graus de escolaridade, por exemplo.
� Amostra aleatória por conglomerados: A população é dividida em grupos
distintos (como se fossem subpopulações), chamados conglomerados. Usamos
a amostra aleatória simples para escolher uma amostra de conglomerados e
em seguida todos os indivíduos dos conglomerados escolhidos são analisados.
� Amostra sistemática: A partir de uma população caracterizada numa listagem,
selecionamos aleatoriamente um elemento inicial, e em seguida, escolhemos
os membros da amostra a intervalos regulares. Por exemplo, se desejamos
selecionar um membro da população a cada 20 elementos da lista, então se-
lecionamos aleatoriamente um número de 1 a 20, digamos 7, e tomamos os
membros 27, 47, 67, e assim sucessivamente da lista.
Mas nossa taxonomia ainda não chegou ao …m... Temos ainda alguns con-
ceitos a discutir. Então vamos lá.
Um elemento é cada uma das unidades observadas no estudo.
Uma variável é uma característica de um elemento que se possa medir.
Uma observação é um conjunto de valores de variáveis de um dado elemento.
Por exemplo, se desejamos testar a in‡uência de um determinado medica-
mento na pressão arterial de idosos acima de 65 anos, a partir da mensuração da
pressão arterial antes e depois da medicação, então, temos que cada idoso no estudo
é um elemento (ou unidade experimental); a pressão arterial é a nossa variável de
mensuração; e as medidas da pressão arterial antes e depois da medicação de cada
idoso compõem uma observação do estudo.
Finalmente, para fechar agora os nossos conceitos fundamentais da Estatís-
tica, precisamos classi…car os tipos de variáveis presentes num determinado estudo.
Por que isso é tão importante? Porque é pela natureza dos dados, ou, como dizemos
em Estatística, pelo nível de mensuração dos dados, que saberemos quais métodos
estatísticos serão apropriados em cada caso. Assim, a natureza de nossos dados já
nos direciona para o tipo de tratamento estatístico de que faremos uso.
7
Uma variável qualitativa é uma variável que não assume valor numérico,
mas é classi…cada em categorias (qualidades).
Uma variável quantitativa é uma variável que assume valores numéricos.
Variáveis qualitativas são também chamadas de variáveis categóricas, pois
podem ser agrupadas em categorias. Alguns exemplos são: sexo,etnia, estado civil,
etc. Já exemplos de variáveis quantitativas temos: altura, peso, idade, número de
…lhos, etc.
As variáveis qualitativas podem ser classi…cadas como nominais ou ordi-
nais.
Uma variável é dita nominal se assume categorias não-ordenadas, sem
característico numérico intrínseco. Por exemplo: sexo e etnia.
Uma variável é dita ordinal se assume categorias ordenadas, sem característico
numérico intrínseco. Por exemplo: classe social e grau de instrução.
Além disso, as variáveis quantitativas podem ser classi…cadas como discre-
tas ou contínuas.
Uma variável discreta pode assumir um número …nito ou contável de valores.
Cada valor pode ser grafado como um ponto na reta, com espaço entre os pontos.
Uma variável contínua assume um número in…nito de valores, formando
um intervalo da reta real, sem espaço entre os pontos.
Exemplos de variáveis quantitativas discretas são: número de habitantes por
domicílio, número de anos cursados com aprovação em séries escolares, etc. Já para
as quantitativas contínuas podemos citar: altura, peso, tempo de vida útil de um
componente eletrônico.
Assim temos o seguinte esquema resumido:
Variável
8>>>><>>>>:
Qualitativa
�
Nominal
Ordinal
Quantitativa
�
Discreta
Contínua
Associados aos tipos de variáveis, temos também os níveis de mensuração.
8
Níveis de Mensuração: Um conjunto de dados pode ser classi…cado de acordo
com o nível de medida mais alto que ele aplica. As quatro escalas de medida, da
mais baixa para a mais alta, são:
1. Escala Nominal: formada por categorias que descrevem atributos ou qual-
idades dos dados (variáveis qualitativas). Não há nenhuma ordem natural nessas
categorias e tampouco característicos numéricos intrínsecos. Exemplos: sexo, estado
civil, cor dos olhos, etnia, etc.
2. Escala Ordinal: formada por categorias que descrevem atributos ou quali-
dades dos dados (variáveis qualitativas), mas que podem ser ordenadas, embora não
tenham característicos numéricos intrínsecos. Exemplos: grau de hipertensão (leve,
moderada e grave), escolaridade (sem instrução, ensino fundamental, ensino médio,
ensino superior, pós-graduação), etc.
3. Escala Intervalar: é similar à escala ordinal, exceto pelo fato de as men-
surações serem numéricas e distâncias entre dois dados podem ser medidas. Entre-
tanto, o zero (0) não é natural, isto é, não indica a ausência do atributo mensurado.
Exemplo: temperatura em graus Celsius (0�C não indica a ausência de temper-
atura).
4. Escala Racional (ou das Razões): é a escala mais rica de mensuração, com
característicos numéricos intrínsecos e zero natural (indicando a ausência do atributo
medido). Exemplo: todas as mensurações físicas (peso, altura, massa corporal).
De posse desses conceitos fundamentais, podemos na próxima aula começar …nal-
mente a operar matematicamente nossos dados. Antes, porém, gostaríamos de pro-
por as seguintes atividades de sedimentação do conteúdo tratado em nossa primeira
aula.
Exercício 1 Qual o objetivo da Estatística?
Exercício 2 Como se estrutura a Estatística?
Exercício 3 Dê um exemplo de fenômeno aleatório e um exemplo de fenômeno
não-aleatório (determinístico).
Exercício 4 Suponha que você tivesse que validar a informação de que a geladeira
da fábrica A consome menos energia ao mês que a geladeira da fábrica B. Como
você intuitivamente estruturaria as fases do método estatístico para validar (ou não)
essa a…rmação?
Exercício 5 Retire de mídias (jornal, revista, internet, etc) uma matéria que você
utilizaria em sala de aula para ilustrar a presença da Estatística no dia a dia aos
seus alunos.
9
Exercício 6 Estabeleça se as seguintes situações ilustram o uso da Estatística De-
scritiva ou Estatística Inferencial, justi…cando as respostas.
(a) Em São Paulo, a média de gasto semanal de consumo de gasolina numa
amostra de 700 proprietários de carros foi de R$ 150; 00. O governo infere a média
semanal de gasto em gasolina no estado de São Paulo é R$ 150; 00.
(b) Uma amostra de 150 residentes de Copacabana mostra que 27 destes são
funcionários públicos. Assim 18% desses 150 residentes trabalham para o governo.
(c) A média de idade de uma amostra de 250 habitantes de Santa Cruz foi de 34
anos.
(d) Numa pesquisa feita com 1000 habitantes de Campos (Rio de Janeiro), 456
disseram que já fazem suas compras com sacola ecológica pessoal. A prefeitura con-
clui que 45; 6% dos habitantes de Campo já aderiram à bolsa ecológica.
Exercício 7 Deseja-se conhecer o comportamento de idosos do bairro do Flamengo,
com idade acima de 65 anos. Para isso, você como pesquisador decide selecionar
200 idosos moradores do Flamengo e, através de mensurações, obter as seguintes
informações por idoso:
(1) Ativo (A) ou Sedentário (S).
(2) Idade (em anos).
(3) Peso (em kg).
(4) Altura (em cm).
(5) Índice de Massa Corporal (IMC), que é a razão entre peso e altura em metros
elevada ao quadrado.
(6) Classe segundo o IMC (Normal (N) ou Sobrepeso (P))
(7) Circunferência da cintura (em cm).
(8) Circunferência do quadril (em cm).
(9) Relação Cintura/Quadril (RCQ) (adimensional).
(10) Classe segundo a RCQ, sendo PR (pequeno risco), MR (médio risco) e GR
(grande risco).
Com base no estudo acima, pede-se:
(a) Identi…car a população em estudo.
(b) Identi…car a amostra em estudo.
(c) Identi…car os possíveis parâmetros de interesse no estudo.
(d) Identi…car as estatísticas associadas aos parâmetros de interesse no estudo.
(e) Identi…car os elementos do estudo.
(f) Identi…car as variáveis do estudo.
(g) Identi…car as observações do estudo.
(h) Classi…car as variáveis do estudo como qualitativas ou quantitativas.
(i) Classi…car as variáveis qualitativas do estudo como nominais ou ordinais.
(j) Classi…car as variáveis quantitativas do estudo como discretas ou contínuas.
(k) Avaliar o nível de mensuração de cada variável do estudo.
Exercício 8 (Fórum de Discussões) Proponha uma atividade em sala de aula
para que os alunos possam reconhecer onde e como a Estatística possa ser utilizada
na descrição de alguma quantidade aleatória de interesse.
10

Outros materiais