Prévia do material em texto
Métodos
Matemáticos
Objetivos
Objetivo 1
o Aplicar as principais propriedades de Álgebra Linear;
Objetivo 2
o Esclarecer os conceitos de cálculo numérico, tais como: interpolação e
integração numérica;
Objetivo 3
o Calcular estatísticas, regressão linear, organização de dados, medidas de
tendência central e de dispersão.
Conteúdo
UNIDADE 1 - Introdução à Álgebra Línea
Aula 1 - Matrizes
Aula 2 - Sistemas Lineares
Aula 3 - Autovalores e Auto vetores
UNIDADE 2 - Cálculo numérico
Aula 1 - Zeros de funções
Aula 2 - Interpolação
Aula 3 - Integração numérica
UNIDADE 3 - Probabilidade e estatística
Aula 1 - Introdução à probabilidade e estatística
Aula 2 - Medidas de tendência central e de dispersão
Aula 3 - Regressão linear e correlação
UNIDADE 4 - Estatística aplicada e probabilidade
Aula 1 - Estatística descritiva
Aula 2 - Probabilidade
Aula 3 - Métodos de tomada de decisão
Introdução
Olá, estudante!
Desejamos boas-vindas à disciplina de Métodos Matemáticos. Nesta disciplina,
trabalharemos com os tópicos mais importantes da álgebra, cálculo numérico e
probabilidade. Inicialmente, abordaremos a Álgebra Linear, com a estrutura
algébrica conhecida por matriz e suas principais propriedades. Uma vez definido
o que é uma matriz, introduziremos as operações com essa estrutura algébrica e
o conceito de determinantes. Para entender melhor, alguns exemplos práticos
relacionados à engenharia serão considerados.
Em segundo lugar, trabalharemos com os conceitos de cálculo numérico, tais
como: interpolação e integração numérica. Estes conceitos são ferramentas
fundamentais quando nos deparamos com problemas práticos, cuja solução
não é possível de se obter com métodos analíticos, gerando a necessidade do
uso de métodos numéricos. Encerraremos a disciplina com os conceitos
fundamentais de probabilidade e estatística, em que abordaremos as questões
de hipóteses estatísticas, regressão linear, organização de dados, medidas de
tendência central e de dispersão, entre outros conceitos importantes. Vale
lembrar que essa disciplina é uma das mais importantes na engenharia, pois ela
permite, além da álgebra, ênfases em cálculo numérico e estatística, que são
fundamentais na profissão de engenheiro, uma vez que esses conceitos formam
a base matemática da profissão.
Competências
Ao fim desta disciplina, você deverá ser capaz de:
aplicar matrizes e suas operações na resolução de sistemas lineares e
conhecer as aplicações de vetores e suas operações.
calcular interpolação polinomial com a finalidade de aproximar funções
reais e aproximar a integral definida de uma função por meio de técnicas
numéricas.
descrever os fundamentos probabilísticos e estatísticos para tomada de
decisão necessários na prática profissional da área de exatas e
Engenharias.
Unidade 1 - Aula 1 - Matrizes
Introdução da Unidade
Objetivos da Unidade
Ao final desta Unidade, você será capaz de:
esclarecer a representação de dados na forma matricial;
identificar modelagem de problemas aplicados como sistema de equações lineares;
aplicar vetores e suas operações na resolução de problemas geométricos aplicados.
Estudante, quando escutamos o termo “métodos matemáticos”, é natural que o primeiro
conceito que vem em nossa cabeça é a relação com a realização de inúmeros cálculos,
às vezes até sem-fim. Mas, será que estamos corretos sobre esse conceito?
Para iniciar seu entendimento sobre os conceitos abordados, trabalharemos com a ideia
de matrizes, as quais são, em linguagem popular, tabelas com um gama de dados. As
matrizes são objetos matemáticos úteis para organização e manipulação de dados
computacionalmente. Após essa ênfase no conceito de matrizes, estudaremos outro
conceito que é muito comum, especialmente em modelagem: sistemas lineares. Os
sistemas lineares podem ser aplicados em diversas situações, por exemplo, no
balanceamento de equações químicas, no cálculo de lucros e dividendos de em empresa,
nos problemas de otimização, na resistência de vigas, entre muitas outras aplicações
comuns em nosso cotidiano.
Por fim, encerraremos a unidade com o conceito de autovalores e autovetores, os quais,
em geral, são utilizados em problemas de otimização computacional e em aplicações
voltadas para a área da física em contexto de mecânica.
Para exemplificar, suponha que você tem que lidar com um problema de construção
civil, cujo objetivo é avaliar a resistência das vigas. Para resolver essa questão, você,
inicialmente, trabalhará com a experimentação da situação e coletará os dados dela. A
partir disso, montará a matriz com os dados. Com a matriz em mãos, por meio de
sistemas lineares e operações com matrizes, você poderá validar a sua hipótese sobre a
resistência das vigas. Esta, porém, não é a única situação em engenharia que você pode
utilizar tais conceitos. Existem muitas outras, como predição de níveis de poluição
atmosférica, na engenharia ambiental; concentração de solventes, na engenharia
química; relatórios financeiros empresariais, no setor público ou privado; entre muitas
outras aplicações. Já se imaginou trabalhando com as matrizes e os sistemas lineares
sob essa visão? Para lhe auxiliar, aprenderemos, no decorrer desta unidade, um pouco
mais sobre esses objetos. Mãos à obra!
Introdução da Aula
Qual é o foco da aula?
Nesta aula, você estudará sobre Matrizes.
Objetivos gerais de aprendizagem
Ao final desta aula, você será capaz de:
identificar a importância do papel das matrizes quando se trata de dados
dispostos em tabelas;
descrever como realizar operações com dados das matrizes;
empregar o conceito de matrizes e determinantes.
Situação-problema
Nesta aula, entenderemos o conceito de matrizes e determinantes por meio de exemplos
práticos e das definições dadas pela matemática em si. Com isso, você compreenderá a
importância do papel das matrizes quando se trata de dados dispostos em tabelas e como
realizar operações com esses dados.
Como exemplo dessa abordagem, podemos considerar uma experimentação de
resistência de vigas de uma construção civil, em que se obteve os valores das
componentes das forças para cada uma das realizações do experimento. Os dados foram
todos dispostos em tabelas, as quais, por sua vez, podem ser dispostas em matrizes para
realização de cálculos, a fim de se atingir o objetivo da pesquisa ou do trabalho, que
pode ser, por exemplo, o tempo total gasto para realização do experimento ou a escala
das forças consideradas nele. Portanto, o uso de operações utilizando-se o conceito de
matriz permite um melhor entendimento e interpretações do experimento em questão.
Vamos criar uma situação hipotética para exemplificar o uso de matrizes no dia a dia de
trabalho, especialmente em áreas relacionadas à engenharia.
Imagine que você foi convocado e nomeado para realizar uma verificação do último
relatório bimestral de uma empresa de construção civil no ano de 2020 em relação às
vendas de cimento e cal. Os dados de venda da empresa são descritos pela matriz:
Cada elemento dessa matriz representa o número de unidades dos produtos do tipo i (i =
1). A representação do cimento (i = 2) e a representação da cal vendidos no mês j (j = 1)
representam novembro, e j = 2 representa dezembro. De acordo com as exigências, foi-
lhe pedido para verificar as seguintes questões:
1. Qual produto e em qual mês foi vendido menos sacos? Qual a maior diferença
de vendas entre os produtos nos meses correspondentes?
2. Qual foi a arrecadação bruta da empresa no bimestre com esses dois tipos de
produtos, se o pacote de cimento custa R$30,00 e o pacote de cal custa R$50,00?
Qual foi a arrecadação bruta de cada mês?Que tal começar esse entendimento agora? Você será acompanhado em todo o processo.
Iniciaremos com os conceitos fundamentais de matrizes, para que você possa entender a
relação delas com a disposição de dados em tabelas e como realizar operações.
Conceito de Matriz
Ao estudar métodos matemáticos, deparamo-nos com diversos conceitos. Nesta aula,
abordaremos um conceito usual em muitas áreas do conhecimento, o conceito de
matrizes. As matrizes são essenciais para muitos problemas, não apenas porque elas
“ordenam e simplificam”, mas também porque oferecem novos métodos de resoluções e
novos olhares sobre o problema.
Neste aspecto, entende-se por uma matriz uma tabela de elementos dispostos em linhas
e colunas. Por exemplo, ao coletarmos dados referentes às concentrações de pH do rio
Columbia no primeiro trimestre dos anos de 2013 a 2015, podemos dispô-los na tabela a
seguir.
Concentrações de pH do rio Columbia de acordo com a estação de monitoramento de
água Umatilla do estado de Washington, nos Estados Unidos, no período de 2013 a
2015. Fonte: https://bit.ly/384JRCT. Acesso em: 20 jan. 2021.
Ao abstrairmos os significados das linhas e colunas, obtemos a seguinte matriz:
______
• Reflita
Quando temos uma tabela com uma enorme quantidade de linhas e colunas, isto é,
diversas variáveis, é viável a disposição desses dados em forma de matriz?
______
Uma questão que você pode estar se perguntando é: quais são os elementos que as
matrizes podem incorporar? Na primeira impressão, pode parecer que as matrizes
incorporam apenas números, porém elas podem incorporar muitos outros elementos, por
exemplo, funções, matrizes, números complexos etc. De fato, considere a matriz:
Essa matriz contém em suas entradas números complexos e equações/funções
algébricas. Logo, uma matriz pode também conter uma combinação de elementos de
natureza diferente, não sendo exclusivamente formada por apenas números.
Outro fator importante quando se trabalha com matriz é a representação dela em termos
algébricos. Representamos uma matriz de m linhas e n colunas por:
______
• Assimile
______
Quando se fala de matriz, uma propriedade que merece destaque é a de igualdade de
matrizes. Diremos que duas matrizes são iguais se elas têm necessariamente o mesmo
número de linhas e colunas e seus termos correspondentes são todos iguais.
______
ෝ Exemplificando
Considere as matrizes de concentrações de pH de dois rios aleatórios:
Note que, embora os números apresentados em ambas as matrizes sejam iguais, as
matrizes não são iguais, pois o número de linhas e colunas são diferentes e os elementos
na posição correspondente também são diferentes.
______
Uma segunda propriedade das matrizes é a operação de adição de matrizes. Por
exemplo, consideramos as tabelas abaixo, as quais descrevem a produção de materiais
de construção em dois anos consecutivos em três regiões brasileiras.
Produção de materiais de construção (em milhões de toneladas) no primeiro ano. Fonte:
elaborada pelo autor.
Produção de materiais de construção (em milhões de toneladas) no segundo ano. Fonte:
elaborada pelo autor.
Suponha que nosso interesse seja descrever uma tabela que nos dê a produção por
material de construção e por região nos dois anos conjuntamente. Como procederemos?
Ora, neste caso, partimos da operação conhecida como adição de matrizes. Para realizá-
la, devemos verificar se ambas as tabelas têm o mesmo número de linhas e de colunas.
No nosso exemplo, essa condição é satisfeita. Logo, basta somar os elementos
correspondentes e teremos a resposta para nosso objetivo! Assim:
Portanto, a produção por material de construção e por região nos dois anos
conjuntamente é descrita pela tabela abaixo.
Produção de materiais de construção (em milhões de toneladas) nos dois anos. Fonte:
elaborada pelo autor.
______
• Assimile
Além da adição e da igualdade de matrizes, duas outras operações são comuns ao
estudarmos matrizes: a multiplicação de um escalar (número) por uma matriz e a
multiplicação de matrizes. Ambas as operações podem ser definidas formalmente
como:
A primeira operação definida é relativamente simples, pois basta multiplicar o número
por cada elemento da matriz. Quanto à segunda operação, devemos tomar um certo
cuidado com ela. Por quê? Vamos ver algumas observações do produto de matrizes:
Só podemos multiplicar duas matrizes A e B se o número de colunas de A for
igual ao número de linhas de B.
O elemento é obtido multiplicando os elementos da i-ésima linha da primeira
matriz pelos elementos correspondentes da j-ésima coluna da segunda matriz e
somando-se esses produtos.
O produto AB das matrizes A e B geralmente é diferente do produto BA das
matrizes B e A. Além disso, em qualquer um dos casos, o produto pode não
existir.
Para exemplificar essa operação, consideraremos a matriz A, que representa o quadro
com o número de engenheiros de uma construção civil, e B como uma matriz que
representa o número de projetos disponíveis em cada área da empresa, em que:
Suponha que o interesse seja multiplicar ambos os quadros, a fim de monitorar os
recursos para a disposição dos projetos associados aos engenheiros. Neste caso,
queremos trabalhar com o produto da matriz A com a matriz B. Isto é,
Como o número de colunas da matriz A é igual ao número de linhas da matriz B,
podemos realizar o produto, e o resultado é uma matriz dada pelo número de linhas de
A com o número de colunas de B, isto é, a ordem da matriz resultante é . Assim:
Portanto, a matriz que representa os recursos para a disposição dos projetos associados
aos engenheiros da empresa é dada por:
Tipos de Matrizes
Agora que sabemos algumas das operações básicas de matrizes, interessa-nos saber
quais são os tipos de matrizes que podemos encontrar em nossas situações-problema.
Dos tipos conhecidos de matrizes, destacaremos dez deles:
Agora que conhecemos os tipos de matrizes e as operações básicas em relação às
matrizes, podemos definir o que é um determinante de uma matriz. Esse conceito será
útil nas seções posteriores na solução de sistemas lineares envolvendo algumas
situações do cotidiano.
O que é determinante? Ora, quando nos referimos a esse termo, estamos nos referindo a
um número associado a uma matriz quadrada A. Esse número é denotado
como det(A) ou |A|. Mas, como encontra-se esse valor? Depende do tamanho da nossa
matriz. Nesta aula, trabalharemos com determinantes de matrizes até a ordem . Vamos
lá?
Para as matrizes de ordem 1x1, não temos nenhum cálculo associado ao determinante,
uma vez o que ele será o próprio elemento da matriz. No entanto, para uma matriz de
ordem 2x2, o cálculo do determinante é feito realizando o produto dos elementos da
diagonal principal subtraindo o produto dos elementos da diagonal secundária. Em
termos matemáticos, temos:
Para as matrizes , o cálculo é feito da mesma maneira? Não necessariamente. Neste
caso, utilizamos a regra de Sarrus para realizar o cálculo. Por esta regra, adicionamos
duas novas colunas na matriz inicial, repetindo os valores das duas primeiras colunas.
Agora temos três diagonais principais e três secundárias. Procedemos, então, da mesma
forma do determinante . Em termos matemáticos, fazemos:
Com isso, encerramos a nossa primeira aula sobre os conceitos básicos e fundamentais
de matrizes e determinantes, além das operações com esses objetos. Tais conceitos serão
de suma importância para orientar sua equipe no trabalho proposto no início da unidade,
especialmente para organização de dados.
Conclusão
Nosso problema aqui é conferir as informações do relatório da empresa,
especificamente a matriz que representa as vendas. Para responder à primeira questão,
devemos, inicialmente, descrever o quecada linha e cada coluna representa. Para esta
empresa, as linhas são os produtos, e as colunas, os meses. Assim, para saber qual
produto teve o menor número de sacos vendidos, basta olhar qual é a menor entrada da
matriz. Neste caso, é o elemento, sobre o qual se observa que foram vendidos 1.375
sacos de cal. Já para a segunda questão, precisamos identificar a quais elementos a
matriz se refere. O número de sacos de cal vendidos em novembro, de acordo com a
matriz, é o elemento, e o número de sacos de cimento vendidos em dezembro é
representado pelo elemento. Logo, para saber quantos sacos de cal foram vendidos a
mais que sacos de cimento, deve-se fazer a seguinte operação:
Portanto, em dezembro, foram vendidos 75 sacos de cal a mais que sacos de cimento
nessa empresa. Logo, a maior diferença de vendas foi no mês de novembro.
Por fim, para a última questão, temos duas operações a se fazer. A primeira delas é
somar o número de sacos de cal e de cimento, individualmente.
Assim, a arrecadação do último bimestre de 2020 pela empresa foi um total de R$
273.600,00. Por outro lado, em relação à arrecadação total no bimestre, podemos
também trabalhar com o produto de matrizes definido, como:
Em que a primeira matriz representa os valores de cada produto, e a segunda matriz 2x2
representa as vendas. Para obter o total arrecadado, basta realizar o produto e somar as
entradas, o que, nesse caso, é R$ 273.600,00. A vantagem desse método é que a matriz
resultante do produto traz a arrecadação bruta em cada mês, e ela é dada por:
Unidade 1 - Aula 2 - Sistemas Lineares
Introdução da Aula
Qual é o foco da aula?
Nesta aula, você estudará sobre Sistemas Lineares.
Objetivos gerais de aprendizagem
Ao final desta aula, você será capaz de:
definir os sistemas de equações lineares;
descrever operações elementares, matrizes equivalentes e escalonamento;
esclarecer os sistemas não-homogêneos e matrizes invertíveis.
Situação-problema
Estudante, nesta aula, entenderemos o conceito de sistemas lineares por meio de
exemplos práticos e de definições dadas pela matemática em si. Com isso, você
compreenderá a importância do papel dos sistemas lineares e como eles podem ser
utilizados em situações do dia a dia.
Como exemplo dessa abordagem, podemos considerar o balanceamento de equações
químicas, muito comuns em aplicações de engenharia química. Balancear uma equação
pode nos dizer muitas coisas sobre o comportamento de uma molécula em determinada
reação, e os sistemas lineares são fundamentais para trabalharmos com esse conceito,
por permitirem calcular com precisão a quantidade de átomos necessários para que se
tenha um equilíbrio químico na reação.
Estudante, criaremos uma situação hipotética para exemplificar o uso de sistemas
lineares no dia a dia de trabalho, especialmente em áreas relacionadas à engenharia.
Em engenharia elétrica, uma das aplicações mais comuns de sistemas lineares é a que
envolve circuitos elétricos. Suponha que você tenha sido contratado para identificar os
valores da corrente elétrica em um circuito elétrico composto por quatro ciclos
fechados, no qual as correntes são denotadas como I1, I2, I3, I4, e as direções atribuídas
a cada uma dessas correntes são arbitrárias, isto é, se uma corrente tem valor negativo
para sua intensidade, então sua direção real é inversa à direção estipulada na situação
considerada. Lembrando-se de que o fluxo de corrente num ciclo é governado pelas leis
de Kirchhoff (a soma algébrica das quedas de voltagem em torno do ciclo é igual à
soma algébrica das fontes de voltagem na mesma direção desse ciclo), foi obtido o
seguinte sistema linear para o problema:
No relatório que você deve escrever, há as seguintes perguntas: quais são os valores das
correntes elétricas nessa situação, de acordo com o sistema de equações obtido? Quais
são as direções dessas correntes? Para responder a essas questões, sugere-se trabalhar
com a forma linha-reduzida do sistema linear em questão. Além disso, para entregar o
relatório completo com suas observações, foi-lhe solicitada a indicação dos campos:
nome da empresa, problema, solução, custo e assinatura.
Que tal começar esse entendimento agora? Você será acompanhado em todo o processo.
Iniciaremos com os conceitos fundamentais de sistemas lineares e suas aplicações em
engenharia química; em seguida, trabalharemos com métodos de soluções desses
sistemas, especialmente em forma de matrizes.
Sistema Linear de Equações
Anteriormente, exploramos o conceito de matrizes e suas principais características. Será
que é somente esse tipo de estrutura que encontramos no nosso dia a dia? Para
responder a essa questão, consideraremos a situação em que você deseja, por exemplo,
saber quantas moléculas de hidrogênio (H2) e de oxigênio (O2) são necessárias para
formar a água (H2O). Podemos escrever essa relação como:
Se conseguir resolver o sistema apresentado, temos o número de moléculas necessárias
para satisfazer a reação e, assim, entender um pouco sobre reações químicas na
natureza. Essa estrutura aqui introduzida é chamada de sistema linear de equações e
será nosso objeto de estudo desta unidade.
______
• Assimile
Matematicamente, definimos um sistema linear com m equações e n incógnitas como
sendo um conjunto de equações do tipo:
______
Os sistemas lineares são utilizados em muitas situações, por exemplo, tráfego de
veículos, balanceamento de equações químicas, funções polinomiais, ruído acústico,
sistemas GPS, mecanismos de busca (como o Google), entre muitas outras. Nosso foco
será, em especial, as aplicações voltadas para a engenharia.
______
• Exemplificando
Como primeiro exemplo, consideremos a combustão da gasolina. Embora a gasolina
seja uma mistura de hidrocarbonetos, o composto que predomina é o C8H18. Em
estudos de engenharia química, estabelece-se que a combustão completa da gasolina
acontece quando reage com o gás oxigênio, que resulta em gás carbônico e água, isto é,
Assim, observa-se que:
a relação para os átomos de carbono é: 8x=w;
a relação para os átomos de hidrogênio é: 18x=2z;
a relação para os átomos de oxigênio é: 2y=2w+z.
A partir dessas informações, podemos escrever o seguinte sistema linear:
______
Para responder à questão do nosso exemplo, introduziremos um novo conceito: matriz
ampliada de um sistema linear. Considere o sistema linear em sua forma geral:
Essa matriz é chamada de matriz ampliada do sistema. Nela, cada linha é apenas uma
representação abreviada da equação correspondente no sistema. Voltando ao nosso
exemplo, podemos reescrever o sistema da combustão de gasolina em forma matricial
como:
Qual é o próximo passo? Para prosseguir, necessitamos de um outro conceito, o qual
chamamos de operações elementares. Elas são operações que realizamos na matriz
ampliada do sistema, a fim de obter uma matriz equivalente, que nos trará a solução,
caso exista, do sistema. São três tipos de operações que podemos considerar:
Veja que agora nossa matriz equivalente tem um aspecto mais simples para obtermos a
solução do sistema. Assim, podemos retornar para as equações do sistema,
reescrevendo-o de acordo com a matriz equivalente. Portanto,
Observe que temos três equações para quatro variáveis. Neste caso, dizemos que o
sistema é possível (visto que nenhuma linha é do tipo, por exemplo, 2 = 0) e
indeterminado, ou seja, admite infinitas soluções, já que temos uma variável livre. Seja
w essa variável livre, logo, temos que:
______
• Reflita
Em que outra situação do cotidiano você poderia utilizar sistemas lineares e resolvê-los
partindo da ideia de operações elementares?
______
No nosso exemplo, consideramos o conceito de possível e indeterminado em relação à
solução do sistema. No entanto, é somenteesse conceito que temos em relação a isso? A
resposta é não! Um sistema linear pode ser classificado de três formas:
1. possível e determinado (SPD): quando não há variáveis livres e todos os
valores das variáveis considerados podem ser encontrados (observação: a
solução (0, 0, ..., 0) é chamada de solução trivial do sistema e será excluída
dessa classificação);
2. possível e indeterminado (SPI): quando o número de equações é menor que o
número de variáveis, obtendo-se, assim, uma variável livre, a qual gerará
infinitas soluções para o sistema;
3. impossível (SI): quando não há variáveis livres e não é possível determinar uma
solução do sistema em questão.
Neste aspecto, trabalhamos com um novo conceito, que é o de matriz linha-reduzida à
forma escada. Tal conceito pode ser definido como:
Definição: uma matriz mxn é linha-reduzida à forma escada se:
o primeiro elemento não nulo de uma linha não nula é igual a 1;
cada coluna que contém o primeiro elemento não nulo de alguma linha tem
todos os seus outros elementos iguais a zero;
toda linha nula está sempre abaixo de todas as linhas não nulas;
se as linhas 1, ..., r são linhas não nulas e se o primeiro elemento não nulo da
linha i está na coluna ki, então k1<k2<...kr.
Essa definição descreve o que chamamos de escalonamento de uma matriz. Em sistemas
lineares, tal escalonamento é útil para definir a solução do mesmo de acordo com a
classificação anterior. Um outro conceito que nos auxilia nisso é o conceito de posto e
nulidade da matriz reduzida (ou equivalente) do sistema. Tal conceito pode ser definido
como:
______
• Assimile
Dada uma matriz A de ordem mxn, seja uma matriz B de ordem mxn a matriz-linha
reduzida à forma escada linha equivalente a A. O posto de A, denotado por p, é o
número de linhas não nulas de B, e a nulidade de a é o número n-p.
______
Assim, podemos reescrever a classificação dos sistemas lineares de acordo com o tipo
de solução da seguinte forma:
possível e determinado (SPD): quando o posto da matriz ampliada é igual ao
posto da matriz dos coeficientes. Ele terá solução única se n=p;
possível e indeterminado (SPI): quando o posto da matriz ampliada é igual ao
posto da matriz dos coeficientes. Ele terá infinitas soluções se p<n;
impossível (SI): quando o posto da matriz ampliada é diferente do posto da
matriz dos coeficientes.
Matrizes inversas
Com isso, encerramos a primeira parte desta aula o que lida com os sistemas lineares.
Agora, vamos à segunda parte, que é referente às matrizes inversas.
Para trabalhar com inversão de matrizes, lidaremos necessariamente com as operações
elementares e a forma matriz-linha reduzida à forma escada. Neste aspecto, dizemos que
uma matriz A é invertível se sua matriz-linha reduzida à forma escada é a matriz
identidade. Além disso, sendo A-1 a inversa de A, o produto A . A-1 resulta na matriz
identidade. Veremos como esse procedimento funciona na prática. Como exemplo,
considere a matriz A dada por:
Para começar o processo de inversão da matriz A, colocamos a matriz identidade junto à
matriz A e aplicamos as operações elementares com as linhas, a fim de reduzir a parte
esquerda (que corresponde a A) à forma escada da linha reduzida. Além disso, as
operações devem ser feitas simultaneamente na parte direita. Isto é,
Conclusão
Usando o conceito de forma linha-reduzida por meio de operações elementares, obtém-
se que o sistema pode ser reduzido ao sistema:
A solução é . Portanto, o valor da intensidade da primeira corrente é 1 amp; da segunda,
2 amp; da terceira, 2 amp; da quarta, -2 amp. Além disso, em termos de direção, as
direções das correntes I1, I2, I3 são as mesmas do que foi estipulado no problema, e da
corrente I4 a direção é oposta. Por fim, resta escrever o relatório, no qual, você deve
seguir este modelo:
Nome da empresa
XXXXX
Problema
Intensidade e direções das correntes elétricas em quatro ciclos fechados de um circuito
elétrico.
Solução
De acordo com o sistema linear apresentado, obteve-se que os valores das correntes
elétricas são: primeira corrente é 1 amp; da segunda, 2 amp; da terceira, 2 amp; da
quarta, -2 amp. Além disso, em termos de direção, as direções das correntes I1, I2,
I3 são as mesmas do que foi estipulado no problema, e da corrente I4 a direção é oposta.
Custo
XXXX
Assinatura
XXXX
Unidade 1 - Aula 3 - Autovalores e Autovetores
Introdução da Aula
Qual é o foco da aula?
Nesta aula, você estudará sobre autovalores e autovetores.
Objetivos gerais de aprendizagem
Ao final desta aula, você será capaz de:
definir espaços vetoriais e diagonalização;
explicar as transformações lineares e operadores;
comparar autovalores e autovetores.
Situação-problema
Estudante, nesta aula, abordaremos o conceito de espaços vetoriais e transformações
lineares. Os espaços vetoriais são uma das estruturas algébricas mais importantes da
álgebra, cujas aplicações são encontradas em diversos aspectos do nosso dia a dia, por
exemplo, no espectro de cores, que nos permite fazer mudanças de coordenadas desses
espectros baseando-se no conceito dos espaços vetoriais e das transformações lineares.
E falando em transformações lineares, esses tipos de operações são a base fundamental
da álgebra linear, podendo ser aplicada em engenharia da computação quando
trabalhamos com criptografia, por exemplo.
Já os autovalores, os autovetores e a diagonização são outras ferramentas que podem ser
utilizadas em engenharia biomédica nas questões de crescimento populacional e
transformações, e na computação em mecanismos de busca, como o Google.
Criaremos uma situação hipotética para exemplificar o uso das transformações lineares
em situações do cotidiano.
Em um estudo envolvendo engenharia biomédica, um determinado pesquisador
trabalhou com espectro de cores, em particular, coordenadas em espectro de cores. Em
sua pesquisa, ele tinha por interesse mudar o sistema de cores, a fim de ampliar o
espectro visível na retina. Sabe-se que, em geral, o espectro de cores é baseado em RGB
(red-green-blue), porém esse pesquisador tinha interesse em criar um novo sistema de
cores para determinar o espectro de cores. Ele chamou esse novo padrão de YGM
(yellow-gray-magenta), que se baseia em mudanças de coordenadas por meio da
transformação linear
definida por . No entanto, ele tinha dúvidas em como verificar se a transformação era,
de fato, linear e lhe contratou para fazer tal verificação, pois, se ela fosse linear, o
sistema de cores dele faria sentido no espectro. Então, baseando-se nos conceitos de
transformação linear, como você verificaria se a transformação é linear? O sistema
criado pelo pesquisador fez sentido em relação ao espectro de cores?
Conseguiu ver a importância desses conceitos? Que tal começarmos a trabalhar com
eles e entender melhor sob o ponto de vista matemático e prático? Não se preocupe,
vamos lhe acompanhar em todo o processo, e os conceitos serão construídos de forma
gradual.
Espaço vetorial
Nas aulas anteriores, exploramos os conceitos de matrizes e sistemas lineares munidos
das suas principais aplicações. Nesta aula, trabalharemos o conceito de uma das
estruturas algébricas mais importantes da álgebra linear: o espaço vetorial.
Um espaço vetorial V (sobre um campo F) é um conjunto, cujos elementos são
chamados de vetores, de modo que se pode adicionar (e subtrair) vetores e multiplicar
um vetor por uma constante de F. Essas constantes são chamadas escalares.
Matematicamente, os axiomas que definem um espaço vetorial são:
V é um grupo Abeliano isto é, valem as propriedades:
o Lei comutativa: v + w = w + v.
o Lei associativa: u + (v + w) = (u + v) + w.
o Elemento neutro: u + 0 = 0 + u = u.
o Elemento oposto: u − u = 0.
V admite uma multiplicação escalar por elementos de F, isto é,valem as
propriedades:
o −u = (−1)u.
o Distributiva: a(u + v) = au + av.
o Associativa: a(bu) = (ab)u.
Dentre as aplicações de espaços vetoriais, uma que se faz interessante é a que envolve a
mudança de coordenadas nos espectros de cores em relação ao sistema de cores RGB
(red-green-blue). Por exemplo, em física, o modelo matemático que se adequa à
representação do espaço espectral de cores é necessariamente um espaço vetorial de
dimensão finita, em que o processo de reconstrução de cor utiliza uma base de cores
primárias, que seria a base do espaço vetorial, gerando o modelo tricromático de
Young-Helmholtz, baseado no padrão RGB. Mas, antes de entrar no conceito de base e
dimensão, definiremos o que chamamos de subespaço vetorial.
Popularmente, dizemos que um subconjunto W de um espaço vetorial V é chamado de
subespaço quando se torna um espaço vetorial com as operações herdadas de V, ou seja,
quando somas e múltiplos escalares de vetores em W pertencem a W.
Matematicamente, dizemos que W é um subespaço vetorial de V quando W⊂V, tal
que o ∈ W; u+ v ∈ W e au ∈ W.
Uma vez definido o que é subespaço vetorial, podemos trabalhar com o conceito de
base e dimensão abordado no exemplo sobre espectro de cores descrito anteriormente.
Neste aspecto, dizemos que uma base é uma coleção de vetores B de um espaço vetorial
V quando cada vetor em V pode ser escrito de uma maneira única como combinação
linear de elementos de B. As bases são precisamente os conjuntos máximos
independentes de vetores. As bases também são precisamente os conjuntos de
abrangência mínima de vetores e, em particular, cada conjunto de abrangência pode ser
reduzido a uma base. Vale lembrar também que todo espaço vetorial tem uma base.
Definimos o que é base, mas e o que é dimensão? Para definir esse conceito, tome
quaisquer duas bases de V que têm o mesmo “tamanho”. Esse “tamanho” é chamado de
dimensão de V, e denotamos por dim(V).
______
• Exemplificando
Transformação linear
Agora, já sabemos o que é um espaço vetorial e o que é uma base, que são ferramentas
de suma importância para definir a nossa próxima estrutura de trabalho,
as transformações lineares. E o que é uma transformação linear? Considere V e W
dois espaços vetoriais sobre um corpo F. Uma transformação linear de V em W é uma
função T : V→W que satisfaz:
Para todo e todo escalar . Como primeiro exemplo, consideraremos V um espaço
vetorial qualquer, a transformação identidade, definida por definida por I(v) =v, que é
uma transformação linear de V em V. De fato:
______
• Exemplificando
Quais são as propriedades de uma transformação linear? Para verificarmos isso, sejam
V e W espaços vetoriais sobre um corpo F. A transformação linear T: V→ W satisfaz
as seguintes propriedades:
T(0) = 0 (T transforma o vetor nulo de V no vetor nulo de W).
T (−v) = −T(v), para todo v ∈ V.
T(v1 − v2) = T(v1) − T(v2), para todo v1,v2∈ V.
Se U é um subespaço de V, então a imagem de U por T é um subespaço de W.
Sendo T: V→W linear, então:
Baseando-se nessas propriedades, podemos trabalhar com o conceito de base também.
Isto é, dados V e W dois espaços vetoriais sobre um corpo F e dada uma base de V={ v1,
…, vn}, sejam w1, …, wn elementos arbitrários de W. Existe uma única transformação
linear T: V→ W, tal que
Então:
T(αv+u)= (αx1+y1)w1+…+(αxn+ yn)wn
Por outro lado:
O núcleo da transformação linear tem algumas propriedades importantes para nosso
trabalho. Dentre todas elas, destacamos:
Ker(T) é um subespaço vetorial de V.
A transformação T é injetora se, e somente se, Ker(T) = {0}.
Teorema do Núcleo e da Imagem e Isomorfismo
Agora, com o núcleo e a imagem de uma transformação linear definidos, podemos
definir o resultado fundamental da teoria de transformações lineares, que é o Teorema
do Núcleo e da Imagem. Esse teorema traduz a dimensão do espaço vetorial.
______
• Assimile
Teorema do Núcleo e da Imagem: sejam V e W espaços vetoriais de dimensão finita
sobre um corpo F. Dada a transformação linear T: V→W, então:
dim(V) = dim(Ker(T)) + dim(Im(T))
Portanto, a soma das dimensões do Ker(T) e da Im(T) é igual à dimensão do espaço
vetorial V.
______
T(x, y, z)= x + y − z = 0⇒ x = −y +z
Um outro conceito importante que diz respeito às transformações lineares é o conceito
de isomorfismo. Para definir tal conceito, sejam V e W espaços vetoriais sobre um
corpo F, suponha que T: V→W é uma transformação linear. Dizemos que T é um
isomorfismo se T for bijetora (isto é, T deve ser injetora e sobrejetora).
______
• Reflita
Matriz de uma transformação linear
Para finalizar nosso estudo de transformações lineares, trabalharemos com a matriz de
uma transformação linear, porém, antes, precisamos definir algumas coisas.
______
• Assimile
A partir dessa definição, podemos escrever a matriz de ordem mxn da transformação
linear F como sendo:
É chamada de matriz da transformação linear F em relação às bases B e C e é denotada
por (F)B,C.
______
• Assimile
Seja V um espaço vetorial de dimensão n e T:V→V uma transformação linear. Dizemos
que pT(t) é um polinômio característico de T se for obtido como pT(t)= det (A− kI), em
que A é a matriz de T e I é a matriz identidade de ordem.
______
As raízes são 1, -1 nos números reais. As raízes dos polinômios característicos são
conhecidas como autovalores de T, que é uma outra definição desse conceito. Uma vez
que sabemos o que é autovalor e autovetor, podemos definir o que é diagonalização de
operações, que é a definição final desta aula. Vamos lá?
Conclusão
Isto é:
Ou seja:
Portanto, T é uma transformação linear e traduz uma reflexão em torno do eixo x, isto é,
o sistema proposto pelo pesquisador faz sentido por T ser linear e é baseado na reflexão
em torno do eixo x.
Unidade 2 - Aula 1 - Zeros de funções
Introdução da Unidade
Objetivos da Unidade
Ao final desta Unidade, você será capaz de:
calcular polinômios interpoladores;
analisar erros na interpolação;
algoritmos para determinação da integral definida de uma função de modo
aproximado.
Estudante, o que vem à sua cabeça quando escuta o termo métodos numéricos?
Aproximações? Se sim, você está em uma linha de pensamento correta! O cálculo
numérico é um subtópico dos métodos matemáticos que envolvem aproximações para
zeros de funções, aproximações de cálculo de integrais que podem estar relacionadas
com a área de uma placa de metal, por exemplo.
Para iniciar o entendimento dessa ferramenta que se faz fundamental nos métodos
matemáticos, vamos trabalhar com a ideia de como encontrar o zero de uma função
usando o computador e os métodos de aproximação quando essa função for de uma
natureza mais complexa. Um dos métodos mais conhecidos para isso é o famoso
método de Newton-Rhapson, que estabelece critérios para encontrar uma aproximação
da raiz de uma equação. Partindo dessa ideia de zeros de funções, em seguida, vamos
trabalhar com o que chamamos de polinômio interpolador, que é um método de
aproximação, uma função utilizando um polinômio de natureza simples, a fim de
facilitar o entendimento do nosso problema.
Por fim, vamos estudar os métodos numéricos para aproximar o valor de uma integral,
que na prática é fundamental para o cálculo da área, especialmente quando se trabalha
com placas de metais em formatos diferentes de figuras planas, por exemplo. Vamos ver
cada um desses conceitos devagar no decorrer desta unidade.
Introdução da Aula
Qual é o foco da aula?
Nesta aula, você estudará sobre Zeros de funções.
Objetivos gerais de aprendizagem
Ao final desta aula, você será capaz de:
definir o conceito de Aritmética de ponto flutuante;
demonstrar erros e estimativas para o erro;
calcular zeros de funções reais por meiode métodos numéricos e seus
algoritmos.
Situação-problema
Estudante! Nesta aula, vamos trabalhar inicialmente com os conceitos de sistemas
numéricos a fim de entender o que é um sistema numérico, como operamos um sistema
numérico e como o computador e a calculadora entende esses sistemas numéricos. Em
seguida, vamos entender o conceito de erro e quais tipos de erros podemos cometer
quando trabalhamos com aproximações numéricas. Por fim, vamos trabalhar com os
tipos de métodos numéricos que temos para lidar com o problema de encontrar o zero
(raíz) de uma função, independente da forma dessa função.
Como exemplo dessa abordagem, podemos considerar o problema de encontrar o ponto
que maximiza, por exemplo, a temperatura de operação de uma máquina industrial para
entender a resistência em casos de acidentes térmicos. Dado a complexidade do
problema, muitas vezes, não é possível obter uma solução usando métodos analíticos,
fazendo-se assim o uso de métodos numéricos importantes.
Vamos criar uma situação hipotética para exemplificar o uso dos métodos numéricos no
dia a dia de trabalho, especialmente em áreas relacionadas com a Engenharia.
Imagine que você foi convocado para implementar um método numérico para resolver o
problema de maximização de lucro de uma dada empresa de software no ano de 2020. O
método que a empresa definiu para a implementação no software matemático Maple foi
o método do ponto fixo descrito pelos passos:
Como você faria para implementar esse algoritmo computacionalmente de forma que
ele fosse útil para a empresa? Além disso, a partir dessa implementação, calcule o valor
do lucro máximo quando a função que determina o lucro é dada por f(x)=ex−2 assumindo
uma aproximação inicial de 0.1 e uma precisão de 1%.
Viu como os métodos numéricos são fundamentais? Que tal começar a entender como
funcionam agora? Você será acompanhado em todo o processo no decorrer da aula!
Vamos iniciar então com algo mais simples, mas que é base para todo o resto dos
métodos numéricos: os sistemas numéricos.
Sistema de ponto flutuante
Você já parou para pensar no que são métodos numéricos? Como utilizamos um sistema
numérico? Nesta unidade, nosso foco será trabalhar com métodos numéricos e é
importante destacar que, quando falamos de uma solução numérica, não estamos
falando de uma solução exata, e sim de uma solução aproximada. E como estamos
falando de aproximações, estamos falando necessariamente de precisão numérica, que é
sujeita a erros. Assim, vamos começar nossos estudos definindo o que é um sistema de
ponto flutuante.
______
• Assimile
Todo sistema computacional utiliza algum sistema de aritmética de ponto flutuante para
trabalhar com números em que os resultados, em geral, são apresentados em base 10.
Esses sistemas são conhecidos como sistemas numéricos de base 10.
______
Agora, vamos entender como funciona esse sistema. Começamos com a mantissa, ela
deve ser fracionária nessa representação, isto é, deve ser menor do que 1 para que
possamos trabalhar com a unicidade para a representação para cada y ∈ F . Mas como
fazemos isso? Ora, devemos trabalhar com o que chamamos de normalização. Essa
normalização deve ser feita de forma que d1≠0 para y≠0 para garantir a representação
do sistema de ponto flutuante.
______
• Assimile
É importante notar que a escolha de uma representação para o zero como sendo o menor
expoente que simboliza a mantissa nula não é a melhor forma, pois isso traz perdas de
dígitos significativos em operações.
Arredondamento simétrico ou truncamento
Uma vez definido o que é um sistema de aritmética de ponto flutuante, resta saber se é
um conjunto finito. De acordo com a definição do sistema de ponto flutuante
(ANDRADE, 2012), podemos notar que a quantidade de números normalizados é
definida pela expressão:
Essa questão de o sistema de ponto flutuante ser finito deriva, principalmente, da
questão em que o computador e a calculadora trabalham com seus cálculos utilizando
uma quantidade finita de dígitos. Por exemplo, na calculadora normal temos 8 dígitos,
na científica 14, e assim por diante; porém nenhum dos dois trabalha com uma
quantidade infinita de dígitos. Nesse aspecto, o uso dos métodos numéricos traz a
necessidade de trabalharmos com o roll finito de dígitos.
Então, sabemos que precisamos trabalhar com uma quantidade finita de dígitos, mas
sabemos também que os números irracionais, por exemplo, têm quantidades infinitas de
dígitos. Como procedemos para descartar os dígitos a fim de deixar esse número
“finito”? Ora, existem duas maneiras de se fazer isso: arredondamento
simétrico ou truncamento. Mas antes de definir o que são ambos, vamos ressaltar que
tanto o computador quanto a calculadora trabalham com representação numérica
discreta, isto é, dado um número x≠0 no sistema de aritmética de ponto flutuante de
base 10, então x é escrito como:
Ou ainda,
Em que
Com essas representações em mente, podemos, então, definir os tipos de
arredondamentos. Assim, no que se refere ao arredondamento simétrico, ele pode ser
definido como: se o primeiro dígito a ser desprezado é menor que cinco, descartamos
todos os dígitos restantes; porém, se esse dígito for maior do que 5, então somamos 1
ao dígito que antecede esse dígito. Por exemplo, considere o número 5.2131412... e
suponha que queremos esse número com apenas três casas decimais. Nesse caso, o
dígito na quarta casa decimal é igual a 1, que é menor do que 5, então descartamos
todos os dígitos a partir da quarta casa decimal e ficamos com o número 5.213. Agora,
no que tange ao conceito de arredondamento por truncamento, ele é definido
como: após decidir até qual casa decimal vamos utilizar, simplesmente descartamos o
restante dos dígitos.
______
• Exemplificando
Conseguiu perceber a diferença entre os arredondamentos? Veja que, em ambos os
casos, obtemos um resultado diferente do valor original, uma vez que descartamos casas
decimais. Essa diferença é o que chamamos de erro, e é importante conhecermos a
magnitude desses erros. Assim, vamos trabalhar com dois tipos de erros: o absoluto e
o relativo. Suponha que x seja uma aproximação para x. O erro absoluto é definido por:
Em geral, o valor exato de não é sempre conhecido. Nesse caso, o cálculo do erro
relativo não seria possível, no entanto, podemos utilizar a seguinte expressão do erro
relativo quando o valor exato não é conhecido:
• Exemplificando
Vamos considerar um exemplo em que x = 1234.9 é uma aproximação para x, tal que o
erro absoluto seja menor do que 0.1. Assim, podemos dizer que o valor exato x está no
intervalo (1234.8, 1235.0). Por outro lado, suponha que y = 7.2 seja uma aproximação
para y, tal que o erro absoluto seja menor do que 0.1, então y pertence ao
intervalo (7.1,7.3). Será que a interpretação desses erros é igual tanto para x quanto para
y? Considerando o erro absoluto, observe que os majorantes são necessariamente iguais,
sendo assim o erro absoluto por si só não é suficiente para diferenciar as interpretações
dos erros de x e y, pois geram a mesma interpretação. Então trabalhamos com o erro
relativo. Note que:
Nesse caso, os erros relativos são diferentes. E essa diferença traz o impacto na precisão
da estimativa. No caso do x, vemos que a precisão da estimativa dele é maior que a de
y, visto que o erro relativo para x é muito menor que o erro relativo para y.
______
• Reflita
E se você quisesse uma precisão maior adicionando uma nova casa decimal, poderíamos
incluir qual dígito: 4,471 ou 4,476? Seria possível incluir o dígito 4,479?
______
Portanto, para encerrar a primeira parte do nosso conteúdo da seção, iremos finalizar
com os conceitos de estabilidade numérica. Em poucas palavras, podemos definir a
estabilidade numérica como sendo uma propriedade doalgoritmo, uma vez que
algoritmos podem ser bem sensíveis conforme a variação de dados, independentemente
do método numérico utilizado. Isto é, de acordo com os dados que temos, um algoritmo
pode se tornar instável. E são esses conceitos que nos dão a ideia da segunda parte do
nosso conteúdo!
Métodos bissecção, de ponto fixo e de Newton-Rhapson
Suponha agora que estamos interessados em encontrar, numericamente, uma solução
aproximada para a equação f(x)=0, onde f é uma função qualquer. Nesta aula, vamos
apresentar os métodos mais comumente utilizados, entre eles o método da bissecção, o
método do ponto fixo e o método de Newton-Rhapson.
Ou seja, o método da bissecção trabalha com uma sequência convergente com base em
intervalos encaixados. Esse método em particular é extremamente lento, mas a
convergência é garantida se f for uma função contínua.
Com isso, encerramos a nossa primeira aula sobre os conceitos básicos e fundamentais
de sistemas numéricos, além dos métodos para encontrar zero de funções! Tais
conceitos serão de suma importância para orientar sua equipe no trabalho e também
para resolver problemas relativos à modelagem que envolva métodos numéricos.
Conclusão
Nosso problema aqui é implementar o método do ponto fixo utilizando o software
Maple. Note que uma implementação computacional pode ser feita de várias formas
diferentes e ainda assim gerar o mesmo resultado. O que vai mudar entre uma e outra é
somente a eficiência e visualização do algoritmo. Então, como sugestão dessa
implementação, podemos fazer:
Assim, utilizando o código acima, encontramos que o valor de x que maximiza o lucro
da empresa é x = 0.158593439, que implica então que o lucro da empresa, em bilhões
de reais, é de 0.1585942.
Unidade 2 - Aula 2 - Interpolação
Introdução da Aula
Qual é o foco da aula?
Nesta aula, você estudará sobre Interpolação.
Objetivos gerais de aprendizagem
Ao final desta aula, você será capaz de:
definir o conceito de interpolação polinomial e forma de Lagrange;
identificar erro na erro na interpolação polinomial;
aplicar a fórmula interpoladora de Newton.
Situação-problema
Estudante, nesta aula iremos entender o conceito de interpolação polinomial, que
consiste em aproximar uma função usando polinômios. Para isso, dois métodos serão
considerados: o método de Lagrange e o método de Newton. A vantagem do uso da
interpolação polinomial, por exemplo, é que se uma dada função com forma complexa
puder ser aproximada por um polinômio, então o nosso trabalho na modelagem facilita
bastante, pois os polinômios são mais flexíveis para se trabalhar.
Como exemplo do uso do polinômio interpolador, considere a situação em que você
precisa modelar o lucro trimestral de sua empresa. Como, em geral, a curva do lucro é
complexa, você pode utilizar o polinômio de Lagrange para aproximá-la e fazer a
previsão do lucro. Uma alternativa a isso são os métodos estatísticos que serão
trabalhados posteriormente em outras aulas.
Em determinada empresa de solventes químicos, deseja-se achar uma forma mais
eficiente de trabalhar com a demanda dos produtos. Pensando nisso, a empresa resolveu
ajustar o modelo que descrevia a demanda usando um polinômio interpolador a partir do
método de Lagrange. No entanto, nenhum dos funcionários tinha conhecimento sobre
como fazer isso. Devido a essa carência, a empresa então lhe contratou para resolver o
problema. Sabendo que os pontos de demanda eram baseados nos pontos , foi lhe
requisitado a equação do polinômio interpolar que passava por esses pontos a fim de
entender como estava funcionando a demanda da empresa. Dessa forma, você deveria
apresentar a solução passo a passo de como foi encontrado tal polinômio sem o uso de
métodos computacionais.
Que tal começar esse entendimento agora? Você será acompanhado em todo o processo!
Iniciaremos com os conceitos fundamentais de interpolação polinomial. Em seguida,
trabalharemos com métodos de interpolação, especialmente o mais popular, que é o de
Newton!
Polinômio interpolador
Anteriormente, exploramos os conceitos relativos a erros e encontrar soluções
de f(x)=0 a partir de métodos iterativos. Agora, o nosso foco será encontrar um
polinômio que aproxima a função f(x), chamado de polinômio interpolador. Para
começar nossos trabalhos neste tópico, vamos supor que que temos (n + 1) pontos
distintos x0, x1, . . . , xn, que iremos chamar de “nós”, e que os pontos y0, y1, . . . ,
yn foram obtidos por meio de alguma função f desconhecida, isto é, yi = f(xi), i = 0, 1, . .
. , n. Queremos, então, conhecer ou estimar f(xr) para algum valor xr que não seja
necessariamente tabelado. Um modo de fazer isso é interpolar f por uma função
polinomial, uma vez que, em geral, temos conhecimento apenas dos pares de pontos (xi,
(fxi)) e não da expressão de f em si.
Com base nos conceitos de Álgebra Linear, podemos reescrever o sistema anterior em
forma de matriz como:
______
• Assimile
Matematicamente, uma matriz é dita matriz de Vandermonde se todos os termos de cada
uma de suas linhas formam uma progressão geométrica.
______
Assim, podemos enunciar o seguinte resultado (ANDRADE, 2012):
Teorema: Dados x0, x1, . . . , xn pontos distintos, existe um único polinômio pn(x), de
grau máximo n, que interpola f nos pontos (xi, f(xi)), i = 0, . . . , n.
Método de Lagrange e Método de Newton
Existem diversos métodos para encontrar o polinômio interpolador, no entanto, nesta
aula, iremos trabalhar com dois desses métodos: (i) o método de Lagrange e (ii) o
método de Newton.
______
• Exemplificando
Dessa forma, encerramos as questões teóricas do método de Lagrange. Mas, para
encerrar o conteúdo do método de Lagrange, vamos escrever um código que pode ser
utilizado no software Maple para encontrarmos o polinômio interpolador de Lagrange
(ANDRADE, 2012).
Esse código transcreve exatamente o método de Lagrange aplicado
no Exemplificando dado anteriormente. Mas note que o método de Lagrange ainda
apresenta uma problemática grande quando adicionamos um ponto (xn+1, yn+1) no
sistema. Por quê? Note que ao usar esse método, adicionar um novo ponto implica que
devemos recalcular todos os polinômios Lk(x), i =0, 1, . . . , n + 1. Como resolver essa
questão? Bem, trabalhamos com o método de Newton (ou método das diferenças
divididas).
No método de Newton para o polinômio interpolador, ele é obtido a partir de uma
construção recursiva utilizando um operador que chamamos de operador das diferenças
divididas. Assim, para encontrar o polinômio interpolador pn(x) que interpola f nos
pontos x0, x1, . . . , xn pelo método de Newton, utilizamos (ANDRADE, 2012):
Chamamos f[x0, x1, x2, . . . , xk] de diferença dividida de ordem k entre os k + 1
pontos x0, x1, x2, . . . , xk. Um ponto importante que podemos destacar é que as
diferenças divididas f[x0, x1, x2,wx . . . , xk] são funções simétricas nos seus argumentos
(ANDRADE, 2012). Com base nesse operador, podemos construir a seguinte tabela de
diferenças divididas para o método de Newton:
Ou, no caso geral,
Bom, agora que sabemos como funciona o operador de diferenças divididas, vamos
trabalhar com a construção do polinômio pn(x) que interpola f(x) nos pontos x0, x1, x2, . .
. , xn segundo o método de Newton. Começando com o polinômio que interpola fx em x
= x0 e assim sucessivamente, construiremos pk(x), que interpola f(x) em x0, x1, x2, . . . ,
xk, k=1, …, n . Assim, seja então p0(x) o polinômio de grau zero, que interpola f(x) em
x = x0, tal que p0(x) = f[x0]. Nesse caso, para x≠x0 e x ∈ [a, b], temos que:
tal que:
onde p0(x)=f(x0). Então, chamaremos E0(x)=f(x)−p0(x) de erro ao se aproximar f(x)
por p0(x). Agora, seja p1(x) o polinômio de grau menor do que 1 que interpola f(x) em
x0 e x1. Temos que:
tal que:onde p1(x)= f(x0)+(x−x0)f[x1,x0]. Então, chamaremos E1(x)=f(x)−p1(x) de erro cometido
ao se aproximar f(x) por p1(x). De modo geral, repetindo o procedimento
anterior n vezes, obtemos:
______
• Assimile
______
• Exemplificando
Vamos colocar em prática o método de Newton para encontrar o polinômio interpolador
nos pontos (xk, yk) = {(−1,0), (0,1), (1,2), (2,7)}. Assim, pelo método de Newton,
obtemos:
Dessa maneira, o polinômio interpolador é dado por:
______
• Reflita
Pensando no método de Lagrange e no método de Newton, qual dos dois trazem uma
aproximação mais concisa de f(x)? Em qual deles o erro cometido é menor? Na prática,
qual é mais viável usar? Pense sobre essas questões, especialmente em âmbito de custo
computacional de tempo de processamento.
______
Por fim, é válido ressaltar que os erros de interpolação são fundamentais, especialmente
quando trabalhamos com modelagem. Em qualquer trabalho que envolva aproximação
numérica, sempre estamos buscando pelo menor erro possível e a magnitude desse erro
nos traz a versatilidade do nosso modelo. Pensando nesse aspecto, em métodos
numéricos, existe um conceito chamado fenômeno Runge que consiste em dizer que o
erro é menor na zona central do intervalo e maior nos extremos. Para evitar esse
fenômeno, podemos considerar pontos não igualmente espaçados juntamente com
polinômios ortonormais, splines ou aproximação por mínimos quadrados.
Com isso, finalizamos a nossa aula sobre polinômio interpolador, que é um dos objetos
fundamentais quando trabalhamos aproximações numéricas.
Conclusão
Pensando em como resolver o problema usando o método de Lagrange para determinar
o polinômio que interpola os pontos (xk, yk) = {(0,0), (1,3), (2,1), (3,3), (4,0)}, você
buscou em seus ensinamentos de cálculo numérico, para relembrar, como era feito tal
método sem apoio computacional. Assim, depois de muito esforço, você obteve, pelo
método de Lagrange, as equações:
Após vários cálculos para simplificação, você concluiu que o polinômio interpolador,
segundo o método de Lagrange, é dado por:
Unidade 2 - Aula 3 - Integração Numérica
Introdução da Aula
Qual é o foco da aula?
Nesta aula, você estudará sobre integração numérica.
Objetivos gerais de aprendizagem
Ao final desta aula, você será capaz de:
aplicar a Integração através dos métodos numéricos e seus algoritmos.
calcular a Fórmula de Newton-Cotes;
diferenciar a regra dos Trapézios e de Simpson.
Situação-problema
Estudante, nesta aula vamos trabalhar basicamente com dois tópicos: regra dos trapézios
e regra de Simpson. Ambos os tópicos são ferramentas para aproximar o valor de uma
integral, consequentemente de uma área, usando métodos numéricos. Essas ferramentas
são importantes, pois, na prática, raramente temos figuras regulares ou até mesmo
funções bem-comportadas. A maioria dos problemas são resolvidos usando métodos
numéricos devido à versatilidade desses métodos. Imagine só ter que lidar com a
modelagem do crescimento populacional ou até mesmo o aumento dos casos de Covid-
19 sem fazer o uso de métodos numéricos. Seria extremamente complexo!
Em um estudo envolvendo Engenharia Biomédica, um determinado pesquisador
realizou um trabalho voltado para modelagem de marca-passo no coração de pessoas
idosas. Em sua pesquisa, ele tinha por interesse achar a área abaixo da curva gerada
pelos dados do marca-passo. Sabe-se que a função que governa o marca-passo é descrita
por:
no intervalo de 0,2 até 0,8 horas. Uma vez que ele tiver a área abaixo dessa curva e
sabendo que essa função tem certos padrões de repetição, ele conseguirá estimar a área
total para mais do que 0,6 horas, considerada em seu experimento para avaliar a
qualidade do marca-passo. Então, baseando-se nos conceitos de integração numérica,
como você calcularia a área abaixo da função dada assumindo uma margem de erro de
no máximo 1%?
Conseguiu ver a importância desses conceitos? Que tal começarmos a trabalhar com
eles e entender melhor sob o ponto de vista matemático e prático? Não se preocupe,
vamos lhe acompanhar em todo o processo e os conceitos serão construídos de forma
gradual!
Fórmulas de Newton-Cotes: fórmulas dos trapézios e de Simpson
Já vimos anteriormente como trabalhar com os erros de aproximações e também com
formas de resolver a equação f(x) = 0 . Agora, nos interessa saber como resolver
numericamente as integrais, uma vez que elas, assim como a equação f(x) = 0 , têm
diversas aplicações em Engenharia, como no cálculo aproximado da área de placas de
metais em construção civil. Nesse aspecto, a ideia da integração numérica consiste,
basicamente, na aproximação da função integranda f por um polinômio em que a
escolha desse polinômio e dos pontos usados em sua determinação vai resultar nos
diversos métodos numéricos de integração.
Em Cálculo Diferencial e Integral, é visto que as fórmulas de integração numéricas são
somatórios, em que suas parcelas são, necessariamente, valores de f(x) calculados em
pontos escolhidos e multiplicados por pesos convenientes, isto é,
e o erro:
que é conhecida como fórmula de Newton-Cotes para integrais numéricas. Como caso
particular dessa fórmula, obtemos as famosas fórmulas dos trapézios e de Simpson, que
são estabelecidas com polinômios de grau 1 e grau 2, respectivamente. Vamos iniciar
então com a fórmula dos trapézios, ou regra dos trapézios.
A fórmula dos trapézios corresponde, basicamente, à interpolação da função a ser
integrada por um polinômio de grau 1 (ANDRADE, 2012). A interpolação linear, nesse
caso, necessita de dois pontos, então, vamos trabalhar com os extremos do intervalo de
integração, isto é, a = x0 e b = x1. Logo, o polinômio linear interpolador é dado por:
Para uma melhor visualização dessa ideia, vamos trabalhar com o gráfico exposto na
figura abaixo.
Gráfico. Fonte: elaborada pelo autor.
Assim, observando a figura acima e partindo dos pesos, temos que:
onde o erro é descrito pela seguinte equação:
• Reflita
Como você acha que fica a fórmula dos trapézios se for aplicada diversas vezes sobre
subintervalos de um intervalo geral [a, b]?
______
Regra de Simpson. Fonte: elaborada pelo autor.
Dessa forma, a partir dos polinômios de Lagrange, obtemos os pesos da fórmula de
Simpson:
Assim, obtemos a seguinte solução para a integral:
onde o erro é dado pela seguinte expressão:
• Reflita
Como você acha que fica a fórmula de Simpson se for aplicada diversas vezes sobre
subintervalos de um intervalo geral [a, b]?
• Assimile
Embora as fórmulas dos trapézios e de Simpson usem polinômios de grau baixo, note
que, em termos de erros, a regra de Simpson não apresenta termos simples como
acontece na regra dos trapézios.
Intervalos de integração grandes e fórmulas compostas
Agora, vamos avaliar outros aspectos dessas fórmulas: intervalos de integração grandes.
Quando o intervalo de integração é grande, em geral, não é conveniente aumentar o grau
do polinômio interpolador para obter fórmulas mais precisas, pois podemos deixar o
problema ainda mais complexo. A alternativa mais usada é subdividir o intervalo de
integração e aplicar fórmulas simples repetidas vezes, obtendo-se as fórmulas
compostas. Vamos começar com a regra dos trapézios composta.
que é chamada de fórmula composta para a regra dos trapézios. Nesse caso, o erro final
dessa fórmula tem como base os erros parciais da fórmula simples dos trapézios que são
dados por:
Logo, o erro final é dado por:
______
• Assimile
Se f é um polinômio no qual seu grau é menor que 3, então o erro
______
• Exemplificando
______
Como exercício prático, você pode escrever a aproximação da integral considerando
pela regra de Simpson e pela regra dos trapézios usando 6 intervalos. Para finalizar,deixo a reflexão: qual desses métodos é mais viável quando eu tenho uma integral mais
complexa?
Isto é,
que é conhecida como fórmula composta para a regra de Simpson. Da mesma forma que
na regra dos trapézios composta, o erro final da regra composta de Simpson pode ser
obtido pela soma dos erros parciais. Portanto, o erro final da regra composta de
Simpson é dado por:
• Assimile
Se f é um polinômio no qual seu grau é menor que 3, então o erro
é nulo, isto é, a regra de Simpson é exata para polinômios de grau menor que 3
(ANDRADE, 2012).
Para finalizar nosso estudo de integração numérica, vamos trabalhar com um exemplo
de cálculo de integral com base nas regras de Simpson e dos trapézios com erro menor
que 10−4.
• Exemplificando
Como exercício prático, você pode escrever a aproximação da integral considerando
pela regra de Simpson e pela regra dos trapézios usando 6 intervalos. Para finalizar,
deixo a reflexão: qual desses métodos é mais viável quando eu tenho uma integral mais
complexa?
Conclusão
Pela definição de área sobre a curva, poderíamos calcular a área exata usando a
integração comum dada por:
No entanto, foi solicitado o uso de métodos numéricos. Nesse caso, podemos proceder
usando a regra dos trapézios com 6 subintervalos. Isto é, para n = 6, temos que h = 0,1 e
assim:
Assim, calculando o erro da estimativa, obtemos:
UNIDADE 3 - Probabilidade e Estatística
Unidade 3 - Aula 1 - Introdução à probabilidade e estatística
Introdução da Unidade
Objetivos da Unidade
Ao final desta Unidade, você será capaz de:
aplicar os fundamentos de probabilidade e estatística;
analisar situações realistas para o profissional de Engenharia e Ciências Exatas;
descrever o processo de amostragem.
Estudante, o que você pensa quando escuta o termo probabilidade? E o termo
estatística? Seria algo como sendo a chance de conseguir alguma coisa, como a chance
de vencer em um jogo de videogame ou a chance de ter sucesso com sua startup? Se
você pensa dessa forma, você pensa de maneira estatística!
Nesta unidade, vamos trabalhar com os principais conceitos de estatística e
probabilidade, iniciando com a história da probabilidade. Logo em seguida, vamos
trabalhar com as definições de população e amostra que se fazem fundamental na
estatística, sendo o carro-chefe dessa disciplina. Por fim, vamos entender como se faz
uma amostragem. Os processos de amostragem são diversos na literatura, mas nosso
foco aqui será a diferença entre uma amostragem probabilística e uma não
probabilística. Além disso, vamos trabalhar também com as medidas de tendência
central e dispersão e o modelo de regressão que envolve a correlação das variáveis.
Algo que você pode estar se perguntando é: mas como utilizamos a estatística e a
probabilidade em áreas como Engenharia? Para exemplificar, suponha que você
trabalha com energia solar e seu objetivo seja criar tipos de telhados que proporcionem
o uso desse tipo de energia. Nesse caso, você irá realizar um experimento para avaliar se
sua proposta traz algum tipo de vantagem para a produção do telhado. Só pelo fato de
realizar um experimento, você já está trabalhando com estatística e, posteriormente,
para avaliar os resultados desse experimento, você irá precisar de métodos estatísticos e
probabilísticos para trazer uma confiança em seu projeto, como um modelo de
regressão. Viu como a estatística é importante nesse aspecto? Para lhe auxiliar, vamos,
no decorrer desta unidade, aprender um pouco mais sobre ela! Então, mãos à obra!
Introdução da Aula
Qual é o foco da aula?
Nesta aula, você estudará sobre probabilidade e estatística.
Objetivos gerais de aprendizagem
Ao final desta aula, você será capaz de:
aplicar probabilidade e estatística;
analisar amostragem probabilística e não probabilística;
calcular aplicações da estatística.
Situação-problema
Estudante, o que você pensa quando escuta o termo probabilidade? E o termo
estatística? Seria algo como sendo a chance de conseguir alguma coisa, como a chance
de vencer em um jogo de videogame ou a chance de ter sucesso com sua startup? Se
você pensa dessa forma, você pensa de maneira estatística!
Nesta unidade, vamos trabalhar com os principais conceitos de estatística e
probabilidade, iniciando com a história da probabilidade. Logo em seguida, vamos
trabalhar com as definições de população e amostra que se fazem fundamental na
estatística, sendo o carro-chefe dessa disciplina. Por fim, vamos entender como se faz
uma amostragem. Os processos de amostragem são diversos na literatura, mas nosso
foco aqui será a diferença entre uma amostragem probabilística e uma não
probabilística. Além disso, vamos trabalhar também com as medidas de tendência
central e dispersão e o modelo de regressão que envolve a correlação das variáveis.
Algo que você pode estar se perguntando é: mas como utilizamos a estatística e a
probabilidade em áreas como Engenharia? Para exemplificar, suponha que você
trabalha com energia solar e seu objetivo seja criar tipos de telhados que proporcionem
o uso desse tipo de energia. Nesse caso, você irá realizar um experimento para avaliar se
sua proposta traz algum tipo de vantagem para a produção do telhado. Só pelo fato de
realizar um experimento, você já está trabalhando com estatística e, posteriormente,
para avaliar os resultados desse experimento, você irá precisar de métodos estatísticos e
probabilísticos para trazer uma confiança em seu projeto, como um modelo de
regressão. Viu como a estatística é importante nesse aspecto? Para lhe auxiliar, vamos,
no decorrer desta unidade, aprender um pouco mais sobre ela! Então, mãos à obra!
Conceito de probabilidade
Você já parou para pensar em como as coisas ao nosso redor acontecem de forma
aleatória? Por exemplo, o cair de uma fruta de uma árvore, uma batida de carro, a queda
de um avião, a subida/descida da bolsa de valores, etc. Poucas coisas são, de fato,
determinísticas. Nesta aula, vamos explorar esses conceitos e definir o que chamamos
de probabilidade, que se faz uma ferramenta mais do que fundamental atualmente e nas
mais diversas áreas de trabalho.
No que tange ao contexto histórico, acredita-se que essa teoria teve seu início com os
matemáticos franceses Blaise Pascal (1623-1662) e Pierre Fermat (1601-1665), quando
eles conseguiram derivar probabilidades exatas para determinados problemas de jogos
envolvendo dados. Atualmente, essa teoria é aplicada em diversas áreas de estudo como
hidrologia, medicina, farmacologia, engenharia, química, educação, dentre outras.
Ao estudar probabilidade, duas coisas são levadas em
consideração: experimentos e eventos. Um experimento é um processo, seja real ou
hipotético, no qual são identificados os resultados no decorrer do tempo. Por outro lado,
um evento é um conjunto bem definido relativo aos resultados de um experimento, seja
ele real ou hipotético. Além disso, existem duas classificações para os
experimentos: aleatórios e determinísticos. Dizemos que um dado experimento é dito
aleatório se, mesmo repetindo-o diversas vezes em condições iguais, o resultado não
pode ser definido ou, até mesmo, predito. Em contrapartida, dizemos que um
experimento é dito determinístico se, repetido diversas vezes, o resultado pode ser
definido ou predito.
Um outro elemento fundamental em probabilidade é o espaço amostral. Podemos
definir espaço amostral como sendo o
“conjunto relativo a todos os resultados possíveis que podemos encontrar em um
experimento aleatório” (MAGALHÃES, 2002).
Denotamos espaço amostral por Ω. Por exemplo, suponha que desejamos representar
todas as plantas que produzem O2. Nesse caso, Ω = {Todas as plantas que
produzem O2} que define as características comuns aos membros do conjunto. Outro
exemplo é o lançamento de uma moeda.Nesse caso, Ω = {cara, coroa} que são as
únicas possibilidades de ocorrência no lançamento da moeda. Em especial, os conjuntos
de um espaço amostral possuem algumas propriedades especiais, dado Ω um espaço
amostral; A, B e C três subconjuntos de um espaço amostral Ω, então as seguintes
propriedades são válidas:
Voltando ao contexto de probabilidade, na literatura, três interpretações diferentes de
probabilidade são consideradas, a saber: a interpretação frequentista, a interpretação
clássica e a interpretação subjetiva. É importante destacar que cada uma dessas
interpretações pode ser útil na aplicação da teoria das probabilidades a problemas
práticos.
Vamos começar então com a interpretação frequentista.
Interpretação frequentista: seja A um evento qualquer. Se nA é o número de
ocorrências do evento A em n repetições independentes do experimento, então dizemos
que a probabilidade em que A ocorre é:
• Exemplificando
Interpretação clássica: seja Ω um determinado espaço amostral e A um evento dado.
Se N(Ω) é o número de elementos possíveis no nosso espaço amostral Ω e N(A) é o
número de elementos possíveis no nosso evento A, então dizemos que a probabilidade
em que A ocorre é:
Vale ressaltar que se um experimento aleatório tem como espaço
amostral Ω=e1,e2,…,en, então podemos dizer que eventos elementares {ei} são
equiprováveis se, porventura, todos esses eventos terem a mesma probabilidade de
ocorrência, isto é:
Logo, considerando tais eventos, podemos definir a probabilidade de ocorrência de um
dado evento
______
• Exemplificando
Considere o lançamento de um dado em que o espaço amostral Ω={1, 2, 3, 4, 5, 6} é
equiprovável. Dado o evento A = {sair número par na face em um lançamento de um
único dado}, de acordo com a interpretação clássica, o número de elementos do
evento A = {2, 4, 6} é igual a 3 e a probabilidade de ocorrência do evento A é dada por:
______
Interpretação subjetiva: se o julgamento das probabilidades relativas de várias
combinações de resultados preencher determinados requisitos de consistência, então as
probabilidades subjetivas dos diferentes eventos possíveis podem ser excepcionalmente
determinadas.
______
• Exemplificando
Suponha que uma moeda é lançada uma vez. Uma pessoa sem informação especial
sobre a moeda ou a maneira que ela é jogada, pode considerar que uma cara e uma
coroa têm resultados igualmente prováveis. Entretanto, a pessoa que está jogando a
moeda pode sentir que uma cara é muito mais provável de ser obtida do que uma coroa
e atribuir uma probabilidade diferente.
______
Agora que sabemos como interpretar uma probabilidade, vamos definir mais dois
conceitos importantes: população e amostra. No que tange a esses conceitos, uma
população pode ser definida como “grupo de indivíduos com característica(s) em
comum”. Já uma amostra, podemos definir como “parte da população”, isto é, uma
porção de indivíduos que usaremos para inferir respostas sobre a população. No que
tange à seleção de uma amostra, ela pode ser feita de diversas maneiras, porém, em
muitos casos, depende exclusivamente dos recursos disponíveis para a coleta dos dados.
Em estatística utilizamos uma notação própria para diferenciar medidas usadas para
descrever características da amostra e da população. Assim, podemos definir uma
estatística como sendo uma medida de descrição de alguma característica da amostra.
Por exemplo, X a média da amostra; S representa desvio-padrão da amostra; P a
proporção da amostra e Xd a diferença de médias são
estatísticas. Já um parâmetro pode ser definido como uma medida usada com
finalidade de descrever uma característica da população e, diferente da amostra, é
representado por uma letra grega. São exemplos de parâmetros: μ (média
populacional); π (proporção populacional); σ (desvio-padrão populacional)
e μd (diferença de médias populacionais). Os dois problemas básicos da estatística
são: estimação e testes de hipóteses. Vamos, por meio de um exemplo, ilustrar essas
duas situações.
Suponha que determinado engenheiro químico está interessado em avaliar a média de
produção de um determinado efluente, μ, para o tratamento de água nas seguintes
condições: rio contaminado por aproximadamente 5 anos com água de péssima
qualidade e ecossistema aquático (peixes) degradado. Nesse caso, a nossa população
consiste em todas as dosagens da concentração do efluente nas condições citadas.
Assim, com os valores de concentração, podemos obter a estimativa da média de
produção verdadeira do efluente.
Esse é um exemplo de problema de estimação. Por outro lado, suponha que o
engenheiro químico deseja saber se a média de produção do efluente A é a mesma da
média de produção do efluente B. Para realizar tal comparação, foi considerada uma
amostra aleatória de 50 concentrações do efluente B e 50 do efluente A, sob as mesmas
condições. Esse é um exemplo de problema de teste de hipóteses.
• Reflita
Em que outras situações práticas você pode encontrar as diferenças entre os problemas
de estimação e testes de hipóteses?
Amostragem
Agora, para encerrar nosso conteúdo da aula, vamos lidar com a amostragem, que é
uma das principais ferramentas da estatística. Como vimos nos exemplos anteriores, um
pesquisador trabalha apenas com a amostra, visto que, em muitos casos, trabalhar com a
população toda é impossível. A maneira como é selecionada uma amostra é de extrema
importância, pois é através dos dados amostrais que estimamos os parâmetros da
população para fazer inferências sobre ela. Existem diversas formas/técnicas de se
realizar uma amostragem, porém, nesta aula, iremos nos limitar a trabalhar com
a amostragem aleatória simples para o uso das técnicas estatísticas aqui apresentadas.
Então, podemos definir a amostragem aleatória simples como sendo uma técnica em
que todos os indivíduos de uma dada população têm a mesma probabilidade de serem
selecionados para a amostra. Em outras palavras, seria análogo à ideia de um sorteio de
números como na Mega-Sena, em que temos 60 números na “população” e escolhemos
6 desses números. A escolha de cada um dos 6 números tem a mesma probabilidade.
Para facilitar o processo de amostragem aleatória simples, podemos dividi-lo em etapas:
1. definir a população-alvo;
2. definir um quadro par ao processo de amostragem;
3. avaliar os recursos disponíveis para execução do quadro de amostragem;
4. atribuir um número único para cada indivíduo;
5. determinar o tamanho da amostra;
6. realizar a amostragem aleatória simples.
Assim como toda técnica de amostragem, a amostragem aleatória simples tem suas
vantagens e desvantagens. Entre as vantagens, destacamos:
1. a probabilidade de seleção de um indivíduo é a mesma para todos os indivíduos;
2. em geral, esse método traz amostras representativas;
3. os métodos estatísticos, para lidar com esse tipo de amostragem, são mais
simples.
No entanto, as desvantagens desse tipo de amostragem são:
1. não se utiliza o conhecimento do pesquisador sobre a população;
2. os erros de amostragem podem ser maiores quando comparados a outros
métodos;
3. se lidamos com uma população mais dispersa, os custos de coleta de dados
podem ser maiores do que o esperado.
Além da amostragem aleatória simples, há outros tipos de amostragem
probabilísticas: amostragem sistemática, que, diferente da amostragem simples,
dividimos a população em grupos e em cada grupo trabalhamos com a amostragem
aleatória simples; amostragem estratificada, que consiste em, basicamente, dividir a
população em grupos e subgrupos de acordo com as características de interesse; e, por
fim, amostragem por conglomerados, que consiste em selecionar primeiramente o
grupo e não o indivíduo, como nos outros tipos de amostragem. Independentemente do
tipo de amostragem probabilística, o objetivo é sempreobter uma amostra
representativa.
Por outro lado, porém, a obtenção de uma amostra verdadeiramente aleatória vai
depender muito da situação da população de interesse. Frequentemente, não é possível
obter uma amostra aleatória, pois, muitas vezes, não há recursos de pesquisa suficientes
para utilizar tal técnica. Por exemplo, se temos por interesse tratar uma doença (como a
Covid-19) em seres humanos através de um dado medicamento, então os seres humanos
que formam a amostra são os acessíveis em hospitais, visto que não há como saber
quem está com a doença fora do hospital. Isso nos leva ao conceito de amostragem não
probabilística, que, em geral, é feita por conveniência devido a recursos disponíveis ou
até mesmo não tem necessariamente um critério para a amostragem. Dentre esse tipo de
amostragem, destacam-se dois tipos principais: julgamento e cotas.
A amostragem por julgamento é simplesmente feita pelo julgamento do próprio
pesquisador em que ele irá buscar por indivíduos com características definidas
anteriormente para a sua amostra. Já a amostragem por cotas é o tipo de amostragem
utilizado para pesquisa de mercado, pesquisa eleitoral e opinião pública. Para se
trabalhar com esse tipo de amostragem, devemos determinar as características gerais de
estudo e fazer os questionários; a partir disso, faz-se um filtro das características mais
importantes e tem-se a amostra. A grande desvantagem desses tipos de amostragem é a
chance de se obter viés na pesquisa ou resultados tendenciosos ou, ainda, inválidos.
Portanto, você já sabe como encontramos dois dos parâmetros da chamada distribuição
amostral da média. O próximo passo, por exemplo, seria determinar qual modelo
probabilístico poderia ser utilizado para trabalhar com tal distribuição. Nesse caso, se
aumentarmos o tamanho das amostras de 2 para 3, as médias amostrais ficam mais
concentradas em torno da média verdadeira (μ), porque o desvio-padrão diminui. Esse
conceito define o que chamamos de Teorema do Limite Central, que encerra a nossa
aula dos conceitos iniciais de probabilidade.
______
• Assimile
Teorema do Limite Central: para as amostras X1,…, Xn independentes e
identicamente distribuídas, a distribuição amostral da média:
Chegamos então ao fim de nossa aula sobre alguns conceitos básicos de Estatística que
irão, no futuro, orientar sua equipe no trabalho e para resolver problemas relativos à
modelagem que envolva análise estatística.
Conclusão
Em primeiro lugar, você deve mapear a área para saber exatamente com quantos rios
você lidará para realizar a amostragem. Dado que você deve ter a mesma probabilidade
de escolha para cada um dos rios, então, naturalmente, você irá considerar um plano de
amostragem baseado em amostragem aleatória simples. Sua população-alvo são os rios,
e devido aos seus recursos, você não pode ter uma amostra muito grande. O segundo
passo é fazer a proporção de instrumentos e pessoas para a coleta da amostra após a
seleção aleatória de uma quantidade amostral dos rios, visto que não há recursos para se
trabalhar com todos. Definida essa proporção, com base na extensão dos rios
selecionados, você fará o cálculo das probabilidades a fim de determinar o tamanho da
amostra necessária para fazer análises estatísticas sobre a população de rios considerada.
Embora não seja seu melhor plano de amostragem (a amostragem simples), é a melhor
maneira de usar com mais eficiência os recursos disponíveis. Após escrever o plano,
você ainda pode se reunir com o prefeito e sugerir uma amostragem por estratificação,
em que os estratos são as regiões em que se localizam os rios.
Unidade 3 - Aula 2 - Medidas de tendência central e de dispersão
Introdução da Aula
Qual é o foco da aula?
Nesta aula, você estudará sobre medidas de tendência central e de dispersão.
Objetivos gerais de aprendizagem
Ao final desta aula, você será capaz de:
descrever medidas de tendência central e medidas de dispersão, com aplicações;
calcular médias, medianas, moda, amplitudes;
identificar variância, desvio padrão e coeficiente de variação.
Situação-problema
Estudante, nesta aula iremos entender o conceito das medidas de tendência central ou
posição e também as medidas de dispersão. Tais medidas são fundamentais para você
compreender a importância delas nos trabalhos científicos e no dia a dia de sua
profissão.
Como exemplo dessa abordagem, podemos considerar uma experimentação de
tratamento de poluição hídrica em lago de uma determinada comunidade em que a
pesca é o principal recurso de sobrevivência das pessoas daquela região. Como um dos
objetivos, você precisa calcular, por exemplo, a concentração média de um determinado
composto para fazer o tratamento da água desse lago e também trabalhar com a
dispersão dos poluentes nesse lago. Percebe o quanto essas medidas nos trazem
informações importantes?
Atualmente, com o crescimento do uso de ferramentas estatísticas, matemáticas e
computacionais em análise de dados, nenhuma empresa quer ficar para trás. Nesse
aspecto, suponha que você foi contratado por uma empresa para avaliar as
concentrações de pH de um determinado rio em que se cria peixes para pesquisa. O
valor do pH é uma medida do grau de acidez ou alcalinidade da água, sendo 7 o valor
neutro do pH. Sabe-se que em certos ecossistemas, como o de peixes, valores de pH
muito baixos ou muito altos podem ser letais para a grande maioria das espécies. Então,
a empresa deseja que isso não aconteça com sua criação de peixes. Logo, uma
amostragem de valores de pH de dois anos foi realizada nessa empresa com a finalidade
de trazer algumas informações sobre tais concentrações, como média, variância,
máximo e mínimo, para se ter um devido controle da produção de peixes. Os dados
amostrados são:
Concentrações de pH fornecidas pela empresa. Fonte: elaborada pelo autor.
Como você faria o cálculo da média, da variância, do máximo e do mínimo em cada
ano? Como apresentaria tais resultados para empresa?
Vamos então começar o entendimento dessas medidas? Você será acompanhado em
todo o processo! Iniciaremos com as medidas de tendência central, como média,
mediana e moda, e depois passaremos para as medidas de dispersão, como variância,
desvio-padrão e coeficiente de variação.
Medidas de tendência central: média aritmética
Em situações práticas, no geral, descrevemos os dados por quantidades, denominadas
medidas resumo, que resumem todos os dados do conjunto bruto de dados. Por
exemplo, em uma fazenda podemos estar interessados em um valor que descreve o mais
típico tipo de árvore; ou o número de árvores presente em 25% da fazenda. Tais
medidas são denominadas medidas de tendência central (de posição).
No geral, as medidas de tendência central podem ser definidas como
“valor numérico central de uma distribuição de valores” (MAGALHÃES, 2002).
Dentre essas medidas, as mais importantes são: média aritmética, mediana, moda e
percentis. Antes de prosseguir com as medidas de posição, dois conceitos devem estar
bem definidos: população e amostra. Tais conceitos já vimos na aula anterior, mas
vamos retomá-los aqui.
População: uma população pode ser definida como um grupo de indivíduos que
possuem característica(s) em comum.
Amostra: uma amostra é, basicamente, um “pedaço” da população da qual temos por
objetivo estudar para inferir resultados sobre a população. Naturalmente, há diversas
formas de selecionar uma amostra, porém, em muitos casos, depende exclusivamente
dos recursos disponíveis para a coleta dos dados.
______
• Assimile
É importante destacar que em grande parte dos estudos trabalhamos com a amostra para
realizar inferências sobre a população quando ela é inviável de se trabalhar (quantidade
de dados exuberantes).
______É importante destacar que em grande parte dos estudos trabalhamos com a amostra para
realizar inferências sobre a população quando ela é inviável de se trabalhar (quantidade
de dados exuberantes).
Bom, vamos então dar início ao nosso conteúdo. Iniciaremos com a primeira medida de
posição: a média aritmética. Tal medida é a de posição mais popular que temos e
trabalhamos em muitos estudos. Ela pode ser calculada em duas situações: amostra e
população.
Média populacional: a média populacional é simplesmente calculada somando-se
todos os valores obtidos para população e dividindo o resultado pelo total de elementos
da população (MAGALHÃES, 2002). Em outras palavras, a média populacional é dada
por:
Média amostral: diferente da média populacional, a média amostral trabalha
exclusivamente com elementos da amostra (MAGALHÃES, 2002). Nesses termos, a
média amostral é dada por:
Média amostral: diferente da média populacional, a média amostral trabalha
exclusivamente com elementos da amostra (MAGALHÃES, 2002). Nesses termos, a
média amostral é dada por:
em que n é o tamanho da amostra e xi, i = 1, …, n são as observações da amostra. É
importante destacar que a média amostral, diferente da populacional, é sempre denotada
por uma letra minúscula do alfabeto tradicional (no caso, x).
______
• Exemplificando
Suponha que nosso objetivo seja avaliar o número médio de amostras contaminadas de
água em uma dada população de lagos. Se o número de amostras contaminadas em um
certo ano em cinco lagos é: 42, 43, 36, 32 e 40, o que podemos afirmar a respeito do
número médio de amostras contaminadas para uma população de 100 lagos? Nesse
caso, temos que n = 5 e a média dessa amostra é dada por:
Supondo que os dados constituem uma amostra no sentido técnico (isto é, um conjunto
de dados do qual podemos tirar generalizações válidas), podemos estimar
(hipoteticamente) que o número médio de amostras contaminadas dos 100 lagos é de μ
= 38,6 amostras contaminadas.
______
Algumas observações importantes sobre a média:
1. a média existe para qualquer conjunto de dados de natureza numérica;
2. a média é sempre única;
3. a média é útil para outras avaliações estatísticas, como a média global de um
conjunto de dados;
4. a média é sensível a pontos extremos, isto é, os pontos extremos de uma amostra
interferem na representatividade da média para aquela amostra;
5. a média leva em conta todos os dados.
Em algumas situações práticas, os dados podem ser apresentados em tabelas de
frequências por ponto ou classes. Nesse caso, a média tradicional não pode ser
diretamente calculada, uma vez que os dados estão agrupados ou possuem pesos
diferentes. Assim, fazemos uma modificação para o cálculo da média, que passa a ser
chamada de média ponderada.
______
• Assimile
Média ponderada: A média aritmética ponderada xp de uma amostra x1, x2, …, xn com
frequência absoluta f1, f2, …, fn é dada por:
______
• Exemplificando
Considere a tabela a seguir com a distribuição do número de testes hidráulicos diários
realizados por 79 engenheiros a respeito de uma avaliação da instalação hidráulica de
um determinado veículo.
Número de testes hidráulicos realizados por 79 engenheiros a respeito de uma instalação
hidráulica. Fonte: elaborada pelo autor.
Nesse caso, inicialmente, determinamos a variável resposta (ou de interesse), que aqui é
o número de análises, e reescrevemos a tabela anterior como:
Tabela de frequência do número de testes hidráulicos realizados por 79 engenheiros a
respeito de uma instalação hidráulica. Fonte: elaborada pelo autor.
Assim, a média ponderada dessa amostra é dada por:
Medidas de tendência central: mediana, moda, máximo, mínimo e
quartil
Com isso, encerramos as duas formas de se calcular a média de um conjunto de dados.
Mas você se lembra de que a média é uma medida sensível? Então, nesse caso,
precisamos de outra medida que não seja sensível a pontos extremos. Tal medida é
conhecida como mediana.
______
• Reflita
Considere o pH de 7 amostras de efluentes industriais de uma determinada empresa: 1,
1, 2, 3, 3, 10, 12. Qual medida representa melhor esse conjunto de dados? Média ou
mediana?
______
Certo, vimos como a mediana funciona. Mas será que existe outra medida de posição
que se faz importante? Sim, a moda. Essa medida desempenha um papel fundamental
em estudos ambientais quando o intuito, por exemplo, é saber qual espécie de árvore é
mais frequente em uma determinada região; a raça mais abundante de peixe em uma
represa; predador mais comum em determinados ecossistemas; entre outras aplicações.
Moda: é a medida representada pelo valor na amostra que ocorre com maior frequência.
A moda não é única, uma vez que podemos ter empate de frequências. A rigor de
notação, denotamos moda por xm.
Para complementar uma boa análise das estatísticas descritivas de uma amostra, além
das medidas de posição citadas anteriormente, necessitamos de mais algumas medidas
de
posição que se fazem importantes: máximo, mínimo e quartil. Essas medidas são
fundamentais para algumas técnicas gráficas como o boxplot.
Máximo e mínimo: o mínimo é definido como sendo a menor observação da amostra;
já o máximo é definido como sendo a maior observação da amostra.
Quartil: medida que divide o conjunto de dados em basicamente quatro partes iguais,
com os dados em ordem crescente. O primeiro quartil, Q1, representa 25% das
observações; Q2 representa a mediana que corresponde a 50% das observações; e Q3,
representa 75% das observações do banco de dados.
Medidas de dispersão: amplitude, variância, desvio-padrão, Teorema
de Tchebichev e o coeficiente de variação
Assim, encerramos nosso conteúdo sobre medidas de posição. Agora, vamos a um
pequeno exemplo: considere que uma indústria A tem três tipos de maquinários com o
número de falhas dessas máquinas descritos por 72, 76 e 74, enquanto uma indústria B
tem os mesmos três tipos de máquinas com o número de falhas de cada máquina dado
por 72, 91 e 59. Note que o número médio de falhas de cada máquina de cada indústria
é o mesmo, 74, mas observe a diferença de variabilidade. Isto é, enquanto a indústria A
tem uma quantidade de falhas equivalente para cada máquina, na indústria B há uma
falha muito maior na segunda máquina. Perceba que, nesse caso, a medida de posição
“média” é insuficiente para descrever, por exemplo, a homogeneidade das falhas das
máquinas. Nesse caso, devemos trabalhar com o que chamamos de medidas de
dispersão, que têm por objetivo medir a variação ou dispersão do nosso conjunto de
dados.
A primeira medida que vamos trabalhar é a amplitude. Tal medida é usada,
preferencialmente, no controle de qualidade industrial para manter o controle imediato
de matérias-primas e produtos. Há dois tipos de amplitudes: geral (abrange todos os
valores da amostra) e interquartil (abrange mais ou menos 50% dos dados centrais).
A amplitude geral não é uma medida muito útil da variação dos dados, uma vez que ela
não nos diz coisa alguma sobre a dispersão dos valores entre os dois extremos.
Considere os três conjuntos de concentração de um determinado efluente a seguir:
conjunto A: 5, 18, 18, 18, 18, 18, 18, 18, 18, 18;
conjunto B: 5, 5, 5, 5, 5, 18, 18, 18, 18, 18;
conjunto C: 5, 6, 8, 9, 10, 12, 14, 15, 17, 18.
Note que a amplitude de cada um dos conjuntos é a mesma e igual a 13, mas suas
dispersões entre o primeiro e o último valor são totalmente diferentes. Assim,
necessitamos de uma nova medida para lidar com esses dados, que é a variância.
A segunda medida de dispersão que vamos trabalhar é a variância. Essa medida
trabalha com a dispersão dos dados ao redor da média e pode ser calculada tanto para a
população quanto para a amostra. Isto é:
Variância populacional: dada uma população x1,...,xN de N elementos, a variância,nesse caso, é dada por (MAGALHÃES, 2002):
Variância amostral: dada uma amostra x1,…,xn de n elementos, a variância, nesse
caso, é dada por (MAGALHÃES, 2002):
______
• Assimile
É importante fixar que ao trabalhar com a variância amostral, iremos perder 1 grau de
liberdade quando comparada à variância populacional devido ao uso da média amostral
como estimador.
• Exemplificando
Voltando ao nosso exemplo da água contaminada em lagos. Vamos supor que nosso
objetivo agora seja avaliar a variância em vez da média. Se o número de amostras
contaminadas em cinco lagos é: 42, 43, 36, 32 e 40, o que podemos concluir sobre a
variância de amostras contaminadas para uma população de 100 lagos? Nesse caso,
temos que n = 5 e a média dessa amostra é 38,6 amostras contaminadas. Portanto, a
variância é dada por:
______
Depois da variância, uma outra medida de dispersão de suma importância é o desvio-
padrão que trabalha o “erro” de estimação. Nesse caso, temos que:
Desvio-padrão populacional: é uma medida de dispersão dada pela equação:
Desvio-padrão amostral: é uma medida de dispersão dada pela equação:
De acordo com a definição de desvio-padrão, observamos que a dispersão de um
conjunto de dados se baseia nas disposições dos dados em torno da média, isto é, quanto
mais “afastados” da média, mais disperso é o conjunto de dados. Esse conceito nos leva
ao último conceito de nossa aula: o Teorema de Tchebichev e o coeficiente de
variação.
Para finalizar, podemos definir o coeficiente de variação, que é uma das medidas
utilizadas quando nosso interesse é analisar a dispersão em termos relativos a seu valor
médio, mas sem levar em conta a influência da ordem de grandeza da variável. Tal
medida é definida como:
É importante salientar que o coeficiente de variação está entre 0 e 1, mas pode ser
escrito também em porcentagem, multiplicando-se o valor do CV por 100. E com isso
encerramos nossa aula sobre medidas de dispersão e tendência central. Deixo também
como encerramento a questão: onde podemos utilizar o Teorema de Tchebichev?
Conclusão
No contexto apresentado e para a amostra considerada, podemos calcular a média e a
variância por meio das expressões dadas, respectivamente, por:
Logo, para o 1º ano, obtemos que a média é, aproximadamente, igual a 6,41 e a
variância é, aproximadamente, 6,72. Já para o 2º ano, temos que a média é,
aproximadamente, 6,98 e a variância é, aproximadamente 8,88. Agora, o máximo e o
mínimo são medidas relativas ao maior e menor falar dos dados observados em cada
ano. Nesse caso, no 1º ano, o máximo é 8,23 e o mínimo é 1,98. Já no 2º ano, o máximo
é 8,23 e o mínimo é 2,97. Agora, para apresentar a empresa, montamos a seguinte
tabela:
Resultados descritivos sobre o pH da amostra considerada. Fonte: elaborada pelo autor.
De acordo com essa tabela, chegamos à conclusão de que a média de pH no primeiro
ano é de 6,41, que não é letal para os peixes, porém houve período em que o pH mínimo
foi de 1,98 nesse ano (junho), que pode ter sido letal para os peixes. A variabilidade do
pH foi de 6,72 de acordo com o valor da variância. Já para o segundo ano, a média de
pH é de 6,98, que não é letal para os peixes, porém houve período em que o pH mínimo
foi de 2,97 nesse ano (janeiro), que pode ter sido letal para os peixes. A variabilidade do
pH foi de 8,88 de acordo com o valor da variância.
UNIDADE 4 - Estatística aplicada e probabilidade
Unidade 4 - Aula 1Estatística descritiva
Introdução da Unidade
Objetivos da Unidade
Ao final desta Unidade, você será capaz de:
descrever os fundamentos probabilísticos e estatísticos;
calcular medidas de tendência central e de dispersão;
empregar regressão linear e correlação.
Estudante, você sabia que uma das melhores maneiras de representar dados é com
gráficos e tabelas? E fazendo esse tipo de representação, você está trabalhando com
estatística? Nesta unidade, vamos trabalhar com os principais conceitos de estatística,
iniciando-se com a estatística descritiva e os principais tipos de gráficos. Logo em
seguida, vamos revisar algumas definições de população e amostra, além dos conceitos
de probabilidade. No entanto, nosso foco será trabalhar com resumo de dados e cálculos
de probabilidades condicionais que são amplamente utilizados em testes de diagnósticos
e também para encontrar o padrão-ouro, que é fundamental para comparação de
parâmetros. Por fim, vamos entender os testes de hipóteses, que são fundamentais
quando o assunto é tomar uma decisão. Vamos entender todos os fatores que afetam
uma tomada de decisão e como decidir, estatisticamente falando.
Algo que você pode estar se perguntando é: mas como utilizamos a estatística em áreas
como a Engenharia? Para exemplificar, suponha que você trabalhe com energia eólica e
seu patrão te faça tomar uma decisão se este tipo de energia é útil e se vai gerar lucros e
ser sustentável. O que você faria? Naturalmente, você coletaria dados e elaboraria uma
hipótese que seria validada por métodos estatísticos para apresentar seus resultados e
apresentaria gráficos. Viu como a estatística é importante nesse aspecto? Para lhe
auxiliar, vamos, no decorrer desta unidade, aprender um pouco mais sobre ela! Então,
mãos à obra!
Introdução da Aula
Qual é o foco da aula?
Nesta aula, você estudará sobre estatística descritiva.
Objetivos gerais de aprendizagem
Ao final desta aula, você será capaz de:
aplicar métodos tabulares e métodos gráficos;
identificar tipos de variáveis
empregar o Excel para métodos tabulares e gráficos.
Situação-problema
Nesta aula, iremos entender como construir gráficos e tabela e como trabalhar com isso
na prática. Esses conceitos são fundamentais, uma vez que são úteis para resumir
informações e gerar apresentações a comitês sobre os resultados.
Como exemplo dessa abordagem, podemos considerar que você tenha interesse em
lançar um serviço no mercado. Para isso, você deve realizar um experimento que irá
gerar dados e você deve organizá-los em tabelas e gráficos para poder fazer um resumo
dos seus resultados para a apresentação em um determinado comitê para aprovação do
seu serviço. Viu como é importante entender essa questão? Gráficos bem detalhados e
corretos te dão uma boa visão do que está ocorrendo em determinado setor e também é
útil para mostrar à empresa as projeções.
Nos dias atuais, em qualquer apresentação empresarial, os gráficos fazem parte desse
mundo, trazendo e até às vezes inovando a forma de exibir os resultados de uma
empresa. Pensando nisso, seu gerente pediu sua sugestão para propor uma nova
apresentação das vendas do último trimestre dos últimos 10 anos da empresa. A ideia é
fazer com que esses valores fiquem apresentáveis, porém ele não tem nenhuma ideia de
como fazer isso. Como você faria essa apresentação? Que tipo de gráfico você utilizaria
para expor as vendas? E como você interpretaria esse gráfico?
Que tal começar esse entendimento agora? Você será acompanhado em todo o processo!
Iniciaremos com os conceitos de tabelas e, depois, passaremos para os gráficos e uso do
Excel!
Conceito de estatística e variável
Quando falamos de dados e o que eles mostram, estamos falando de estatística, mas o
que é estatística? Como podemos definir esse conceito? Em termos gerais, podemos
definir estatística como um conjunto de técnicas e métodos para realização de
experimentos, coleta e análise de dados (NETO, 2006). Duas ferramentas são essenciais
quando trabalhamos com estatística: população e amostra.
______
• Assimile
População: dizemos que um conjunto de elementos é uma população se tais elementos
têm pelo menos uma característica em comum. Como exemplo de populações, temos
árvores de uma determinadaespécie, poluentes atmosféricos, pessoas que têm olhos de
cor clara, etc.
Amostra: dizemos que um subconjunto de elementos é uma amostra quando ele for
subconjunto de uma dada população. Como exemplo de amostra, podemos considerar
um subconjunto de pessoas que têm olhos azuis da população de pessoas de olhos de
cor clara.
______
Certo, agora que sabemos o que é uma população e uma amostra, que são as bases dos
trabalhos de estatística, vamos introduzir um novo conceito que nos auxilia a construir
métodos estatísticos no futuro. Esse conceito é o conceito de variável.
• Assimile
Variável: dizemos que uma determinada característica é uma variável se determina a
natureza de uma população e pode assumir diversas classificações de acordo com a
origem da população. No planejamento da pesquisa, por exemplo, devemos definir
quais são as nossas características de interesse, antes da coleta dos dados.
______
É importante lembrar que as variáveis, em geral, têm natureza diferente, o que nos leva
à classificá-las em dois grupos: quantitativas e qualitativas. Como definimos esses
conceitos? Vamos começar com as variáveis quantitativas. Tais variáveis dizem respeito
a características que podem ser medidas ou contadas, por exemplo, o preço de um ativo
no mercado financeiro, o número de árvores de uma determinada espécie, a taxa de
hemoglobina de um paciente, etc. E as variáveis qualitativas, como definimos? Ora,
como o próprio nome já diz, qualidade. Essas variáveis estão ligadas à descrição de uma
característica, não podendo ser contada ou medida, mas podendo ser observada, por
exemplo, o nível educacional, a cor dos olhos, o sexo de um animal, etc.
Além dessas classificações de variáveis, podemos ainda classificá-las em subcategorias.
Isto é, no caso das variáveis qualitativas, podemos classificá-las em qualitativa
nominal (quando não há uma ordem de classificação) ou qualitativa ordinal (quando
há uma ordem de classificação). Exemplos de variáveis qualitativas nominais envolvem
espécie de uma planta, cor dos olhos, sexo de um animal, etc. Já os exemplos de
variáveis qualitativas ordinais envolvem a classificação do nível escolar, nível de
urgência em um hospital, etc. (NETO, 2006).
Por outro lado, podemos também classificar as variáveis quantitativas em dois
grupos: discretas ou contínuas. As discretas são aquelas que são originadas de um
processo de contagem, como o número de peixes de uma espécie X em um determinado
lago. Já as contínuas, bem, não existe uma contagem e podem assumir qualquer valor na
reta real, como temperatura, índices pluviométricos, etc. (NETO, 2006).
• Reflita
Como você acha que devemos representar as variáveis? É possível ter um novo tipo de
classificação de uma variável?
Tabelas de frequência
Certo, agora que sabemos o que é uma variável e suas classificações, vamos trabalhar
com a exposição de dados. Em geral, representamos os dados por tabelas de
frequência, que consiste, basicamente, em listar os valores possíveis da variável,
numéricos ou não, e fazer a contagem na tabela de dados brutos do número de suas
ocorrências (VIRGILITO, 2017). De acordo com Magalhães (2002), são componentes
de uma tabela de frequência:
______
• Exemplificando
Suponha que uma dada variável que representa a concentração de metal no sangue
(em μg/ml) de um paciente tenha como dados observados os valores: 20, 20, 20, 20, 21,
21, 21, 22, 22, 22, 22, 22, 23, 24, 24. Como representamos esses dados em tabela de
frequência? Nesse caso, podemos trabalhar com a seguinte tabela de frequência:
Concentração de um metal no sangue (em μg/ml) dos pacientes. Fonte: elaborada pelo
autor (2021).
______
No exemplo anterior, trabalhamos com uma representação de dados discretos. Mas
como trabalhamos com dados contínuos? Nesse caso, dado que não podemos fazer uma
contagem, trabalhamos com faixa de variações divididas em intervalos de classes, onde
o menor valor da classe é denominado limite inferior (li) e o maior valor da classe é
denominado limite superior (Li) (NETO, 2006). O intervalo ou a classe podem ser
representados das seguintes maneiras (MAGALHÃES, 2002):
1. li⊢Li, onde o limite inferior da classe é incluído na contagem da frequência
absoluta, mas o superior não;
2. i⊣Li, onde o limite superior da classe é incluído na contagem, mas o inferior não;
______
• Exemplificando
Suponha que em uma cidade X as precipitações diárias (em mm) foram dadas por 350,
260, 390, 250, 390, 210, 400, 160, 320, 390, 230, 150, 270, 440, 500 no mês de agosto
de 2020. A partir dessas observações, pela regra de Surges, vamos considerar cinco
classes, uma vez que k=4,88≈5. Nesse caso, uma tabela de frequência relativa a essas
precipitações diárias (em mm) da cidade é descrita por:
Precipitações diárias (em mm) em uma cidade X em agosto de 2020. Fonte: elaborada
pelo autor (2021).
______
Entendemos então como funcionam as tabelas de frequência, vamos agora para outra
ferramenta importante para a análise de dados: os gráficos. As representações gráficas
de tabelas de distribuições de frequências permitem uma visualização a respeito do
comportamento das variáveis, incluindo sua dispersão. Em geral, a utilização de
gráficos para resumir os resultados de uma pesquisa é comum e é sempre recomendável.
E já que estamos falando de gráficos, alguns pontos devem ser levados em conta na sua
construção (MAGALHÃES, 2002):
1. devem ser claros, simples, atrair a atenção e inspirar confiança;
2. servem para resumir resultados importantes de uma pesquisa;
3. sempre devem ter um título completo e ser colocado na parte superior do
gráfico;
4. devem ser construídos numa escala que não implique outros tipos de
interpretações;
5. deve-se sempre especificar (dar nome) e graduar (criar escala) os eixos;
6. quando os dados não são próprios, deve-se citar a fonte de origem dos dados do
gráfico.
Vamos então trabalhar com alguns tipos de gráficos, iniciando-se com o gráfico de
barras. O gráfico de barras apresenta dados categorizados em barras retangulares em
que cada barra é proporcional ao número de observações naquela categoria da variável
(NETO, 2006). Utilizamos esse tipo de gráfico, em geral, para realizar comparações
entre as categorias de uma variável qualitativa ou quantitativa discreta. E como fazemos
esse gráfico em um software como o Excel? Ora, nesse caso, digitamos os nossos dados
na planilha e vamos em Inserir > Gráficos > Barra. Como exemplo, vamos considerar o
gráfico de barras feito no Excel exposto na figura abaixo.
Gráfico de barras correspondente à precipitação total (em mm) de 1 ano em quatro
cidades diferentes. Fonte: elaborada pelo autor (2021).
Vimos que o gráfico de barras é um gráfico para variáveis qualitativas ou variável
quantitativa discreta, mas e para variável quantitativa contínua, qual gráfico utilizamos?
Nesse caso, trabalhamos com o histograma, que é uma representação gráfica da
distribuição de frequências em intervalos de classes de dados quantitativos contínuos. E
como fazemos esse gráfico no Excel? Ora, seguimos o mesmo caminho do gráfico de
barras, só mudamos o tipo de gráfico. Nesse caso, vamos na opção Inserir > Gráficos >
Histograma. Como exemplo, vamos considerar o histograma feito no Excel exposto na
figura abaixo.
Precipitação (mm) em 15 cidades no mês de agosto. Fonte: elaborada pelo autor (2021).
Vimos então como lidar com gráficos de barras e com o histograma. No entanto, temos
um terceiro tipo de gráfico que é de suma importância para variáveis qualitativas
nominais, que é o gráfico de setores. Esse tipo de gráfico é a representação gráfica da
frequência relativa (percentagem) de cada categoria da variável qualitativa (NETO,
2006). E no Excel, como fazemos esse tipo de gráfico? Ora, trabalhamos como nos
anteriores, Inserir > Gráfico > Pizza 2D, nessecaso. Como exemplo, vamos considerar a
representação dos dados de duas espécies de plantas descritos na tabela a seguir
Dados relativos a duas espécies de plantas e suas respectivas porcentagens em um dado estudo biológico.
Fonte: elaborada pelo autor (2020).
Gráfico de setores do número de plantas de espécies carnívoras e não carnívoras em uma determinada
região. Fonte: elaborada pelo autor (2021).
Um outro tipo de gráfico popular é o de linhas. É um tipo de gráfico que exibe
informações de uma série temporal em que os valores do eixo x representam a escala de
tempo e os valores do eixo y os dados observados. Os pontos são ligados por segmentos
de reta (MAGALHÃES, 2002). E como fazemos no Excel? Da mesma forma que os
anteriores, Inserir > Gráfico > Gráfico de linhas. Como exemplo, considere a
concentração de nitrogênio no decorrer dos anos em um determinado rio, conforme a
figura abaixo.
Concentrações de nitrogênio em um determinado rio nos últimos anos. Fonte: elaborada pelo autor
(2021).
Agora, para encerrar nosso estudo de gráficos e tabelas, vamos considerar o boxplot,
que é gráfico utilizado para avaliar a distribuição empírica dos dados e é extremamente
comum em pesquisas médicas, por exemplo. Esse gráfico é, basicamente, formado pelo
primeiro e terceiro quartil e pela mediana. No Excel, trabalhamos da mesma forma que
nos anteriores, Inserir > Gráfico > Boxplot. Como exemplo, vamos trabalhar com as
concentrações de chumbo no sangue de pacientes de um determinado hospital após
sofrerem um acidente de trabalho em uma mina. As concentrações (em μg/ml) de cada
paciente estudado são dadas por: 15.2; 10.5; 20.1; 14.2; 13.2; 15.8; 15.7; 14.2; 11.5;
17.8; 18.5. Utilizando-se o Excel, o gráfico dessa situação é dado pela figura abaixo.
Boxplot das concentrações de chumbo no sangue de pacientes após um acidente de trabalho em uma
mina. Fonte: elaborada pelo autor (2021).
E com isso encerramos nossa aula sobre tabelas e gráficos, que são as ferramentas
essenciais quando trabalhamos com estatística. Lembre-se sempre de usá-los quando
você estiver atuando em sua área de trabalho!
Conclusão
Visto que a natureza da variável é quantitativa contínua, devemos pensar em gráficos
relacionados com essa variável. Uma outra coisa deve ser levada em conta também, a
escala temporal. Isto é, a ideia é avaliar as vendas do último trimestre nos últimos 10
anos da empresa, então temos uma escala temporal de 10 anos, uma observação por ano.
Isso nos define um tipo de gráfico chamado gráfico de linha, que nos traz a informação
de uma variável quantitativa contínua em escala temporal, como podemos ver, por
exemplo, na figura abaixo.
Exemplo de gráfico de linha para variáveis em escala temporal. Fonte: elaborada pelo autor (2021).
Podemos interpretar esse gráfico da seguinte maneira: o lucro da empresa sofreu uma
alta nos anos de 2011 e 2017, sendo a maior alta em 2017, e uma queda brusca entre
2011 e 2012. Embora entre 2012 e 2017 a empresa estava se recuperando, em 2018 ela
teve outra queda brusca e o menor lucro dos 10 anos considerado na análise. Voltou a
crescer em 2019, chegando próximo ao valor do lucro obtido no ano de 2010 somente
no ano de 2020, após a queda de 2018.
Unidade 4 - Aula 2 - Probabilidade
Introdução da Aula
Qual é o foco da aula?
Nesta aula, você estudará sobre interpolação.
Objetivos gerais de aprendizagem
Ao final desta aula, você será capaz de:
descrever as técnicas de contagem da probabilidade;
calcular probabilidade condicional;
aplicar distribuições de probabilidade para variáveis discretas e contínuas;
Situação-problema
Estudante, nesta aula iremos entender o conceito de probabilidade e o que são as
distribuições de probabilidade. Tais conceitos são fundamentais quando trabalhamos,
por exemplo, com modelagem ou, até mesmo, previsão de lucros de uma empresa.
Como exemplo dessa abordagem, imagine que você tenha interesse em saber, em
média, quanto tempo irá demorar para o seu maquinário falhar para saber quando será
necessário trocar e se programar com o orçamento. Para fazer isso, você deve considerar
a distribuição de probabilidade do tempo de falhar e trabalhar com a média dessa
distribuição. Percebe a importância desse conteúdo?
Os acidentes industriais, na atualidade, embora reduzidos, ainda são um problema
complexo para muitas indústrias. Pensando nisso, você foi contratado para estimar a
probabilidade de acidentes anuais de uma determinada empresa. A única informação
que o dono da empresa lhe passou foi de que a chance de um único trabalhador se
envolver em um acidente é de aproximadamente 0,00024 e que a empresa tem muitos
trabalhadores. Como você faria para estimar esse número? Como você pode interpretar
esse resultado?
Que tal começar esse entendimento agora? Você será acompanhado em todo o processo!
Iniciaremos com os conceitos básicos de probabilidade e, depois, passaremos para as
distribuições de probabilidade.
Conceito de probabilidade e Variável aleatória
Antes de começar nossos estudos, vamos relembrar um pouquinho da história da
probabilidade. De acordo com o contexto histórico, acredita-se que a teoria da
probabilidade que conhecemos hoje teve seu início com os matemáticos franceses
Blaise Pascal (1623-1662) e Pierre Fermat (1601-1665) em estudos sobre jogos de
dados, em que o objetivo era determinar a probabilidade exata (NETO, 2006).
De acordo com Magalhães (2002), na literatura, há três interpretações do conceito de
probabilidade: a frequentista, a clássica e a subjetiva. Ele é válido para o conceito de
experimentos, que são classificados em aleatórios e determinísticos.
______
• Assimile
______
Pronto, agora sabemos o que é uma probabilidade no sentido matemático. Como a
calculamos, é com base nas interpretações frequentista, clássica e subjetiva
supracitadas. O nosso foco agora é, a partir desse conceito, definir o que é uma
distribuição de probabilidade. Mas antes necessitamos de alguns conceitos preliminares
que são de suma importância, como a regra da adição.
Regra da adição (MAGALHÃES, 2002): sejam A, B∈Λ. Então P(A∪B) = P(A) +
P(B) − P(A∩B). Por outro lado, se A e B são eventos mutuamente exclusivos, a
probabilidade P(A∪B) se reduz a P(A∪B) = P(A) + P(B).
Com a regra da adição em mãos, temos ferramentas para definir a probabilidade
condicional. Antes de fazer essa definição, vamos a uma questão: por que necessitamos
de probabilidade condicional? Ora, em algumas situações, a probabilidade necessita ser
reavaliada sempre que novas informações se tornam disponíveis e essa nova informação
pode causar algum tipo de interferência no resultado anterior. Nessa situação,
trabalhamos então com a chamada probabilidade condicional.
• Exemplificando
Isto é, como (PA∣B)=0,33 e sabendo que a face foi menor ou igual a 3, temos evidências
de que a chance de sair par é improvável de acontecer.
______
Bom, definimos a nossa primeira regra, a regra da adição, que foi base para a
probabilidade condicional. Será que existem outras regras que são bases para outros
tipos de probabilidade? A resposta é sim. Vamos trabalhar com a regra da
multiplicação, que é base do famoso teorema de Bayes.
A partir dessa regra, podemos definir dois teoremas de suma importância no contexto de
probabilidade: o teorema da probabilidade total e o teorema de Bayes. Esses dois
teoremas são a base do que chamamos de inferência bayesiana. Vamos à definição
deles?
Uma das principais aplicações do tão famoso teorema de Bayes é em análises clínicas
no contexto de teste de diagnósticos, em que o objetivo é definir os falsos positivos e
falsos negativos, a fim de encontrar um padrão-ouro.
______
• Reflita
Em que outras situações você acha que o teorema de Bayes pode ser aplicado? Existecondições especiais para essa aplicação?
Bom, fizemos então um resumo dos principais conceitos de probabilidade que
necessitamos para trabalhar com nossas distribuições de probabilidade. No entanto,
ainda falta uma ferramenta essencial: a variável aleatória. O que é uma variável
aleatória? No que consiste a ideia desse conceito? Basicamente, a ideia de variáveis
aleatórias consiste no conceito de que é possível associar um número real a cada
resultado no espaço amostral Ω. Matematicamente, podemos definir uma variável
aleatória como:
Certo, agora sim temos todas as ferramentas necessárias para lidar com as distribuições
de probabilidade. Mas antes, vamos primeiro classificar as variáveis aleatórias. Lembra-
se de que tínhamos dois tipos de dados quantitativos, discretos ou contínuos? Pois
então, temos a mesma classificação para variáveis aleatórias.
e obedece às seguintes propriedades:
Uma vez que sabemos o que é uma função de distribuição acumulada, podemos calcular
a função densidade de probabilidade. No entanto, devemos tomar cuidado com essa
função já que ela possui definições diferentes dependendo da natureza da nossa variável
aleatória. Por exemplo, se X é uma variável aleatória discreta, então a função de
probabilidade é definida como P(X=x)=F(x)−F(x+1). Por outro lado, se X é uma
variável aleatória contínua, então a função densidade de probabilidade é descrita como
É importante destacar também que o nome “função densidade de probabilidade” muda
de acordo com a natureza da variável aleatória justamente para diferenciar as duas, tudo
bem?
Distribuição de probabilidade
Bom, definimos as duas funções fundamentais para determinar uma distribuição de
probabilidade. Vamos começar então? Iremos dividir as distribuições de probabilidade
em dois grupos: contínuas e discretas, iniciando-se pelas discretas. Vale a ressalva que,
neste texto, nosso enfoque será entender a equação da distribuição, e não detalhá-la
matematicamente.
A primeira distribuição de probabilidade discreta que vamos estudar é a distribuição de
Bernoulli. Essa distribuição, em particular, trata de uma variável em que se observa
apenas dois tipos de probabilidade: sucesso e fracasso. Matematicamente, podemos
defini-la como:
Distribuição de Bernoulli (MAGALHÃES, 2002): seja X uma variável aleatória
discreta com as seguintes características:
x: Sucesso, se x = 1
x: Fracasso, se x = 0
Logo, a função de probabilidade que caracteriza X é descrita por
A distribuição de probabilidade de X é conhecida como distribuição de Bernoulli com
parâmetro e função de probabilidade dada pela expressão anterior. Se X~Bernoulli(ρ),
então E(X) =ρ e Var(X) = 1 −ρ, em que E(X) representa a média da distribuição e
Var(X) a variância da distribuição.
A segunda distribuição discreta que vamos trabalhar é a distribuição binomial. Ela é
basicamente uma generalização da distribuição de Bernoulli, aqui estamos interessados
em n sucessos. Matematicamente, essa distribuição pode ser definida como:
Distribuição Binomial (MAGALHÃES, 2002): seja X uma variável aleatória discreta,
tal que X conta o número de tentativas que resultam em um sucesso em n tentativas.
Nesse caso, a distribuição de probabilidade de X é conhecida como distribuição
binomial com parâmetro ρ e função de probabilidade caracterizada por:
A terceira distribuição de probabilidade discreta mais famosa é a distribuição
geométrica, diferente das duas anteriores, nosso interesse aqui é trabalhar com o número
de fracassos até o primeiro sucesso. Matematicamente, ela pode ser definida como:
Distribuição geométrica (MAGALHÃES, 2002): seja X uma variável aleatória
discreta, tal que X conte o número de fracassos anteriores ao primeiro sucesso. Nesse
caso, a distribuição de probabilidade de X é conhecida como distribuição geométrica
com parâmetro ρ e tem função de probabilidade escrita na forma:
Por fim, a última distribuição discreta que vamos abordar neste texto é a distribuição
de Poisson. Em comparação às outras três, a distribuição de Poisson não lida com
fracasso e sucesso, mas sim com número de eventos em um dado intervalo de tempo.
Matematicamente, essa distribuição pode ser definida como:
Beleza, encerramos as distribuições de probabilidade discretas. Vamos então para as
distribuições de probabilidade contínuas. Vamos dar início aos estudos dessas
distribuições com a distribuição uniforme que trabalha com intervalos (a,b).
Matematicamente, essa distribuição é definida como:
Distribuição uniforme (MAGALHÃES, 2002): Dizemos que uma variável aleatória
contínua X é distribuída uniformemente ao longo do intervalo (a,b) se sua função
densidade de probabilidade é dada por:
Uma segunda distribuição de probabilidade contínua extremamente conhecida é a
distribuição beta, que é uma distribuição para lidar com dados no intervalo (0,1), como
taxas sanguíneas que estão limitadas a esse intervalo. As principais aplicações dessa
distribuição, em geral, são na área da saúde. Matematicamente, podemos definir a
distribuição beta como:
Para encerrar nossos estudos sobre distribuições contínuas, vamos trabalhar com três
distribuições que são muito famosas, especialmente no contexto de teste de hipóteses,
que são as distribuições qui-quadrado, t de Student e normal. Essas distribuições têm
seus valores tabelados (que chamamos de Tabela da Normal, Tabela do Qui-Quadrado,
Tabela t de Student), o que facilita o cálculo das probabilidades dessas distribuições.
Mas o maior interesse nelas é, justamente, quando lidamos com testes de hipóteses em
que precisamos decidir sobre uma hipótese (veremos mais sobre esses conceitos na
Aula 3 desta unidade). Essas distribuições são definidas, matematicamente, como:
Distribuição qui-quadrado (MAGALHÃES, 2002): uma variável aleatória contínua
X segue uma distribuição qui-quadrado com ν graus de liberdade se sua função
densidade for escrita na forma:
Distribuição t de Student (MAGALHÃES, 2002): uma variável aleatória contínua X
tem distribuição t de Student com ν graus de liberdade se sua função densidade de
probabilidade é dada por:
e é conhecida como distribuição normal padrão. Nesse caso, dizemos que X~N(0,1).
Para transformar uma variável da distribuição normal para a distribuição normal padrão,
utilizamos a seguinte equação:
que é chamada de normalização padrão da variável e Z segue uma distribuição normal
padrão. Com isso, então, fechamos o nosso conteúdo sobre probabilidade e distribuições
de probabilidade. Agora é hora de colocar a mão na massa e trabalhar com esses
conceitos!
Conclusão
Veja que o problema em questão envolve contagem e tempo, visto que são acidentes
anuais. Naturalmente, esse problema seria trabalhar com a questão de sofrer ou não um
acidente que remete à distribuição binomial, porém ela pode se tornar complexa devido
ao grande número de funcionários. Nesse caso, trabalhamos com a aproximação da
distribuição binomial para a distribuição de Poisson, em que tiramos que o parâmetro λ
é estimado por:
λ=np
Em que n é o número de trabalhadores e p é a probabilidade de um único trabalhador se
envolver em um acidente. Vamos supor que nessa empresa tenha 100.000 trabalhadores.
Nesse caso, temos que:
Isso quer dizer que, em média, o número de trabalhadores envolvidos em acidentes seria
de 24 trabalhadores anualmente. Assumindo que a distribuição de Poisson é
recomendada para esses dados, temos que a probabilidade de nenhum trabalhador sofrer
acidente é descrita por:
Ou seja, a chance de ninguém sofrer acidente é muito baixa. Agora, a chance de mais do
que 24 trabalhadores sofrer acidentes é descrita por:
Isto é, a chance de mais de 24 trabalhadores sofrerem acidentes nessa empresa é de
aproximadamente 44,6%. Conclusão, há poucas chances de um número X de
trabalhadores não sofrerem acidente,mas há uma chance muito grande de, acima de um
limiar, muitos trabalhadores sofrerem acidente.
Unidade 4 - Aula 3 - Métodos de tomada de decisão
Introdução da Aula
Qual é o foco da aula?
Nesta aula, você estudará métodos de tomada de decisão.
Objetivos gerais de aprendizagem
Ao final desta aula, você será capaz de:
empregar hipótese estatística;
aplicar testes de hipóteses.
diferenciar teste de uma cauda e de duas caudas, teste t e teste z e testes
referentes à proporção amostral;
Situação-problema
Estudante, nesta aula iremos entender como fazemos para tomar uma decisão com
embasamento estatístico. Este é um dos tópicos mais importantes que você irá estudar
nesta unidade, visto que a tomada de decisões faz parte do nosso cotidiano.
Como exemplo dessa abordagem, considere que você precisa decidir sobre a eficácia de
uma vacina. Após realizações de experimentos, você chega à seguinte hipótese: “a
vacina é eficaz?”. Para saber como responder essa pergunta, você deve se basear em
métodos estatísticos para fundamentar sua resposta, pois é com base nessa
experimentação que você vai decidir se a vacina é ou não eficaz.
Os níveis de colesterol, em geral, são indicadores de boa saúde. Em um dado estudo
envolvendo adultos hipertensos e fumantes, o pesquisador-chefe lhe convidou para
auxiliá-lo em um teste de hipóteses. Sabendo que o desvio-padrão populacional é
descrito por 46 mg/ml, o pesquisador deseja testar a hipótese de que o nível médio de
colesterol nessa população é de 211 mg/ml a partir de uma amostra de 12 adultos
hipertensos e fumantes que têm como nível médio de colesterol cerca de 217 mg/ml ao
nível de significância de 5%. Como você faria para auxiliar esse pesquisador? Qual tipo
de teste você recomendaria para testar a hipótese dele? Qual seria o p-valor obtido no
teste definido?
Que tal começar esse entendimento agora? Você será acompanhado em todo o processo!
Iniciaremos com os conceitos de hipóteses e, depois, passaremos para os métodos
estatísticos para a tomada de decisões.
Hipótese estatística e teste de hipótese
Você já imaginou como são feitas as tomadas de decisões acerca de um medicamento?
De um júri? Ou até mesmo de um material de construção? Não? Pois então, nesta se
iremos trabalhar com os métodos que fundamentam a tomada de decisões com base em
experimentação. Vamos começar com um pequeno exemplo antes de definir as
condições para tomar uma decisão.
Suponha que um certo indivíduo está sendo julgado por um certo crime. Naturalmente,
o júri precisa decidir sobre a culpa ou não desse indivíduo, com base em fatos,
testemunhas e leis. Nesse caso, então, duas hipóteses podem ser formuladas:
H0: {o indivíduo é culpado}
H1: {o indivíduo é inocente}
A decisão por cada uma das hipóteses está sujeita a erros, é claro. Por exemplo, ao
tomar a decisão por H0, o júri pode cometer um erro, uma vez que o indivíduo pode ser
inocente. O mesmo vale se for tomada a decisão por H1. No entanto, na prática, uma
das decisões deve ser tomada, mesmo com essa possibilidade de se cometer um erro.
Então, sabendo das condições de erro, como fazemos para tomar a decisão mais
coerente? Antes de responder essa questão, vamos a algumas definições importantes.
A primeira definição que vamos trabalhar é com a de hipótese estatística, que é a base
fundamental da tomada de decisões. Mas o que é uma hipótese estatística? Ora, uma
hipótese estatística nada mais é do que qualquer tipo de afirmação que se faça sobre a
distribuição de probabilidade de uma ou mais variável aleatória em que H0 representa a
hipótese nula e H1 a hipótese alternativa. Certo, mas você deve estar se perguntando o
que essa definição tem a ver com a questão exposta sobre o júri, por exemplo. Veja que,
embora não foi citado, a distribuição de probabilidade no exemplo estava implícita. Em
geral, trabalhamos com essas distribuições implicitamente nas questões práticas, quando
o assunto é tomar uma decisão, isto é, elas funcionam, basicamente, como uma
ferramenta.
Certo, sabemos o que é uma hipótese. Precisamos entender agora o que é um teste de
hipóteses. Em termos matemáticos, um teste de uma hipótese estatística é uma função
de decisão d: X→ {a0, a1}, em que a1 corresponde à ação de considerar a hipótese H0
como verdadeira, corresponde à de considerar a hipótese H1 como verdadeira e X é o
espaço amostral associado à amostra X1, …, Xn (CASELLA; BERGER, 2010).
______
• Assimile
Certo, temos as hipóteses, mas como escrevemos a região de aceitação e região de
rejeição que formam a base do teste de hipóteses? Para isso, vamos trabalhar com
a distribuição de probabilidade da situação ilustrada. Logo, seja Xi a variável aleatória
de Bernoulli que assume valor 1 se ocorrer cara no i-ésimo lançamento, e o valor 0 caso
contrário, i = 1,2,3. Nesses termos, o espaço amostral X é descrito por:
X={(0,0,0), (1,0,0), (0,1,0), (0,0,1), (0,1,1), (1,0,1), (1,1,0), (1,1,1)}
Logo, podemos escrever a região de rejeição (ou crítica) para esse teste de hipóteses
como:
de modo que a região de aceitação seja:
A0={(x1, x2, x3); x1+ x2+ x3< 2}.
______
Bom, agora sabemos o que é uma hipótese, um teste de hipótese e como determinar a
região crítica, porém, no início da aula falamos também sobre os possíveis erros ao se
tomar uma decisão. Temos dois tipos de erros a considerar: o erro do tipo I e o erro do
tipo II. O que significam esses erros? Ora, quando rejeitamos a hipótese nula quando de
fato ela é verdadeira, estamos cometendo o que chamamos de erro do tipo I. Por outro
lado, quando não rejeitamos a hipótese nula quando de fato ela é falsa, estamos
cometendo erro do tipo II (CASELLA; BERGER, 2010). No geral, denotamos as
probabilidades desses dois tipos de erro como α e β, respectivamente.
Outro fator importante quando trabalhamos com testes de hipóteses é a função de risco,
que vai determinar para nós a probabilidade dos erros do tipo I e tipo II. Mas antes de
trabalhar com essa função, precisamos de uma definição da função de perda, que é a
seguinte:
Agora sim podemos trabalhar com a função de risco. Nesse caso, a função de risco que
determina a probabilidade dos erros do tipo I e II, com base na função de perda, é dada
por:
Em que E representa o valor esperado (ou média).
Certo, vimos muitas componentes sobre os testes de hipóteses, mas ainda faltam duas
que são as mais usuais de aparecerem nos trabalhos científicos e nos trabalhos diários
envolvendo testes de hipóteses: o nível de significância nominal e o nível descritivo do
teste (ou p-valor). Vamos entender esses conceitos pelas definições a seguir:
Nível de significância nominal de um teste de hipótese (CASELLA; BERGER,
2010): é caracterizado pela probabilidade de se cometer o erro do tipo I. Em grande
parte dos estudos, adota-se, em geral, o nível de significância α=0.05.
Nível descritivo do teste, ou p-valor (CASELLA; BERGER, 2010): traduz a
probabilidade de que a estatística do teste (como variável aleatória) tenha valor extremo
em relação ao valor observado (estatística) quando a hipótese nula é verdadeira. Em
outras palavras, sob o ponto de vista matemático, considere um teste de hipóteses no
qual Rα é a região de rejeição com nível de significância α e suponha que, para
diferentes valores de α, as regiões Rα e Rα1 satisfazem Rα⊂Rα1 com α<α1. Dessa forma,
sob essas condições, o p-valor é definido por: p = p(X)=inf{α: X∈ Rα} em que X
representa a amostra aleatória e inf é o ínfimo do conjunto.
É importante destacar que com essa definição de p-valor, podemos reescrever a nossa
definição anterior de região a fim de definir o que é poder do teste, que é um dos
conceitos mais importantes quando se trabalha com teste de hipóteses. Nesse caso, o
poder do teste pode ser definido como:
______
•Exemplificando
Hipótese simples, teste ótimo e lema de Neyman-Pearson
Agora já sabemos trabalhar com testes de hipóteses! Antes de ir para os tipos de testes
mais comuns da prática cotidiana, vamos trabalhar com mais três conceitos para fechar
esse aparato teórico. Tais conceitos são: hipótese simples, teste ótimo e, finalmente, o
lema de Neyman-Pearson. O lema de Neyman-Pearson é o que nos assegura a
construção de qualquer tipo de teste de hipóteses, isto é, é o resultado mais importante e
fundamental desse contexto teórico. Mas vamos começar com a hipótese simples.
A partir dessa definição e da definição da função de verossimilhança de uma
distribuição de probabilidade (ver Casella; Berger, 2010), podemos definir o conceito de
teste ótimo.
Agora, com as definições de hipótese simples e teste ótimo, temos as ferramentas
necessárias para enunciar o lema de Neyman-Pearson, que é um dos resultados mais
importantes quando se fala de teste de hipóteses.
Neyman-Pearson (CASELLA; BERGER, 2010): considere o teste com região crítica
descrita por:
Testes de hipóteses na prática
Encerramos então a nossa primeira parte desta aula, que era a parte teórica a respeito
dos testes de hipóteses. Agora, vamos trabalhar com alguns testes comuns na prática. O
primeiro que iremos trabalhar é o teste Z.
O teste Z para média é um teste estatístico baseado na distribuição normal para amostras
grandes e desvio-padrão conhecido. Nesse caso, a estatística do teste é descrita por:
O teste Z é um dos testes mais simples que temos para fazer comparação de médias,
porém ele pode ser ruim quando trabalhamos com amostras muito pequenas e não
aplicável quando não conhecemos o valor do desvio-padrão populacional. E como
resolvemos se isso acontecer? Ora, nesse caso, temos um teste análogo ao teste Z, que é
o teste t baseado na distribuição t de Student. Esse teste é utilizado, em geral, quando
não conhecemos o valor do desvio-padrão populacional e a amostra é pequena. A
estatística do teste é dada por:
Além disso, podemos testar os mesmos tipos de hipóteses anteriores para o teste
bicaudal e unicaudal. E quando temos duas médias, podemos trabalhar também com o
teste t? Sim, podemos, porém há uma diferença em relação ao teste Z. Nesse caso,
temos duas considerações: variâncias iguais e variâncias diferentes. No caso em que
elas são iguais, a estatística do teste é dada por:
E no caso em que elas são diferentes, a estatística do teste é dada por:
Agora já sabemos como testar a média. Mas esse é o único tipo de teste que pode ser
feito? Não, podemos trabalhar também com testes de proporção, além de outras
medidas. Neste texto, nosso foco serão os testes de média e de proporção. Então, para
encerrar nossa aula, vamos considerar o teste para proporção, que é baseado no teorema
central do limite e no teste Z, com estatística de teste dada por:
Como exemplo de aplicação desse teste, podemos testar hipóteses do tipo “um
engenheiro garante que 95% dos seus projetos estão de acordo com as normas da
ABNT” ou “uma empresa garante que é responsável por apenas 10% da contaminação
de um determinado lago”, e assim por diante. E para duas proporções, também
conseguimos trabalhar com esse teste? Sim, nesse caso, a estatística do teste é dada por:
______
• Reflita
No caso de proporções, você acha que é possível trabalhar com o teste t em vez do teste
Z? Se sim, como você acha que ficaria a estatística do teste?
______
Com isso fechamos o nosso conteúdo sobre testes de hipóteses, que são ferramentas
fundamentais para lidar com a tomada de decisões. Agora é hora de colocar a mão na
massa e trabalhar com esses conceitos.
Conclusão
A primeira coisa que devemos analisar é se o teste será unicaudal ou bicaudal. Na
situação exposta, notemos que o nível médio de colesterol da subpopulação de
hipertensos e fumantes pode ser maior ou menor do que o nível médio de colesterol
considerado na hipótese de teste, então, nossa hipótese alternativa é descrita por:
Isto é, estamos considerando um teste bicaudal nas condições do problema. A segunda
observação que devemos ter em mente é de que o tamanho da amostra considerada é
pequeno, o que nos indica que o teste t seria apropriado. No entanto, devemos notar
também que o desvio-padrão populacional é conhecido, nossa terceira observação.
Então, nesse caso, podemos utilizar o teste Z. Assim, após esses critérios, podemos
recomendar ao pesquisador o uso do teste Z, que é baseado na estatística:
Que, usando os dados do nosso problema, é dado por:
Nesse caso, como Z segue a distribuição normal padrão, temos que o p-valor, ao nível
de significância de 5% e com base na tabela da distribuição normal para teste bicaudal,
é igual a 0,652. Como esse valor é maior do que 0,05, não rejeitamos a hipótese nula
(ou de pesquisa). Ou seja, podemos concluir ao pesquisador que, baseado nessa
amostra, não há evidências de que o nível médio de colesterol dessa população de
fumantes hipertensos seja diferente de 211 mg/ml.