Logo Passei Direto
Buscar
Material
páginas com resultados encontrados.
páginas com resultados encontrados.
left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Prévia do material em texto

Métodos 
Matemáticos 
 
 
 
 
 
 
 
 
 
 
 
 
 
Objetivos 
 
 Objetivo 1 
o Aplicar as principais propriedades de Álgebra Linear; 
 Objetivo 2 
o Esclarecer os conceitos de cálculo numérico, tais como: interpolação e 
integração numérica; 
 Objetivo 3 
o Calcular estatísticas, regressão linear, organização de dados, medidas de 
tendência central e de dispersão. 
 
 
 
 
 
 
 
 
 
 
 
 
 
Conteúdo 
 
UNIDADE 1 - Introdução à Álgebra Línea 
 
Aula 1 - Matrizes 
Aula 2 - Sistemas Lineares 
Aula 3 - Autovalores e Auto vetores 
 
UNIDADE 2 - Cálculo numérico 
 
Aula 1 - Zeros de funções 
Aula 2 - Interpolação 
Aula 3 - Integração numérica 
 
UNIDADE 3 - Probabilidade e estatística 
 
Aula 1 - Introdução à probabilidade e estatística 
Aula 2 - Medidas de tendência central e de dispersão 
Aula 3 - Regressão linear e correlação 
 
UNIDADE 4 - Estatística aplicada e probabilidade 
 
Aula 1 - Estatística descritiva 
Aula 2 - Probabilidade 
Aula 3 - Métodos de tomada de decisão 
 
 
 
 
 
 
 
 
 
Introdução 
Olá, estudante! 
Desejamos boas-vindas à disciplina de Métodos Matemáticos. Nesta disciplina, 
trabalharemos com os tópicos mais importantes da álgebra, cálculo numérico e 
probabilidade. Inicialmente, abordaremos a Álgebra Linear, com a estrutura 
algébrica conhecida por matriz e suas principais propriedades. Uma vez definido 
o que é uma matriz, introduziremos as operações com essa estrutura algébrica e 
o conceito de determinantes. Para entender melhor, alguns exemplos práticos 
relacionados à engenharia serão considerados. 
Em segundo lugar, trabalharemos com os conceitos de cálculo numérico, tais 
como: interpolação e integração numérica. Estes conceitos são ferramentas 
fundamentais quando nos deparamos com problemas práticos, cuja solução 
não é possível de se obter com métodos analíticos, gerando a necessidade do 
uso de métodos numéricos. Encerraremos a disciplina com os conceitos 
fundamentais de probabilidade e estatística, em que abordaremos as questões 
de hipóteses estatísticas, regressão linear, organização de dados, medidas de 
tendência central e de dispersão, entre outros conceitos importantes. Vale 
lembrar que essa disciplina é uma das mais importantes na engenharia, pois ela 
permite, além da álgebra, ênfases em cálculo numérico e estatística, que são 
fundamentais na profissão de engenheiro, uma vez que esses conceitos formam 
a base matemática da profissão. 
 
 
 
Competências 
Ao fim desta disciplina, você deverá ser capaz de: 
 aplicar matrizes e suas operações na resolução de sistemas lineares e 
conhecer as aplicações de vetores e suas operações. 
 calcular interpolação polinomial com a finalidade de aproximar funções 
reais e aproximar a integral definida de uma função por meio de técnicas 
numéricas. 
 descrever os fundamentos probabilísticos e estatísticos para tomada de 
decisão necessários na prática profissional da área de exatas e 
Engenharias. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Unidade 1 - Aula 1 - Matrizes 
 
Introdução da Unidade 
 
Objetivos da Unidade 
Ao final desta Unidade, você será capaz de: 
esclarecer a representação de dados na forma matricial; 
identificar modelagem de problemas aplicados como sistema de equações lineares; 
aplicar vetores e suas operações na resolução de problemas geométricos aplicados. 
Estudante, quando escutamos o termo “métodos matemáticos”, é natural que o primeiro 
conceito que vem em nossa cabeça é a relação com a realização de inúmeros cálculos, 
às vezes até sem-fim. Mas, será que estamos corretos sobre esse conceito? 
Para iniciar seu entendimento sobre os conceitos abordados, trabalharemos com a ideia 
de matrizes, as quais são, em linguagem popular, tabelas com um gama de dados. As 
matrizes são objetos matemáticos úteis para organização e manipulação de dados 
computacionalmente. Após essa ênfase no conceito de matrizes, estudaremos outro 
conceito que é muito comum, especialmente em modelagem: sistemas lineares. Os 
sistemas lineares podem ser aplicados em diversas situações, por exemplo, no 
balanceamento de equações químicas, no cálculo de lucros e dividendos de em empresa, 
nos problemas de otimização, na resistência de vigas, entre muitas outras aplicações 
comuns em nosso cotidiano. 
Por fim, encerraremos a unidade com o conceito de autovalores e autovetores, os quais, 
em geral, são utilizados em problemas de otimização computacional e em aplicações 
voltadas para a área da física em contexto de mecânica. 
Para exemplificar, suponha que você tem que lidar com um problema de construção 
civil, cujo objetivo é avaliar a resistência das vigas. Para resolver essa questão, você, 
inicialmente, trabalhará com a experimentação da situação e coletará os dados dela. A 
partir disso, montará a matriz com os dados. Com a matriz em mãos, por meio de 
sistemas lineares e operações com matrizes, você poderá validar a sua hipótese sobre a 
resistência das vigas. Esta, porém, não é a única situação em engenharia que você pode 
utilizar tais conceitos. Existem muitas outras, como predição de níveis de poluição 
atmosférica, na engenharia ambiental; concentração de solventes, na engenharia 
química; relatórios financeiros empresariais, no setor público ou privado; entre muitas 
outras aplicações. Já se imaginou trabalhando com as matrizes e os sistemas lineares 
sob essa visão? Para lhe auxiliar, aprenderemos, no decorrer desta unidade, um pouco 
mais sobre esses objetos. Mãos à obra! 
 
 
Introdução da Aula 
 
Qual é o foco da aula? 
Nesta aula, você estudará sobre Matrizes. 
Objetivos gerais de aprendizagem 
Ao final desta aula, você será capaz de: 
 identificar a importância do papel das matrizes quando se trata de dados 
dispostos em tabelas; 
 descrever como realizar operações com dados das matrizes; 
 empregar o conceito de matrizes e determinantes. 
Situação-problema 
Nesta aula, entenderemos o conceito de matrizes e determinantes por meio de exemplos 
práticos e das definições dadas pela matemática em si. Com isso, você compreenderá a 
importância do papel das matrizes quando se trata de dados dispostos em tabelas e como 
realizar operações com esses dados. 
Como exemplo dessa abordagem, podemos considerar uma experimentação de 
resistência de vigas de uma construção civil, em que se obteve os valores das 
componentes das forças para cada uma das realizações do experimento. Os dados foram 
todos dispostos em tabelas, as quais, por sua vez, podem ser dispostas em matrizes para 
realização de cálculos, a fim de se atingir o objetivo da pesquisa ou do trabalho, que 
pode ser, por exemplo, o tempo total gasto para realização do experimento ou a escala 
das forças consideradas nele. Portanto, o uso de operações utilizando-se o conceito de 
matriz permite um melhor entendimento e interpretações do experimento em questão. 
Vamos criar uma situação hipotética para exemplificar o uso de matrizes no dia a dia de 
trabalho, especialmente em áreas relacionadas à engenharia. 
Imagine que você foi convocado e nomeado para realizar uma verificação do último 
relatório bimestral de uma empresa de construção civil no ano de 2020 em relação às 
vendas de cimento e cal. Os dados de venda da empresa são descritos pela matriz: 
 
Cada elemento dessa matriz representa o número de unidades dos produtos do tipo i (i = 
1). A representação do cimento (i = 2) e a representação da cal vendidos no mês j (j = 1) 
representam novembro, e j = 2 representa dezembro. De acordo com as exigências, foi-
lhe pedido para verificar as seguintes questões: 
1. Qual produto e em qual mês foi vendido menos sacos? Qual a maior diferença 
de vendas entre os produtos nos meses correspondentes? 
2. Qual foi a arrecadação bruta da empresa no bimestre com esses dois tipos de 
produtos, se o pacote de cimento custa R$30,00 e o pacote de cal custa R$50,00? 
Qual foi a arrecadação bruta de cada mês?Que tal começar esse entendimento agora? Você será acompanhado em todo o processo. 
Iniciaremos com os conceitos fundamentais de matrizes, para que você possa entender a 
relação delas com a disposição de dados em tabelas e como realizar operações. 
 
Conceito de Matriz 
Ao estudar métodos matemáticos, deparamo-nos com diversos conceitos. Nesta aula, 
abordaremos um conceito usual em muitas áreas do conhecimento, o conceito de 
matrizes. As matrizes são essenciais para muitos problemas, não apenas porque elas 
“ordenam e simplificam”, mas também porque oferecem novos métodos de resoluções e 
novos olhares sobre o problema. 
Neste aspecto, entende-se por uma matriz uma tabela de elementos dispostos em linhas 
e colunas. Por exemplo, ao coletarmos dados referentes às concentrações de pH do rio 
Columbia no primeiro trimestre dos anos de 2013 a 2015, podemos dispô-los na tabela a 
seguir. 
 
 
Concentrações de pH do rio Columbia de acordo com a estação de monitoramento de 
água Umatilla do estado de Washington, nos Estados Unidos, no período de 2013 a 
2015. Fonte: https://bit.ly/384JRCT. Acesso em: 20 jan. 2021. 
 
 
 
Ao abstrairmos os significados das linhas e colunas, obtemos a seguinte matriz: 
______ 
• Reflita 
Quando temos uma tabela com uma enorme quantidade de linhas e colunas, isto é, 
diversas variáveis, é viável a disposição desses dados em forma de matriz? 
______ 
Uma questão que você pode estar se perguntando é: quais são os elementos que as 
matrizes podem incorporar? Na primeira impressão, pode parecer que as matrizes 
incorporam apenas números, porém elas podem incorporar muitos outros elementos, por 
exemplo, funções, matrizes, números complexos etc. De fato, considere a matriz: 
 
 
Essa matriz contém em suas entradas números complexos e equações/funções 
algébricas. Logo, uma matriz pode também conter uma combinação de elementos de 
natureza diferente, não sendo exclusivamente formada por apenas números. 
Outro fator importante quando se trabalha com matriz é a representação dela em termos 
algébricos. Representamos uma matriz de m linhas e n colunas por: 
 
 
 
______ 
• Assimile 
 
 
______ 
Quando se fala de matriz, uma propriedade que merece destaque é a de igualdade de 
matrizes. Diremos que duas matrizes são iguais se elas têm necessariamente o mesmo 
número de linhas e colunas e seus termos correspondentes são todos iguais. 
______ 
ෝ Exemplificando 
Considere as matrizes de concentrações de pH de dois rios aleatórios: 
 
Note que, embora os números apresentados em ambas as matrizes sejam iguais, as 
matrizes não são iguais, pois o número de linhas e colunas são diferentes e os elementos 
na posição correspondente também são diferentes. 
______ 
Uma segunda propriedade das matrizes é a operação de adição de matrizes. Por 
exemplo, consideramos as tabelas abaixo, as quais descrevem a produção de materiais 
de construção em dois anos consecutivos em três regiões brasileiras. 
 
 
 
Produção de materiais de construção (em milhões de toneladas) no primeiro ano. Fonte: 
elaborada pelo autor. 
 
 
 
 
 
 
 
 
 
Produção de materiais de construção (em milhões de toneladas) no segundo ano. Fonte: 
elaborada pelo autor. 
Suponha que nosso interesse seja descrever uma tabela que nos dê a produção por 
material de construção e por região nos dois anos conjuntamente. Como procederemos? 
Ora, neste caso, partimos da operação conhecida como adição de matrizes. Para realizá-
la, devemos verificar se ambas as tabelas têm o mesmo número de linhas e de colunas. 
No nosso exemplo, essa condição é satisfeita. Logo, basta somar os elementos 
correspondentes e teremos a resposta para nosso objetivo! Assim: 
 
Portanto, a produção por material de construção e por região nos dois anos 
conjuntamente é descrita pela tabela abaixo. 
 
 
Produção de materiais de construção (em milhões de toneladas) nos dois anos. Fonte: 
elaborada pelo autor. 
______ 
 
• Assimile 
 
Além da adição e da igualdade de matrizes, duas outras operações são comuns ao 
estudarmos matrizes: a multiplicação de um escalar (número) por uma matriz e a 
multiplicação de matrizes. Ambas as operações podem ser definidas formalmente 
como: 
 
A primeira operação definida é relativamente simples, pois basta multiplicar o número 
por cada elemento da matriz. Quanto à segunda operação, devemos tomar um certo 
cuidado com ela. Por quê? Vamos ver algumas observações do produto de matrizes: 
 Só podemos multiplicar duas matrizes A e B se o número de colunas de A for 
igual ao número de linhas de B. 
 O elemento é obtido multiplicando os elementos da i-ésima linha da primeira 
matriz pelos elementos correspondentes da j-ésima coluna da segunda matriz e 
somando-se esses produtos. 
 O produto AB das matrizes A e B geralmente é diferente do produto BA das 
matrizes B e A. Além disso, em qualquer um dos casos, o produto pode não 
existir. 
Para exemplificar essa operação, consideraremos a matriz A, que representa o quadro 
com o número de engenheiros de uma construção civil, e B como uma matriz que 
representa o número de projetos disponíveis em cada área da empresa, em que: 
 
Suponha que o interesse seja multiplicar ambos os quadros, a fim de monitorar os 
recursos para a disposição dos projetos associados aos engenheiros. Neste caso, 
queremos trabalhar com o produto da matriz A com a matriz B. Isto é, 
 
Como o número de colunas da matriz A é igual ao número de linhas da matriz B, 
podemos realizar o produto, e o resultado é uma matriz dada pelo número de linhas de 
A com o número de colunas de B, isto é, a ordem da matriz resultante é . Assim: 
 
Portanto, a matriz que representa os recursos para a disposição dos projetos associados 
aos engenheiros da empresa é dada por: 
 
 
 
Tipos de Matrizes 
Agora que sabemos algumas das operações básicas de matrizes, interessa-nos saber 
quais são os tipos de matrizes que podemos encontrar em nossas situações-problema. 
Dos tipos conhecidos de matrizes, destacaremos dez deles: 
 
 
Agora que conhecemos os tipos de matrizes e as operações básicas em relação às 
matrizes, podemos definir o que é um determinante de uma matriz. Esse conceito será 
útil nas seções posteriores na solução de sistemas lineares envolvendo algumas 
situações do cotidiano. 
O que é determinante? Ora, quando nos referimos a esse termo, estamos nos referindo a 
um número associado a uma matriz quadrada A. Esse número é denotado 
como det(A) ou |A|. Mas, como encontra-se esse valor? Depende do tamanho da nossa 
matriz. Nesta aula, trabalharemos com determinantes de matrizes até a ordem . Vamos 
lá? 
Para as matrizes de ordem 1x1, não temos nenhum cálculo associado ao determinante, 
uma vez o que ele será o próprio elemento da matriz. No entanto, para uma matriz de 
ordem 2x2, o cálculo do determinante é feito realizando o produto dos elementos da 
diagonal principal subtraindo o produto dos elementos da diagonal secundária. Em 
termos matemáticos, temos: 
 
Para as matrizes , o cálculo é feito da mesma maneira? Não necessariamente. Neste 
caso, utilizamos a regra de Sarrus para realizar o cálculo. Por esta regra, adicionamos 
duas novas colunas na matriz inicial, repetindo os valores das duas primeiras colunas. 
Agora temos três diagonais principais e três secundárias. Procedemos, então, da mesma 
forma do determinante . Em termos matemáticos, fazemos: 
 
Com isso, encerramos a nossa primeira aula sobre os conceitos básicos e fundamentais 
de matrizes e determinantes, além das operações com esses objetos. Tais conceitos serão 
de suma importância para orientar sua equipe no trabalho proposto no início da unidade, 
especialmente para organização de dados. 
 
Conclusão 
Nosso problema aqui é conferir as informações do relatório da empresa, 
especificamente a matriz que representa as vendas. Para responder à primeira questão, 
devemos, inicialmente, descrever o quecada linha e cada coluna representa. Para esta 
empresa, as linhas são os produtos, e as colunas, os meses. Assim, para saber qual 
produto teve o menor número de sacos vendidos, basta olhar qual é a menor entrada da 
matriz. Neste caso, é o elemento, sobre o qual se observa que foram vendidos 1.375 
sacos de cal. Já para a segunda questão, precisamos identificar a quais elementos a 
matriz se refere. O número de sacos de cal vendidos em novembro, de acordo com a 
matriz, é o elemento, e o número de sacos de cimento vendidos em dezembro é 
representado pelo elemento. Logo, para saber quantos sacos de cal foram vendidos a 
mais que sacos de cimento, deve-se fazer a seguinte operação: 
 
Portanto, em dezembro, foram vendidos 75 sacos de cal a mais que sacos de cimento 
nessa empresa. Logo, a maior diferença de vendas foi no mês de novembro. 
Por fim, para a última questão, temos duas operações a se fazer. A primeira delas é 
somar o número de sacos de cal e de cimento, individualmente. 
 
Assim, a arrecadação do último bimestre de 2020 pela empresa foi um total de R$ 
273.600,00. Por outro lado, em relação à arrecadação total no bimestre, podemos 
também trabalhar com o produto de matrizes definido, como: 
 
Em que a primeira matriz representa os valores de cada produto, e a segunda matriz 2x2 
representa as vendas. Para obter o total arrecadado, basta realizar o produto e somar as 
entradas, o que, nesse caso, é R$ 273.600,00. A vantagem desse método é que a matriz 
resultante do produto traz a arrecadação bruta em cada mês, e ela é dada por: 
 
 
 
 
 
 
 
 
 
Unidade 1 - Aula 2 - Sistemas Lineares 
 
Introdução da Aula 
 
Qual é o foco da aula? 
Nesta aula, você estudará sobre Sistemas Lineares. 
Objetivos gerais de aprendizagem 
Ao final desta aula, você será capaz de: 
 definir os sistemas de equações lineares; 
 descrever operações elementares, matrizes equivalentes e escalonamento; 
 esclarecer os sistemas não-homogêneos e matrizes invertíveis. 
Situação-problema 
Estudante, nesta aula, entenderemos o conceito de sistemas lineares por meio de 
exemplos práticos e de definições dadas pela matemática em si. Com isso, você 
compreenderá a importância do papel dos sistemas lineares e como eles podem ser 
utilizados em situações do dia a dia. 
Como exemplo dessa abordagem, podemos considerar o balanceamento de equações 
químicas, muito comuns em aplicações de engenharia química. Balancear uma equação 
pode nos dizer muitas coisas sobre o comportamento de uma molécula em determinada 
reação, e os sistemas lineares são fundamentais para trabalharmos com esse conceito, 
por permitirem calcular com precisão a quantidade de átomos necessários para que se 
tenha um equilíbrio químico na reação. 
Estudante, criaremos uma situação hipotética para exemplificar o uso de sistemas 
lineares no dia a dia de trabalho, especialmente em áreas relacionadas à engenharia. 
Em engenharia elétrica, uma das aplicações mais comuns de sistemas lineares é a que 
envolve circuitos elétricos. Suponha que você tenha sido contratado para identificar os 
valores da corrente elétrica em um circuito elétrico composto por quatro ciclos 
fechados, no qual as correntes são denotadas como I1, I2, I3, I4, e as direções atribuídas 
a cada uma dessas correntes são arbitrárias, isto é, se uma corrente tem valor negativo 
para sua intensidade, então sua direção real é inversa à direção estipulada na situação 
considerada. Lembrando-se de que o fluxo de corrente num ciclo é governado pelas leis 
de Kirchhoff (a soma algébrica das quedas de voltagem em torno do ciclo é igual à 
soma algébrica das fontes de voltagem na mesma direção desse ciclo), foi obtido o 
seguinte sistema linear para o problema: 
 
No relatório que você deve escrever, há as seguintes perguntas: quais são os valores das 
correntes elétricas nessa situação, de acordo com o sistema de equações obtido? Quais 
são as direções dessas correntes? Para responder a essas questões, sugere-se trabalhar 
com a forma linha-reduzida do sistema linear em questão. Além disso, para entregar o 
relatório completo com suas observações, foi-lhe solicitada a indicação dos campos: 
nome da empresa, problema, solução, custo e assinatura. 
Que tal começar esse entendimento agora? Você será acompanhado em todo o processo. 
Iniciaremos com os conceitos fundamentais de sistemas lineares e suas aplicações em 
engenharia química; em seguida, trabalharemos com métodos de soluções desses 
sistemas, especialmente em forma de matrizes. 
 
Sistema Linear de Equações 
Anteriormente, exploramos o conceito de matrizes e suas principais características. Será 
que é somente esse tipo de estrutura que encontramos no nosso dia a dia? Para 
responder a essa questão, consideraremos a situação em que você deseja, por exemplo, 
saber quantas moléculas de hidrogênio (H2) e de oxigênio (O2) são necessárias para 
formar a água (H2O). Podemos escrever essa relação como: 
 
Se conseguir resolver o sistema apresentado, temos o número de moléculas necessárias 
para satisfazer a reação e, assim, entender um pouco sobre reações químicas na 
natureza. Essa estrutura aqui introduzida é chamada de sistema linear de equações e 
será nosso objeto de estudo desta unidade. 
______ 
• Assimile 
Matematicamente, definimos um sistema linear com m equações e n incógnitas como 
sendo um conjunto de equações do tipo: 
 
______ 
Os sistemas lineares são utilizados em muitas situações, por exemplo, tráfego de 
veículos, balanceamento de equações químicas, funções polinomiais, ruído acústico, 
sistemas GPS, mecanismos de busca (como o Google), entre muitas outras. Nosso foco 
será, em especial, as aplicações voltadas para a engenharia. 
______ 
• Exemplificando 
Como primeiro exemplo, consideremos a combustão da gasolina. Embora a gasolina 
seja uma mistura de hidrocarbonetos, o composto que predomina é o C8H18. Em 
estudos de engenharia química, estabelece-se que a combustão completa da gasolina 
acontece quando reage com o gás oxigênio, que resulta em gás carbônico e água, isto é, 
 
Assim, observa-se que: 
 a relação para os átomos de carbono é: 8x=w; 
 a relação para os átomos de hidrogênio é: 18x=2z; 
 a relação para os átomos de oxigênio é: 2y=2w+z. 
A partir dessas informações, podemos escrever o seguinte sistema linear: 
 
______ 
Para responder à questão do nosso exemplo, introduziremos um novo conceito: matriz 
ampliada de um sistema linear. Considere o sistema linear em sua forma geral: 
 
 
Essa matriz é chamada de matriz ampliada do sistema. Nela, cada linha é apenas uma 
representação abreviada da equação correspondente no sistema. Voltando ao nosso 
exemplo, podemos reescrever o sistema da combustão de gasolina em forma matricial 
como: 
 
Qual é o próximo passo? Para prosseguir, necessitamos de um outro conceito, o qual 
chamamos de operações elementares. Elas são operações que realizamos na matriz 
ampliada do sistema, a fim de obter uma matriz equivalente, que nos trará a solução, 
caso exista, do sistema. São três tipos de operações que podemos considerar: 
 
Veja que agora nossa matriz equivalente tem um aspecto mais simples para obtermos a 
solução do sistema. Assim, podemos retornar para as equações do sistema, 
reescrevendo-o de acordo com a matriz equivalente. Portanto, 
 
Observe que temos três equações para quatro variáveis. Neste caso, dizemos que o 
sistema é possível (visto que nenhuma linha é do tipo, por exemplo, 2 = 0) e 
indeterminado, ou seja, admite infinitas soluções, já que temos uma variável livre. Seja 
w essa variável livre, logo, temos que: 
 
 
______ 
• Reflita 
Em que outra situação do cotidiano você poderia utilizar sistemas lineares e resolvê-los 
partindo da ideia de operações elementares? 
______ 
No nosso exemplo, consideramos o conceito de possível e indeterminado em relação à 
solução do sistema. No entanto, é somenteesse conceito que temos em relação a isso? A 
resposta é não! Um sistema linear pode ser classificado de três formas: 
1. possível e determinado (SPD): quando não há variáveis livres e todos os 
valores das variáveis considerados podem ser encontrados (observação: a 
solução (0, 0, ..., 0) é chamada de solução trivial do sistema e será excluída 
dessa classificação); 
2. possível e indeterminado (SPI): quando o número de equações é menor que o 
número de variáveis, obtendo-se, assim, uma variável livre, a qual gerará 
infinitas soluções para o sistema; 
3. impossível (SI): quando não há variáveis livres e não é possível determinar uma 
solução do sistema em questão. 
Neste aspecto, trabalhamos com um novo conceito, que é o de matriz linha-reduzida à 
forma escada. Tal conceito pode ser definido como: 
Definição: uma matriz mxn é linha-reduzida à forma escada se: 
 o primeiro elemento não nulo de uma linha não nula é igual a 1; 
 cada coluna que contém o primeiro elemento não nulo de alguma linha tem 
todos os seus outros elementos iguais a zero; 
 toda linha nula está sempre abaixo de todas as linhas não nulas; 
 se as linhas 1, ..., r são linhas não nulas e se o primeiro elemento não nulo da 
linha i está na coluna ki, então k1<k2<...kr. 
Essa definição descreve o que chamamos de escalonamento de uma matriz. Em sistemas 
lineares, tal escalonamento é útil para definir a solução do mesmo de acordo com a 
classificação anterior. Um outro conceito que nos auxilia nisso é o conceito de posto e 
nulidade da matriz reduzida (ou equivalente) do sistema. Tal conceito pode ser definido 
como: 
______ 
• Assimile 
Dada uma matriz A de ordem mxn, seja uma matriz B de ordem mxn a matriz-linha 
reduzida à forma escada linha equivalente a A. O posto de A, denotado por p, é o 
número de linhas não nulas de B, e a nulidade de a é o número n-p. 
______ 
Assim, podemos reescrever a classificação dos sistemas lineares de acordo com o tipo 
de solução da seguinte forma: 
 possível e determinado (SPD): quando o posto da matriz ampliada é igual ao 
posto da matriz dos coeficientes. Ele terá solução única se n=p; 
 possível e indeterminado (SPI): quando o posto da matriz ampliada é igual ao 
posto da matriz dos coeficientes. Ele terá infinitas soluções se p<n; 
 impossível (SI): quando o posto da matriz ampliada é diferente do posto da 
matriz dos coeficientes. 
 
Matrizes inversas 
 
Com isso, encerramos a primeira parte desta aula o que lida com os sistemas lineares. 
Agora, vamos à segunda parte, que é referente às matrizes inversas. 
Para trabalhar com inversão de matrizes, lidaremos necessariamente com as operações 
elementares e a forma matriz-linha reduzida à forma escada. Neste aspecto, dizemos que 
uma matriz A é invertível se sua matriz-linha reduzida à forma escada é a matriz 
identidade. Além disso, sendo A-1 a inversa de A, o produto A . A-1 resulta na matriz 
identidade. Veremos como esse procedimento funciona na prática. Como exemplo, 
considere a matriz A dada por: 
 
Para começar o processo de inversão da matriz A, colocamos a matriz identidade junto à 
matriz A e aplicamos as operações elementares com as linhas, a fim de reduzir a parte 
esquerda (que corresponde a A) à forma escada da linha reduzida. Além disso, as 
operações devem ser feitas simultaneamente na parte direita. Isto é, 
 
 
 
Conclusão 
Usando o conceito de forma linha-reduzida por meio de operações elementares, obtém-
se que o sistema pode ser reduzido ao sistema: 
 
A solução é . Portanto, o valor da intensidade da primeira corrente é 1 amp; da segunda, 
2 amp; da terceira, 2 amp; da quarta, -2 amp. Além disso, em termos de direção, as 
direções das correntes I1, I2, I3 são as mesmas do que foi estipulado no problema, e da 
corrente I4 a direção é oposta. Por fim, resta escrever o relatório, no qual, você deve 
seguir este modelo: 
Nome da empresa 
XXXXX 
Problema 
Intensidade e direções das correntes elétricas em quatro ciclos fechados de um circuito 
elétrico. 
Solução 
De acordo com o sistema linear apresentado, obteve-se que os valores das correntes 
elétricas são: primeira corrente é 1 amp; da segunda, 2 amp; da terceira, 2 amp; da 
quarta, -2 amp. Além disso, em termos de direção, as direções das correntes I1, I2, 
I3 são as mesmas do que foi estipulado no problema, e da corrente I4 a direção é oposta. 
Custo 
XXXX 
Assinatura 
XXXX 
Unidade 1 - Aula 3 - Autovalores e Autovetores 
 
Introdução da Aula 
Qual é o foco da aula? 
Nesta aula, você estudará sobre autovalores e autovetores. 
Objetivos gerais de aprendizagem 
Ao final desta aula, você será capaz de: 
 definir espaços vetoriais e diagonalização; 
 explicar as transformações lineares e operadores; 
 comparar autovalores e autovetores. 
Situação-problema 
Estudante, nesta aula, abordaremos o conceito de espaços vetoriais e transformações 
lineares. Os espaços vetoriais são uma das estruturas algébricas mais importantes da 
álgebra, cujas aplicações são encontradas em diversos aspectos do nosso dia a dia, por 
exemplo, no espectro de cores, que nos permite fazer mudanças de coordenadas desses 
espectros baseando-se no conceito dos espaços vetoriais e das transformações lineares. 
E falando em transformações lineares, esses tipos de operações são a base fundamental 
da álgebra linear, podendo ser aplicada em engenharia da computação quando 
trabalhamos com criptografia, por exemplo. 
Já os autovalores, os autovetores e a diagonização são outras ferramentas que podem ser 
utilizadas em engenharia biomédica nas questões de crescimento populacional e 
transformações, e na computação em mecanismos de busca, como o Google. 
Criaremos uma situação hipotética para exemplificar o uso das transformações lineares 
em situações do cotidiano. 
Em um estudo envolvendo engenharia biomédica, um determinado pesquisador 
trabalhou com espectro de cores, em particular, coordenadas em espectro de cores. Em 
sua pesquisa, ele tinha por interesse mudar o sistema de cores, a fim de ampliar o 
espectro visível na retina. Sabe-se que, em geral, o espectro de cores é baseado em RGB 
(red-green-blue), porém esse pesquisador tinha interesse em criar um novo sistema de 
cores para determinar o espectro de cores. Ele chamou esse novo padrão de YGM 
(yellow-gray-magenta), que se baseia em mudanças de coordenadas por meio da 
transformação linear 
definida por . No entanto, ele tinha dúvidas em como verificar se a transformação era, 
de fato, linear e lhe contratou para fazer tal verificação, pois, se ela fosse linear, o 
sistema de cores dele faria sentido no espectro. Então, baseando-se nos conceitos de 
transformação linear, como você verificaria se a transformação é linear? O sistema 
criado pelo pesquisador fez sentido em relação ao espectro de cores? 
Conseguiu ver a importância desses conceitos? Que tal começarmos a trabalhar com 
eles e entender melhor sob o ponto de vista matemático e prático? Não se preocupe, 
vamos lhe acompanhar em todo o processo, e os conceitos serão construídos de forma 
gradual. 
 
 
Espaço vetorial 
Nas aulas anteriores, exploramos os conceitos de matrizes e sistemas lineares munidos 
das suas principais aplicações. Nesta aula, trabalharemos o conceito de uma das 
estruturas algébricas mais importantes da álgebra linear: o espaço vetorial. 
Um espaço vetorial V (sobre um campo F) é um conjunto, cujos elementos são 
chamados de vetores, de modo que se pode adicionar (e subtrair) vetores e multiplicar 
um vetor por uma constante de F. Essas constantes são chamadas escalares. 
Matematicamente, os axiomas que definem um espaço vetorial são: 
 V é um grupo Abeliano isto é, valem as propriedades: 
o Lei comutativa: v + w = w + v. 
o Lei associativa: u + (v + w) = (u + v) + w. 
o Elemento neutro: u + 0 = 0 + u = u. 
o Elemento oposto: u − u = 0. 
 V admite uma multiplicação escalar por elementos de F, isto é,valem as 
propriedades: 
o −u = (−1)u. 
o Distributiva: a(u + v) = au + av. 
o Associativa: a(bu) = (ab)u. 
 
Dentre as aplicações de espaços vetoriais, uma que se faz interessante é a que envolve a 
mudança de coordenadas nos espectros de cores em relação ao sistema de cores RGB 
(red-green-blue). Por exemplo, em física, o modelo matemático que se adequa à 
representação do espaço espectral de cores é necessariamente um espaço vetorial de 
dimensão finita, em que o processo de reconstrução de cor utiliza uma base de cores 
primárias, que seria a base do espaço vetorial, gerando o modelo tricromático de 
Young-Helmholtz, baseado no padrão RGB. Mas, antes de entrar no conceito de base e 
dimensão, definiremos o que chamamos de subespaço vetorial. 
Popularmente, dizemos que um subconjunto W de um espaço vetorial V é chamado de 
subespaço quando se torna um espaço vetorial com as operações herdadas de V, ou seja, 
quando somas e múltiplos escalares de vetores em W pertencem a W. 
Matematicamente, dizemos que W é um subespaço vetorial de V quando W⊂V, tal 
que o ∈ W; u+ v ∈ W e au ∈ W. 
 
Uma vez definido o que é subespaço vetorial, podemos trabalhar com o conceito de 
base e dimensão abordado no exemplo sobre espectro de cores descrito anteriormente. 
Neste aspecto, dizemos que uma base é uma coleção de vetores B de um espaço vetorial 
V quando cada vetor em V pode ser escrito de uma maneira única como combinação 
linear de elementos de B. As bases são precisamente os conjuntos máximos 
independentes de vetores. As bases também são precisamente os conjuntos de 
abrangência mínima de vetores e, em particular, cada conjunto de abrangência pode ser 
reduzido a uma base. Vale lembrar também que todo espaço vetorial tem uma base. 
Definimos o que é base, mas e o que é dimensão? Para definir esse conceito, tome 
quaisquer duas bases de V que têm o mesmo “tamanho”. Esse “tamanho” é chamado de 
dimensão de V, e denotamos por dim(V). 
______ 
• Exemplificando 
 
 
Transformação linear 
Agora, já sabemos o que é um espaço vetorial e o que é uma base, que são ferramentas 
de suma importância para definir a nossa próxima estrutura de trabalho, 
as transformações lineares. E o que é uma transformação linear? Considere V e W 
dois espaços vetoriais sobre um corpo F. Uma transformação linear de V em W é uma 
função T : V→W que satisfaz: 
 
Para todo e todo escalar . Como primeiro exemplo, consideraremos V um espaço 
vetorial qualquer, a transformação identidade, definida por definida por I(v) =v, que é 
uma transformação linear de V em V. De fato: 
 
______ 
• Exemplificando 
 
Quais são as propriedades de uma transformação linear? Para verificarmos isso, sejam 
V e W espaços vetoriais sobre um corpo F. A transformação linear T: V→ W satisfaz 
as seguintes propriedades: 
 T(0) = 0 (T transforma o vetor nulo de V no vetor nulo de W). 
 T (−v) = −T(v), para todo v ∈ V. 
 T(v1 − v2) = T(v1) − T(v2), para todo v1,v2∈ V. 
 Se U é um subespaço de V, então a imagem de U por T é um subespaço de W. 
 Sendo T: V→W linear, então: 
 
Baseando-se nessas propriedades, podemos trabalhar com o conceito de base também. 
Isto é, dados V e W dois espaços vetoriais sobre um corpo F e dada uma base de V={ v1, 
…, vn}, sejam w1, …, wn elementos arbitrários de W. Existe uma única transformação 
linear T: V→ W, tal que 
 
Então: 
T(αv+u)= (αx1+y1)w1+…+(αxn+ yn)wn 
Por outro lado: 
 
O núcleo da transformação linear tem algumas propriedades importantes para nosso 
trabalho. Dentre todas elas, destacamos: 
 Ker(T) é um subespaço vetorial de V. 
 A transformação T é injetora se, e somente se, Ker(T) = {0}. 
 
 
 
Teorema do Núcleo e da Imagem e Isomorfismo 
 
Agora, com o núcleo e a imagem de uma transformação linear definidos, podemos 
definir o resultado fundamental da teoria de transformações lineares, que é o Teorema 
do Núcleo e da Imagem. Esse teorema traduz a dimensão do espaço vetorial. 
______ 
• Assimile 
Teorema do Núcleo e da Imagem: sejam V e W espaços vetoriais de dimensão finita 
sobre um corpo F. Dada a transformação linear T: V→W, então: 
dim(V) = dim(Ker(T)) + dim(Im(T)) 
Portanto, a soma das dimensões do Ker(T) e da Im(T) é igual à dimensão do espaço 
vetorial V. 
______ 
 
T(x, y, z)= x + y − z = 0⇒ x = −y +z 
 
Um outro conceito importante que diz respeito às transformações lineares é o conceito 
de isomorfismo. Para definir tal conceito, sejam V e W espaços vetoriais sobre um 
corpo F, suponha que T: V→W é uma transformação linear. Dizemos que T é um 
isomorfismo se T for bijetora (isto é, T deve ser injetora e sobrejetora). 
______ 
• Reflita 
 
Matriz de uma transformação linear 
Para finalizar nosso estudo de transformações lineares, trabalharemos com a matriz de 
uma transformação linear, porém, antes, precisamos definir algumas coisas. 
______ 
• Assimile 
 
A partir dessa definição, podemos escrever a matriz de ordem mxn da transformação 
linear F como sendo: 
 
É chamada de matriz da transformação linear F em relação às bases B e C e é denotada 
por (F)B,C. 
 
______ 
• Assimile 
Seja V um espaço vetorial de dimensão n e T:V→V uma transformação linear. Dizemos 
que pT(t) é um polinômio característico de T se for obtido como pT(t)= det (A− kI), em 
que A é a matriz de T e I é a matriz identidade de ordem. 
______ 
 
As raízes são 1, -1 nos números reais. As raízes dos polinômios característicos são 
conhecidas como autovalores de T, que é uma outra definição desse conceito. Uma vez 
que sabemos o que é autovalor e autovetor, podemos definir o que é diagonalização de 
operações, que é a definição final desta aula. Vamos lá? 
 
 
Conclusão 
 
Isto é: 
 
Ou seja: 
 
Portanto, T é uma transformação linear e traduz uma reflexão em torno do eixo x, isto é, 
o sistema proposto pelo pesquisador faz sentido por T ser linear e é baseado na reflexão 
em torno do eixo x. 
 
Unidade 2 - Aula 1 - Zeros de funções 
 
Introdução da Unidade 
Objetivos da Unidade 
Ao final desta Unidade, você será capaz de: 
 calcular polinômios interpoladores; 
 analisar erros na interpolação; 
 algoritmos para determinação da integral definida de uma função de modo 
aproximado. 
Estudante, o que vem à sua cabeça quando escuta o termo métodos numéricos? 
Aproximações? Se sim, você está em uma linha de pensamento correta! O cálculo 
numérico é um subtópico dos métodos matemáticos que envolvem aproximações para 
zeros de funções, aproximações de cálculo de integrais que podem estar relacionadas 
com a área de uma placa de metal, por exemplo. 
Para iniciar o entendimento dessa ferramenta que se faz fundamental nos métodos 
matemáticos, vamos trabalhar com a ideia de como encontrar o zero de uma função 
usando o computador e os métodos de aproximação quando essa função for de uma 
natureza mais complexa. Um dos métodos mais conhecidos para isso é o famoso 
método de Newton-Rhapson, que estabelece critérios para encontrar uma aproximação 
da raiz de uma equação. Partindo dessa ideia de zeros de funções, em seguida, vamos 
trabalhar com o que chamamos de polinômio interpolador, que é um método de 
aproximação, uma função utilizando um polinômio de natureza simples, a fim de 
facilitar o entendimento do nosso problema. 
Por fim, vamos estudar os métodos numéricos para aproximar o valor de uma integral, 
que na prática é fundamental para o cálculo da área, especialmente quando se trabalha 
com placas de metais em formatos diferentes de figuras planas, por exemplo. Vamos ver 
cada um desses conceitos devagar no decorrer desta unidade. 
 
Introdução da Aula 
Qual é o foco da aula? 
Nesta aula, você estudará sobre Zeros de funções. 
Objetivos gerais de aprendizagem 
Ao final desta aula, você será capaz de: 
 definir o conceito de Aritmética de ponto flutuante; 
 demonstrar erros e estimativas para o erro; 
 calcular zeros de funções reais por meiode métodos numéricos e seus 
algoritmos. 
Situação-problema 
Estudante! Nesta aula, vamos trabalhar inicialmente com os conceitos de sistemas 
numéricos a fim de entender o que é um sistema numérico, como operamos um sistema 
numérico e como o computador e a calculadora entende esses sistemas numéricos. Em 
seguida, vamos entender o conceito de erro e quais tipos de erros podemos cometer 
quando trabalhamos com aproximações numéricas. Por fim, vamos trabalhar com os 
tipos de métodos numéricos que temos para lidar com o problema de encontrar o zero 
(raíz) de uma função, independente da forma dessa função. 
Como exemplo dessa abordagem, podemos considerar o problema de encontrar o ponto 
que maximiza, por exemplo, a temperatura de operação de uma máquina industrial para 
entender a resistência em casos de acidentes térmicos. Dado a complexidade do 
problema, muitas vezes, não é possível obter uma solução usando métodos analíticos, 
fazendo-se assim o uso de métodos numéricos importantes. 
Vamos criar uma situação hipotética para exemplificar o uso dos métodos numéricos no 
dia a dia de trabalho, especialmente em áreas relacionadas com a Engenharia. 
Imagine que você foi convocado para implementar um método numérico para resolver o 
problema de maximização de lucro de uma dada empresa de software no ano de 2020. O 
método que a empresa definiu para a implementação no software matemático Maple foi 
o método do ponto fixo descrito pelos passos: 
 
Como você faria para implementar esse algoritmo computacionalmente de forma que 
ele fosse útil para a empresa? Além disso, a partir dessa implementação, calcule o valor 
do lucro máximo quando a função que determina o lucro é dada por f(x)=ex−2 assumindo 
uma aproximação inicial de 0.1 e uma precisão de 1%. 
Viu como os métodos numéricos são fundamentais? Que tal começar a entender como 
funcionam agora? Você será acompanhado em todo o processo no decorrer da aula! 
Vamos iniciar então com algo mais simples, mas que é base para todo o resto dos 
métodos numéricos: os sistemas numéricos. 
 
Sistema de ponto flutuante 
Você já parou para pensar no que são métodos numéricos? Como utilizamos um sistema 
numérico? Nesta unidade, nosso foco será trabalhar com métodos numéricos e é 
importante destacar que, quando falamos de uma solução numérica, não estamos 
falando de uma solução exata, e sim de uma solução aproximada. E como estamos 
falando de aproximações, estamos falando necessariamente de precisão numérica, que é 
sujeita a erros. Assim, vamos começar nossos estudos definindo o que é um sistema de 
ponto flutuante. 
 
______ 
• Assimile 
Todo sistema computacional utiliza algum sistema de aritmética de ponto flutuante para 
trabalhar com números em que os resultados, em geral, são apresentados em base 10. 
Esses sistemas são conhecidos como sistemas numéricos de base 10. 
______ 
Agora, vamos entender como funciona esse sistema. Começamos com a mantissa, ela 
deve ser fracionária nessa representação, isto é, deve ser menor do que 1 para que 
possamos trabalhar com a unicidade para a representação para cada y ∈ F . Mas como 
fazemos isso? Ora, devemos trabalhar com o que chamamos de normalização. Essa 
normalização deve ser feita de forma que d1≠0 para y≠0 para garantir a representação 
do sistema de ponto flutuante. 
 
______ 
 
 
 
• Assimile 
É importante notar que a escolha de uma representação para o zero como sendo o menor 
expoente que simboliza a mantissa nula não é a melhor forma, pois isso traz perdas de 
dígitos significativos em operações. 
 
Arredondamento simétrico ou truncamento 
 
Uma vez definido o que é um sistema de aritmética de ponto flutuante, resta saber se é 
um conjunto finito. De acordo com a definição do sistema de ponto flutuante 
(ANDRADE, 2012), podemos notar que a quantidade de números normalizados é 
definida pela expressão: 
 
Essa questão de o sistema de ponto flutuante ser finito deriva, principalmente, da 
questão em que o computador e a calculadora trabalham com seus cálculos utilizando 
uma quantidade finita de dígitos. Por exemplo, na calculadora normal temos 8 dígitos, 
na científica 14, e assim por diante; porém nenhum dos dois trabalha com uma 
quantidade infinita de dígitos. Nesse aspecto, o uso dos métodos numéricos traz a 
necessidade de trabalharmos com o roll finito de dígitos. 
Então, sabemos que precisamos trabalhar com uma quantidade finita de dígitos, mas 
sabemos também que os números irracionais, por exemplo, têm quantidades infinitas de 
dígitos. Como procedemos para descartar os dígitos a fim de deixar esse número 
“finito”? Ora, existem duas maneiras de se fazer isso: arredondamento 
simétrico ou truncamento. Mas antes de definir o que são ambos, vamos ressaltar que 
tanto o computador quanto a calculadora trabalham com representação numérica 
discreta, isto é, dado um número x≠0 no sistema de aritmética de ponto flutuante de 
base 10, então x é escrito como: 
 
Ou ainda, 
 
Em que 
 
Com essas representações em mente, podemos, então, definir os tipos de 
arredondamentos. Assim, no que se refere ao arredondamento simétrico, ele pode ser 
definido como: se o primeiro dígito a ser desprezado é menor que cinco, descartamos 
todos os dígitos restantes; porém, se esse dígito for maior do que 5, então somamos 1 
ao dígito que antecede esse dígito. Por exemplo, considere o número 5.2131412... e 
suponha que queremos esse número com apenas três casas decimais. Nesse caso, o 
dígito na quarta casa decimal é igual a 1, que é menor do que 5, então descartamos 
todos os dígitos a partir da quarta casa decimal e ficamos com o número 5.213. Agora, 
no que tange ao conceito de arredondamento por truncamento, ele é definido 
como: após decidir até qual casa decimal vamos utilizar, simplesmente descartamos o 
restante dos dígitos. 
______ 
 
• Exemplificando 
 
Conseguiu perceber a diferença entre os arredondamentos? Veja que, em ambos os 
casos, obtemos um resultado diferente do valor original, uma vez que descartamos casas 
decimais. Essa diferença é o que chamamos de erro, e é importante conhecermos a 
magnitude desses erros. Assim, vamos trabalhar com dois tipos de erros: o absoluto e 
o relativo. Suponha que x seja uma aproximação para x. O erro absoluto é definido por: 
 
Em geral, o valor exato de não é sempre conhecido. Nesse caso, o cálculo do erro 
relativo não seria possível, no entanto, podemos utilizar a seguinte expressão do erro 
relativo quando o valor exato não é conhecido: 
 
• Exemplificando 
Vamos considerar um exemplo em que x = 1234.9 é uma aproximação para x, tal que o 
erro absoluto seja menor do que 0.1. Assim, podemos dizer que o valor exato x está no 
intervalo (1234.8, 1235.0). Por outro lado, suponha que y = 7.2 seja uma aproximação 
para y, tal que o erro absoluto seja menor do que 0.1, então y pertence ao 
intervalo (7.1,7.3). Será que a interpretação desses erros é igual tanto para x quanto para 
y? Considerando o erro absoluto, observe que os majorantes são necessariamente iguais, 
sendo assim o erro absoluto por si só não é suficiente para diferenciar as interpretações 
dos erros de x e y, pois geram a mesma interpretação. Então trabalhamos com o erro 
relativo. Note que: 
 
Nesse caso, os erros relativos são diferentes. E essa diferença traz o impacto na precisão 
da estimativa. No caso do x, vemos que a precisão da estimativa dele é maior que a de 
y, visto que o erro relativo para x é muito menor que o erro relativo para y. 
______ 
 
• Reflita 
E se você quisesse uma precisão maior adicionando uma nova casa decimal, poderíamos 
incluir qual dígito: 4,471 ou 4,476? Seria possível incluir o dígito 4,479? 
______ 
 
Portanto, para encerrar a primeira parte do nosso conteúdo da seção, iremos finalizar 
com os conceitos de estabilidade numérica. Em poucas palavras, podemos definir a 
estabilidade numérica como sendo uma propriedade doalgoritmo, uma vez que 
algoritmos podem ser bem sensíveis conforme a variação de dados, independentemente 
do método numérico utilizado. Isto é, de acordo com os dados que temos, um algoritmo 
pode se tornar instável. E são esses conceitos que nos dão a ideia da segunda parte do 
nosso conteúdo! 
 
 
Métodos bissecção, de ponto fixo e de Newton-Rhapson 
Suponha agora que estamos interessados em encontrar, numericamente, uma solução 
aproximada para a equação f(x)=0, onde f é uma função qualquer. Nesta aula, vamos 
apresentar os métodos mais comumente utilizados, entre eles o método da bissecção, o 
método do ponto fixo e o método de Newton-Rhapson. 
 
Ou seja, o método da bissecção trabalha com uma sequência convergente com base em 
intervalos encaixados. Esse método em particular é extremamente lento, mas a 
convergência é garantida se f for uma função contínua. 
 
 
Com isso, encerramos a nossa primeira aula sobre os conceitos básicos e fundamentais 
de sistemas numéricos, além dos métodos para encontrar zero de funções! Tais 
conceitos serão de suma importância para orientar sua equipe no trabalho e também 
para resolver problemas relativos à modelagem que envolva métodos numéricos. 
 
Conclusão 
Nosso problema aqui é implementar o método do ponto fixo utilizando o software 
Maple. Note que uma implementação computacional pode ser feita de várias formas 
diferentes e ainda assim gerar o mesmo resultado. O que vai mudar entre uma e outra é 
somente a eficiência e visualização do algoritmo. Então, como sugestão dessa 
implementação, podemos fazer: 
 
Assim, utilizando o código acima, encontramos que o valor de x que maximiza o lucro 
da empresa é x = 0.158593439, que implica então que o lucro da empresa, em bilhões 
de reais, é de 0.1585942. 
Unidade 2 - Aula 2 - Interpolação 
 
Introdução da Aula 
Qual é o foco da aula? 
Nesta aula, você estudará sobre Interpolação. 
Objetivos gerais de aprendizagem 
Ao final desta aula, você será capaz de: 
 definir o conceito de interpolação polinomial e forma de Lagrange; 
 identificar erro na erro na interpolação polinomial; 
 aplicar a fórmula interpoladora de Newton. 
Situação-problema 
Estudante, nesta aula iremos entender o conceito de interpolação polinomial, que 
consiste em aproximar uma função usando polinômios. Para isso, dois métodos serão 
considerados: o método de Lagrange e o método de Newton. A vantagem do uso da 
interpolação polinomial, por exemplo, é que se uma dada função com forma complexa 
puder ser aproximada por um polinômio, então o nosso trabalho na modelagem facilita 
bastante, pois os polinômios são mais flexíveis para se trabalhar. 
Como exemplo do uso do polinômio interpolador, considere a situação em que você 
precisa modelar o lucro trimestral de sua empresa. Como, em geral, a curva do lucro é 
complexa, você pode utilizar o polinômio de Lagrange para aproximá-la e fazer a 
previsão do lucro. Uma alternativa a isso são os métodos estatísticos que serão 
trabalhados posteriormente em outras aulas. 
Em determinada empresa de solventes químicos, deseja-se achar uma forma mais 
eficiente de trabalhar com a demanda dos produtos. Pensando nisso, a empresa resolveu 
ajustar o modelo que descrevia a demanda usando um polinômio interpolador a partir do 
método de Lagrange. No entanto, nenhum dos funcionários tinha conhecimento sobre 
como fazer isso. Devido a essa carência, a empresa então lhe contratou para resolver o 
problema. Sabendo que os pontos de demanda eram baseados nos pontos , foi lhe 
requisitado a equação do polinômio interpolar que passava por esses pontos a fim de 
entender como estava funcionando a demanda da empresa. Dessa forma, você deveria 
apresentar a solução passo a passo de como foi encontrado tal polinômio sem o uso de 
métodos computacionais. 
Que tal começar esse entendimento agora? Você será acompanhado em todo o processo! 
Iniciaremos com os conceitos fundamentais de interpolação polinomial. Em seguida, 
trabalharemos com métodos de interpolação, especialmente o mais popular, que é o de 
Newton! 
 
Polinômio interpolador 
Anteriormente, exploramos os conceitos relativos a erros e encontrar soluções 
de f(x)=0 a partir de métodos iterativos. Agora, o nosso foco será encontrar um 
polinômio que aproxima a função f(x), chamado de polinômio interpolador. Para 
começar nossos trabalhos neste tópico, vamos supor que que temos (n + 1) pontos 
distintos x0, x1, . . . , xn, que iremos chamar de “nós”, e que os pontos y0, y1, . . . , 
yn foram obtidos por meio de alguma função f desconhecida, isto é, yi = f(xi), i = 0, 1, . . 
. , n. Queremos, então, conhecer ou estimar f(xr) para algum valor xr que não seja 
necessariamente tabelado. Um modo de fazer isso é interpolar f por uma função 
polinomial, uma vez que, em geral, temos conhecimento apenas dos pares de pontos (xi, 
(fxi)) e não da expressão de f em si. 
 
Com base nos conceitos de Álgebra Linear, podemos reescrever o sistema anterior em 
forma de matriz como: 
 
______ 
• Assimile 
Matematicamente, uma matriz é dita matriz de Vandermonde se todos os termos de cada 
uma de suas linhas formam uma progressão geométrica. 
______ 
Assim, podemos enunciar o seguinte resultado (ANDRADE, 2012): 
Teorema: Dados x0, x1, . . . , xn pontos distintos, existe um único polinômio pn(x), de 
grau máximo n, que interpola f nos pontos (xi, f(xi)), i = 0, . . . , n. 
Método de Lagrange e Método de Newton 
 
Existem diversos métodos para encontrar o polinômio interpolador, no entanto, nesta 
aula, iremos trabalhar com dois desses métodos: (i) o método de Lagrange e (ii) o 
método de Newton. 
 
 
______ 
• Exemplificando 
 
 
 
Dessa forma, encerramos as questões teóricas do método de Lagrange. Mas, para 
encerrar o conteúdo do método de Lagrange, vamos escrever um código que pode ser 
utilizado no software Maple para encontrarmos o polinômio interpolador de Lagrange 
(ANDRADE, 2012). 
 
Esse código transcreve exatamente o método de Lagrange aplicado 
no Exemplificando dado anteriormente. Mas note que o método de Lagrange ainda 
apresenta uma problemática grande quando adicionamos um ponto (xn+1, yn+1) no 
sistema. Por quê? Note que ao usar esse método, adicionar um novo ponto implica que 
devemos recalcular todos os polinômios Lk(x), i =0, 1, . . . , n + 1. Como resolver essa 
questão? Bem, trabalhamos com o método de Newton (ou método das diferenças 
divididas). 
No método de Newton para o polinômio interpolador, ele é obtido a partir de uma 
construção recursiva utilizando um operador que chamamos de operador das diferenças 
divididas. Assim, para encontrar o polinômio interpolador pn(x) que interpola f nos 
pontos x0, x1, . . . , xn pelo método de Newton, utilizamos (ANDRADE, 2012): 
 
Chamamos f[x0, x1, x2, . . . , xk] de diferença dividida de ordem k entre os k + 1 
pontos x0, x1, x2, . . . , xk. Um ponto importante que podemos destacar é que as 
diferenças divididas f[x0, x1, x2,wx . . . , xk] são funções simétricas nos seus argumentos 
(ANDRADE, 2012). Com base nesse operador, podemos construir a seguinte tabela de 
diferenças divididas para o método de Newton: 
 
Ou, no caso geral, 
 
Bom, agora que sabemos como funciona o operador de diferenças divididas, vamos 
trabalhar com a construção do polinômio pn(x) que interpola f(x) nos pontos x0, x1, x2, . . 
. , xn segundo o método de Newton. Começando com o polinômio que interpola fx em x 
= x0 e assim sucessivamente, construiremos pk(x), que interpola f(x) em x0, x1, x2, . . . , 
xk, k=1, …, n . Assim, seja então p0(x) o polinômio de grau zero, que interpola f(x) em 
x = x0, tal que p0(x) = f[x0]. Nesse caso, para x≠x0 e x ∈ [a, b], temos que: 
 
tal que: 
 
onde p0(x)=f(x0). Então, chamaremos E0(x)=f(x)−p0(x) de erro ao se aproximar f(x) 
por p0(x). Agora, seja p1(x) o polinômio de grau menor do que 1 que interpola f(x) em 
x0 e x1. Temos que: 
 
tal que:onde p1(x)= f(x0)+(x−x0)f[x1,x0]. Então, chamaremos E1(x)=f(x)−p1(x) de erro cometido 
ao se aproximar f(x) por p1(x). De modo geral, repetindo o procedimento 
anterior n vezes, obtemos: 
 
______ 
• Assimile 
 
______ 
• Exemplificando 
Vamos colocar em prática o método de Newton para encontrar o polinômio interpolador 
nos pontos (xk, yk) = {(−1,0), (0,1), (1,2), (2,7)}. Assim, pelo método de Newton, 
obtemos: 
 
Dessa maneira, o polinômio interpolador é dado por: 
 
______ 
• Reflita 
Pensando no método de Lagrange e no método de Newton, qual dos dois trazem uma 
aproximação mais concisa de f(x)? Em qual deles o erro cometido é menor? Na prática, 
qual é mais viável usar? Pense sobre essas questões, especialmente em âmbito de custo 
computacional de tempo de processamento. 
______ 
Por fim, é válido ressaltar que os erros de interpolação são fundamentais, especialmente 
quando trabalhamos com modelagem. Em qualquer trabalho que envolva aproximação 
numérica, sempre estamos buscando pelo menor erro possível e a magnitude desse erro 
nos traz a versatilidade do nosso modelo. Pensando nesse aspecto, em métodos 
numéricos, existe um conceito chamado fenômeno Runge que consiste em dizer que o 
erro é menor na zona central do intervalo e maior nos extremos. Para evitar esse 
fenômeno, podemos considerar pontos não igualmente espaçados juntamente com 
polinômios ortonormais, splines ou aproximação por mínimos quadrados. 
Com isso, finalizamos a nossa aula sobre polinômio interpolador, que é um dos objetos 
fundamentais quando trabalhamos aproximações numéricas. 
 
Conclusão 
Pensando em como resolver o problema usando o método de Lagrange para determinar 
o polinômio que interpola os pontos (xk, yk) = {(0,0), (1,3), (2,1), (3,3), (4,0)}, você 
buscou em seus ensinamentos de cálculo numérico, para relembrar, como era feito tal 
método sem apoio computacional. Assim, depois de muito esforço, você obteve, pelo 
método de Lagrange, as equações: 
 
Após vários cálculos para simplificação, você concluiu que o polinômio interpolador, 
segundo o método de Lagrange, é dado por: 
 
 
 
 
Unidade 2 - Aula 3 - Integração Numérica 
 
Introdução da Aula 
Qual é o foco da aula? 
Nesta aula, você estudará sobre integração numérica. 
Objetivos gerais de aprendizagem 
Ao final desta aula, você será capaz de: 
 aplicar a Integração através dos métodos numéricos e seus algoritmos. 
 calcular a Fórmula de Newton-Cotes; 
 diferenciar a regra dos Trapézios e de Simpson. 
Situação-problema 
Estudante, nesta aula vamos trabalhar basicamente com dois tópicos: regra dos trapézios 
e regra de Simpson. Ambos os tópicos são ferramentas para aproximar o valor de uma 
integral, consequentemente de uma área, usando métodos numéricos. Essas ferramentas 
são importantes, pois, na prática, raramente temos figuras regulares ou até mesmo 
funções bem-comportadas. A maioria dos problemas são resolvidos usando métodos 
numéricos devido à versatilidade desses métodos. Imagine só ter que lidar com a 
modelagem do crescimento populacional ou até mesmo o aumento dos casos de Covid-
19 sem fazer o uso de métodos numéricos. Seria extremamente complexo! 
Em um estudo envolvendo Engenharia Biomédica, um determinado pesquisador 
realizou um trabalho voltado para modelagem de marca-passo no coração de pessoas 
idosas. Em sua pesquisa, ele tinha por interesse achar a área abaixo da curva gerada 
pelos dados do marca-passo. Sabe-se que a função que governa o marca-passo é descrita 
por: 
 
no intervalo de 0,2 até 0,8 horas. Uma vez que ele tiver a área abaixo dessa curva e 
sabendo que essa função tem certos padrões de repetição, ele conseguirá estimar a área 
total para mais do que 0,6 horas, considerada em seu experimento para avaliar a 
qualidade do marca-passo. Então, baseando-se nos conceitos de integração numérica, 
como você calcularia a área abaixo da função dada assumindo uma margem de erro de 
no máximo 1%? 
Conseguiu ver a importância desses conceitos? Que tal começarmos a trabalhar com 
eles e entender melhor sob o ponto de vista matemático e prático? Não se preocupe, 
vamos lhe acompanhar em todo o processo e os conceitos serão construídos de forma 
gradual! 
 
Fórmulas de Newton-Cotes: fórmulas dos trapézios e de Simpson 
Já vimos anteriormente como trabalhar com os erros de aproximações e também com 
formas de resolver a equação f(x) = 0 . Agora, nos interessa saber como resolver 
numericamente as integrais, uma vez que elas, assim como a equação f(x) = 0 , têm 
diversas aplicações em Engenharia, como no cálculo aproximado da área de placas de 
metais em construção civil. Nesse aspecto, a ideia da integração numérica consiste, 
basicamente, na aproximação da função integranda f por um polinômio em que a 
escolha desse polinômio e dos pontos usados em sua determinação vai resultar nos 
diversos métodos numéricos de integração. 
Em Cálculo Diferencial e Integral, é visto que as fórmulas de integração numéricas são 
somatórios, em que suas parcelas são, necessariamente, valores de f(x) calculados em 
pontos escolhidos e multiplicados por pesos convenientes, isto é, 
 
 
e o erro: 
 
que é conhecida como fórmula de Newton-Cotes para integrais numéricas. Como caso 
particular dessa fórmula, obtemos as famosas fórmulas dos trapézios e de Simpson, que 
são estabelecidas com polinômios de grau 1 e grau 2, respectivamente. Vamos iniciar 
então com a fórmula dos trapézios, ou regra dos trapézios. 
A fórmula dos trapézios corresponde, basicamente, à interpolação da função a ser 
integrada por um polinômio de grau 1 (ANDRADE, 2012). A interpolação linear, nesse 
caso, necessita de dois pontos, então, vamos trabalhar com os extremos do intervalo de 
integração, isto é, a = x0 e b = x1. Logo, o polinômio linear interpolador é dado por: 
 
Para uma melhor visualização dessa ideia, vamos trabalhar com o gráfico exposto na 
figura abaixo. 
 
 
Gráfico. Fonte: elaborada pelo autor. 
Assim, observando a figura acima e partindo dos pesos, temos que: 
 
onde o erro é descrito pela seguinte equação: 
 
• Reflita 
Como você acha que fica a fórmula dos trapézios se for aplicada diversas vezes sobre 
subintervalos de um intervalo geral [a, b]? 
______ 
 
 
 
Regra de Simpson. Fonte: elaborada pelo autor. 
Dessa forma, a partir dos polinômios de Lagrange, obtemos os pesos da fórmula de 
Simpson: 
 
Assim, obtemos a seguinte solução para a integral: 
 
onde o erro é dado pela seguinte expressão: 
 
• Reflita 
Como você acha que fica a fórmula de Simpson se for aplicada diversas vezes sobre 
subintervalos de um intervalo geral [a, b]? 
 
• Assimile 
Embora as fórmulas dos trapézios e de Simpson usem polinômios de grau baixo, note 
que, em termos de erros, a regra de Simpson não apresenta termos simples como 
acontece na regra dos trapézios. 
 
Intervalos de integração grandes e fórmulas compostas 
Agora, vamos avaliar outros aspectos dessas fórmulas: intervalos de integração grandes. 
Quando o intervalo de integração é grande, em geral, não é conveniente aumentar o grau 
do polinômio interpolador para obter fórmulas mais precisas, pois podemos deixar o 
problema ainda mais complexo. A alternativa mais usada é subdividir o intervalo de 
integração e aplicar fórmulas simples repetidas vezes, obtendo-se as fórmulas 
compostas. Vamos começar com a regra dos trapézios composta. 
 
que é chamada de fórmula composta para a regra dos trapézios. Nesse caso, o erro final 
dessa fórmula tem como base os erros parciais da fórmula simples dos trapézios que são 
dados por: 
 
Logo, o erro final é dado por: 
______ 
• Assimile 
Se f é um polinômio no qual seu grau é menor que 3, então o erro 
______ 
• Exemplificando 
 
______ 
Como exercício prático, você pode escrever a aproximação da integral considerando 
pela regra de Simpson e pela regra dos trapézios usando 6 intervalos. Para finalizar,deixo a reflexão: qual desses métodos é mais viável quando eu tenho uma integral mais 
complexa? 
 
Isto é, 
 
que é conhecida como fórmula composta para a regra de Simpson. Da mesma forma que 
na regra dos trapézios composta, o erro final da regra composta de Simpson pode ser 
obtido pela soma dos erros parciais. Portanto, o erro final da regra composta de 
Simpson é dado por: 
 
• Assimile 
Se f é um polinômio no qual seu grau é menor que 3, então o erro 
 
é nulo, isto é, a regra de Simpson é exata para polinômios de grau menor que 3 
(ANDRADE, 2012). 
Para finalizar nosso estudo de integração numérica, vamos trabalhar com um exemplo 
de cálculo de integral com base nas regras de Simpson e dos trapézios com erro menor 
que 10−4. 
 
 
 
 
• Exemplificando 
 
Como exercício prático, você pode escrever a aproximação da integral considerando 
pela regra de Simpson e pela regra dos trapézios usando 6 intervalos. Para finalizar, 
deixo a reflexão: qual desses métodos é mais viável quando eu tenho uma integral mais 
complexa? 
 
Conclusão 
Pela definição de área sobre a curva, poderíamos calcular a área exata usando a 
integração comum dada por: 
 
No entanto, foi solicitado o uso de métodos numéricos. Nesse caso, podemos proceder 
usando a regra dos trapézios com 6 subintervalos. Isto é, para n = 6, temos que h = 0,1 e 
assim: 
 
Assim, calculando o erro da estimativa, obtemos: 
 
UNIDADE 3 - Probabilidade e Estatística 
 
Unidade 3 - Aula 1 - Introdução à probabilidade e estatística 
 
Introdução da Unidade 
Objetivos da Unidade 
Ao final desta Unidade, você será capaz de: 
 aplicar os fundamentos de probabilidade e estatística; 
 analisar situações realistas para o profissional de Engenharia e Ciências Exatas; 
 descrever o processo de amostragem. 
Estudante, o que você pensa quando escuta o termo probabilidade? E o termo 
estatística? Seria algo como sendo a chance de conseguir alguma coisa, como a chance 
de vencer em um jogo de videogame ou a chance de ter sucesso com sua startup? Se 
você pensa dessa forma, você pensa de maneira estatística! 
Nesta unidade, vamos trabalhar com os principais conceitos de estatística e 
probabilidade, iniciando com a história da probabilidade. Logo em seguida, vamos 
trabalhar com as definições de população e amostra que se fazem fundamental na 
estatística, sendo o carro-chefe dessa disciplina. Por fim, vamos entender como se faz 
uma amostragem. Os processos de amostragem são diversos na literatura, mas nosso 
foco aqui será a diferença entre uma amostragem probabilística e uma não 
probabilística. Além disso, vamos trabalhar também com as medidas de tendência 
central e dispersão e o modelo de regressão que envolve a correlação das variáveis. 
Algo que você pode estar se perguntando é: mas como utilizamos a estatística e a 
probabilidade em áreas como Engenharia? Para exemplificar, suponha que você 
trabalha com energia solar e seu objetivo seja criar tipos de telhados que proporcionem 
o uso desse tipo de energia. Nesse caso, você irá realizar um experimento para avaliar se 
sua proposta traz algum tipo de vantagem para a produção do telhado. Só pelo fato de 
realizar um experimento, você já está trabalhando com estatística e, posteriormente, 
para avaliar os resultados desse experimento, você irá precisar de métodos estatísticos e 
probabilísticos para trazer uma confiança em seu projeto, como um modelo de 
regressão. Viu como a estatística é importante nesse aspecto? Para lhe auxiliar, vamos, 
no decorrer desta unidade, aprender um pouco mais sobre ela! Então, mãos à obra! 
 
 
Introdução da Aula 
Qual é o foco da aula? 
Nesta aula, você estudará sobre probabilidade e estatística. 
Objetivos gerais de aprendizagem 
Ao final desta aula, você será capaz de: 
 aplicar probabilidade e estatística; 
 analisar amostragem probabilística e não probabilística; 
 calcular aplicações da estatística. 
Situação-problema 
Estudante, o que você pensa quando escuta o termo probabilidade? E o termo 
estatística? Seria algo como sendo a chance de conseguir alguma coisa, como a chance 
de vencer em um jogo de videogame ou a chance de ter sucesso com sua startup? Se 
você pensa dessa forma, você pensa de maneira estatística! 
Nesta unidade, vamos trabalhar com os principais conceitos de estatística e 
probabilidade, iniciando com a história da probabilidade. Logo em seguida, vamos 
trabalhar com as definições de população e amostra que se fazem fundamental na 
estatística, sendo o carro-chefe dessa disciplina. Por fim, vamos entender como se faz 
uma amostragem. Os processos de amostragem são diversos na literatura, mas nosso 
foco aqui será a diferença entre uma amostragem probabilística e uma não 
probabilística. Além disso, vamos trabalhar também com as medidas de tendência 
central e dispersão e o modelo de regressão que envolve a correlação das variáveis. 
Algo que você pode estar se perguntando é: mas como utilizamos a estatística e a 
probabilidade em áreas como Engenharia? Para exemplificar, suponha que você 
trabalha com energia solar e seu objetivo seja criar tipos de telhados que proporcionem 
o uso desse tipo de energia. Nesse caso, você irá realizar um experimento para avaliar se 
sua proposta traz algum tipo de vantagem para a produção do telhado. Só pelo fato de 
realizar um experimento, você já está trabalhando com estatística e, posteriormente, 
para avaliar os resultados desse experimento, você irá precisar de métodos estatísticos e 
probabilísticos para trazer uma confiança em seu projeto, como um modelo de 
regressão. Viu como a estatística é importante nesse aspecto? Para lhe auxiliar, vamos, 
no decorrer desta unidade, aprender um pouco mais sobre ela! Então, mãos à obra! 
 
 
Conceito de probabilidade 
Você já parou para pensar em como as coisas ao nosso redor acontecem de forma 
aleatória? Por exemplo, o cair de uma fruta de uma árvore, uma batida de carro, a queda 
de um avião, a subida/descida da bolsa de valores, etc. Poucas coisas são, de fato, 
determinísticas. Nesta aula, vamos explorar esses conceitos e definir o que chamamos 
de probabilidade, que se faz uma ferramenta mais do que fundamental atualmente e nas 
mais diversas áreas de trabalho. 
No que tange ao contexto histórico, acredita-se que essa teoria teve seu início com os 
matemáticos franceses Blaise Pascal (1623-1662) e Pierre Fermat (1601-1665), quando 
eles conseguiram derivar probabilidades exatas para determinados problemas de jogos 
envolvendo dados. Atualmente, essa teoria é aplicada em diversas áreas de estudo como 
hidrologia, medicina, farmacologia, engenharia, química, educação, dentre outras. 
Ao estudar probabilidade, duas coisas são levadas em 
consideração: experimentos e eventos. Um experimento é um processo, seja real ou 
hipotético, no qual são identificados os resultados no decorrer do tempo. Por outro lado, 
um evento é um conjunto bem definido relativo aos resultados de um experimento, seja 
ele real ou hipotético. Além disso, existem duas classificações para os 
experimentos: aleatórios e determinísticos. Dizemos que um dado experimento é dito 
aleatório se, mesmo repetindo-o diversas vezes em condições iguais, o resultado não 
pode ser definido ou, até mesmo, predito. Em contrapartida, dizemos que um 
experimento é dito determinístico se, repetido diversas vezes, o resultado pode ser 
definido ou predito. 
Um outro elemento fundamental em probabilidade é o espaço amostral. Podemos 
definir espaço amostral como sendo o 
“conjunto relativo a todos os resultados possíveis que podemos encontrar em um 
experimento aleatório” (MAGALHÃES, 2002). 
Denotamos espaço amostral por Ω. Por exemplo, suponha que desejamos representar 
todas as plantas que produzem O2. Nesse caso, Ω = {Todas as plantas que 
produzem O2} que define as características comuns aos membros do conjunto. Outro 
exemplo é o lançamento de uma moeda.Nesse caso, Ω = {cara, coroa} que são as 
únicas possibilidades de ocorrência no lançamento da moeda. Em especial, os conjuntos 
de um espaço amostral possuem algumas propriedades especiais, dado Ω um espaço 
amostral; A, B e C três subconjuntos de um espaço amostral Ω, então as seguintes 
propriedades são válidas: 
 
Voltando ao contexto de probabilidade, na literatura, três interpretações diferentes de 
probabilidade são consideradas, a saber: a interpretação frequentista, a interpretação 
clássica e a interpretação subjetiva. É importante destacar que cada uma dessas 
interpretações pode ser útil na aplicação da teoria das probabilidades a problemas 
práticos. 
Vamos começar então com a interpretação frequentista. 
Interpretação frequentista: seja A um evento qualquer. Se nA é o número de 
ocorrências do evento A em n repetições independentes do experimento, então dizemos 
que a probabilidade em que A ocorre é: 
 
• Exemplificando 
 
Interpretação clássica: seja Ω um determinado espaço amostral e A um evento dado. 
Se N(Ω) é o número de elementos possíveis no nosso espaço amostral Ω e N(A) é o 
número de elementos possíveis no nosso evento A, então dizemos que a probabilidade 
em que A ocorre é: 
 
Vale ressaltar que se um experimento aleatório tem como espaço 
amostral Ω=e1,e2,…,en, então podemos dizer que eventos elementares {ei} são 
equiprováveis se, porventura, todos esses eventos terem a mesma probabilidade de 
ocorrência, isto é: 
 
Logo, considerando tais eventos, podemos definir a probabilidade de ocorrência de um 
dado evento 
 
______ 
 
 
• Exemplificando 
Considere o lançamento de um dado em que o espaço amostral Ω={1, 2, 3, 4, 5, 6} é 
equiprovável. Dado o evento A = {sair número par na face em um lançamento de um 
único dado}, de acordo com a interpretação clássica, o número de elementos do 
evento A = {2, 4, 6} é igual a 3 e a probabilidade de ocorrência do evento A é dada por: 
 
______ 
Interpretação subjetiva: se o julgamento das probabilidades relativas de várias 
combinações de resultados preencher determinados requisitos de consistência, então as 
probabilidades subjetivas dos diferentes eventos possíveis podem ser excepcionalmente 
determinadas. 
______ 
• Exemplificando 
Suponha que uma moeda é lançada uma vez. Uma pessoa sem informação especial 
sobre a moeda ou a maneira que ela é jogada, pode considerar que uma cara e uma 
coroa têm resultados igualmente prováveis. Entretanto, a pessoa que está jogando a 
moeda pode sentir que uma cara é muito mais provável de ser obtida do que uma coroa 
e atribuir uma probabilidade diferente. 
______ 
Agora que sabemos como interpretar uma probabilidade, vamos definir mais dois 
conceitos importantes: população e amostra. No que tange a esses conceitos, uma 
população pode ser definida como “grupo de indivíduos com característica(s) em 
comum”. Já uma amostra, podemos definir como “parte da população”, isto é, uma 
porção de indivíduos que usaremos para inferir respostas sobre a população. No que 
tange à seleção de uma amostra, ela pode ser feita de diversas maneiras, porém, em 
muitos casos, depende exclusivamente dos recursos disponíveis para a coleta dos dados. 
Em estatística utilizamos uma notação própria para diferenciar medidas usadas para 
descrever características da amostra e da população. Assim, podemos definir uma 
estatística como sendo uma medida de descrição de alguma característica da amostra. 
Por exemplo, X a média da amostra; S representa desvio-padrão da amostra; P a 
proporção da amostra e Xd a diferença de médias são 
estatísticas. Já um parâmetro pode ser definido como uma medida usada com 
finalidade de descrever uma característica da população e, diferente da amostra, é 
representado por uma letra grega. São exemplos de parâmetros: μ (média 
populacional); π (proporção populacional); σ (desvio-padrão populacional) 
e μd (diferença de médias populacionais). Os dois problemas básicos da estatística 
são: estimação e testes de hipóteses. Vamos, por meio de um exemplo, ilustrar essas 
duas situações. 
Suponha que determinado engenheiro químico está interessado em avaliar a média de 
produção de um determinado efluente, μ, para o tratamento de água nas seguintes 
condições: rio contaminado por aproximadamente 5 anos com água de péssima 
qualidade e ecossistema aquático (peixes) degradado. Nesse caso, a nossa população 
consiste em todas as dosagens da concentração do efluente nas condições citadas. 
Assim, com os valores de concentração, podemos obter a estimativa da média de 
produção verdadeira do efluente. 
Esse é um exemplo de problema de estimação. Por outro lado, suponha que o 
engenheiro químico deseja saber se a média de produção do efluente A é a mesma da 
média de produção do efluente B. Para realizar tal comparação, foi considerada uma 
amostra aleatória de 50 concentrações do efluente B e 50 do efluente A, sob as mesmas 
condições. Esse é um exemplo de problema de teste de hipóteses. 
• Reflita 
Em que outras situações práticas você pode encontrar as diferenças entre os problemas 
de estimação e testes de hipóteses? 
 
 
 
 
Amostragem 
Agora, para encerrar nosso conteúdo da aula, vamos lidar com a amostragem, que é 
uma das principais ferramentas da estatística. Como vimos nos exemplos anteriores, um 
pesquisador trabalha apenas com a amostra, visto que, em muitos casos, trabalhar com a 
população toda é impossível. A maneira como é selecionada uma amostra é de extrema 
importância, pois é através dos dados amostrais que estimamos os parâmetros da 
população para fazer inferências sobre ela. Existem diversas formas/técnicas de se 
realizar uma amostragem, porém, nesta aula, iremos nos limitar a trabalhar com 
a amostragem aleatória simples para o uso das técnicas estatísticas aqui apresentadas. 
Então, podemos definir a amostragem aleatória simples como sendo uma técnica em 
que todos os indivíduos de uma dada população têm a mesma probabilidade de serem 
selecionados para a amostra. Em outras palavras, seria análogo à ideia de um sorteio de 
números como na Mega-Sena, em que temos 60 números na “população” e escolhemos 
6 desses números. A escolha de cada um dos 6 números tem a mesma probabilidade. 
Para facilitar o processo de amostragem aleatória simples, podemos dividi-lo em etapas: 
1. definir a população-alvo; 
2. definir um quadro par ao processo de amostragem; 
3. avaliar os recursos disponíveis para execução do quadro de amostragem; 
4. atribuir um número único para cada indivíduo; 
5. determinar o tamanho da amostra; 
6. realizar a amostragem aleatória simples. 
Assim como toda técnica de amostragem, a amostragem aleatória simples tem suas 
vantagens e desvantagens. Entre as vantagens, destacamos: 
1. a probabilidade de seleção de um indivíduo é a mesma para todos os indivíduos; 
2. em geral, esse método traz amostras representativas; 
3. os métodos estatísticos, para lidar com esse tipo de amostragem, são mais 
simples. 
No entanto, as desvantagens desse tipo de amostragem são: 
1. não se utiliza o conhecimento do pesquisador sobre a população; 
2. os erros de amostragem podem ser maiores quando comparados a outros 
métodos; 
3. se lidamos com uma população mais dispersa, os custos de coleta de dados 
podem ser maiores do que o esperado. 
Além da amostragem aleatória simples, há outros tipos de amostragem 
probabilísticas: amostragem sistemática, que, diferente da amostragem simples, 
dividimos a população em grupos e em cada grupo trabalhamos com a amostragem 
aleatória simples; amostragem estratificada, que consiste em, basicamente, dividir a 
população em grupos e subgrupos de acordo com as características de interesse; e, por 
fim, amostragem por conglomerados, que consiste em selecionar primeiramente o 
grupo e não o indivíduo, como nos outros tipos de amostragem. Independentemente do 
tipo de amostragem probabilística, o objetivo é sempreobter uma amostra 
representativa. 
Por outro lado, porém, a obtenção de uma amostra verdadeiramente aleatória vai 
depender muito da situação da população de interesse. Frequentemente, não é possível 
obter uma amostra aleatória, pois, muitas vezes, não há recursos de pesquisa suficientes 
para utilizar tal técnica. Por exemplo, se temos por interesse tratar uma doença (como a 
Covid-19) em seres humanos através de um dado medicamento, então os seres humanos 
que formam a amostra são os acessíveis em hospitais, visto que não há como saber 
quem está com a doença fora do hospital. Isso nos leva ao conceito de amostragem não 
probabilística, que, em geral, é feita por conveniência devido a recursos disponíveis ou 
até mesmo não tem necessariamente um critério para a amostragem. Dentre esse tipo de 
amostragem, destacam-se dois tipos principais: julgamento e cotas. 
A amostragem por julgamento é simplesmente feita pelo julgamento do próprio 
pesquisador em que ele irá buscar por indivíduos com características definidas 
anteriormente para a sua amostra. Já a amostragem por cotas é o tipo de amostragem 
utilizado para pesquisa de mercado, pesquisa eleitoral e opinião pública. Para se 
trabalhar com esse tipo de amostragem, devemos determinar as características gerais de 
estudo e fazer os questionários; a partir disso, faz-se um filtro das características mais 
importantes e tem-se a amostra. A grande desvantagem desses tipos de amostragem é a 
chance de se obter viés na pesquisa ou resultados tendenciosos ou, ainda, inválidos. 
 
 
 
Portanto, você já sabe como encontramos dois dos parâmetros da chamada distribuição 
amostral da média. O próximo passo, por exemplo, seria determinar qual modelo 
probabilístico poderia ser utilizado para trabalhar com tal distribuição. Nesse caso, se 
aumentarmos o tamanho das amostras de 2 para 3, as médias amostrais ficam mais 
concentradas em torno da média verdadeira (μ), porque o desvio-padrão diminui. Esse 
conceito define o que chamamos de Teorema do Limite Central, que encerra a nossa 
aula dos conceitos iniciais de probabilidade. 
______ 
• Assimile 
Teorema do Limite Central: para as amostras X1,…, Xn independentes e 
identicamente distribuídas, a distribuição amostral da média: 
 
Chegamos então ao fim de nossa aula sobre alguns conceitos básicos de Estatística que 
irão, no futuro, orientar sua equipe no trabalho e para resolver problemas relativos à 
modelagem que envolva análise estatística. 
 
 
Conclusão 
Em primeiro lugar, você deve mapear a área para saber exatamente com quantos rios 
você lidará para realizar a amostragem. Dado que você deve ter a mesma probabilidade 
de escolha para cada um dos rios, então, naturalmente, você irá considerar um plano de 
amostragem baseado em amostragem aleatória simples. Sua população-alvo são os rios, 
e devido aos seus recursos, você não pode ter uma amostra muito grande. O segundo 
passo é fazer a proporção de instrumentos e pessoas para a coleta da amostra após a 
seleção aleatória de uma quantidade amostral dos rios, visto que não há recursos para se 
trabalhar com todos. Definida essa proporção, com base na extensão dos rios 
selecionados, você fará o cálculo das probabilidades a fim de determinar o tamanho da 
amostra necessária para fazer análises estatísticas sobre a população de rios considerada. 
Embora não seja seu melhor plano de amostragem (a amostragem simples), é a melhor 
maneira de usar com mais eficiência os recursos disponíveis. Após escrever o plano, 
você ainda pode se reunir com o prefeito e sugerir uma amostragem por estratificação, 
em que os estratos são as regiões em que se localizam os rios. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Unidade 3 - Aula 2 - Medidas de tendência central e de dispersão 
 
Introdução da Aula 
Qual é o foco da aula? 
Nesta aula, você estudará sobre medidas de tendência central e de dispersão. 
Objetivos gerais de aprendizagem 
Ao final desta aula, você será capaz de: 
 descrever medidas de tendência central e medidas de dispersão, com aplicações; 
 calcular médias, medianas, moda, amplitudes; 
 identificar variância, desvio padrão e coeficiente de variação. 
Situação-problema 
Estudante, nesta aula iremos entender o conceito das medidas de tendência central ou 
posição e também as medidas de dispersão. Tais medidas são fundamentais para você 
compreender a importância delas nos trabalhos científicos e no dia a dia de sua 
profissão. 
Como exemplo dessa abordagem, podemos considerar uma experimentação de 
tratamento de poluição hídrica em lago de uma determinada comunidade em que a 
pesca é o principal recurso de sobrevivência das pessoas daquela região. Como um dos 
objetivos, você precisa calcular, por exemplo, a concentração média de um determinado 
composto para fazer o tratamento da água desse lago e também trabalhar com a 
dispersão dos poluentes nesse lago. Percebe o quanto essas medidas nos trazem 
informações importantes? 
Atualmente, com o crescimento do uso de ferramentas estatísticas, matemáticas e 
computacionais em análise de dados, nenhuma empresa quer ficar para trás. Nesse 
aspecto, suponha que você foi contratado por uma empresa para avaliar as 
concentrações de pH de um determinado rio em que se cria peixes para pesquisa. O 
valor do pH é uma medida do grau de acidez ou alcalinidade da água, sendo 7 o valor 
neutro do pH. Sabe-se que em certos ecossistemas, como o de peixes, valores de pH 
muito baixos ou muito altos podem ser letais para a grande maioria das espécies. Então, 
a empresa deseja que isso não aconteça com sua criação de peixes. Logo, uma 
amostragem de valores de pH de dois anos foi realizada nessa empresa com a finalidade 
de trazer algumas informações sobre tais concentrações, como média, variância, 
máximo e mínimo, para se ter um devido controle da produção de peixes. Os dados 
amostrados são: 
 
Concentrações de pH fornecidas pela empresa. Fonte: elaborada pelo autor. 
Como você faria o cálculo da média, da variância, do máximo e do mínimo em cada 
ano? Como apresentaria tais resultados para empresa? 
Vamos então começar o entendimento dessas medidas? Você será acompanhado em 
todo o processo! Iniciaremos com as medidas de tendência central, como média, 
mediana e moda, e depois passaremos para as medidas de dispersão, como variância, 
desvio-padrão e coeficiente de variação. 
 
Medidas de tendência central: média aritmética 
Em situações práticas, no geral, descrevemos os dados por quantidades, denominadas 
medidas resumo, que resumem todos os dados do conjunto bruto de dados. Por 
exemplo, em uma fazenda podemos estar interessados em um valor que descreve o mais 
típico tipo de árvore; ou o número de árvores presente em 25% da fazenda. Tais 
medidas são denominadas medidas de tendência central (de posição). 
No geral, as medidas de tendência central podem ser definidas como 
“valor numérico central de uma distribuição de valores” (MAGALHÃES, 2002). 
Dentre essas medidas, as mais importantes são: média aritmética, mediana, moda e 
percentis. Antes de prosseguir com as medidas de posição, dois conceitos devem estar 
bem definidos: população e amostra. Tais conceitos já vimos na aula anterior, mas 
vamos retomá-los aqui. 
População: uma população pode ser definida como um grupo de indivíduos que 
possuem característica(s) em comum. 
Amostra: uma amostra é, basicamente, um “pedaço” da população da qual temos por 
objetivo estudar para inferir resultados sobre a população. Naturalmente, há diversas 
formas de selecionar uma amostra, porém, em muitos casos, depende exclusivamente 
dos recursos disponíveis para a coleta dos dados. 
______ 
 
 
 
• Assimile 
É importante destacar que em grande parte dos estudos trabalhamos com a amostra para 
realizar inferências sobre a população quando ela é inviável de se trabalhar (quantidade 
de dados exuberantes). 
______É importante destacar que em grande parte dos estudos trabalhamos com a amostra para 
realizar inferências sobre a população quando ela é inviável de se trabalhar (quantidade 
de dados exuberantes). 
Bom, vamos então dar início ao nosso conteúdo. Iniciaremos com a primeira medida de 
posição: a média aritmética. Tal medida é a de posição mais popular que temos e 
trabalhamos em muitos estudos. Ela pode ser calculada em duas situações: amostra e 
população. 
Média populacional: a média populacional é simplesmente calculada somando-se 
todos os valores obtidos para população e dividindo o resultado pelo total de elementos 
da população (MAGALHÃES, 2002). Em outras palavras, a média populacional é dada 
por: 
 
 
Média amostral: diferente da média populacional, a média amostral trabalha 
exclusivamente com elementos da amostra (MAGALHÃES, 2002). Nesses termos, a 
média amostral é dada por: 
 
Média amostral: diferente da média populacional, a média amostral trabalha 
exclusivamente com elementos da amostra (MAGALHÃES, 2002). Nesses termos, a 
média amostral é dada por: 
 
em que n é o tamanho da amostra e xi, i = 1, …, n são as observações da amostra. É 
importante destacar que a média amostral, diferente da populacional, é sempre denotada 
por uma letra minúscula do alfabeto tradicional (no caso, x). 
______ 
• Exemplificando 
Suponha que nosso objetivo seja avaliar o número médio de amostras contaminadas de 
água em uma dada população de lagos. Se o número de amostras contaminadas em um 
certo ano em cinco lagos é: 42, 43, 36, 32 e 40, o que podemos afirmar a respeito do 
número médio de amostras contaminadas para uma população de 100 lagos? Nesse 
caso, temos que n = 5 e a média dessa amostra é dada por: 
 
Supondo que os dados constituem uma amostra no sentido técnico (isto é, um conjunto 
de dados do qual podemos tirar generalizações válidas), podemos estimar 
(hipoteticamente) que o número médio de amostras contaminadas dos 100 lagos é de μ 
= 38,6 amostras contaminadas. 
______ 
 
Algumas observações importantes sobre a média: 
1. a média existe para qualquer conjunto de dados de natureza numérica; 
2. a média é sempre única; 
3. a média é útil para outras avaliações estatísticas, como a média global de um 
conjunto de dados; 
4. a média é sensível a pontos extremos, isto é, os pontos extremos de uma amostra 
interferem na representatividade da média para aquela amostra; 
5. a média leva em conta todos os dados. 
Em algumas situações práticas, os dados podem ser apresentados em tabelas de 
frequências por ponto ou classes. Nesse caso, a média tradicional não pode ser 
diretamente calculada, uma vez que os dados estão agrupados ou possuem pesos 
diferentes. Assim, fazemos uma modificação para o cálculo da média, que passa a ser 
chamada de média ponderada. 
______ 
• Assimile 
Média ponderada: A média aritmética ponderada xp de uma amostra x1, x2, …, xn com 
frequência absoluta f1, f2, …, fn é dada por: 
 
______ 
• Exemplificando 
Considere a tabela a seguir com a distribuição do número de testes hidráulicos diários 
realizados por 79 engenheiros a respeito de uma avaliação da instalação hidráulica de 
um determinado veículo. 
 
Número de testes hidráulicos realizados por 79 engenheiros a respeito de uma instalação 
hidráulica. Fonte: elaborada pelo autor. 
Nesse caso, inicialmente, determinamos a variável resposta (ou de interesse), que aqui é 
o número de análises, e reescrevemos a tabela anterior como: 
 
 
Tabela de frequência do número de testes hidráulicos realizados por 79 engenheiros a 
respeito de uma instalação hidráulica. Fonte: elaborada pelo autor. 
Assim, a média ponderada dessa amostra é dada por: 
 
 
 
 
 
Medidas de tendência central: mediana, moda, máximo, mínimo e 
quartil 
Com isso, encerramos as duas formas de se calcular a média de um conjunto de dados. 
Mas você se lembra de que a média é uma medida sensível? Então, nesse caso, 
precisamos de outra medida que não seja sensível a pontos extremos. Tal medida é 
conhecida como mediana. 
 
______ 
• Reflita 
Considere o pH de 7 amostras de efluentes industriais de uma determinada empresa: 1, 
1, 2, 3, 3, 10, 12. Qual medida representa melhor esse conjunto de dados? Média ou 
mediana? 
______ 
Certo, vimos como a mediana funciona. Mas será que existe outra medida de posição 
que se faz importante? Sim, a moda. Essa medida desempenha um papel fundamental 
em estudos ambientais quando o intuito, por exemplo, é saber qual espécie de árvore é 
mais frequente em uma determinada região; a raça mais abundante de peixe em uma 
represa; predador mais comum em determinados ecossistemas; entre outras aplicações. 
Moda: é a medida representada pelo valor na amostra que ocorre com maior frequência. 
A moda não é única, uma vez que podemos ter empate de frequências. A rigor de 
notação, denotamos moda por xm. 
Para complementar uma boa análise das estatísticas descritivas de uma amostra, além 
das medidas de posição citadas anteriormente, necessitamos de mais algumas medidas 
de 
posição que se fazem importantes: máximo, mínimo e quartil. Essas medidas são 
fundamentais para algumas técnicas gráficas como o boxplot. 
Máximo e mínimo: o mínimo é definido como sendo a menor observação da amostra; 
já o máximo é definido como sendo a maior observação da amostra. 
Quartil: medida que divide o conjunto de dados em basicamente quatro partes iguais, 
com os dados em ordem crescente. O primeiro quartil, Q1, representa 25% das 
observações; Q2 representa a mediana que corresponde a 50% das observações; e Q3, 
representa 75% das observações do banco de dados. 
 
 
Medidas de dispersão: amplitude, variância, desvio-padrão, Teorema 
de Tchebichev e o coeficiente de variação 
Assim, encerramos nosso conteúdo sobre medidas de posição. Agora, vamos a um 
pequeno exemplo: considere que uma indústria A tem três tipos de maquinários com o 
número de falhas dessas máquinas descritos por 72, 76 e 74, enquanto uma indústria B 
tem os mesmos três tipos de máquinas com o número de falhas de cada máquina dado 
por 72, 91 e 59. Note que o número médio de falhas de cada máquina de cada indústria 
é o mesmo, 74, mas observe a diferença de variabilidade. Isto é, enquanto a indústria A 
tem uma quantidade de falhas equivalente para cada máquina, na indústria B há uma 
falha muito maior na segunda máquina. Perceba que, nesse caso, a medida de posição 
“média” é insuficiente para descrever, por exemplo, a homogeneidade das falhas das 
máquinas. Nesse caso, devemos trabalhar com o que chamamos de medidas de 
dispersão, que têm por objetivo medir a variação ou dispersão do nosso conjunto de 
dados. 
A primeira medida que vamos trabalhar é a amplitude. Tal medida é usada, 
preferencialmente, no controle de qualidade industrial para manter o controle imediato 
de matérias-primas e produtos. Há dois tipos de amplitudes: geral (abrange todos os 
valores da amostra) e interquartil (abrange mais ou menos 50% dos dados centrais). 
 
A amplitude geral não é uma medida muito útil da variação dos dados, uma vez que ela 
não nos diz coisa alguma sobre a dispersão dos valores entre os dois extremos. 
Considere os três conjuntos de concentração de um determinado efluente a seguir: 
 conjunto A: 5, 18, 18, 18, 18, 18, 18, 18, 18, 18; 
 conjunto B: 5, 5, 5, 5, 5, 18, 18, 18, 18, 18; 
 conjunto C: 5, 6, 8, 9, 10, 12, 14, 15, 17, 18. 
Note que a amplitude de cada um dos conjuntos é a mesma e igual a 13, mas suas 
dispersões entre o primeiro e o último valor são totalmente diferentes. Assim, 
necessitamos de uma nova medida para lidar com esses dados, que é a variância. 
A segunda medida de dispersão que vamos trabalhar é a variância. Essa medida 
trabalha com a dispersão dos dados ao redor da média e pode ser calculada tanto para a 
população quanto para a amostra. Isto é: 
Variância populacional: dada uma população x1,...,xN de N elementos, a variância,nesse caso, é dada por (MAGALHÃES, 2002): 
 
Variância amostral: dada uma amostra x1,…,xn de n elementos, a variância, nesse 
caso, é dada por (MAGALHÃES, 2002): 
 
 
______ 
• Assimile 
É importante fixar que ao trabalhar com a variância amostral, iremos perder 1 grau de 
liberdade quando comparada à variância populacional devido ao uso da média amostral 
como estimador. 
 
• Exemplificando 
Voltando ao nosso exemplo da água contaminada em lagos. Vamos supor que nosso 
objetivo agora seja avaliar a variância em vez da média. Se o número de amostras 
contaminadas em cinco lagos é: 42, 43, 36, 32 e 40, o que podemos concluir sobre a 
variância de amostras contaminadas para uma população de 100 lagos? Nesse caso, 
temos que n = 5 e a média dessa amostra é 38,6 amostras contaminadas. Portanto, a 
variância é dada por: 
 
______ 
Depois da variância, uma outra medida de dispersão de suma importância é o desvio-
padrão que trabalha o “erro” de estimação. Nesse caso, temos que: 
Desvio-padrão populacional: é uma medida de dispersão dada pela equação: 
 
Desvio-padrão amostral: é uma medida de dispersão dada pela equação: 
 
De acordo com a definição de desvio-padrão, observamos que a dispersão de um 
conjunto de dados se baseia nas disposições dos dados em torno da média, isto é, quanto 
mais “afastados” da média, mais disperso é o conjunto de dados. Esse conceito nos leva 
ao último conceito de nossa aula: o Teorema de Tchebichev e o coeficiente de 
variação. 
 
Para finalizar, podemos definir o coeficiente de variação, que é uma das medidas 
utilizadas quando nosso interesse é analisar a dispersão em termos relativos a seu valor 
médio, mas sem levar em conta a influência da ordem de grandeza da variável. Tal 
medida é definida como: 
 
É importante salientar que o coeficiente de variação está entre 0 e 1, mas pode ser 
escrito também em porcentagem, multiplicando-se o valor do CV por 100. E com isso 
encerramos nossa aula sobre medidas de dispersão e tendência central. Deixo também 
como encerramento a questão: onde podemos utilizar o Teorema de Tchebichev? 
 
 
 
 
 
 
 
 
 
 
 
Conclusão 
No contexto apresentado e para a amostra considerada, podemos calcular a média e a 
variância por meio das expressões dadas, respectivamente, por: 
 
Logo, para o 1º ano, obtemos que a média é, aproximadamente, igual a 6,41 e a 
variância é, aproximadamente, 6,72. Já para o 2º ano, temos que a média é, 
aproximadamente, 6,98 e a variância é, aproximadamente 8,88. Agora, o máximo e o 
mínimo são medidas relativas ao maior e menor falar dos dados observados em cada 
ano. Nesse caso, no 1º ano, o máximo é 8,23 e o mínimo é 1,98. Já no 2º ano, o máximo 
é 8,23 e o mínimo é 2,97. Agora, para apresentar a empresa, montamos a seguinte 
tabela: 
 
 
Resultados descritivos sobre o pH da amostra considerada. Fonte: elaborada pelo autor. 
De acordo com essa tabela, chegamos à conclusão de que a média de pH no primeiro 
ano é de 6,41, que não é letal para os peixes, porém houve período em que o pH mínimo 
foi de 1,98 nesse ano (junho), que pode ter sido letal para os peixes. A variabilidade do 
pH foi de 6,72 de acordo com o valor da variância. Já para o segundo ano, a média de 
pH é de 6,98, que não é letal para os peixes, porém houve período em que o pH mínimo 
foi de 2,97 nesse ano (janeiro), que pode ter sido letal para os peixes. A variabilidade do 
pH foi de 8,88 de acordo com o valor da variância. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
UNIDADE 4 - Estatística aplicada e probabilidade 
 
Unidade 4 - Aula 1Estatística descritiva 
 
Introdução da Unidade 
Objetivos da Unidade 
Ao final desta Unidade, você será capaz de: 
 descrever os fundamentos probabilísticos e estatísticos; 
 calcular medidas de tendência central e de dispersão; 
 empregar regressão linear e correlação. 
Estudante, você sabia que uma das melhores maneiras de representar dados é com 
gráficos e tabelas? E fazendo esse tipo de representação, você está trabalhando com 
estatística? Nesta unidade, vamos trabalhar com os principais conceitos de estatística, 
iniciando-se com a estatística descritiva e os principais tipos de gráficos. Logo em 
seguida, vamos revisar algumas definições de população e amostra, além dos conceitos 
de probabilidade. No entanto, nosso foco será trabalhar com resumo de dados e cálculos 
de probabilidades condicionais que são amplamente utilizados em testes de diagnósticos 
e também para encontrar o padrão-ouro, que é fundamental para comparação de 
parâmetros. Por fim, vamos entender os testes de hipóteses, que são fundamentais 
quando o assunto é tomar uma decisão. Vamos entender todos os fatores que afetam 
uma tomada de decisão e como decidir, estatisticamente falando. 
Algo que você pode estar se perguntando é: mas como utilizamos a estatística em áreas 
como a Engenharia? Para exemplificar, suponha que você trabalhe com energia eólica e 
seu patrão te faça tomar uma decisão se este tipo de energia é útil e se vai gerar lucros e 
ser sustentável. O que você faria? Naturalmente, você coletaria dados e elaboraria uma 
hipótese que seria validada por métodos estatísticos para apresentar seus resultados e 
apresentaria gráficos. Viu como a estatística é importante nesse aspecto? Para lhe 
auxiliar, vamos, no decorrer desta unidade, aprender um pouco mais sobre ela! Então, 
mãos à obra! 
 
Introdução da Aula 
Qual é o foco da aula? 
Nesta aula, você estudará sobre estatística descritiva. 
Objetivos gerais de aprendizagem 
Ao final desta aula, você será capaz de: 
 aplicar métodos tabulares e métodos gráficos; 
 identificar tipos de variáveis 
 empregar o Excel para métodos tabulares e gráficos. 
Situação-problema 
Nesta aula, iremos entender como construir gráficos e tabela e como trabalhar com isso 
na prática. Esses conceitos são fundamentais, uma vez que são úteis para resumir 
informações e gerar apresentações a comitês sobre os resultados. 
Como exemplo dessa abordagem, podemos considerar que você tenha interesse em 
lançar um serviço no mercado. Para isso, você deve realizar um experimento que irá 
gerar dados e você deve organizá-los em tabelas e gráficos para poder fazer um resumo 
dos seus resultados para a apresentação em um determinado comitê para aprovação do 
seu serviço. Viu como é importante entender essa questão? Gráficos bem detalhados e 
corretos te dão uma boa visão do que está ocorrendo em determinado setor e também é 
útil para mostrar à empresa as projeções. 
Nos dias atuais, em qualquer apresentação empresarial, os gráficos fazem parte desse 
mundo, trazendo e até às vezes inovando a forma de exibir os resultados de uma 
empresa. Pensando nisso, seu gerente pediu sua sugestão para propor uma nova 
apresentação das vendas do último trimestre dos últimos 10 anos da empresa. A ideia é 
fazer com que esses valores fiquem apresentáveis, porém ele não tem nenhuma ideia de 
como fazer isso. Como você faria essa apresentação? Que tipo de gráfico você utilizaria 
para expor as vendas? E como você interpretaria esse gráfico? 
Que tal começar esse entendimento agora? Você será acompanhado em todo o processo! 
Iniciaremos com os conceitos de tabelas e, depois, passaremos para os gráficos e uso do 
Excel! 
 
Conceito de estatística e variável 
Quando falamos de dados e o que eles mostram, estamos falando de estatística, mas o 
que é estatística? Como podemos definir esse conceito? Em termos gerais, podemos 
definir estatística como um conjunto de técnicas e métodos para realização de 
experimentos, coleta e análise de dados (NETO, 2006). Duas ferramentas são essenciais 
quando trabalhamos com estatística: população e amostra. 
______ 
• Assimile 
População: dizemos que um conjunto de elementos é uma população se tais elementos 
têm pelo menos uma característica em comum. Como exemplo de populações, temos 
árvores de uma determinadaespécie, poluentes atmosféricos, pessoas que têm olhos de 
cor clara, etc. 
Amostra: dizemos que um subconjunto de elementos é uma amostra quando ele for 
subconjunto de uma dada população. Como exemplo de amostra, podemos considerar 
um subconjunto de pessoas que têm olhos azuis da população de pessoas de olhos de 
cor clara. 
______ 
Certo, agora que sabemos o que é uma população e uma amostra, que são as bases dos 
trabalhos de estatística, vamos introduzir um novo conceito que nos auxilia a construir 
métodos estatísticos no futuro. Esse conceito é o conceito de variável. 
• Assimile 
Variável: dizemos que uma determinada característica é uma variável se determina a 
natureza de uma população e pode assumir diversas classificações de acordo com a 
origem da população. No planejamento da pesquisa, por exemplo, devemos definir 
quais são as nossas características de interesse, antes da coleta dos dados. 
______ 
É importante lembrar que as variáveis, em geral, têm natureza diferente, o que nos leva 
à classificá-las em dois grupos: quantitativas e qualitativas. Como definimos esses 
conceitos? Vamos começar com as variáveis quantitativas. Tais variáveis dizem respeito 
a características que podem ser medidas ou contadas, por exemplo, o preço de um ativo 
no mercado financeiro, o número de árvores de uma determinada espécie, a taxa de 
hemoglobina de um paciente, etc. E as variáveis qualitativas, como definimos? Ora, 
como o próprio nome já diz, qualidade. Essas variáveis estão ligadas à descrição de uma 
característica, não podendo ser contada ou medida, mas podendo ser observada, por 
exemplo, o nível educacional, a cor dos olhos, o sexo de um animal, etc. 
Além dessas classificações de variáveis, podemos ainda classificá-las em subcategorias. 
Isto é, no caso das variáveis qualitativas, podemos classificá-las em qualitativa 
nominal (quando não há uma ordem de classificação) ou qualitativa ordinal (quando 
há uma ordem de classificação). Exemplos de variáveis qualitativas nominais envolvem 
espécie de uma planta, cor dos olhos, sexo de um animal, etc. Já os exemplos de 
variáveis qualitativas ordinais envolvem a classificação do nível escolar, nível de 
urgência em um hospital, etc. (NETO, 2006). 
Por outro lado, podemos também classificar as variáveis quantitativas em dois 
grupos: discretas ou contínuas. As discretas são aquelas que são originadas de um 
processo de contagem, como o número de peixes de uma espécie X em um determinado 
lago. Já as contínuas, bem, não existe uma contagem e podem assumir qualquer valor na 
reta real, como temperatura, índices pluviométricos, etc. (NETO, 2006). 
• Reflita 
Como você acha que devemos representar as variáveis? É possível ter um novo tipo de 
classificação de uma variável? 
 
Tabelas de frequência 
Certo, agora que sabemos o que é uma variável e suas classificações, vamos trabalhar 
com a exposição de dados. Em geral, representamos os dados por tabelas de 
frequência, que consiste, basicamente, em listar os valores possíveis da variável, 
numéricos ou não, e fazer a contagem na tabela de dados brutos do número de suas 
ocorrências (VIRGILITO, 2017). De acordo com Magalhães (2002), são componentes 
de uma tabela de frequência: 
 
______ 
• Exemplificando 
Suponha que uma dada variável que representa a concentração de metal no sangue 
(em μg/ml) de um paciente tenha como dados observados os valores: 20, 20, 20, 20, 21, 
21, 21, 22, 22, 22, 22, 22, 23, 24, 24. Como representamos esses dados em tabela de 
frequência? Nesse caso, podemos trabalhar com a seguinte tabela de frequência: 
 
 
Concentração de um metal no sangue (em μg/ml) dos pacientes. Fonte: elaborada pelo 
autor (2021). 
______ 
No exemplo anterior, trabalhamos com uma representação de dados discretos. Mas 
como trabalhamos com dados contínuos? Nesse caso, dado que não podemos fazer uma 
contagem, trabalhamos com faixa de variações divididas em intervalos de classes, onde 
o menor valor da classe é denominado limite inferior (li) e o maior valor da classe é 
denominado limite superior (Li) (NETO, 2006). O intervalo ou a classe podem ser 
representados das seguintes maneiras (MAGALHÃES, 2002): 
1. li⊢Li, onde o limite inferior da classe é incluído na contagem da frequência 
absoluta, mas o superior não; 
2. i⊣Li, onde o limite superior da classe é incluído na contagem, mas o inferior não; 
 
______ 
• Exemplificando 
Suponha que em uma cidade X as precipitações diárias (em mm) foram dadas por 350, 
260, 390, 250, 390, 210, 400, 160, 320, 390, 230, 150, 270, 440, 500 no mês de agosto 
de 2020. A partir dessas observações, pela regra de Surges, vamos considerar cinco 
classes, uma vez que k=4,88≈5. Nesse caso, uma tabela de frequência relativa a essas 
precipitações diárias (em mm) da cidade é descrita por: 
 
 
Precipitações diárias (em mm) em uma cidade X em agosto de 2020. Fonte: elaborada 
pelo autor (2021). 
______ 
Entendemos então como funcionam as tabelas de frequência, vamos agora para outra 
ferramenta importante para a análise de dados: os gráficos. As representações gráficas 
de tabelas de distribuições de frequências permitem uma visualização a respeito do 
comportamento das variáveis, incluindo sua dispersão. Em geral, a utilização de 
gráficos para resumir os resultados de uma pesquisa é comum e é sempre recomendável. 
E já que estamos falando de gráficos, alguns pontos devem ser levados em conta na sua 
construção (MAGALHÃES, 2002): 
1. devem ser claros, simples, atrair a atenção e inspirar confiança; 
2. servem para resumir resultados importantes de uma pesquisa; 
3. sempre devem ter um título completo e ser colocado na parte superior do 
gráfico; 
4. devem ser construídos numa escala que não implique outros tipos de 
interpretações; 
5. deve-se sempre especificar (dar nome) e graduar (criar escala) os eixos; 
6. quando os dados não são próprios, deve-se citar a fonte de origem dos dados do 
gráfico. 
Vamos então trabalhar com alguns tipos de gráficos, iniciando-se com o gráfico de 
barras. O gráfico de barras apresenta dados categorizados em barras retangulares em 
que cada barra é proporcional ao número de observações naquela categoria da variável 
(NETO, 2006). Utilizamos esse tipo de gráfico, em geral, para realizar comparações 
entre as categorias de uma variável qualitativa ou quantitativa discreta. E como fazemos 
esse gráfico em um software como o Excel? Ora, nesse caso, digitamos os nossos dados 
na planilha e vamos em Inserir > Gráficos > Barra. Como exemplo, vamos considerar o 
gráfico de barras feito no Excel exposto na figura abaixo. 
 
 
Gráfico de barras correspondente à precipitação total (em mm) de 1 ano em quatro 
cidades diferentes. Fonte: elaborada pelo autor (2021). 
Vimos que o gráfico de barras é um gráfico para variáveis qualitativas ou variável 
quantitativa discreta, mas e para variável quantitativa contínua, qual gráfico utilizamos? 
Nesse caso, trabalhamos com o histograma, que é uma representação gráfica da 
distribuição de frequências em intervalos de classes de dados quantitativos contínuos. E 
como fazemos esse gráfico no Excel? Ora, seguimos o mesmo caminho do gráfico de 
barras, só mudamos o tipo de gráfico. Nesse caso, vamos na opção Inserir > Gráficos > 
Histograma. Como exemplo, vamos considerar o histograma feito no Excel exposto na 
figura abaixo. 
 
 
Precipitação (mm) em 15 cidades no mês de agosto. Fonte: elaborada pelo autor (2021). 
Vimos então como lidar com gráficos de barras e com o histograma. No entanto, temos 
um terceiro tipo de gráfico que é de suma importância para variáveis qualitativas 
nominais, que é o gráfico de setores. Esse tipo de gráfico é a representação gráfica da 
frequência relativa (percentagem) de cada categoria da variável qualitativa (NETO, 
2006). E no Excel, como fazemos esse tipo de gráfico? Ora, trabalhamos como nos 
anteriores, Inserir > Gráfico > Pizza 2D, nessecaso. Como exemplo, vamos considerar a 
representação dos dados de duas espécies de plantas descritos na tabela a seguir 
 
 
Dados relativos a duas espécies de plantas e suas respectivas porcentagens em um dado estudo biológico. 
Fonte: elaborada pelo autor (2020). 
 
 
Gráfico de setores do número de plantas de espécies carnívoras e não carnívoras em uma determinada 
região. Fonte: elaborada pelo autor (2021). 
Um outro tipo de gráfico popular é o de linhas. É um tipo de gráfico que exibe 
informações de uma série temporal em que os valores do eixo x representam a escala de 
tempo e os valores do eixo y os dados observados. Os pontos são ligados por segmentos 
de reta (MAGALHÃES, 2002). E como fazemos no Excel? Da mesma forma que os 
anteriores, Inserir > Gráfico > Gráfico de linhas. Como exemplo, considere a 
concentração de nitrogênio no decorrer dos anos em um determinado rio, conforme a 
figura abaixo. 
 
 
Concentrações de nitrogênio em um determinado rio nos últimos anos. Fonte: elaborada pelo autor 
(2021). 
Agora, para encerrar nosso estudo de gráficos e tabelas, vamos considerar o boxplot, 
que é gráfico utilizado para avaliar a distribuição empírica dos dados e é extremamente 
comum em pesquisas médicas, por exemplo. Esse gráfico é, basicamente, formado pelo 
primeiro e terceiro quartil e pela mediana. No Excel, trabalhamos da mesma forma que 
nos anteriores, Inserir > Gráfico > Boxplot. Como exemplo, vamos trabalhar com as 
concentrações de chumbo no sangue de pacientes de um determinado hospital após 
sofrerem um acidente de trabalho em uma mina. As concentrações (em μg/ml) de cada 
paciente estudado são dadas por: 15.2; 10.5; 20.1; 14.2; 13.2; 15.8; 15.7; 14.2; 11.5; 
17.8; 18.5. Utilizando-se o Excel, o gráfico dessa situação é dado pela figura abaixo. 
 
 
Boxplot das concentrações de chumbo no sangue de pacientes após um acidente de trabalho em uma 
mina. Fonte: elaborada pelo autor (2021). 
E com isso encerramos nossa aula sobre tabelas e gráficos, que são as ferramentas 
essenciais quando trabalhamos com estatística. Lembre-se sempre de usá-los quando 
você estiver atuando em sua área de trabalho! 
 
 
Conclusão 
Visto que a natureza da variável é quantitativa contínua, devemos pensar em gráficos 
relacionados com essa variável. Uma outra coisa deve ser levada em conta também, a 
escala temporal. Isto é, a ideia é avaliar as vendas do último trimestre nos últimos 10 
anos da empresa, então temos uma escala temporal de 10 anos, uma observação por ano. 
Isso nos define um tipo de gráfico chamado gráfico de linha, que nos traz a informação 
de uma variável quantitativa contínua em escala temporal, como podemos ver, por 
exemplo, na figura abaixo. 
 
Exemplo de gráfico de linha para variáveis em escala temporal. Fonte: elaborada pelo autor (2021). 
Podemos interpretar esse gráfico da seguinte maneira: o lucro da empresa sofreu uma 
alta nos anos de 2011 e 2017, sendo a maior alta em 2017, e uma queda brusca entre 
2011 e 2012. Embora entre 2012 e 2017 a empresa estava se recuperando, em 2018 ela 
teve outra queda brusca e o menor lucro dos 10 anos considerado na análise. Voltou a 
crescer em 2019, chegando próximo ao valor do lucro obtido no ano de 2010 somente 
no ano de 2020, após a queda de 2018. 
 
 
 
 
 
 
 
 
 
 
Unidade 4 - Aula 2 - Probabilidade 
 
Introdução da Aula 
Qual é o foco da aula? 
Nesta aula, você estudará sobre interpolação. 
Objetivos gerais de aprendizagem 
Ao final desta aula, você será capaz de: 
 descrever as técnicas de contagem da probabilidade; 
 calcular probabilidade condicional; 
 aplicar distribuições de probabilidade para variáveis discretas e contínuas; 
Situação-problema 
Estudante, nesta aula iremos entender o conceito de probabilidade e o que são as 
distribuições de probabilidade. Tais conceitos são fundamentais quando trabalhamos, 
por exemplo, com modelagem ou, até mesmo, previsão de lucros de uma empresa. 
Como exemplo dessa abordagem, imagine que você tenha interesse em saber, em 
média, quanto tempo irá demorar para o seu maquinário falhar para saber quando será 
necessário trocar e se programar com o orçamento. Para fazer isso, você deve considerar 
a distribuição de probabilidade do tempo de falhar e trabalhar com a média dessa 
distribuição. Percebe a importância desse conteúdo? 
Os acidentes industriais, na atualidade, embora reduzidos, ainda são um problema 
complexo para muitas indústrias. Pensando nisso, você foi contratado para estimar a 
probabilidade de acidentes anuais de uma determinada empresa. A única informação 
que o dono da empresa lhe passou foi de que a chance de um único trabalhador se 
envolver em um acidente é de aproximadamente 0,00024 e que a empresa tem muitos 
trabalhadores. Como você faria para estimar esse número? Como você pode interpretar 
esse resultado? 
Que tal começar esse entendimento agora? Você será acompanhado em todo o processo! 
Iniciaremos com os conceitos básicos de probabilidade e, depois, passaremos para as 
distribuições de probabilidade. 
 
Conceito de probabilidade e Variável aleatória 
Antes de começar nossos estudos, vamos relembrar um pouquinho da história da 
probabilidade. De acordo com o contexto histórico, acredita-se que a teoria da 
probabilidade que conhecemos hoje teve seu início com os matemáticos franceses 
Blaise Pascal (1623-1662) e Pierre Fermat (1601-1665) em estudos sobre jogos de 
dados, em que o objetivo era determinar a probabilidade exata (NETO, 2006). 
De acordo com Magalhães (2002), na literatura, há três interpretações do conceito de 
probabilidade: a frequentista, a clássica e a subjetiva. Ele é válido para o conceito de 
experimentos, que são classificados em aleatórios e determinísticos. 
 
______ 
• Assimile 
 
______ 
Pronto, agora sabemos o que é uma probabilidade no sentido matemático. Como a 
calculamos, é com base nas interpretações frequentista, clássica e subjetiva 
supracitadas. O nosso foco agora é, a partir desse conceito, definir o que é uma 
distribuição de probabilidade. Mas antes necessitamos de alguns conceitos preliminares 
que são de suma importância, como a regra da adição. 
Regra da adição (MAGALHÃES, 2002): sejam A, B∈Λ. Então P(A∪B) = P(A) + 
P(B) − P(A∩B). Por outro lado, se A e B são eventos mutuamente exclusivos, a 
probabilidade P(A∪B) se reduz a P(A∪B) = P(A) + P(B). 
Com a regra da adição em mãos, temos ferramentas para definir a probabilidade 
condicional. Antes de fazer essa definição, vamos a uma questão: por que necessitamos 
de probabilidade condicional? Ora, em algumas situações, a probabilidade necessita ser 
reavaliada sempre que novas informações se tornam disponíveis e essa nova informação 
pode causar algum tipo de interferência no resultado anterior. Nessa situação, 
trabalhamos então com a chamada probabilidade condicional. 
 
• Exemplificando 
 
Isto é, como (PA∣B)=0,33 e sabendo que a face foi menor ou igual a 3, temos evidências 
de que a chance de sair par é improvável de acontecer. 
______ 
Bom, definimos a nossa primeira regra, a regra da adição, que foi base para a 
probabilidade condicional. Será que existem outras regras que são bases para outros 
tipos de probabilidade? A resposta é sim. Vamos trabalhar com a regra da 
multiplicação, que é base do famoso teorema de Bayes. 
 
A partir dessa regra, podemos definir dois teoremas de suma importância no contexto de 
probabilidade: o teorema da probabilidade total e o teorema de Bayes. Esses dois 
teoremas são a base do que chamamos de inferência bayesiana. Vamos à definição 
deles? 
 
 
Uma das principais aplicações do tão famoso teorema de Bayes é em análises clínicas 
no contexto de teste de diagnósticos, em que o objetivo é definir os falsos positivos e 
falsos negativos, a fim de encontrar um padrão-ouro. 
______ 
• Reflita 
Em que outras situações você acha que o teorema de Bayes pode ser aplicado? Existecondições especiais para essa aplicação? 
Bom, fizemos então um resumo dos principais conceitos de probabilidade que 
necessitamos para trabalhar com nossas distribuições de probabilidade. No entanto, 
ainda falta uma ferramenta essencial: a variável aleatória. O que é uma variável 
aleatória? No que consiste a ideia desse conceito? Basicamente, a ideia de variáveis 
aleatórias consiste no conceito de que é possível associar um número real a cada 
resultado no espaço amostral Ω. Matematicamente, podemos definir uma variável 
aleatória como: 
 
Certo, agora sim temos todas as ferramentas necessárias para lidar com as distribuições 
de probabilidade. Mas antes, vamos primeiro classificar as variáveis aleatórias. Lembra-
se de que tínhamos dois tipos de dados quantitativos, discretos ou contínuos? Pois 
então, temos a mesma classificação para variáveis aleatórias. 
 
e obedece às seguintes propriedades: 
 
Uma vez que sabemos o que é uma função de distribuição acumulada, podemos calcular 
a função densidade de probabilidade. No entanto, devemos tomar cuidado com essa 
função já que ela possui definições diferentes dependendo da natureza da nossa variável 
aleatória. Por exemplo, se X é uma variável aleatória discreta, então a função de 
probabilidade é definida como P(X=x)=F(x)−F(x+1). Por outro lado, se X é uma 
variável aleatória contínua, então a função densidade de probabilidade é descrita como 
 
É importante destacar também que o nome “função densidade de probabilidade” muda 
de acordo com a natureza da variável aleatória justamente para diferenciar as duas, tudo 
bem? 
 
Distribuição de probabilidade 
Bom, definimos as duas funções fundamentais para determinar uma distribuição de 
probabilidade. Vamos começar então? Iremos dividir as distribuições de probabilidade 
em dois grupos: contínuas e discretas, iniciando-se pelas discretas. Vale a ressalva que, 
neste texto, nosso enfoque será entender a equação da distribuição, e não detalhá-la 
matematicamente. 
A primeira distribuição de probabilidade discreta que vamos estudar é a distribuição de 
Bernoulli. Essa distribuição, em particular, trata de uma variável em que se observa 
apenas dois tipos de probabilidade: sucesso e fracasso. Matematicamente, podemos 
defini-la como: 
Distribuição de Bernoulli (MAGALHÃES, 2002): seja X uma variável aleatória 
discreta com as seguintes características: 
x: Sucesso, se x = 1 
x: Fracasso, se x = 0 
Logo, a função de probabilidade que caracteriza X é descrita por 
 
A distribuição de probabilidade de X é conhecida como distribuição de Bernoulli com 
parâmetro e função de probabilidade dada pela expressão anterior. Se X~Bernoulli(ρ), 
então E(X) =ρ e Var(X) = 1 −ρ, em que E(X) representa a média da distribuição e 
Var(X) a variância da distribuição. 
A segunda distribuição discreta que vamos trabalhar é a distribuição binomial. Ela é 
basicamente uma generalização da distribuição de Bernoulli, aqui estamos interessados 
em n sucessos. Matematicamente, essa distribuição pode ser definida como: 
Distribuição Binomial (MAGALHÃES, 2002): seja X uma variável aleatória discreta, 
tal que X conta o número de tentativas que resultam em um sucesso em n tentativas. 
Nesse caso, a distribuição de probabilidade de X é conhecida como distribuição 
binomial com parâmetro ρ e função de probabilidade caracterizada por: 
 
A terceira distribuição de probabilidade discreta mais famosa é a distribuição 
geométrica, diferente das duas anteriores, nosso interesse aqui é trabalhar com o número 
de fracassos até o primeiro sucesso. Matematicamente, ela pode ser definida como: 
Distribuição geométrica (MAGALHÃES, 2002): seja X uma variável aleatória 
discreta, tal que X conte o número de fracassos anteriores ao primeiro sucesso. Nesse 
caso, a distribuição de probabilidade de X é conhecida como distribuição geométrica 
com parâmetro ρ e tem função de probabilidade escrita na forma: 
 
Por fim, a última distribuição discreta que vamos abordar neste texto é a distribuição 
de Poisson. Em comparação às outras três, a distribuição de Poisson não lida com 
fracasso e sucesso, mas sim com número de eventos em um dado intervalo de tempo. 
Matematicamente, essa distribuição pode ser definida como: 
 
Beleza, encerramos as distribuições de probabilidade discretas. Vamos então para as 
distribuições de probabilidade contínuas. Vamos dar início aos estudos dessas 
distribuições com a distribuição uniforme que trabalha com intervalos (a,b). 
Matematicamente, essa distribuição é definida como: 
Distribuição uniforme (MAGALHÃES, 2002): Dizemos que uma variável aleatória 
contínua X é distribuída uniformemente ao longo do intervalo (a,b) se sua função 
densidade de probabilidade é dada por: 
 
Uma segunda distribuição de probabilidade contínua extremamente conhecida é a 
distribuição beta, que é uma distribuição para lidar com dados no intervalo (0,1), como 
taxas sanguíneas que estão limitadas a esse intervalo. As principais aplicações dessa 
distribuição, em geral, são na área da saúde. Matematicamente, podemos definir a 
distribuição beta como: 
 
Para encerrar nossos estudos sobre distribuições contínuas, vamos trabalhar com três 
distribuições que são muito famosas, especialmente no contexto de teste de hipóteses, 
que são as distribuições qui-quadrado, t de Student e normal. Essas distribuições têm 
seus valores tabelados (que chamamos de Tabela da Normal, Tabela do Qui-Quadrado, 
Tabela t de Student), o que facilita o cálculo das probabilidades dessas distribuições. 
Mas o maior interesse nelas é, justamente, quando lidamos com testes de hipóteses em 
que precisamos decidir sobre uma hipótese (veremos mais sobre esses conceitos na 
Aula 3 desta unidade). Essas distribuições são definidas, matematicamente, como: 
Distribuição qui-quadrado (MAGALHÃES, 2002): uma variável aleatória contínua 
X segue uma distribuição qui-quadrado com ν graus de liberdade se sua função 
densidade for escrita na forma: 
 
Distribuição t de Student (MAGALHÃES, 2002): uma variável aleatória contínua X 
tem distribuição t de Student com ν graus de liberdade se sua função densidade de 
probabilidade é dada por: 
 
 
e é conhecida como distribuição normal padrão. Nesse caso, dizemos que X~N(0,1). 
Para transformar uma variável da distribuição normal para a distribuição normal padrão, 
utilizamos a seguinte equação: 
 
que é chamada de normalização padrão da variável e Z segue uma distribuição normal 
padrão. Com isso, então, fechamos o nosso conteúdo sobre probabilidade e distribuições 
de probabilidade. Agora é hora de colocar a mão na massa e trabalhar com esses 
conceitos! 
 
Conclusão 
Veja que o problema em questão envolve contagem e tempo, visto que são acidentes 
anuais. Naturalmente, esse problema seria trabalhar com a questão de sofrer ou não um 
acidente que remete à distribuição binomial, porém ela pode se tornar complexa devido 
ao grande número de funcionários. Nesse caso, trabalhamos com a aproximação da 
distribuição binomial para a distribuição de Poisson, em que tiramos que o parâmetro λ 
é estimado por: 
λ=np 
Em que n é o número de trabalhadores e p é a probabilidade de um único trabalhador se 
envolver em um acidente. Vamos supor que nessa empresa tenha 100.000 trabalhadores. 
Nesse caso, temos que: 
 
Isso quer dizer que, em média, o número de trabalhadores envolvidos em acidentes seria 
de 24 trabalhadores anualmente. Assumindo que a distribuição de Poisson é 
recomendada para esses dados, temos que a probabilidade de nenhum trabalhador sofrer 
acidente é descrita por: 
 
Ou seja, a chance de ninguém sofrer acidente é muito baixa. Agora, a chance de mais do 
que 24 trabalhadores sofrer acidentes é descrita por: 
 
Isto é, a chance de mais de 24 trabalhadores sofrerem acidentes nessa empresa é de 
aproximadamente 44,6%. Conclusão, há poucas chances de um número X de 
trabalhadores não sofrerem acidente,mas há uma chance muito grande de, acima de um 
limiar, muitos trabalhadores sofrerem acidente. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Unidade 4 - Aula 3 - Métodos de tomada de decisão 
 
Introdução da Aula 
Qual é o foco da aula? 
Nesta aula, você estudará métodos de tomada de decisão. 
Objetivos gerais de aprendizagem 
Ao final desta aula, você será capaz de: 
 empregar hipótese estatística; 
 aplicar testes de hipóteses. 
 diferenciar teste de uma cauda e de duas caudas, teste t e teste z e testes 
referentes à proporção amostral; 
Situação-problema 
Estudante, nesta aula iremos entender como fazemos para tomar uma decisão com 
embasamento estatístico. Este é um dos tópicos mais importantes que você irá estudar 
nesta unidade, visto que a tomada de decisões faz parte do nosso cotidiano. 
Como exemplo dessa abordagem, considere que você precisa decidir sobre a eficácia de 
uma vacina. Após realizações de experimentos, você chega à seguinte hipótese: “a 
vacina é eficaz?”. Para saber como responder essa pergunta, você deve se basear em 
métodos estatísticos para fundamentar sua resposta, pois é com base nessa 
experimentação que você vai decidir se a vacina é ou não eficaz. 
Os níveis de colesterol, em geral, são indicadores de boa saúde. Em um dado estudo 
envolvendo adultos hipertensos e fumantes, o pesquisador-chefe lhe convidou para 
auxiliá-lo em um teste de hipóteses. Sabendo que o desvio-padrão populacional é 
descrito por 46 mg/ml, o pesquisador deseja testar a hipótese de que o nível médio de 
colesterol nessa população é de 211 mg/ml a partir de uma amostra de 12 adultos 
hipertensos e fumantes que têm como nível médio de colesterol cerca de 217 mg/ml ao 
nível de significância de 5%. Como você faria para auxiliar esse pesquisador? Qual tipo 
de teste você recomendaria para testar a hipótese dele? Qual seria o p-valor obtido no 
teste definido? 
Que tal começar esse entendimento agora? Você será acompanhado em todo o processo! 
Iniciaremos com os conceitos de hipóteses e, depois, passaremos para os métodos 
estatísticos para a tomada de decisões. 
 
Hipótese estatística e teste de hipótese 
Você já imaginou como são feitas as tomadas de decisões acerca de um medicamento? 
De um júri? Ou até mesmo de um material de construção? Não? Pois então, nesta se 
iremos trabalhar com os métodos que fundamentam a tomada de decisões com base em 
experimentação. Vamos começar com um pequeno exemplo antes de definir as 
condições para tomar uma decisão. 
Suponha que um certo indivíduo está sendo julgado por um certo crime. Naturalmente, 
o júri precisa decidir sobre a culpa ou não desse indivíduo, com base em fatos, 
testemunhas e leis. Nesse caso, então, duas hipóteses podem ser formuladas: 
H0: {o indivíduo é culpado} 
H1: {o indivíduo é inocente} 
A decisão por cada uma das hipóteses está sujeita a erros, é claro. Por exemplo, ao 
tomar a decisão por H0, o júri pode cometer um erro, uma vez que o indivíduo pode ser 
inocente. O mesmo vale se for tomada a decisão por H1. No entanto, na prática, uma 
das decisões deve ser tomada, mesmo com essa possibilidade de se cometer um erro. 
Então, sabendo das condições de erro, como fazemos para tomar a decisão mais 
coerente? Antes de responder essa questão, vamos a algumas definições importantes. 
A primeira definição que vamos trabalhar é com a de hipótese estatística, que é a base 
fundamental da tomada de decisões. Mas o que é uma hipótese estatística? Ora, uma 
hipótese estatística nada mais é do que qualquer tipo de afirmação que se faça sobre a 
distribuição de probabilidade de uma ou mais variável aleatória em que H0 representa a 
hipótese nula e H1 a hipótese alternativa. Certo, mas você deve estar se perguntando o 
que essa definição tem a ver com a questão exposta sobre o júri, por exemplo. Veja que, 
embora não foi citado, a distribuição de probabilidade no exemplo estava implícita. Em 
geral, trabalhamos com essas distribuições implicitamente nas questões práticas, quando 
o assunto é tomar uma decisão, isto é, elas funcionam, basicamente, como uma 
ferramenta. 
Certo, sabemos o que é uma hipótese. Precisamos entender agora o que é um teste de 
hipóteses. Em termos matemáticos, um teste de uma hipótese estatística é uma função 
de decisão d: X→ {a0, a1}, em que a1 corresponde à ação de considerar a hipótese H0 
como verdadeira, corresponde à de considerar a hipótese H1 como verdadeira e X é o 
espaço amostral associado à amostra X1, …, Xn (CASELLA; BERGER, 2010). 
______ 
• Assimile 
 
Certo, temos as hipóteses, mas como escrevemos a região de aceitação e região de 
rejeição que formam a base do teste de hipóteses? Para isso, vamos trabalhar com 
a distribuição de probabilidade da situação ilustrada. Logo, seja Xi a variável aleatória 
de Bernoulli que assume valor 1 se ocorrer cara no i-ésimo lançamento, e o valor 0 caso 
contrário, i = 1,2,3. Nesses termos, o espaço amostral X é descrito por: 
X={(0,0,0), (1,0,0), (0,1,0), (0,0,1), (0,1,1), (1,0,1), (1,1,0), (1,1,1)} 
Logo, podemos escrever a região de rejeição (ou crítica) para esse teste de hipóteses 
como: 
 
de modo que a região de aceitação seja: 
A0={(x1, x2, x3); x1+ x2+ x3< 2}. 
______ 
Bom, agora sabemos o que é uma hipótese, um teste de hipótese e como determinar a 
região crítica, porém, no início da aula falamos também sobre os possíveis erros ao se 
tomar uma decisão. Temos dois tipos de erros a considerar: o erro do tipo I e o erro do 
tipo II. O que significam esses erros? Ora, quando rejeitamos a hipótese nula quando de 
fato ela é verdadeira, estamos cometendo o que chamamos de erro do tipo I. Por outro 
lado, quando não rejeitamos a hipótese nula quando de fato ela é falsa, estamos 
cometendo erro do tipo II (CASELLA; BERGER, 2010). No geral, denotamos as 
probabilidades desses dois tipos de erro como α e β, respectivamente. 
Outro fator importante quando trabalhamos com testes de hipóteses é a função de risco, 
que vai determinar para nós a probabilidade dos erros do tipo I e tipo II. Mas antes de 
trabalhar com essa função, precisamos de uma definição da função de perda, que é a 
seguinte: 
 
Agora sim podemos trabalhar com a função de risco. Nesse caso, a função de risco que 
determina a probabilidade dos erros do tipo I e II, com base na função de perda, é dada 
por: 
 
Em que E representa o valor esperado (ou média). 
Certo, vimos muitas componentes sobre os testes de hipóteses, mas ainda faltam duas 
que são as mais usuais de aparecerem nos trabalhos científicos e nos trabalhos diários 
envolvendo testes de hipóteses: o nível de significância nominal e o nível descritivo do 
teste (ou p-valor). Vamos entender esses conceitos pelas definições a seguir: 
Nível de significância nominal de um teste de hipótese (CASELLA; BERGER, 
2010): é caracterizado pela probabilidade de se cometer o erro do tipo I. Em grande 
parte dos estudos, adota-se, em geral, o nível de significância α=0.05. 
Nível descritivo do teste, ou p-valor (CASELLA; BERGER, 2010): traduz a 
probabilidade de que a estatística do teste (como variável aleatória) tenha valor extremo 
em relação ao valor observado (estatística) quando a hipótese nula é verdadeira. Em 
outras palavras, sob o ponto de vista matemático, considere um teste de hipóteses no 
qual Rα é a região de rejeição com nível de significância α e suponha que, para 
diferentes valores de α, as regiões Rα e Rα1 satisfazem Rα⊂Rα1 com α<α1. Dessa forma, 
sob essas condições, o p-valor é definido por: p = p(X)=inf{α: X∈ Rα} em que X 
representa a amostra aleatória e inf é o ínfimo do conjunto. 
É importante destacar que com essa definição de p-valor, podemos reescrever a nossa 
definição anterior de região a fim de definir o que é poder do teste, que é um dos 
conceitos mais importantes quando se trabalha com teste de hipóteses. Nesse caso, o 
poder do teste pode ser definido como: 
 
______ 
 
 
•Exemplificando 
 
 
Hipótese simples, teste ótimo e lema de Neyman-Pearson 
Agora já sabemos trabalhar com testes de hipóteses! Antes de ir para os tipos de testes 
mais comuns da prática cotidiana, vamos trabalhar com mais três conceitos para fechar 
esse aparato teórico. Tais conceitos são: hipótese simples, teste ótimo e, finalmente, o 
lema de Neyman-Pearson. O lema de Neyman-Pearson é o que nos assegura a 
construção de qualquer tipo de teste de hipóteses, isto é, é o resultado mais importante e 
fundamental desse contexto teórico. Mas vamos começar com a hipótese simples. 
 
A partir dessa definição e da definição da função de verossimilhança de uma 
distribuição de probabilidade (ver Casella; Berger, 2010), podemos definir o conceito de 
teste ótimo. 
 
Agora, com as definições de hipótese simples e teste ótimo, temos as ferramentas 
necessárias para enunciar o lema de Neyman-Pearson, que é um dos resultados mais 
importantes quando se fala de teste de hipóteses. 
Neyman-Pearson (CASELLA; BERGER, 2010): considere o teste com região crítica 
descrita por: 
 
 
Testes de hipóteses na prática 
Encerramos então a nossa primeira parte desta aula, que era a parte teórica a respeito 
dos testes de hipóteses. Agora, vamos trabalhar com alguns testes comuns na prática. O 
primeiro que iremos trabalhar é o teste Z. 
O teste Z para média é um teste estatístico baseado na distribuição normal para amostras 
grandes e desvio-padrão conhecido. Nesse caso, a estatística do teste é descrita por: 
 
O teste Z é um dos testes mais simples que temos para fazer comparação de médias, 
porém ele pode ser ruim quando trabalhamos com amostras muito pequenas e não 
aplicável quando não conhecemos o valor do desvio-padrão populacional. E como 
resolvemos se isso acontecer? Ora, nesse caso, temos um teste análogo ao teste Z, que é 
o teste t baseado na distribuição t de Student. Esse teste é utilizado, em geral, quando 
não conhecemos o valor do desvio-padrão populacional e a amostra é pequena. A 
estatística do teste é dada por: 
 
Além disso, podemos testar os mesmos tipos de hipóteses anteriores para o teste 
bicaudal e unicaudal. E quando temos duas médias, podemos trabalhar também com o 
teste t? Sim, podemos, porém há uma diferença em relação ao teste Z. Nesse caso, 
temos duas considerações: variâncias iguais e variâncias diferentes. No caso em que 
elas são iguais, a estatística do teste é dada por: 
 
E no caso em que elas são diferentes, a estatística do teste é dada por: 
 
Agora já sabemos como testar a média. Mas esse é o único tipo de teste que pode ser 
feito? Não, podemos trabalhar também com testes de proporção, além de outras 
medidas. Neste texto, nosso foco serão os testes de média e de proporção. Então, para 
encerrar nossa aula, vamos considerar o teste para proporção, que é baseado no teorema 
central do limite e no teste Z, com estatística de teste dada por: 
 
Como exemplo de aplicação desse teste, podemos testar hipóteses do tipo “um 
engenheiro garante que 95% dos seus projetos estão de acordo com as normas da 
ABNT” ou “uma empresa garante que é responsável por apenas 10% da contaminação 
de um determinado lago”, e assim por diante. E para duas proporções, também 
conseguimos trabalhar com esse teste? Sim, nesse caso, a estatística do teste é dada por: 
 
______ 
• Reflita 
No caso de proporções, você acha que é possível trabalhar com o teste t em vez do teste 
Z? Se sim, como você acha que ficaria a estatística do teste? 
______ 
Com isso fechamos o nosso conteúdo sobre testes de hipóteses, que são ferramentas 
fundamentais para lidar com a tomada de decisões. Agora é hora de colocar a mão na 
massa e trabalhar com esses conceitos. 
 
 
Conclusão 
A primeira coisa que devemos analisar é se o teste será unicaudal ou bicaudal. Na 
situação exposta, notemos que o nível médio de colesterol da subpopulação de 
hipertensos e fumantes pode ser maior ou menor do que o nível médio de colesterol 
considerado na hipótese de teste, então, nossa hipótese alternativa é descrita por: 
 
Isto é, estamos considerando um teste bicaudal nas condições do problema. A segunda 
observação que devemos ter em mente é de que o tamanho da amostra considerada é 
pequeno, o que nos indica que o teste t seria apropriado. No entanto, devemos notar 
também que o desvio-padrão populacional é conhecido, nossa terceira observação. 
Então, nesse caso, podemos utilizar o teste Z. Assim, após esses critérios, podemos 
recomendar ao pesquisador o uso do teste Z, que é baseado na estatística: 
 
Que, usando os dados do nosso problema, é dado por: 
 
Nesse caso, como Z segue a distribuição normal padrão, temos que o p-valor, ao nível 
de significância de 5% e com base na tabela da distribuição normal para teste bicaudal, 
é igual a 0,652. Como esse valor é maior do que 0,05, não rejeitamos a hipótese nula 
(ou de pesquisa). Ou seja, podemos concluir ao pesquisador que, baseado nessa 
amostra, não há evidências de que o nível médio de colesterol dessa população de 
fumantes hipertensos seja diferente de 211 mg/ml.

Mais conteúdos dessa disciplina