modelos tradicionais
50 pág.

modelos tradicionais


DisciplinaPlanejamento de Transporte Urbano e Uso do Solo2 materiais11 seguidores
Pré-visualização19 páginas
12 categorias diferentes. As taxas de viagens 
associadas a cada categoria são estimadas por métodos estatísticos e, assume-se 
que são constantes no tempo. Os valores das taxas de geração de viagens por 
categoria são obtidos a partir dos dados do ano-base. 
Taxa de viagem de uma categoria H: c
c
c H
Tt = , 
Onde 
\u2211= i cic TT - total de viagens da categoria 
\u2211= i cic HH - total de elementos da categoria 
Agregação por zona: \u2211= c cipcpi H.tT 
A principal característica deste tipo de modelagem está em escolher categorias que 
minimizem variância das taxas de viagem. Existem métodos estatísticos para este 
tipo de análise. 
As viagens futuras são estimadas a partir da projeção (exógena ao modelo) do 
número de residências por categoria em cada zona de tráfego, multiplicada pela 
taxa respectiva à categoria. 
Este tipo de modelo traz como vantagem a independência do zoneamento, 
permitindo relações diferentes para cada categoria definida; contudo, existe a 
perda da variância interna de cada categoria e dificuldades relativas às projeções 
das variáveis. Tem se encontrado alguns problemas na projeção da população e/ou 
de famílias por categorias, principalmente das categorias com tamanho da amostra 
reduzido. 
 
 
 
Carlos Eduardo de Paiva Cardoso \u2013 Engenheiro Eletrônico e Mestre em Transporte pela Escola Politécnica da Universidade de São 
Paulo (USP-SP) e Doutor em Serviço Social pela Universidade Pontifícia Católica de São Paulo (PUC-SP). Especialista de Transporte e 
Tráfego da CET-SP e Membro do Conselho Editorial da Revista de Transportes Públicos da ANTP - paivacardoso@yahoo.com.br 
 
Árvores de Decisão uma Alternativa a Problemas de Classificação 
A árvore de decisão é considerada a forma mais simples de representação das 
relações existentes em um conjunto de dados. Os dados são divididos em 
subgrupos, com base nos valores das variáveis. 
Os modelos de árvores fornecem uma alternativa a problemas de classificação de 
dados. Eles são ajustados por sucessivas divisões de dados com a finalidade de 
obter subconjuntos cada vez mais homogêneos. O resultado é uma árvore 
hierárquica de regras de decisão utilizadas para prever ou classificar. Defini-se 
variável resposta, ou dependente (por exemplo: viagem), aquela que se deseja 
prever ou classificar de acordo com variáveis preditoras ou independentes, 
potencialmente relacionada à primeira. 
O algoritmo ID3, desenvolvido por Ross Quinlan (Sydney,1983) - considerado o pai 
das árvores de decisão \u2013 e suas evoluções procuram encontrar na base de dados as 
variáveis preditoras mais importantes, ou seja, aquelas que fornecem máxima 
segregação dos dados. 
Uma árvore de decisão tem as seguintes propriedades: (1) há um nó chamado raiz, 
que contem todo o banco de dados; (2) este nó contém dados que podem ser 
subdivididos dentro de outros sub-nós chamados de nós filhos; (3) existe um único 
caminho entre o nó raiz e cada nó da árvore; (4) quanto os dados do nó não 
podem ser mais subdivididos em um outro sub-conjunto ele é considerado um nó 
terminal ou folha. 
As vantagens deste método são: (1) consideram as variáreis de maior relevância 
para a segmentação dos dados; (2) são facilmente compreensíveis; (3) permitem 
aos usuários visualizar diretamente quais os fatores que mais influenciam suas 
classificações ou previsões, pois representam as variarias em ordem de 
importância. 
Algoritmos utilizados para desenvolvimento de árvores de decisão são: C4.5 
(evolução do ID3 \u2013 Quinlan, 1993), CHAID (Kass, 1980) e CART (Breiman et al., 
1984). 
2.1.1.4 Modelo de Regressão 
A utilização deste método visa construir uma relação linear (ou não) entre o 
número de viagens existentes (variável dependente) e os vários fatores que 
influenciam as viagens (variáveis independentes). A forma mais freqüente é o 
Modelo de Regressão Múltipla: 
\u2022 Com dados totais da zona \u2013 agregado 
iiii XXY \u395++++= ..... 22110 \u3b8\u3b8\u3b8 
Onde: 
Y
i
 - variável dependente (número de viagens) 
 
 
 
Carlos Eduardo de Paiva Cardoso \u2013 Engenheiro Eletrônico e Mestre em Transporte pela Escola Politécnica da Universidade de São 
Paulo (USP-SP) e Doutor em Serviço Social pela Universidade Pontifícia Católica de São Paulo (PUC-SP). Especialista de Transporte e 
Tráfego da CET-SP e Membro do Conselho Editorial da Revista de Transportes Públicos da ANTP - paivacardoso@yahoo.com.br 
 
X
li 
- variáveis independentes (fatores sócio-econômicos e de uso do solo); 
\u3b8
i
 - parâmetros estimados pelo modelo. 
\u2022 Com Médias (por família, população, residência) \u2013 desagregado 
ii22i110i e...x.x.y ++\u3b8+\u3b8+\u3b8= 
 
com 
 
Onde : 
iH = número de famílias na zona i (ou pessoas) 
As características destes modelos: (1) os coeficientes e constantes são encontrados 
por calibração para o ano base, utilizando-se o modelo de regressão linear e dados 
de todas as zonas; (2) algumas variáveis explicam melhor as viagens atraídas, 
outras as produzidas; (3) a variável dependente (Y) pode dar uma estimativa das 
viagens produzidas (P
i
), ou atraídas (A
j
), na zona i, se este é um modelo que utiliza 
dados agregados; ou uma taxa de produção (atração) de viagens por tipo de 
residência, se este é um modelo desagregado de base residencial; (4) usualmente 4 
variáveis independentes no máximo são suficientes; (5) cada termo da equação de 
regressão pode ser interpretado como uma contribuição da variável independente 
para a variável dependente. 
Critérios de escolha das variáveis dependentes: (1) devem estar linearmente 
relacionadas com a variável independente; (2) devem estar altamente 
correlacionadas com a variável independente; (3) não devem estar altamente 
correlacionadas com outra variável dependente; (4) devem ser facilmente 
projetadas para o futuro. 
Para modelos agregados as seguintes variáveis podem ser consideradas: (1) na 
produção de viagens: renda, propriedade de veículos, número de residências (área 
de ocupação do solo), número de pessoas empregadas, população ou densidade 
populacional e número de pessoas em idade escolar; (2) na atração de viagens: 
área destinada à indústria, ao comércio e outros, número de empregos, matrículas 
escolares e acessibilidade. 
2.1.2 Distribuição de Viagens 
Uma vez definido o número de viagens produzidas ou atraídas nas Zonas de 
Tráfego que compõem a área em estudo, o passo seguinte é a determinação da 
origem e do destino dos movimentos interzonais futuros (distribuição das futuras 
viagens entre zonas de origem e destino). 
Os modelos de distribuição de viagens de modo genérico podem ser definidos pela 
seguinte expressão: 
i
i
i H
Yy =
, i
ki
ki H
Xx =
e i
i
i H
e \u395=
 
 
 
Carlos Eduardo de Paiva Cardoso \u2013 Engenheiro Eletrônico e Mestre em Transporte pela Escola Politécnica da Universidade de São 
Paulo (USP-SP) e Doutor em Serviço Social pela Universidade Pontifícia Católica de São Paulo (PUC-SP). Especialista de Transporte e 
Tráfego da CET-SP e Membro do Conselho Editorial da Revista de Transportes Públicos da ANTP - paivacardoso@yahoo.com.br 
 
 
Onde t
ij
 representa o número de viagens entre i e j no intervalo de tempo 
considerado. 
Os modelos de distribuição de viagens podem ser grupados da seguinte forma: (1) 
Modelos de fator de Crescimento: método do crescimento uniforme, método do 
crescimento médio, Método de Fratar e Método de Furness; (2) Modelos 
Gravitacionais. 
2.1.2.1 Modelos de Fator de Crescimento 
Os modelos de fator de crescimento têm a seguinte forma geral: 
 
Onde: 
t\u2019ij = número de viagens futuras entre as zonas i e j; 
fij = fator de expansão; 
tij = número de viagens atuais entre as zonas i e j 
A aplicação deste método se baseia na existência de uma matriz de origem e 
destino das viagens no ano base (viagens atuais) e sua grande vantagem