Buscar

TCC_ITAMAR_REVISADOV4_(1)[1]


Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 67 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 67 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 67 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

MINISTÉRIO DA EDUCAÇÃO
FUNDO NACIONAL DE DESENVOLVIMENTO DA EDUCAÇÃO
SECRETARIA DE EDUCAÇÃO PROFISSIONAL E TECNOLÓGICA
INSTITUTO FEDERAL DE EDUCAÇÃO, CIÊNCIA E TECNOLOGIA BAIANO – CAMPUS CATU
ITAMAR SERENO MOREIRA JUNIOR
VIEW SAFE: 
RECONHECIMENTO AUTOMATIZADO DE EPI´S EM AMBIENTES INDUSTRIAIS COM INTELIGÊNCIA ARTIFICIAL ATRAVÉS DE CÂMERAS DE SEGURANÇA.
CATU- BA
2023
ITAMAR SERENO MOREIRA JUNIOR
VIEW SAFE: 
RECONHECIMENTO AUTOMATIZADO DE EPI´S EM AMBIENTES INDUSTRIAIS COM INTELIGÊNCIA ARTIFICIAL ATRAVÉS DE CÂMERAS DE SEGURANÇA.
Trabalho de Conclusão de Curso apresentado ao Instituto Federal de Educação, Ciência e Tecnologia Baiano-Campus Catu ligado ao Ministério da Educação, como requisito parcial para a obtenção do título de Tecnólogo em Análise e Desenvolvimento de Sistemas.
Orientador: Dr. André Luiz Andrade Rezende
Co-orientador: Dr. Romero Mendes Freire Júnior
CATU - BA
2023
Ficha Catalográfica
ITAMAR SERENO MOREIRA JUNIOR
VIEW SAFE:
RECONHECIMENTO AUTOMATIZADO DE EPI´S EM AMBIENTES INDUSTRIAIS COM INTELIGÊNCIA ARTIFICIAL ATRAVÉS DE CÂMERAS DE SEGURANÇA.
Trabalho de Conclusão de Curso apresentado ao Instituto Federal de Educação, Ciência e Tecnologia Baiano–Campus Catu ligado ao Ministério da Educação como requisito parcial para obtenção do Título de Tecnólogo em Análise e Desenvolvimento de Sistemas.
APROVADA EM .......... / ........... / ..............
BANCA EXAMINADORA
_______________________________________
Título. Nome do Professor
Nome da Instituição
______________________________________
Título. Nome do Professor
Nome da Instituição
Dr. André Luiz Andrade Rezende
Orientador
Dr. Romero Mendes Freire de Moura Júnior
Coorientador
CATU - BA
2023
DEDICATÓRIA
Dedico este trabalho a todos que acreditaram em mim, mesmo quando eu duvidei de mim mesmo. Vocês são a razão pela qual persisti e alcancei este marco.
AGRADECIMENTOS
Primeiramente, gostaria de expressar minha profunda gratidão aos meus professores, que não apenas compartilharam seu vasto conhecimento, mas também me orientaram, motivaram e inspiraram durante toda a minha jornada acadêmica. A dedicação, paciência e comprometimento de vocês foram fundamentais para a realização deste trabalho.
Aos meus colegas de trabalho, agradeço pelo companheirismo, apoio e pelos momentos compartilhados. Cada discussão, brainstorm e feedback contribuíram imensamente para o meu crescimento pessoal e profissional. Vocês tornaram os desafios mais suportáveis e as conquistas mais gratificantes.
Também gostaria de agradecer a todos que, direta ou indiretamente, contribuíram para a conclusão deste trabalho. Cada gesto, palavra de encorajamento e conselho desempenharam um papel crucial em minha trajetória.
“A tecnologia, quando usada para o bem, tem o poder de melhorar a vida das pessoas.”
 - Bill Gates
MOREIRA JUNIOR, Itamar Sereno. VIEW SAFE: Reconhecimento Automatizado de EPI’s em Ambientes Industriais com Inteligência Artificial Através de Câmeras de Segurança. ___p. Trabalho de Conclusão de Curso (Tecnólogo em Análise e Desenvolvimento de Sistemas) Instituto Federal de Educação, Ciência e Tecnologia Baiano – Campus Catu, Catu, BA, 2023.
Resumo
Palavras-Chave: 
MOREIRA JUNIOR, Itamar Sereno. VIEW SAFE: Automated Recognition of PPE in Industrial Environments with Artificial Intelligence through security cameras. ___ p. Work Course Conclusion (Technologist in Systems Analysis and Development) Federal Institute of Education, Science and Technology Baiano - Campus Catu, Catu, BA, 2023.
Abstract
Keywords: Inteligência Artificial, Reconhecimento de Imagem, Equipamentos de Proteção Individual, Segurança no Trabalho, Monitoramento Industrial, Câmeras de Segurança, Automação Industrial, Normas Regulamentadoras, Segurança Ocupacional, Tecnologias de Vigilância.
LISTA DE FIGURAS
LISTA DE TABELAS
LISTA DE SIGLAS
A Internet das Coisas (IOT)
Associação Brasileira para a Prevenção de Acidentes (ABPA).
Equipamentos de Proteção Individual (EPI’s)
Inteligência Artificial (IA)
Normas Regulamentadoras (nrs)
Organização Internacional do Trabalho (OIT)
Organização Mundial da Saúde (OMS)
Programas de Controle Médico de Saúde Ocupacional - PCMSO
Reconhecimento inteligente de caracteres (ICR)
Reconhecimento óptico de caracteres (OCR)
Redes neurais convolucionais (CNN)
Redes Neurais Recorrentes (RNN)
Redes Neurais Residuais (RESNET)
Região de Interesse (ROI).
Tomografia computadorizada (TC)
SUMÁRIO
1. INTRODUÇÃO	13
2. REFERENCIAL TEORICO 15
 2.1 SEGURANÇA DO TRABALHO	15
2.2. Tecnologia para reconhecimento de EPIs de forma automatizada	30
3. INTELIGÊNCIA ARTIFICIAL E SUAS TECNOLOGIAS	33
3.1. Visão Computacional	34
3.2. Aprendizado de Máquina	39
3.3. Detecção de Objetos	46
3.4. Classificação de Imagens	47
4. METODOLOGIA	52
4.1 Prototipação	52
4.2 Codificação	52
4.3 Testes	52
4.4 Procedimentos de Análise dos Dados	52
5 RESULTADOS E DISCUSSÃO	53
6 CONCLUSÃO	54
7 CONSIDERAÇÕES FINAIS	55
REFERÊNCIAS	56
APÊNDICES	58
ANEXOS	59
	
1. INTRODUÇÃO
O projeto VIEW SAFE surge em resposta a um desafio crucial na indústria: como garantir a segurança dos trabalhadores por meio da verificação automatizada do uso adequado de Equipamentos de Proteção Individual (EPIs) em ambientes industriais. A identificação manual dos EPIs pode ser custosa e ineficiente, muitas vezes impossibilitando a detecção imediata de não conformidades e aumentando os riscos de acidentes. Diante desse contexto, a aplicação de inteligência artificial e visão computacional em imagens de câmeras de segurança se apresenta como uma solução promissora.
O cerne do problema reside na complexidade de reconhecer e validar a presença correta dos EPIs por meio de imagens obtidas por câmeras. Este desafio não apenas demanda precisão na identificação dos equipamentos, mas também a capacidade de diferenciar entre seu uso adequado e inadequado em um ambiente industrial dinâmico e diversificado.
Nesse sentido, o objetivo principal do projeto VIEW SAFE é explorar e desenvolver tecnologias capazes de reconhecer automaticamente os EPIs em ambientes industriais através de imagens capturadas por câmeras de segurança. Essa abordagem visa não somente otimizar a identificação dos equipamentos, mas também garantir que sejam utilizados de maneira correta pelos trabalhadores.
Ao automatizar esse processo, busca-se não apenas reduzir a sobrecarga de trabalho associada à verificação manual, mas principalmente elevar o nível de segurança nos ambientes industriais. A implementação bem-sucedida desse sistema proporcionará uma detecção mais rápida e precisa de não conformidades, permitindo a intervenção imediata e a prevenção de acidentes potencialmente graves.
Dessa forma, o projeto VIEW SAFE não apenas propõe uma solução tecnológica, mas também se apresenta como uma estratégia essencial para garantir ambientes de trabalho mais seguros e eficientes. Ao aplicar inteligência artificial e visão computacional para reconhecer de forma automatizada os EPIs, busca-se não só aprimorar a segurança dos trabalhadores, mas também contribuir significativamente para a prevenção de acidentes e para a otimização dos processos de conformidade em ambientes industriais.
1.1. Contextualização
A segurança no ambiente de trabalho é uma preocupação central em todos os setores industriais, com o objetivo fundamental de prevenir acidentes e proteger a saúde dos trabalhadores (OLIVEIRA, 2003). Nesse contexto, segundo o Instituto de Pesquisa Econômica Aplicada (IPEA), os Equipamentos de Proteção Individual (EPI’s) desempenham um papel crucial na garantia da segurança ocupacional. No entanto, assegurar o uso adequado desses EPI’s é um desafio constante e crítico, à medida que as estatísticas de acidentes e lesões ocupacionais continuam a ser preocupantes.No Brasil, o ano de 2022 testemunhou mais de 612,9 mil acidentes de trabalho, com trágicas 2.538 mortes de trabalhadores com carteira assinada (OIT, 2023). De acordo com o Ministério Público do Trabalho (MPT), na Bahia, apenas nos primeiros três meses de 2023, foram registrados 2.409 acidentes de trabalho, com 24 vítimas fatais. Além disso, segundo Aratu On (2023), conforme dados do MPT até julho de 2023, o estado já havia contabilizado 58 mortes devido a acidentes de trabalho, com mais de 7 mil pessoas feridas. Essas estatísticas alarmantes evidenciam a urgente necessidade de estratégias mais eficazes para monitorar e garantir o uso apropriado de EPIs.
É nesse cenário desafiador que a Inteligência Artificial (IA) surge como uma promissora ferramenta, destinada a automatizar o processo de identificação e monitoramento do uso de EPIs. Por meio de técnicas avançadas, a IA oferece a capacidade de detectar e corrigir o uso inadequado de EPI’s de maneira ágil e eficaz. Isso, por sua vez, contribui para aprimorar a segurança no ambiente de trabalho, mitigando o risco de acidentes graves e protegendo a integridade dos trabalhadores.
1.2. Problema
Como reconhecer Equipamentos de Proteção Individual (EPIs) em ambiente industrial de forma automatizada a partir de imagens obtidas por câmeras?
1.3. Hipótese
A utilização de Inteligência Artificial pode auxiliar o reconhecimento preciso e eficiente dos Equipamentos de Proteção Individual (EPIs) em ambiente industrial de forma automatizada a partir de imagens obtidas por câmeras.
1.4. Justificativa
A identificação correta e eficiente dos Equipamentos de Proteção Individual (EPIs) em ambientes industriais desempenha um papel fundamental na promoção da segurança e bem-estar dos trabalhadores, reduzindo o risco de acidentes e lesões graves. No entanto, o processo tradicional de inspeção manual dos EPIs apresenta limitações significativas, incluindo a demora na identificação, a possibilidade de erros humanos e a demanda por recursos consideráveis.
1.5. Objetivo Geral
Investigar como reconhecer de forma automatizada Equipamentos de Proteção Individual (EPIs) em ambiente industrial de forma automatizada a partir de imagens obtidas por câmeras.
1.6. Objetivos Específicos
A avaliação e comparação do desempenho da solução proposta em relação à detecção e reconhecimento de Equipamentos de Proteção Individual (EPIs) frente às abordagens tradicionais de inspeção manual têm como objetivo principal conduzir uma análise científica detalhada. Este processo inclui a quantificação da precisão e confiabilidade da detecção dos EPIs pela solução proposta, comparando-as com os resultados obtidos por métodos manuais.
A avaliação científica consistirá na mensuração das métricas de desempenho, como taxa de detecção, taxa de falsos positivos, tempo de identificação e precisão na identificação dos diferentes tipos de EPIs. Essa análise comparativa será realizada em variados contextos, contemplando diferentes condições de iluminação e ambientes, a fim de garantir a robustez e a generalização dos resultados.
Além disso, será conduzida uma análise de conformidade, verificando a capacidade da solução proposta em identificar não apenas a presença, mas também a correta utilização e posicionamento dos EPIs. Essa análise abordará a conformidade dos equipamentos em relação às normas de segurança, comparando a precisão da solução proposta com os resultados da inspeção manual.
A coleta de dados será realizada de forma sistemática e controlada, utilizando métodos estatísticos apropriados para analisar a significância dos resultados obtidos. Essa abordagem científica visa a fornecer evidências sólidas e conclusivas sobre a eficácia, confiabilidade e potencial vantagem da implementação da solução proposta em comparação com os métodos tradicionais de inspeção manual no contexto da detecção e reconhecimento de EPIs.
1.7 Trabalhos correlatos
O tema abordado pelos estudos de Nipun D. Nath, Amir H. Behzadan, Stephanie G. Paal e Venkata Santosh Kumar Deli, R. Sankarlal e Alberto Tomás é de extrema relevância no contexto da segurança no ambiente de trabalho, especialmente na indústria da construção. Ambos os trabalhos exploram a aplicação de técnicas avançadas de aprendizado profundo e visão computacional para a detecção e verificação automatizada do uso de Equipamentos de Proteção Individual (EPIs) por trabalhadores.
Os estudos buscam oferecer soluções inovadoras para um desafio crítico: garantir a conformidade dos trabalhadores com a utilização adequada de EPIs, como capacetes e coletes de segurança. Em um cenário onde acidentes graves são frequentemente associados à falta ou uso inadequado desses equipamentos, a automação da verificação de conformidade por meio de modelos de aprendizado de máquina representa um avanço significativo na mitigação de riscos.
Os resultados apresentados pelos estudos evidenciam o potencial dessas abordagens. A utilização de arquiteturas como You-Only-Look-Once (YOLO) e Redes Neurais Convolucionais (CNNs) demonstrou altos níveis de precisão na detecção e classificação dos EPIs, permitindo a identificação em tempo real da conformidade ou não conformidade dos trabalhadores.
Além disso, a capacidade de processamento em tempo real e a viabilidade para aplicação em dispositivos móveis tornam essas soluções não apenas eficazes, mas também acessíveis e práticas para implementação em ambientes industriais.
A contribuição desses estudos reside não apenas na eficiência dos modelos desenvolvidos, mas também na disponibilização dos conjuntos de dados anotados publicamente, como o Pictor-v3. Essa ação promove a colaboração e o avanço de pesquisas futuras na área, incentivando a inovação e a criação de novas aplicações para a segurança no ambiente de trabalho.
Em suma, os estudos apresentam uma perspectiva promissora para a automação da verificação de conformidade dos EPIs, representando uma importante evolução na busca por ambientes de trabalho mais seguros e na redução significativa de acidentes relacionados à falta de utilização adequada desses equipamentos de proteção.
2. referencial teórico
2.1 Segurança do Trabalho
A segurança do trabalho é um campo de estudo e prática fundamental que visa proteger a segurança e o bem-estar dos trabalhadores em diversos ambientes laborais (OLIVEIRA, 2003). Ela se tornou uma área de extrema importância devido ao aumento da consciência sobre os riscos associados ao trabalho e ao compromisso de reduzir acidentes e doenças ocupacionais (FIGUEIREDO JUNIOR, 2009).
Segundo Santos (p. 41, 2009), a segurança do trabalho é uma área que engloba diversas ciências e áreas como:
[...] Segurança, Higiene e Medicina do Trabalho, Prevenção e Controle de Riscos em Máquinas, Equipamentos e Instalações, psicologia na Engenharia de Segurança, Comunicação e Treinamento, Administração aplicada à Engenharia de Segurança, O Ambiente e as Doenças do Trabalho, Higiene do Trabalho, Legislação, Normas Técnicas, Responsabilidade Civil e Criminal, Perícias, Proteção do Meio Ambiente, Ergonomia e Iluminação, Proteção contra Incêndios e Explosões e Gerência de Riscos, Sociologia, etc. 
A Segurança do Trabalho é um campo que se originou durante a Revolução Industrial, um período caracterizado por transformações significativas na organização do trabalho. Antes desse período, as atividades laborais eram predominantemente nômades e baseadas na coleta de recursos (GIACOMASSA, 1999). Com o advento da Revolução Industrial, novas modalidades de trabalho, como o artesanato, surgiram, e posteriormente, a especialização em fábricas e indústrias tornou-se comum (COURA, 2012).
Segundo a Revista da Escola Nacional da Inspeção do Trabalho (2021), em 1700, o médico italiano Bernardino Ramazzini publicou a obra “De Morbis Artificum Diatriba” (Dissertação sobre as Doenças dos Trabalhadores), na qual descreveu aproximadamente cinquenta profissões distintas e associou as doenças correspondentes a cada uma delas. Com isso, Ramazzini introduziu o conceito de que as enfermidades podem estar relacionadas àocupação do trabalhador. Ele é reconhecido como o “Pai da Medicina do Trabalho” devido à relevância de sua obra.
No início da Revolução Industrial, no século XVIII, as condições de trabalho eram frequentemente precárias e perigosas, resultando em um grande número de acidentes e lesões. Os trabalhadores enfrentavam frequentemente jornadas de trabalho exaustivas, com maior ventilação e exposição a substâncias tóxicas sem proteção adequada (SILVA, 2010). A segurança do trabalho, na época, estava longe de ser uma prioridade.
No início da Revolução Industrial, as condições de trabalho eram extremamente precárias, com jornadas exaustivas e riscos significativos. O movimento sindical desempenhou um papel crucial na luta por melhores condições de trabalho. (Smith, p. 15. 2005).
Com o progresso da Revolução Industrial, as condições de trabalho tornaram-se cada vez mais desafiadoras, com jornadas exaustivas de até 14 horas por dia e a utilização de mão de obra barata, incluindo crianças (OLIVEIRA, 2015). Com o tempo, à medida que a industrialização se expandia, tornou-se evidente que medidas de segurança eram permitidas para proteger os trabalhadores (RODRIGUES, 2009). Diante desse cenário, segundo CARVALHO (2014), o Parlamento inglês aprovou em 1802 a “Lei de Saúde e Moral dos Aprendizes”, que estabelecia um limite de 12 horas de trabalho por dia, proibia o trabalho noturno e introduziu medidas de higiene nas fábricas. 
Figura 1 Uma rua em um bairro pobre de Londres (Dudley Street)
Fonte: Gravura de Gustave Doré. 1872.
Disponível em: https://vitruvius.com.br/revistas/read/arquitextos/17.202/6480 
No entanto, essa lei não foi devidamente cumprida, o que levou o Parlamento Britânico a criar a “Lei das Fábricas” em 1833. Segundo Arruda (2015), essa nova lei previa a inspeção nas fábricas, estabelecia que a idade mínima para o trabalho seria de nove anos, proibia o trabalho noturno para menores de 18 anos e limitava a jornada de trabalho a 12 horas diárias, sendo que essa não poderia exceder 69 horas semanais. 
O estabelecimento das primeiras leis de segurança contra acidentes, como na Alemanha em 1884, marcou o início da regulamentação efetiva da segurança do trabalho em nível governamental. (Jones, p.36, 2008).
Essas primeiras leis e regulamentações foram um marco importante na história da Segurança do Trabalho, pois reconheceram a necessidade de proteger os trabalhadores e estabeleceram medidas para garantir condições mais seguras nos ambientes laborais. A partir desse ponto, Bitencourt e Quelhas (2021) afirmam que o conceito de Segurança do Trabalho continuou a evoluir, resultando na criação de legislações mais abrangentes e na implementação de práticas e normas de segurança em todo o mundo.
No Brasil, segundo Oliveira (2003), a preocupação com a segurança do trabalho também ganhou destaque, levando à criação da primeira lei trabalhista do país, a Lei Eloy Chaves, em 1923. Essa lei dinâmica medidas de segurança e saúde no trabalho, bem como a regulamentação da jornada de trabalho. Segundo SILVA (2010), a Lei Eloy Chaves de 1923 foi um passo importante na história da segurança do trabalho no Brasil, estabelecendo regulamentações e medidas de proteção para os trabalhadores, é a origem da Previdência Social.
Segundo Oliveira (2003), a partir desse momento, a segurança no trabalho começou a receber atenção da comunidade científica, principalmente no campo da Medicina. Em 1931, Heinrich começou a promover o conceito de prevenção, buscando não apenas evitar acidentes, mas também reduzir os riscos de lesões. Com essa abordagem preventiva, começou-se a buscar a identificação e avaliação dos riscos inerentes a cada atividade, a fim de determinar as possíveis perdas e controlar os riscos (Figueiredo Júnior, 2009).
Um dos desenvolvimentos mais significativos na área de segurança do trabalho foi a criação da Organização Internacional do Trabalho (OIT) em 1919. A OIT se tornou um órgão internacional central na promoção de normas e regulamentos relacionados à segurança e saúde no trabalho em todo o mundo (RESENDE, 2014). Ela desempenhou um papel fundamental na formulação de convenções e recomendações que influenciam a legislação trabalhista em muitos países.
A criação da Organização Internacional do Trabalho em 1919 representou um marco importante na promoção de padrões internacionais de segurança do trabalho." (OIT, 2019). No entanto, foi somente em 1957, durante uma reunião da Organização Internacional do Trabalho (OIT) e da Organização Mundial da Saúde (OMS) em Genebra, que foram estabelecidos os objetivos para a Saúde Ocupacional (NOGUEIRA, 2005). Segundo Gomes, Vasconcellos e Machado (2018), esses objetivos incluem promover e manter o maior grau de bem-estar físico, mental e social dos trabalhadores em todas as ocupações, prevenir danos à saúde dos trabalhadores causados pelas condições de trabalho, proteger os trabalhadores contra riscos para a saúde, adequar o trabalho às capacidades fisiológicas e psicológicas do trabalhador e adaptar o trabalho ao homem e cada homem ao seu trabalho.
No Brasil, até 1930, existiam quatro leis relacionadas à Previdência Social dos trabalhadores (LUZ e SANTIN, 2011). Conforme Santos (2011), não havia uma legislação específica que tratasse exclusivamente da segurança e saúde no trabalho. Foi somente a partir desse período que começaram a surgir regulamentações mais específicas nessa área, com a criação de normas e leis voltadas para a proteção dos trabalhadores no ambiente laboral.
Até então, no Brasil, existiam cinco leis relacionadas aos trabalhadores:
· Decreto Legislativo nº 4.682/1923 - Lei Eloy Chaves - Criação da Previdência Social.
· Lei n.º 3724, de 15/01/19, que tratava dos acidentes de trabalho, tornando obrigatório o seguro contra risco profissional;
· Decreto n.º 16027, de 30/04/23, que criou o Conselho Nacional do Trabalho;
· Lei n.º 4682, de 24/01/23, que instituiu uma Caixa de Aposentadoria e Pensões;
· Lei n.º 5109, de 20/12/26, que estendeu o regime das Caixas de Aposentadoria às empresas portuárias.
No entanto, somente em 1941, impulsionada pelo setor privado, foi criada a Associação Brasileira para a Prevenção de Acidentes (ABPA). Foi nesse momento que a Segurança do Trabalho começou a ser abordada de uma maneira diferente (BITENCOURT e QUELHAS, 2021).
A Consolidação das Leis do Trabalho de 1943 foi um passo importante na consolidação das regulamentações trabalhistas e na promoção da segurança do trabalho no Brasil. O objetivo principal é regulamentar as relações individuais e coletivas do trabalho, nela previstas. Ela surgiu como uma necessidade constitucional, após a criação da Justiça do Trabalho. (Brasil, 1943).
No Brasil, a área de segurança do trabalho também viu avanços notáveis ​​com a promulgação da Consolidação das Leis do Trabalho (CLT) em 1943 (BRASIL, 1943). A CLT consolidou e expandiu as regulamentações trabalhistas, incluindo aquelas relacionadas à segurança e saúde no trabalho (LUZ e SANTIN, 2010). Este marco legal distribuiu uma base sólida para a proteção dos trabalhadores no país.
No entanto, apesar dos avanços na atualização e conscientização, a segurança do trabalho continua a enfrentar desafios importantes. Segundo Luz e Santin (2010), A diversidade de ambientes de trabalho, os riscos ocupacionais e a constante evolução da tecnologia exigem uma abordagem adaptável e atualizada para garantir a segurança dos trabalhadores.
Em 1972, como parte do Plano de Valorização do Trabalhador, os aspectos de higiene e segurança, juntamente com os serviços médicos, tornaram-se obrigatórios em todas as empresas com cem ou mais trabalhadores. Segundo o Ministério do trabalho e Previdência Social (2021), essa iniciativa representou um marco importante no contexto da legislação trabalhista, estabelecendo regulamentações mais rigorosas para proteger a saúde e a segurança dos trabalhadores. Além disso, essa medida refletiu um reconhecimento crescente da importância da segurança no trabalho e da saúde ocupacional como elementos fundamentais para o bem-estar dostrabalhadores e para o bom funcionamento das empresas. Ao tornar esses aspectos obrigatórios, o governo demonstrou um compromisso em melhorar as condições de trabalho e em reduzir os riscos associados às atividades laborais em ambientes industriais e comerciais de maior porte (BRASIL, 2021). Isso contribuiu significativamente para a promoção de ambientes laborais mais seguros e saudáveis em todo o país.
Em junho de 1978, foram aprovadas as Normas Regulamentadoras (NRs) no Brasil, que dizem respeito à Segurança e Medicina do Trabalho (LUZ e SANTIN, 2010). Essas normas possuem efeito de lei e obrigam as empresas a cumpri-las integralmente (MARZIALE et al, 2013). As NRs visam estabelecer requisitos mínimos de segurança e saúde no trabalho, visando a prevenção de acidentes e doenças ocupacionais. Elas abordam uma ampla gama de temas, como proteção contra incêndios, uso de equipamentos de proteção individual, prevenção de quedas, controle de substâncias perigosas, entre outros (BRASIL, 1978). O cumprimento das NRs é fundamental para garantir um ambiente de trabalho seguro e saudável para os trabalhadores
Figura 2 Livro segurança e medicina do trabalho
Fonte: https://www.catalivros.com.br/comprar/seguranca-e-medicina-do-trabalho/direto/2391
As Normas Regulamentadoras (NRs) constituem um conjunto de diretrizes e regulamentos estabelecidos pelo Ministério do Trabalho do Brasil, com o propósito de assegurar a integridade e o bem-estar dos trabalhadores em seus locais de trabalho. Essas normas desempenham um papel essencial na promoção de ambientes laborais seguros e saudáveis, abordando uma ampla variedade de questões relacionadas à segurança do trabalho, desde a utilização de equipamentos de proteção individual até a prevenção de riscos ocupacionais específicos. A criação e implementação das NRs refletem um compromisso governamental de regulamentar e monitorar as práticas laborais, garantindo que os trabalhadores estejam protegidos contra acidentes e exposição a riscos no ambiente de trabalho. Cada NR se concentra em uma área específica da Segurança do Trabalho, estabelecendo requisitos e procedimentos que as empresas devem seguir para cumprir as regulamentações em benefício dos trabalhadores e do próprio ambiente de trabalho. Essas normas desempenham um papel crucial na busca pela redução de acidentes, doenças ocupacionais e na melhoria das condições gerais de trabalho em todo o território brasileiro.
NR-1 (Disposições Gerais): Define o campo de aplicação de todas as Normas Regulamentadoras, bem como os direitos e obrigações do governo, empregadores e trabalhadores no que tange à segurança e medicina do trabalho.
NR-2 (Inspeção Prévia): Estipula as situações em que as empresas devem solicitar ao Ministério do Trabalho a realização de inspeção prévia em seus estabelecimentos, bem como a forma de sua realização.
NR-3 (Embargo ou Interdição): Determina as situações em que as empresas podem ter suas atividades, máquinas ou equipamentos paralisados, e estabelece os procedimentos a serem adotados pela fiscalização trabalhista.
NR-4 (Serviços Especializados em Engenharia de Segurança e em Medicina do Trabalho - SESMT): Exige que as empresas públicas e privadas que possuam empregados regidos pela CLT (Consolidação das Leis do Trabalho) organizem e mantenham em funcionamento o SESMT, com o objetivo de promover a saúde e proteger a integridade dos trabalhadores no local de trabalho.
NR-5 (Comissão Interna de Prevenção de Acidentes - CIPA): Requer que as empresas organizem e mantenham em funcionamento a CIPA, uma comissão composta exclusivamente por empregados, com o intuito de prevenir acidentes de trabalho e doenças ocupacionais.
NR-6 (Equipamentos de Proteção Individual - EPI): Define os tipos de EPIs que as empresas devem fornecer aos seus empregados, sempre que as condições de trabalho assim exigirem, visando proteger a saúde e a integridade física dos trabalhadores.
NR-7 (Programas de Controle Médico de Saúde Ocupacional - PCMSO): Exige a elaboração e implementação do PCMSO por todos os empregadores e instituições que admitem trabalhadores como empregados, com o objetivo de promover e preservar a saúde dos trabalhadores.
NR-8 (Edificações): Estabelece os requisitos técnicos mínimos que devem ser observados nas edificações para garantir a segurança e o conforto dos trabalhadores que nela atuam.
NR-9 (Programas de Prevenção de Riscos Ambientais - PPRA): Exige a elaboração e implementação do PPRA por todos os empregadores e instituições que admitam trabalhadores como empregados, com o objetivo de prevenir riscos ambientais no local de trabalho.
NR-10 (Instalações e Serviços em Eletricidade): Estabelece as condições mínimas de segurança para trabalhos envolvendo instalações elétricas, garantindo a proteção dos trabalhadores contra os riscos decorrentes da eletricidade.
NR-11 (Transporte, Movimentação, Armazenagem e Manuseio de Materiais): Estipula os requisitos de segurança a serem seguidos no transporte, movimentação, armazenagem e manuseio de materiais, visando prevenir acidentes e lesões aos trabalhadores.
NR-12 (Máquinas e Equipamentos): Define medidas de segurança para a utilização de máquinas e equipamentos, a fim de garantir a integridade física dos trabalhadores e prevenir acidentes.
NR-15 (Atividades e Operações Insalubres): Identifica as atividades e operações que são consideradas insalubres, devido à exposição dos trabalhadores a agentes nocivos à saúde, estabelecendo os limites de tolerância e as medidas de controle a serem adotadas.
NR-16 (Atividades e Operações Perigosas): Define as atividades e operações consideradas perigosas, devido à exposição dos trabalhadores a riscos elevados, e determina os direitos e as obrigações dos trabalhadores que exercem essas atividades.
NR-17 (Ergonomia): Estabelece parâmetros que visam adequar as condições de trabalho às características psicofisiológicas dos trabalhadores, de modo a proporcionar conforto, segurança e eficiência nas atividades realizadas.
NR-23 (Proteção contra Incêndios): Define as medidas de prevenção e combate a incêndios nas edificações e áreas de trabalho, a fim de proteger a vida dos trabalhadores e o patrimônio da empresa.
(Lei nº6.514, de 22 de dezembro de 1977)
Essas são apenas algumas das Normas Regulamentadoras existentes no Brasil (BRASIL, 2008). É crucial que as empresas e os trabalhadores estejam cientes dessas normas e as cumpram adequadamente para assegurar um ambiente de trabalho seguro e saudável.
“As Normas Regulamentadoras (NRs) desempenham um papel crucial na promoção da segurança do trabalho, estabelecendo padrões e regulamentações que buscam assegurar ambientes laborais seguros, mitigando riscos ocupacionais e contribuindo para a preservação da integridade dos trabalhadores em variados setores de atuação. ” (Ministério da Economia, s/d).
As NRs são fundamentais para a prevenção de acidentes e doenças ocupacionais, pois estabelecem requisitos mínimos de segurança e saúde no trabalho. Conforme Vilela et al (2015), as NRs abordam uma ampla gama de temas, como proteção contra incêndios, uso de equipamentos de proteção individual, prevenção de quedas, controle de substâncias perigosas, entre outros. 
"Para que as NRs sejam eficazes, é necessário que haja um compromisso contínuo por parte dos funcionários em fornecer um ambiente de trabalho seguro e que a fiscalização rigorosa para garantir a conformidade. A cooperação entre empregadores, trabalhadores e órgãos fiscalizadores desempenha um papel essencial na aplicação bem-sucedida dessas normas, assegurando um ambiente laboral verdadeiramente protegido." (Ministério do Trabalho, 2020).
No entanto, mesmo com a implementação dessas normas, ainda podem ocorrer acidentes e incidentes no ambiente de trabalho. É aqui que entra A Pirâmide de Bird, também conhecida como Pirâmide da Causa, é uma ferramenta conceitual frequentemente utilizada na segurança do trabalho e na análise de acidentes (ALMEIDA et al, 2014). Ela representa visualmente a relação entre os diferentes níveis de eventosque podem levar a acidentes no local de trabalho. Segundo Correa et al (2007), o modelo foi desenvolvido por Frank E. Bird Jr. na década de 1960 e foi amplamente adotado em ambientes industriais para compreender as causas subjacentes aos acidentes de trabalho.
Conforme Almeida et al (2014), a Pirâmide de Bird é estruturada em diferentes camadas, com cada camada representando uma etapa de eventos que pode levar a acidentes. Na base da pirâmide estão os “quase acidentes” ou “incidentes menores”, que são eventos não específicos, mas que têm o potencial de levar a acidentes mais graves se não forem identificados e corrigidos a tempo.
Conforme Schivani, Souza e Pereira (2018), a proporção da Pirâmide de Bird é de 1-10-30-600, ou seja, para cada 1 lesão séria haveria 10 lesões menores, 300 acidentes sem lesões, mas com perdas patrimoniais (danos a propriedade), e 600 incidentes ou quase acidentes. Isso nos mostra que, para cada acidente grave que ocorre, há um número muito maior de pequenos incidentes e quase acidentes que passam despercebidos.
Figura 3 Pirâmide de Bird
Fonte: Segurança do trabalho, 2018. Disponível em: https://segurancadotrabalhonwn.com/piramide-de-bird-entendendo-causa-dos-acidentes-de-trabalho/
Segundo Pássaro (1969), a Pirâmide de Bird destaca a importância de identificar e corrigir os eventos na base da pirâmide para prevenir acidentes mais graves. Ou seja, à medida que se sobem na pirâmide, os eventos tornam-se mais sérios e menos frequentes. Acima dos quase acidentes estão os “acidentes sem danos”, que resultam em danos materiais, mas não causam lesões aos trabalhadores. A próxima camada são os “acidentes com lesões leves”, seguidos por “acidentes com lesões graves” e, finalmente, no topo da pirâmide, estão os “acidentes fatais”, que resultam na perda de vidas.
A abordagem da Pirâmide de Bird, frequentemente utilizada em contextos de segurança do trabalho, fundamenta-se na premissa de que é possível prevenir a ocorrência de acidentes graves ao identificar e lidar com eventos na base da pirâmide, como quase acidentes e incidentes menores. A analogia da pirâmide representa graficamente essa relação, mostrando que há uma incidência muito maior de ocorrências menos graves em comparação com acidentes fatais. Isso sugere que muitos acidentes graves têm suas raízes em eventos anteriores que não foram adequadamente identificados ou tratados. Concentrando esforços na base da pirâmide, as organizações podem adotar medidas preventivas que evitam a escalada de incidentes, reduzindo assim a ocorrência de acidentes graves.
Além disso, a Pirâmide de Bird destaca a importância da análise de acidentes como ferramenta para identificar as causas raízes dos eventos. Através da investigação de quase acidentes e incidentes menores, as empresas podem identificar falhas nos processos, problemas de segurança e áreas que precisam de melhorias. Essa análise aprofundada proporciona às organizações a oportunidade de adotar medidas preventivas, solucionando as questões identificadas antes que evoluam para problemas mais graves.
Portanto, a Pirâmide de Bird vai além de ser uma simples representação gráfica, sendo uma abordagem completa que não se restringe à análise retrospectiva de acidentes, mas busca a prevenção proativa. Ela incentiva as organizações a adotar uma abordagem proativa em relação à segurança do trabalho, focando em evitar incidentes em vez de apenas reagir a eles. Nesse contexto, a conformidade com as Normas Regulamentadoras (NRs) relacionadas à segurança no trabalho é apenas o ponto de partida. É igualmente importante a identificação e correção de comportamentos de risco, quase acidentes e incidentes menores. Essa abordagem não apenas contribui para a segurança no presente, mas também para a prevenção de acidentes mais graves no futuro e a criação de um ambiente de trabalho mais seguro e saudável. A Segurança no Trabalho é uma preocupação crescente em muitos setores da indústria. Com o avanço da tecnologia, novas ferramentas estão sendo desenvolvidas para melhorar a segurança dos trabalhadores. Uma dessas ferramentas é a Inteligência Artificial, que tem sido aplicada de várias maneiras para prevenir acidentes e melhorar a segurança no local de trabalho (SAFWAT, 2020).
A IA tem o potencial de transformar a segurança no local de trabalho, especialmente quando combinada com a Visão Computacional. A Visão Computacional é uma subárea da IA que capacita os computadores a interpretar e entender o mundo visual de maneira semelhante aos humanos. Isso é feito através da análise e interpretação de imagens e vídeos (IoT For All, 2023).
A combinação da visão computacional com a inteligência artificial tem o potencial de revolucionar a segurança do trabalho, permitindo uma análise mais detalhada e precisa dos ambientes de trabalho, bem como a detecção e prevenção de riscos de maneira eficaz. Conforme Nunes (2023), a visão computacional envolve o uso de câmeras e sensores para coleta de dados visuais, enquanto a IA processa e analisa esses dados, tomando decisões com base em algoritmos complexos.
A aplicação da Visão Computacional na segurança do trabalho pode assumir várias formas. Por exemplo, pode ser usada para monitorar o uso adequado de Equipamentos de Proteção Individual pelos trabalhadores. Através da análise de imagens e vídeos, a IA pode identificar se os trabalhadores estão usando os EPI’s corretamente e alertar os supervisores se não estiverem (Chooch AI, 2023).
A combinação de visão computacional e IA permite o monitoramento em tempo real, análise de postura e movimento, e a detecção de riscos ambientais, contribuindo para ambientes de trabalho mais seguros. Essa integração tecnológica oferece uma abordagem preventiva ao identificar comportamentos de risco em tempo real, tornando possível a implementação imediata de medidas corretivas, alinhando-se com a busca por ambientes laborais mais seguros e eficientes (Garcia, 2021).
Além disso, a IA e a Visão Computacional podem ser usadas para identificar comportamentos de risco no local de trabalho. Por exemplo, podem ser usadas para identificar se os trabalhadores estão se colocando em situações perigosas, como trabalhar muito perto de máquinas em movimento ou carregar objetos pesados de maneira inadequada. Ao identificar esses comportamentos de risco, a IA pode ajudar a prevenir acidentes antes que eles ocorram (Perspectiv AI, 2023).
A IA também pode ser usada para melhorar a formação em segurança no trabalho. Por exemplo, pode ser usada para criar simulações realistas de situações de trabalho perigosas, permitindo que os trabalhadores se preparem para essas situações de maneira segura (Safety+Health Magazine, 2023).
Em resumo, a IA e a Visão Computacional têm o potencial de melhorar significativamente a segurança no local de trabalho. No entanto, segundo Nunes (2023) é importante notar que a implementação dessas tecnologias deve ser feita de maneira cuidadosa e considerada, levando em conta as necessidades específicas de cada local de trabalho e os direitos e privacidade dos trabalhadores.
A análise de dados é uma etapa crucial desse processo. Com o auxílio de algoritmos avançados de aprendizado de máquina, os dados visuais encontrados são submetidos a uma análise profunda (LUDERMIR, 2021). Isso possibilita a identificação de tendências e padrões de risco, o que é fundamental para a tomada de decisões baseadas em dados.
Essas tecnologias oferecem monitoramento em tempo real, permitindo ações corretivas imediatas diante de possíveis riscos (NUNES, 2023). Além disso, elas são essenciais em situações de emergência, contribuindo para a segurança dos trabalhadores durante evacuações e na prevenção de acidentes.
A implementação de IA e Visão Computacional na segurança do trabalho não é uma tarefa simples e requer uma abordagem cuidadosa. É necessário considerar vários fatores, como a privacidade dos trabalhadores, a precisão dos sistemas de IA e a aceitação dessas tecnologias pelos trabalhadores (KAPLAN et al., 2020).
A privacidade dos trabalhadoresé uma preocupação importante ao implementar sistemas de IA que monitoram o comportamento dos trabalhadores. É essencial garantir que esses sistemas sejam usados apenas para melhorar a segurança e não para monitorar os trabalhadores de maneira invasiva. Além disso, é importante garantir que os dados coletados por esses sistemas sejam armazenados e usados de maneira segura e de acordo com as leis de proteção de dados (Kaplan et al., 2020).
"A coleta de dados por sistemas de IA na segurança do trabalho deve ser transparente e baseada no consentimento informado dos trabalhadores. Medidas como anonimização e criptografia são essenciais para proteger a privacidade. Além disso, a ética na coleta de dados por sistemas de IA na segurança do trabalho demanda transparência e a obtenção do consentimento informado dos trabalhadores, enquanto a aplicação de práticas como anonimização e criptografia é fundamental para salvaguardar a privacidade dos envolvidos" (GONZÁLEZ, 2020).
A precisão dos sistemas de IA também é um fator crucial. Embora a IA tenha o potencial de melhorar significativamente a segurança no local de trabalho, isso só é possível se os sistemas de IA forem precisos e confiáveis. Se um sistema de IA comete muitos erros, isso pode levar a falsos alarmes, o que pode causar confusão e potencialmente colocar os trabalhadores em risco. Portanto, é essencial testar e validar cuidadosamente os sistemas de IA antes de implementá-los (Kaplan et al., 2020).
A aceitação dos trabalhadores dessas tecnologias também é um fator importante a ser considerado. A implementação de IA e Visão Computacional na segurança do trabalho pode ser vista com suspeita por alguns trabalhadores, que podem vê-la como uma forma de vigilância invasiva. Portanto, é importante envolver os trabalhadores no processo de implementação e garantir que eles entendam como essas tecnologias podem melhorar sua segurança (KAPLAN et al., 2020).
Conforme González (2020), é importante estabelecer políticas claras sobre a retenção e o descarte de dados perdidos. Manter os dados por mais tempo do que o necessário representa um risco para a privacidade dos trabalhadores. Os dados devem ser destruídos de forma segura quando não forem mais relevantes.
As empresas que utilizam sistemas de IA na segurança do trabalho devem ser transparentes sobre suas práticas de coleta e uso de dados (Kaplan et al., 2020). Devem ser responsáveis ​​por garantir que os dados dos trabalhadores sejam usados ​​apenas para os fins acordados.
É importante observar que as regulamentações de privacidade, como a Lei Geral de Proteção de Dados (LGPD) do Brasil, estabelecem diretrizes para a coleta e uso de dados pessoais (NUNES, 2023). As empresas que implementam sistemas de IA na segurança do trabalho devem estar em conformidade com essas regulamentações e devem designar um Carregador de Proteção de Dados (DPO) para supervisionar as práticas de privacidade (Kaplan et al., 2020).
O equilíbrio entre a segurança do trabalho e a privacidade dos trabalhadores é um desafio complexo. No entanto, abordar essas questões de maneira ética e responsável é essencial para garantir que a IA seja uma aliada eficaz na promoção de ambientes de trabalho seguros e saudáveis (LUDERMIR, 2021).
Em conclusão, a IA e a Visão Computacional têm o potencial de transformar a segurança no local de trabalho. No entanto, conforme González (2020) a implementação dessas tecnologias deve ser feita de maneira cuidadosa e considerada, levando em conta a privacidade dos trabalhadores, a precisão dos sistemas de IA e a aceitação dos trabalhadores dessas tecnologias.
A implementação de IA e Visão Computacional na segurança do trabalho, conforme discutido anteriormente, apresenta desafios significativos, especialmente no que diz respeito à precisão dos sistemas de IA (NUNES, 2023). Neste contexto, o trabalho proposto apresenta uma abordagem inovadora para melhorar a precisão da detecção de EPI’s em áreas específicas, utilizando a técnica de Região de Interesse (ROI).
A técnica de ROI permite que o sistema de IA se concentre em áreas específicas da imagem, onde a presença de EPIs é mais provável. Isso pode melhorar significativamente a precisão da detecção, reduzindo o número de falsos positivos e falsos negativos (RODRIGUES, 2022). Além disso, ao se concentrar em áreas específicas, o sistema de IA pode processar imagens mais rapidamente, o que é crucial em ambientes de trabalho dinâmicos e em rápida mudança.
Na segurança do trabalho, nem todas as áreas de um ambiente de trabalho são igualmente críticas em termos de riscos e segurança. Segundo Kassai (2019), um ROI permite que os sistemas identifiquem áreas onde os trabalhadores realizam tarefas que envolvem riscos significativos, como máquinas perigosas, zonas de alta tensão ou áreas de trabalho em altura.
Processar imagens e vídeos completos de um ambiente de trabalho pode ser demorado e consumir recursos computacionais. Conforme Casarotto Filho e Koptike (1994), o ROI permite que os sistemas se concentrem apenas nas áreas de interesse, reduzindo a quantidade de dados a serem processados. Isso melhora a eficiência do sistema e reduz o tempo de análise.
Ao definir um ROI, Catelli (1995) afirma que os sistemas podem se concentrar em características específicas, como o uso correto de Equipamentos de Proteção Individual (EPIs) em trabalhadores. Isso permite uma análise mais precisa e detalhada dessas áreas específicas, identificando riscos potenciais e não conformidades.
"A Técnica de Região de Interesse (ROI) representa um avanço significativo na aplicação de IA para a segurança do trabalho, pois possibilita uma abordagem mais focalizada. Ela capacita sistemas de IA a concentrarem seus esforços nas áreas onde a detecção de Equipamentos de Proteção Individual (EPIs) é mais crucial, minimizando informações irrelevantes. Isso não apenas aprimora a precisão da detecção, mas também otimiza a capacidade de análise, tornando a abordagem mais eficiente e eficaz (Silva, 2021)." (Silva, 2021).
Ao usar o ROI, os recursos computacionais são alocados de forma mais eficaz. Isso é particularmente importante em sistemas de monitoramento em tempo real, onde a otimização é essencial para garantir que os alertas sejam acionados imediatamente em caso de riscos (CATELLI, 1995).
A implementação eficaz do ROI na segurança do trabalho requer a definição cuidadosa das áreas de interesse, garantindo que todas as áreas críticas sejam abrangidas. Além disso, a análise deve ser complementada por outras técnicas de IA, como detecção de objetos e reconhecimento de padrões, para garantir uma visão abrangente da segurança do trabalho (GONZALEZ, 2019).
Segundo Carvalho, (2021) a ROI é uma ferramenta versátil que desempenha um papel importante na segurança do trabalho com IA permitindo a focalização em áreas críticas, a redução de dados e análises apresentadas que são projetadas para ambientes de trabalho mais seguros.
Essa integração de tecnologias está realmente esboçando o futuro da segurança do trabalho de uma forma que não apenas otimiza a eficiência, mas também coloca a prevenção de riscos no centro das estratégias de segurança. Conforme Silva (2021), a evolução que estamos presenciando tem o potencial de causar um impacto transformador na saúde e segurança dos trabalhadores, e sua importância não pode ser subestimada.
Um dos diferenciais fundamentais do trabalho proposto é sua abordagem abrangente. Embora muitos sistemas de IA se concentrem exclusivamente na detecção de Equipamentos de Proteção Individual, o sistema proposto vai além. Ele não identifica apenas a presença de EPIs, mas também está disponível sendo usado da maneira correta. Essa abordagem é crucial, uma vez que um EPI presente, mas usado de forma incorreta, não oferece a proteção necessária. Por exemplo, um capacete de segurança mal ajustado pode ser tão ineficaz quanto à ausência de um capacete. Portanto, a capacidade do sistema proposto de avaliar o uso adequado dos EPIs é uma inovação fundamental.
Em resumo, o trabalho proposto apresentauma abordagem pioneira para a implementação de Inteligência Artificial e Visão Computacional na segurança do trabalho, superando muitos dos desafios tradicionalmente associados a essas tecnologias. Por meio da utilização da técnica de Região de Interesse e do foco não apenas na detecção, mas também no uso adequado dos EPIs, o sistema proposto está bem posicionado para melhorar significativamente a segurança no ambiente de trabalho. Essa abordagem oferece um caminho promissor para reduzir acidentes, prevenir lesões e salvar vidas, contribuindo para um futuro onde os trabalhadores possam exercer suas atividades com a confiança de que estão protegidos de maneira eficaz.
2.2. Tecnologia para reconhecimento de EPIs de forma automatizada
A identificação e utilização adequada dos Equipamentos de Proteção Individual (EPIs) são elementos fundamentais para garantir a segurança e a saúde dos trabalhadores em diversos setores. À medida que avançamos na era da automação e da tecnologia, a busca por soluções que permitam o reconhecimento automatizado de EPIs tem se tornado uma prioridade. 
As tecnologias de reconhecimento de EPIs de forma automatizada são diversificadas em suas abordagens. No entanto, a visão computacional e a Internet das Coisas (IoT) são dois pilares importantes nesse campo. A visão computacional baseia-se na análise de imagens e vídeos para identificar EPIs. Algoritmos avançados são empregados para reconhecer padrões, características visuais e até mesmo condições de desgaste dos EPIs.
A Internet das Coisas desempenha um papel crucial no monitoramento e rastreamento em tempo real dos EPIs. Sensores IoT são incorporados nos EPIs para coletar uma variedade de dados, como a localização, a temperatura, a umidade e o estado de integridade do equipamento. Isso oferece informações em tempo real que podem ser usadas para avaliar o desempenho dos EPIs e a segurança dos trabalhadores.
Por outro lado, a IoT desempenha um papel significativo ao incorporar sensores diretamente nos EPIs. Esses sensores podem coletar dados em tempo real, como a localização do EPI, sua integridade e o tempo de uso. Isso possibilita o monitoramento ativo e contínuo do status dos EPIs, garantindo a conformidade com as regulamentações de segurança.
A visão computacional é um pilar fundamental no desenvolvimento das tecnologias de reconhecimento de EPIs. Ela se baseia na capacidade de sistemas computacionais interpretarem e analisarem informações visuais, geralmente imagens e vídeos. No contexto dos EPIs, a visão computacional permite a detecção e identificação de dispositivos de proteção, como capacetes, óculos de segurança, luvas, coletes, máscaras faciais e outros itens.
Para alcançar esse reconhecimento, algoritmos de visão computacional são treinados em grandes conjuntos de dados de imagens que contêm diferentes tipos e condições de EPIs. Esses algoritmos são capazes de reconhecer padrões visuais, como cores, formas, tamanhos e etiquetas de identificação. A capacidade de processar informações visuais em tempo real torna a visão computacional uma ferramenta poderosa para identificar a presença e o uso adequado de EPIs.
A visão computacional desempenha um papel essencial no reconhecimento automatizado de EPIs, permitindo que sistemas interpretem e identifiquem dispositivos de proteção com base em características visuais, como cores e formas. (Smith et al., 2020).
Essa abordagem permite a identificação precisa dos EPIs em imagens ou vídeos, mesmo em condições desafiadoras, como variações na iluminação ou oclusões parciais. Além disso, esses algoritmos podem ser adaptados para reconhecer novos tipos de EPIs à medida que são introduzidos no mercado.
Outro aspecto crítico da identificação de EPIs é a capacidade de avaliar as condições de desgaste. Algoritmos avançados podem analisar imagens de EPIs para determinar se eles estão em boas condições ou se precisam ser substituídos. Por exemplo, em um capacete de segurança, esses algoritmos podem identificar rachaduras, amassados, sinais de desgaste excessivo ou a presença de componentes soltos.
Essa análise de condições de desgaste é essencial para garantir que os EPIs estejam em conformidade com os padrões de segurança e ofereçam a proteção necessária. Além disso, esses algoritmos podem ajudar a programar alertas automáticos para a substituição de EPIs desgastados, garantindo a segurança contínua dos trabalhadores.
O aprendizado de máquina desempenha um papel vital na melhoria contínua dos algoritmos de reconhecimento de EPIs. À medida que os sistemas são alimentados com mais dados e experiência, eles se tornam mais precisos na identificação de EPIs e na análise de condições de desgaste. Os algoritmos de aprendizado de máquina podem ajustar seus modelos com base em novas informações, aprimorando assim sua capacidade de reconhecimento ao longo do tempo.
Essa capacidade de adaptação contínua é particularmente valiosa, pois os ambientes de trabalho e os tipos de EPIs podem evoluir. Novos modelos de EPIs podem ser introduzidos, e as condições de trabalho podem mudar. Os algoritmos de aprendizado de máquina garantem que os sistemas de reconhecimento de EPIs permaneçam relevantes e eficazes em face dessas mudanças.
3. INTELIGÊNCIA ARTIFICIAL E SUAS TECNOLOGIAS
A Inteligência Artificial pode ser definida como a capacidade de um sistema ou máquina de imitar ou replicar funções cognitivas humanas, como aprender, raciocinar, perceber, interagir com o ambiente, resolver problemas e até mesmo demonstrar emoções (CANDIOTTO e KARASINSKI, 2022). Em termos mais técnicos, a IA é o estudo de algoritmos e modelos que permitem que computadores realizem tarefas sem serem explicitamente programados para elas (FENG et al, 2021).
A ideia de máquinas inteligentes remonta à antiguidade, com mitos e histórias de autómatos e objetos animados. No entanto, a IA, como a conhecemos hoje, começou a tomar forma na década de 1950.
Alan Turing, um matemático e cientista da computação britânico, é frequentemente referido como o pai da ciência da computação e da inteligência artificial. Em seu famoso artigo “Computing Machinery and Intelligenc”, publicado em 1950, Turing introduziu o que é agora conhecido como o "Teste de Turing". Este teste propõe que uma máquina pode ser considerada inteligente quando um interrogador humano não consegue distinguir, com base nas respostas às suas perguntas, se a entidade com a qual está se comunicando é uma máquina ou um ser humano.
John McCarthy, outro pioneiro no campo da IA, cunhou o termo "Inteligência Artificial" em 1955. Ele definiu a IA como “a ciência e engenharia de fazer máquinas 
Inteligentes”. McCarthy também é conhecido por desenvolver a linguagem de programação LISP, que se tornou amplamente utilizada em pesquisas de IA. 
No cenário atual, a IA tem visto avanços notáveis, em grande parte devido ao crescimento do “aprendizado profundo”, uma subárea do aprendizado de máquina que se concentra no uso de redes neurais com muitas camadas (ou "profundas").
Yoshua Bengio é um dos principais nomes no campo do aprendizado profundo. Ele é um dos poucos pioneiros que acreditava no potencial das redes neurais durante o "inverno da IA", um período em que a pesquisa em redes neurais estava em declínio. Bengio (2016) fez contribuições significativas para o desenvolvimento de algoritmos e arquiteturas de redes neurais. 
A IA pode ser classificada em dois tipos principais: fraca e forte. A IA fraca é especializada em tarefas específicas, como reconhecimento de voz ou diagnóstico médico, mas carece da capacidade de generalização humana. Por outro lado, a IA forte aspira replicar a amplitude da inteligência humana, abrangendo raciocínio, aprendizado e compreensão em diversos contextos, como defendido por Kurzweil.
Um subconjunto essencial da IA é o Aprendizado de Máquina (Machine Learning - ML). Como destaca Mitchell (2018), o ML permite que as máquinas aprendam com dados e experiências anteriores, evoluindo e melhorando ao longo do tempo. Além disso, as Redes Neurais, inspiradas na estruturado cérebro humano, desempenham um papel fundamental no Aprendizado Profundo (Deep Learning), sendo a espinha dorsal de avanços recentes em visão computacional e processamento de linguagem natural, como observado por Goodfellow et al (2011).
Com o avanço da IA, surge a necessidade de compreender e explicar as decisões dos modelos, levando ao conceito de Inteligência Artificial Explicável (XAI). Gunning destaca a importância da XAI para tornar os processos de IA transparentes e interpretáveis, essenciais para construir confiança e aceitação pública nas aplicações da IA.
Essas categorias representam uma visão geral do campo da IA, mas à medida que a pesquisa e desenvolvimento continuam, novas abordagens e categorias emergirão, impulsionando avanços contínuos nesta jornada emocionante em direção à criação de máquinas cada vez mais inteligentes. Com isso, a contribuição de teóricos clássicos e modernos tem sido fundamental para moldar o campo e direcionar seu futuro.
Hoje, a IA permeia muitos aspectos de nossas vidas. Alguns exemplos incluem:
· Assistentes Virtuais: Siri, Alexa e Google Assistant são exemplos de IA que usamos diariamente para obter informações, controlar dispositivos domésticos e até mesmo para entretenimento.
· Reconhecimento de Imagem: As redes neurais convolucionais, uma subcategoria da IA, são usadas em plataformas de mídia social para identificar e marcar pessoas em fotos.
· Carros Autônomos: Empresas como Tesla e Waymon estão usando IA para desenvolver carros que podem dirigir sozinhos, com mínima ou nenhuma intervenção humana.
· Medicina: A IA está sendo usada para diagnóstico de doenças, análise de imagens médicas e até mesmo na pesquisa de novos medicamentos.
A Inteligência Artificial é uma área em constante evolução, com potencial para transformar muitos aspectos de nossa sociedade. Enquanto exploramos seu potencial, também devemos ser cautelosos e considerar as implicações éticas e sociais de sua adoção em larga escala. O futuro da IA é promissor, mas também é nossa responsabilidade moldá-lo de uma maneira que beneficie a humanidade como um todo. 
Com base no exposto, este projeto de pesquisa se situa no âmbito da IA aplicada à segurança industrial, com um foco específico na automação do reconhecimento de Equipamentos de Proteção Individual (EPIs) em ambientes fabris. A proposta busca empregar técnicas avançadas de processamento de imagem e aprendizado de máquina para analisar em tempo real imagens provenientes de câmeras de segurança. O objetivo central é desenvolver um sistema capaz de identificar automaticamente a presença e a utilização adequada de EPIs, tais como capacetes, óculos de proteção e vestuário apropriado, visando assim promover um ambiente de trabalho mais seguro.
3.1. Visão Computacional
A visão computacional, uma intersecção entre a ciência da computação e a óptica, tem como objetivo replicar a complexidade da visão humana em máquinas (SALDAÑA et al, 2013) Esta área da Inteligência Artificial busca não apenas permitir que as máquinas “vejam”, mas também que compreendam e interpretem o que estão vendo, assim como os seres humanos (GONZALEZ E WOODS, 2000).
A ideia de replicar a visão humana em máquinas remonta a várias décadas. Durante cerca de 60 anos, cientistas e engenheiros têm tentado desenvolver formas para as máquinas verem e compreenderem dados visuais. A experimentação começou em 1959, quando neurofisiologistas mostraram a um gato um conjunto de imagens, tentando correlacioná-las com uma resposta no seu cérebro. Eles descobriram que ele respondia primeiro a bordas ou linhas rígidas e, cientificamente, isso significava que o processamento de imagens começava com formas simples, como bordas retas.
Na mesma época, foi desenvolvida a primeira tecnologia de digitalização de imagens de computador, permitindo que os computadores digitalizassem e adquirissem imagens. Outro marco foi alcançado em 1963, quando os computadores foram capazes de transformar imagens bidimensionais em formas tridimensionais. 
Figura 4 Treinamento
Fonte: MathWorks
Disponível em: https://www.mathworks.com/help/deeplearning/ug/create-simple-deep-learning-network-for-classification.html;jsessionid=af4d23ce7f4c11c02e110ef400f9
Na década de 1960, a inteligência artificial tornou-se um campo de estudo acadêmico e marcou o início da busca da inteligência artificial para resolver o problema da visão humana.
Em 1974, temos o advento da tecnologia de reconhecimento óptico de caracteres (OCR), capaz de reconhecer texto impresso em qualquer tipo de letra. Da mesma forma, o reconhecimento inteligente de caracteres (ICR) poderia decifrar texto manuscrito usando redes neurais. Desde então, o OCR e o ICR encontraram seu caminho no processamento de documentos e faturas, reconhecimento de placas de veículos, pagamentos móveis, tradução automática e outras aplicações comuns.
Em 1982, o neurocientista David Marr, determinando que a visão funcionava de maneira hierárquica, criou algoritmos que permitiam às máquinas detectar arestas, ângulos, curvas e formas básicas semelhantes. Ele acreditava que a visão poderia ser compreendida em três níveis distintos: 
· Nível Computacional: Este nível se concentra no “o quê” - define os problemas que o sistema visual busca resolver.
· Nível Algorítmico: Aqui, o foco é o "como" - descreve os processos e algoritmos que o sistema utiliza.
· Nível de Implementação: Este nível se preocupa com a realização física dos algoritmos e processos.
O “pai da visão computacional”, Rosenfeld, foi pioneiro em muitos conceitos que formam a base da visão computacional moderna. Ele reconheceu a importância do processamento digital de imagens e aplicou métodos matemáticos rigorosos para interpretar imagens.
O cientista da computação Kunihiko Fukushima desenvolveu uma rede de células capaz de reconhecer padrões. A rede, chamada Neocognitron, compreendia camadas convolucionais em uma rede neural.
Em 2000, a pesquisa se concentrou no reconhecimento de objetos, e em 2001 surgiram os primeiros aplicativos de reconhecimento facial em tempo real. A padronização da rotulagem e anotação de conjuntos de dados visuais surgiu na década de 2000. Em 2010, surgiram os arquivos ImageNet. Eles continham milhões de imagens rotuladas em mil classes de objetos e forneceram uma base para CNNs e modelos de aprendizagem profunda usados hoje. Em 2012, uma equipe da Universidade de Toronto inscreveu a CNN em uma competição de reconhecimento de imagem. O modelo, denominado AlexNet, reduziu significativamente a taxa de erro no reconhecimento de imagens. Após esta descoberta, as taxas de erro caíram para apenas alguns por cento.
A visão computacional é um campo da inteligência artificial (IA) que permite que computadores e sistemas obtenham informações significativas de imagens digitais, vídeos e outras informações visuais, e tomem medidas ou façam recomendações com base nessas informações. Se a inteligência artificial permite que os computadores pensem, a visão computacional permite-lhes ver, observar e compreender.
A visão computacional funciona da mesma forma que a visão humana, mas os humanos têm uma vantagem inicial. A visão humana tem a vantagem de poder treinar-se para distinguir objetos, determinar a sua distância, saber se estão em movimento e se algo está errado numa imagem.
A visão computacional treina máquinas para executar essas funções, mas deve fazê-lo muito mais rapidamente usando câmeras, dados e algoritmos que substituem nossas retinas, nervos ópticos e córtex visual. Como um sistema treinado para inspecionar produtos ou monitorar um ativo de produção pode analisar milhares de produtos ou processos por minuto, detectando defeitos ou problemas imperceptíveis, ele pode rapidamente exceder as capacidades humanas.
A visão computacional precisa de muitos dados. Ela executa análises de dados repetidas vezes até ver distinções e finalmente reconhecer as imagens. Por exemplo, para treinar um computador para reconhecer pneus de automóveis, ele deve receber grandes quantidades de imagens de pneus e itensrelacionados a pneus para aprender as diferenças e reconhecer um pneu, especialmente um pneu sem defeitos.
Duas tecnologias essenciais são usadas na visão computacional: um tipo de aprendizado de máquina denominado aprendizado profundo e uma rede neural convolucional (CNN).
O aprendizado de máquina usa modelos algorítmicos que permitem que um computador treine no contexto de dados visuais. Se dados suficientes forem inseridos no modelo, o computador “olhará” os dados e aprenderá a distinguir uma imagem da outra. Os algoritmos permitem que a máquina aprenda sozinha, em vez de alguém a programar para reconhecer uma imagem.
Uma rede neural convolucional (CNN) ajuda um modelo de aprendizado de máquina ou aprendizado profundo a “olhar”, dividindo as imagens em pixels aos quais são atribuídas tags ou rótulos. Ele usa os rótulos para realizar convoluções (uma operação matemática em duas funções para produzir uma terceira função) e faz previsões sobre o que “vê”. A rede neural executa convoluções e verifica a precisão de suas previsões por meio de uma série de iterações até que as previsões comecem a se tornar realidade. Isso envolve então reconhecer ou ver imagens de uma forma semelhante aos humanos.
Tal como um ser humano que distingue uma imagem à distância, uma CNN primeiro discerne arestas e formas simples e depois preenche as informações à medida que repete as suas previsões. Uma CNN é usada para compreender imagens individuais. Uma rede neural recorrente (RNN) é usada de forma semelhante em aplicações de vídeo para ajudar os computadores a entender como os quadros de uma série se relacionam entre si.
A Visão Computacional é um campo interdisciplinar da ciência da computação que se concentra em permitir que as máquinas interpretem e compreendam o mundo visual, de maneira semelhante à capacidade humana de percepção visual. Neste capítulo, exploraremos os conceitos fundamentais dessa área, bem como técnicas avançadas, incluindo as redes neurais convolucionais (CNNs), que têm desempenhado um papel revolucionário na Visão Computacional.
Conforme resumiu Shapiro e Stockman (2001), a Visão Computacional é “o processo de automatização da extração de informações úteis a partir de uma representação visual”. Isso implica a capacidade de sistemas computacionais de adquirir, processar e compreender informações visuais, abrindo portas para uma ampla gama de aplicações.
A base da Visão Computacional reside no processamento de imagens. Conforme destacado por Szeliski (2010), o processamento de imagens envolve “a aplicação de operações em imagens para melhorar a qualidade, realçar características e preparar dados visuais para análise subsequente”. Essas operações incluem a eliminação de ruídos, a correção de distorções e a otimização do contraste.
Um dos principais desafios na Visão Computacional é a segmentação de imagens. Esse processo divide uma imagem em regiões significativas ou objetos individuais, permitindo a análise de partes isoladas. Técnicas de segmentação são amplamente aplicadas em áreas como reconhecimento de objetos, detecção de bordas e identificação de regiões de interesse, como apontado por González e Woods (2008), é “o processo de dividir uma imagem em partes significativas, como objetos individuais ou regiões de interesse”. A segmentação desempenha um papel fundamental na detecção de objetos e na análise de suas características.
A detecção de objetos é uma área fundamental da Visão Computacional que tem aplicações em sistemas de vigilância, veículos autônomos e muito mais. Envolve a identificação da presença e da localização de objetos específicos em uma imagem ou vídeo. Técnicas tradicionais, como a detecção de pontos de interesse e descritores de características, têm sido empregadas para esse fim. Conforme Szegedy et al. (2014) destacam, “a detecção de objetos envolve a identificação da presença e da localização de objetos específicos em uma imagem”. 
Figura 5 Detecção de objetos com o algoritmo de aprendizagem profunda
Fonte: https://www.mathworks.com/help/deeplearning/ug/ate-simple-deep-learning-nrk-for-classification
Um avanço notável na Visão Computacional é o uso de Redes Neurais Convolucionais, como ilustrado por LeCun et al. (2015). Essas redes têm uma arquitetura inspirada na organização visual do cérebro humano e se mostraram altamente eficazes na classificação de objetos e na detecção de características visuais complexas. Aprender a fundo sobre a arquitetura das CNNs e como treiná-las é essencial para qualquer aplicação de Visão Computacional que envolva o reconhecimento de objetos.
O reconhecimento preciso e eficaz dos Equipamentos de Proteção Individual (EPIs) desempenha um papel crucial na promoção da segurança e bem-estar dos trabalhadores em ambientes industriais. A integridade e utilização adequada desses equipamentos são fundamentais para mitigar riscos ocupacionais e garantir um ambiente laboral seguro. Nesse contexto, a Visão Computacional e o Aprendizado de Máquina emergem como ferramentas inovadoras e promissoras para a identificação e verificação automatizadas dos EPIs.
A aplicação da Visão Computacional nesse cenário permite a análise detalhada de imagens ou vídeos, capacitando sistemas a identificar e reconhecer, de forma precisa e ágil, os diferentes tipos de Equipamentos de Proteção Individual. Por meio da extração de características visuais e padrões específicos, os algoritmos de Aprendizado de Máquina são treinados para discernir capacetes, luvas, óculos de proteção, entre outros dispositivos, garantindo a conformidade com as normas de segurança e regulamentações específicas da indústria.
Essa abordagem inovadora oferece vantagens significativas, indo além da simples detecção, permitindo a verificação da correta utilização dos EPIs pelos trabalhadores em tempo real. A integração dessas tecnologias pode contribuir para a redução de acidentes, monitoramento proativo da conformidade com os protocolos de segurança e, consequentemente, para a promoção de ambientes de trabalho mais seguros e saudáveis.
Ao possibilitar a identificação e análise automatizadas dos Equipamentos de Proteção Individual, a Visão Computacional e o Aprendizado de Máquina não apenas simplificam a gestão de segurança industrial, mas também oferecem uma camada adicional de controle e vigilância para assegurar a proteção dos trabalhadores em seus ambientes laborais.
Essa integração de tecnologias representa um avanço significativo na promoção da cultura de segurança, reforçando a importância da inovação tecnológica na preservação da saúde e bem-estar dos colaboradores em ambientes industriais.
3.2. Aprendizado de Máquina
Aprendizado de máquina, aprendizado profundo e redes neurais são subcampos da inteligência artificial. No entanto, as redes neurais são, na verdade, um subcampo do aprendizado de máquina, e o aprendizado profundo é um subcampo das redes neurais.
A diferença entre aprendizado profundo e aprendizado de máquina é como cada algoritmo aprende. A aprendizagem “profunda” pode contar com conjuntos de dados rotulados (aprendizagem supervisionada) para alimentar seu algoritmo, embora isso não seja absolutamente necessário. O aprendizado profundo pode ingerir dados não estruturados em sua forma bruta (texto, imagens, etc.) e determinar automaticamente o conjunto de características que distinguem diferentes categorias de dados entre si. Assim, parte da intervenção humana necessária é eliminada e é possível utilizar conjuntos de dados maiores. 
O aprendizado de máquina clássico ou “não profundo” depende mais da intervenção humana para aprender. Especialistas humanos determinam o conjunto de recursos para compreender as diferenças entre as entradas de dados, o que normalmente requer dados mais estruturados para aprender.
As redes neurais são constituídas por camadas nodais contendo uma camada de entrada, uma ou mais camadas ocultas e uma camada de saída. Cada nó, ou neurônio artificial, se conecta a outro e possui um peso e um limite. Se a saída de um nó for maior que o valor limite especificado,esse nó será ativado e enviará dados para a próxima camada da rede. Caso contrário, nenhum dado será transmitido para a próxima camada da rede. “Profundo” no termo “aprendizado profundo” refere-se simplesmente ao número de camadas de uma rede neural. Uma rede neural que consiste em mais de três camadas (incluindo entradas e saídas) pode ser considerada um algoritmo de aprendizagem profunda ou uma rede neural profunda. Uma rede neural que possui apenas duas ou três camadas é apenas uma rede neural básica.
O aprendizado profundo e as redes neurais são creditados principalmente por acelerar avanços em áreas como visão computacional, processamento de linguagem natural e reconhecimento de fala.
O aprendizado supervisionado, também chamado de aprendizado de máquina supervisionado, é o uso de conjuntos de dados rotulados para treinar algoritmos que classificam dados ou preveem resultados com precisão. Quando os dados de entrada são inseridos no modelo, ele ajusta seus pesos até obter um bom ajuste. Isso acontece como parte do processo de validação cruzada, para que o modelo evite overfitting  ou  underfitting. Com o aprendizado supervisionado, as organizações podem resolver vários problemas do mundo real em grande escala, como classificar e-mails de spam em uma pasta separada na sua caixa de entrada. Redes neurais, modelo ingênuo de Bayes, regressão linear, regressão logística, floresta aleatória, máquina de vetores de suporte (SVM), etc. estão entre os métodos utilizados na aprendizagem supervisionada.
O aprendizado não supervisionado, ou aprendizado de máquina não supervisionado, usa algoritmos de aprendizado de máquina para analisar e agrupar conjuntos de dados não rotulados. Esses algoritmos descobrem padrões ou agrupamentos ocultos em dados sem exigir intervenção humana. A capacidade do aprendizado de máquina não supervisionado de descobrir semelhanças e diferenças nas informações o torna ideal para análise exploratória de dados, estratégias de venda cruzada, segmentação de clientes e reconhecimento de imagens e modelos. Também ajuda a reduzir o número de recursos em um modelo por meio do processo de redução de dimensionalidade. A Análise de Componentes Principais (PCA) e a Decomposição de Valores Singulares (SVD) são duas abordagens comuns nesta área. Redes neurais, agrupamento com k-means, métodos de classificação probabilística, etc. estão entre outros algoritmos usados ​​​​na aprendizagem não supervisionada.
A aprendizagem semissupervisionada é um meio termo entre a aprendizagem supervisionada e a aprendizagem não supervisionada. Durante o treinamento, ele usa um conjunto de dados rotulado menor para orientar a classificação e extração de recursos de um conjunto de dados maior não rotulado. A aprendizagem semissupervisionada pode resolver o problema da quantidade insuficiente de dados rotulados para um algoritmo de aprendizagem supervisionada.
O aprendizado de máquina por reforço é um modelo de aprendizado semelhante ao aprendizado supervisionado, mas o algoritmo não é treinado usando dados de amostra. Este modelo aprende por tentativa e erro. Uma sequência de resultados positivos será reforçada para desenvolver a melhor recomendação ou política para um determinado problema.
Figura 6: treinamento uma rede neural convolucional para regressão
Fonte:
Vários algoritmos de aprendizado de máquina são comumente usados, incluindo regressão linear, regressão logística, clustering, Árvores de decisão, florestas aleatórias e redes Neurais. Aqui será abordado apenas os algoritmos de aprendizagem de redes neurais.
Uma CNN pode ter dezenas ou até centenas de camadas, cada uma aprendendo a detectar diferentes características de uma imagem. Filtros são aplicados a cada imagem do conjunto de treinamento com diferentes resoluções e então a saída de cada imagem convolvida é usada como entrada para a próxima camada. A princípio, esses filtros podem dizer respeito a características muito simples, como brilho e contornos, depois se tornam mais complexos até representarem características únicas e específicas do objeto.
Uma CNN possui uma camada de entrada, uma camada de saída e muitas camadas intermediárias ocultas.
Figura 7 Camadas da CNN
Essas camadas realizam operações de modificação dos dados, a fim de conhecer suas características específicas. As três camadas mais comuns são: convolução, ativação (ou ReLU) e pooling.
A camada de convolução  é a primeira camada de uma rede convolucional. Embora possa ser seguida por camadas de convolução ou camadas de pooling adicionais, a camada totalmente conectada é a camada final. A cada camada, a CNN aumenta sua complexidade, identificando porções maiores da imagem. As camadas anteriores concentram-se em recursos simples, como cores e bordas. À medida que os dados da imagem avançam pelas camadas da CNN, eles começam a reconhecer características ou formas maiores do objeto até finalmente identificarem o objeto esperado.
O detector de características é uma matriz de pesos bidimensional (2D), que representa uma parte da imagem. Embora o tamanho possa variar, o filtro geralmente é uma matriz 3x3; isso também determina o tamanho do campo receptivo. O filtro é então aplicado a uma área da imagem e um produto escalar é calculado entre os pixels de entrada e o filtro. Este produto escalar é então integrado em uma matriz de saída. Em seguida, o filtro muda uma etapa para repetir o processo até que o kernel tenha verificado a imagem inteira. A saída final da série de produtos escalares da entrada e do filtro é conhecida como mapa de recursos, mapa de ativação, mapa de recursos ou recurso convolvido.
As camadas de pooling, também chamadas de camadas de subamostragem, permitem reduzir a dimensionalidade, ou seja, reduzir o número de parâmetros de entrada. Tal como acontece com a camada de convolução, a operação de pooling varre um filtro sobre toda a entrada, com a diferença de que este filtro não tem peso. Em vez disso, o kernel aplica uma função de agregação aos valores do campo receptivo, preenchendo assim a matriz de saída. Existem dois tipos principais de pooling:
· Pool máximo: conforme o filtro se move sobre a entrada, ele seleciona o pixel com o valor máximo para enviar para a matriz de saída. A propósito, esta abordagem tende a ser usada com mais frequência do que o pooling médio.
· Agrupamento médio: À medida que o filtro se move sobre a entrada, ele calcula o valor médio no campo receptivo para enviá-lo à matriz de saída.
Embora muita informação seja perdida na camada de pooling, ela ainda apresenta uma série de vantagens para a CNN. Ajuda a reduzir a complexidade, melhorar a eficiência e limitar o risco de overfitting.
A camada totalmente conectada faz jus ao seu nome. Conforme mencionado anteriormente, os valores de pixel da imagem de entrada não estão diretamente conectados à camada de saída em camadas parcialmente conectadas. Entretanto, na camada totalmente conectada, cada nó da camada de saída se conecta diretamente a um nó da camada anterior.
Redes neurais convolucionais potencializam tarefas de reconhecimento de imagem e visão computacional.
Figura 8 Exemplo de rede com muitas camadas convolucionais
Fonte: 
Filtros são aplicados a cada imagem do conjunto de treinamento com diferentes resoluções e então a saída de cada imagem convolvida é usada como entrada para a próxima camada.
Ao contrário das redes neurais tradicionais, uma rede neural convolucional compartilha valores de peso e polarização, que são os mesmos para todos os neurônios ocultos em uma determinada camada.
Isto significa que o conjunto de neurônios ocultos detecta a mesma característica (por exemplo, uma borda ou uma bolha) em diferentes regiões da imagem. Assim, a rede torna-se tolerante à tradução de objetos em uma imagem. Por exemplo, uma rede treinada para reconhecer carros será capaz de identificar um veículo, independentemente da sua localização na imagem.
Após a fase de aprendizado de recursos em suas diversas camadas, a arquitetura de uma rede neural convolucional muda e passa para a classificação.

Mais conteúdos dessa disciplina