Automatic breast cancer classification from histopathological images : a hybrid approach

Detalhes bibliográficos
Ano de defesa: 2018
Autor(a) principal: Spanhol, Fabio Alexandre
Orientador(a): Oliveira, Luiz Eduardo Soares de, 1971-
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: eng
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://hdl.handle.net/1884/57312
Resumo: Orientador: Prof. Dr. Luiz Eduardo Soares de Oliveira
id UFPR_2a586d51d5fb4e3bb86fc77eda1bca8e
oai_identifier_str oai:acervodigital.ufpr.br:1884/57312
network_acronym_str UFPR
network_name_str Repositório Institucional da UFPR
repository_id_str
spelling Spanhol, Fabio AlexandreUniversidade Federal do Paraná. Setor de Ciências Exatas. Programa de Pós-Graduação em InformáticaOliveira, Luiz Eduardo Soares de, 1971-2018-10-26T16:15:21Z2018-10-26T16:15:21Z2018https://hdl.handle.net/1884/57312Orientador: Prof. Dr. Luiz Eduardo Soares de OliveiraTese (doutorado) - Universidade Federal do Paraná, Setor de Ciências Exatas, Programa de Pós-Graduação em Informática. Defesa : Curitiba, 10/08/2018Inclui referências: p.146-171Área de concentração: Ciência da ComputaçãoResumo: O câncer é um grave problema de saúde pública mundial, apresentando altas taxas de mortalidade e sobrecarga dos sistemas de saúde públicos e privados. Especialmente na população feminina, o câncer de mama surge como o segundo mais incidente e um dos tipos mais letais quando não devidamente diagnosticado e tratado. Apesar do progresso significativo alcançado pelas tecnologias de diagnóstico por imagem, a biópsia é a única maneira de diagnosticar com confiança se o câncer está realmente presente. O diagnóstico final do câncer de mama, incluindo graduação e estadiamento, ainda continua sendo feito por patologistas aplicando inspeção visual de imagens histológicas sob o microscópio. A análise histopatológica é uma tarefa altamente especializada, demorada, extremamente dependente da experiência dos patologistas e diretamente influenciada por fatores tais como fadiga e diminuição da atenção. Avanços recentes em técnicas de processamento de imagem e de aprendizado de máquina permitem construir sistemas CAD (Computer-Aided Diagnosis) que podem ajudar os patologistas a serem mais produtivos, objetivos e consistentes no processo de diagnóstico. Infelizmente, há também uma falta de bases de dados de imagem histológicas rotuladas abrangentes e públicas destinadas à pesquisa em sistemas CAD. Bases de dados rotuladas são cruciais para desenvolver e validar sistemas de aprendizado de máquina. Além disso, o desempenho da maioria dos sistemas de classificação convencionais depende da representação de dados apropriada e grande parte dos esforços são dedicados a engenharia de características, um processo difícil e demorado que usa o conhecimento prévio do especialista no domínio para criar características úteis. Contribuindo para eliminar esta lacuna, o presente trabalho apresenta um novo conjunto de dados publicamente disponível chamado BreaKHis, o qual contém imagens histopatológicas de tumores mamários. Este trabalho também apresenta uma abordagem alternativa para classificar estas imagens desafiadoras evitando qualquer segmentação explícita. Tal abordagem explora descritores texturais manuais e representação automática, particularmente empregando Redes Neurais Convolucionais, bem como o paradigma Aprendizado de Instâncias Múltiplas. Os resultados experimentais obtidos demonstraram a viabilidade desta proposta, dando indicações para melhorar tal modelo. Palavras-chave: reconhecimento de padrões, câncer de mama, imagem histopatológica, aprendizagem profunda, rede neural convolucional, aprendizado de instâncias múltiplas, processamento de imagens, aprendizado de máquina, diagnóstico auxiliado por computador.Abstract: Cancer is a serious public health problem worldwide, presenting high mortality rates and overloading both public and private health systems. Especially in the female population, breast cancer emerges as the second most incident and one of the most lethal types when not properly diagnosed and treated. In spite of the significant progress reached through the diagnostic imaging technologies, biopsy is the only way to diagnose with confidence if cancer is really present. Final breast cancer diagnosis, including grading and staging, still continues to be done by pathologists applying visual inspection of histological images under the microscope. Histopathological analysis is a highly specialized and time-consuming task, extremely dependent on the experience of the pathologists and directly influenced by factors such as fatigue and decrease of attention. Recent advances in image processing and machine learning techniques, which allow CAD (Computer-Aided Diagnosis) systems to be built, which in turn can assist pathologists to be more productive, objective and consistent in the diagnosis process. Unfortunately, there is also a lack of comprehensive and public annotated histological image databases intended for research in CAD systems. Annotated databases are crucial for developing and validating machine learning systems. Moreover, the performance of most conventional classification systems relies on appropriate data representation and much of the efforts are dedicated to feature engineering, a difficult and time-consuming process that uses prior expert domain knowledge of the data to create useful features. By contributing to eliminate this gap, the present work introduces a new publicly available image dataset named BreaKHis, which contains histopathological images of breast tumors. This work also presents an alternative approach to classify these challenging images, avoiding any explicit segmentation. Such approach explores hand-crafted textural descriptors and automatic representation, particularly using Convolutional Neural Networks as well as the paradigm Multiple Instance Learning. The obtained experimental results have demonstrated the feasibility of this proposal, giving directions for improvement in such model. Keywords: pattern recognition, breast cancer, histopathological image, deep learning, convolutional neural network, multiple instance learning, image processing, machine learning, computer-aided diagnosis.171 p. : il. (algumas color.).application/pdfMamas - CancerCiência da ComputaçãoProcessamento de imagensReconhecimento de padrõesConvoluções (Matemática)Automatic breast cancer classification from histopathological images : a hybrid approachinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisengreponame:Repositório Institucional da UFPRinstname:Universidade Federal do Paraná (UFPR)instacron:UFPRinfo:eu-repo/semantics/openAccessORIGINALR - T - FABIO ALEXANDRE SPANHOL.pdfapplication/pdf19177702https://acervodigital.ufpr.br/bitstream/1884/57312/1/R%20-%20T%20-%20FABIO%20ALEXANDRE%20SPANHOL.pdf056cbf8eba64a2bac4489fb16b3d9ad3MD51open access1884/573122018-10-26 13:15:21.881open accessoai:acervodigital.ufpr.br:1884/57312Repositório InstitucionalPUBhttp://acervodigital.ufpr.br/oai/requestinformacaodigital@ufpr.bropendoar:3082018-10-26T16:15:21Repositório Institucional da UFPR - Universidade Federal do Paraná (UFPR)false
dc.title.pt_BR.fl_str_mv Automatic breast cancer classification from histopathological images : a hybrid approach
title Automatic breast cancer classification from histopathological images : a hybrid approach
spellingShingle Automatic breast cancer classification from histopathological images : a hybrid approach
Spanhol, Fabio Alexandre
Mamas - Cancer
Ciência da Computação
Processamento de imagens
Reconhecimento de padrões
Convoluções (Matemática)
title_short Automatic breast cancer classification from histopathological images : a hybrid approach
title_full Automatic breast cancer classification from histopathological images : a hybrid approach
title_fullStr Automatic breast cancer classification from histopathological images : a hybrid approach
title_full_unstemmed Automatic breast cancer classification from histopathological images : a hybrid approach
title_sort Automatic breast cancer classification from histopathological images : a hybrid approach
author Spanhol, Fabio Alexandre
author_facet Spanhol, Fabio Alexandre
author_role author
dc.contributor.other.pt_BR.fl_str_mv Universidade Federal do Paraná. Setor de Ciências Exatas. Programa de Pós-Graduação em Informática
dc.contributor.author.fl_str_mv Spanhol, Fabio Alexandre
dc.contributor.advisor1.fl_str_mv Oliveira, Luiz Eduardo Soares de, 1971-
contributor_str_mv Oliveira, Luiz Eduardo Soares de, 1971-
dc.subject.por.fl_str_mv Mamas - Cancer
Ciência da Computação
Processamento de imagens
Reconhecimento de padrões
Convoluções (Matemática)
topic Mamas - Cancer
Ciência da Computação
Processamento de imagens
Reconhecimento de padrões
Convoluções (Matemática)
description Orientador: Prof. Dr. Luiz Eduardo Soares de Oliveira
publishDate 2018
dc.date.accessioned.fl_str_mv 2018-10-26T16:15:21Z
dc.date.available.fl_str_mv 2018-10-26T16:15:21Z
dc.date.issued.fl_str_mv 2018
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://hdl.handle.net/1884/57312
url https://hdl.handle.net/1884/57312
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv 171 p. : il. (algumas color.).
application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFPR
instname:Universidade Federal do Paraná (UFPR)
instacron:UFPR
instname_str Universidade Federal do Paraná (UFPR)
instacron_str UFPR
institution UFPR
reponame_str Repositório Institucional da UFPR
collection Repositório Institucional da UFPR
bitstream.url.fl_str_mv https://acervodigital.ufpr.br/bitstream/1884/57312/1/R%20-%20T%20-%20FABIO%20ALEXANDRE%20SPANHOL.pdf
bitstream.checksum.fl_str_mv 056cbf8eba64a2bac4489fb16b3d9ad3
bitstream.checksumAlgorithm.fl_str_mv MD5
repository.name.fl_str_mv Repositório Institucional da UFPR - Universidade Federal do Paraná (UFPR)
repository.mail.fl_str_mv informacaodigital@ufpr.br
_version_ 1847526121179971584