Detecção automática de conteúdo ofensivo na web

Detalhes bibliográficos
Ano de defesa: 2006
Autor(a) principal: Belém, Ruan Josemberg Silva
Outros Autores: http://lattes.cnpq.br/1956136040044296
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal do Amazonas
Instituto de Computação
BR
UFAM
Programa de Pós-graduação em Informática
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Web
Link de acesso: http://tede.ufam.edu.br/handle/tede/2932
Resumo: A World Wide Web (Web) é uma fonte de informação com grande quantidade e diversidade de conteúdo, incluindo material de caráter ofensivo relacionado á pornografia. Diante deste cenário, existe a necessidade de detectar tal conteúdo ofensivo de maneira a evitar que o mesmo seja indevidamente acessado por crianças ou por funcionários de empresas, onde o acesso a este tipo de conteúdo geralmente não é permitido. Embora este tipo de informação possa estar presente na Web em forma de texto, vídeo ou sons, grande parte deste conteúdo está disponibilizado na forma de imagens. O problema de identificação de imagens ofensivas pode ser visto como um problema de classificação. Como as imagens em questão estão inseridas em páginas web, além das informações que podem ser extraídas da própria imagem, também têm-se as informações textuais encontradas nas páginas que possuem as imagens. Aptos a extração de evidências a classificação é realizada usando-se um classificador baseado em SVM treinado com uma coleção de 1000 imagens ofensivas e 1000 imagens não-ofensivas. Este trabalho apresenta duas abordagens diferentes para detecção de imagens ofensivas na Web: a primeira, baseada no conteúdo da imagem e a segunda, baseada em evidências textuais extraídas das páginas web onde se encontram as imagens. Ambas as abordagens se mostraram efiazes na detecção de imagens ofensivas, apesar de utilizarem algoritmos simples para a extração de informações relacionadas às imagens.
id UFAM_e460880d3961a21c26acbc9149998d8a
oai_identifier_str oai:https://tede.ufam.edu.br/handle/:tede/2932
network_acronym_str UFAM
network_name_str Biblioteca Digital de Teses e Dissertações da UFAM
repository_id_str
spelling Detecção automática de conteúdo ofensivo na webAutomatic detection of offensive content on WebRecuperação de InformaçãoDetecção de imagens ofensivasWebProcessamento Digital de ImagensRecuperação de InformaçãoDetecção de imagens ofensivasWeb Processamento Digital de ImagensInformation recoveingOffensive image detectionWebDigital image processingCIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃOA World Wide Web (Web) é uma fonte de informação com grande quantidade e diversidade de conteúdo, incluindo material de caráter ofensivo relacionado á pornografia. Diante deste cenário, existe a necessidade de detectar tal conteúdo ofensivo de maneira a evitar que o mesmo seja indevidamente acessado por crianças ou por funcionários de empresas, onde o acesso a este tipo de conteúdo geralmente não é permitido. Embora este tipo de informação possa estar presente na Web em forma de texto, vídeo ou sons, grande parte deste conteúdo está disponibilizado na forma de imagens. O problema de identificação de imagens ofensivas pode ser visto como um problema de classificação. Como as imagens em questão estão inseridas em páginas web, além das informações que podem ser extraídas da própria imagem, também têm-se as informações textuais encontradas nas páginas que possuem as imagens. Aptos a extração de evidências a classificação é realizada usando-se um classificador baseado em SVM treinado com uma coleção de 1000 imagens ofensivas e 1000 imagens não-ofensivas. Este trabalho apresenta duas abordagens diferentes para detecção de imagens ofensivas na Web: a primeira, baseada no conteúdo da imagem e a segunda, baseada em evidências textuais extraídas das páginas web onde se encontram as imagens. Ambas as abordagens se mostraram efiazes na detecção de imagens ofensivas, apesar de utilizarem algoritmos simples para a extração de informações relacionadas às imagens.The World Wide Web is a huge source of diverse information, including offensive material such as pornography related content. This poses the problem of automatcally detecting offensive content as a way to avoid unauthorised access, for instance, by children or by employees during working hours. Although this sort of information is published in many forms, including text, sound and video, images are the most common form of publication of offensive content on the Web. Detecting offensive images can be considered as a classification problem. Given that images are part of Web pages, textual information can be used as important evidence along with the content extracted from images, such as colour, texture and shapes. This dissertation proposes two distinct approaches for automatic detection of offensive images on the Web. The first is based on image content, specifically colour. The second approach is based on textual terms extracted from the Web page that present the images. After evidence extraction the classification is performed using the SVM technique, based on a collection of 1000 offensive images and 1000 non-offensive images for training. Experiments carried out have shown that both approaches are effective, although they rely on simple algorithms for extracting evidences related to the images.Fundação de Amparo à Pesquisa do Estado do AmazonasUniversidade Federal do AmazonasInstituto de ComputaçãoBRUFAMPrograma de Pós-graduação em InformáticaCavalcanti, João Marcos Bastoshttp://lattes.cnpq.br/3537707069694606Belém, Ruan Josemberg Silvahttp://lattes.cnpq.br/19561360400442962015-04-11T14:03:02Z2007-07-062006-05-12info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfBELÉM, Ruan Josemberg Silva.Detecção automática de conteúdo ofensivo na web. 2006. 52 f. Dissertação (Mestrado em Informática) - Universidade Federal do Amazonas, Manaus, 2006.http://tede.ufam.edu.br/handle/tede/2932porinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFAMinstname:Universidade Federal do Amazonas (UFAM)instacron:UFAM2016-04-22T14:34:33Zoai:https://tede.ufam.edu.br/handle/:tede/2932Biblioteca Digital de Teses e Dissertaçõeshttp://200.129.163.131:8080/PUBhttp://200.129.163.131:8080/oai/requestddbc@ufam.edu.br||ddbc@ufam.edu.bropendoar:65922016-04-22T14:34:33Biblioteca Digital de Teses e Dissertações da UFAM - Universidade Federal do Amazonas (UFAM)false
dc.title.none.fl_str_mv Detecção automática de conteúdo ofensivo na web
Automatic detection of offensive content on Web
title Detecção automática de conteúdo ofensivo na web
spellingShingle Detecção automática de conteúdo ofensivo na web
Belém, Ruan Josemberg Silva
Recuperação de Informação
Detecção de imagens ofensivas
Web
Processamento Digital de Imagens
Recuperação de Informação
Detecção de imagens ofensivas
Web Processamento Digital de Imagens
Information recoveing
Offensive image detection
Web
Digital image processing
CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO
title_short Detecção automática de conteúdo ofensivo na web
title_full Detecção automática de conteúdo ofensivo na web
title_fullStr Detecção automática de conteúdo ofensivo na web
title_full_unstemmed Detecção automática de conteúdo ofensivo na web
title_sort Detecção automática de conteúdo ofensivo na web
author Belém, Ruan Josemberg Silva
author_facet Belém, Ruan Josemberg Silva
http://lattes.cnpq.br/1956136040044296
author_role author
author2 http://lattes.cnpq.br/1956136040044296
author2_role author
dc.contributor.none.fl_str_mv Cavalcanti, João Marcos Bastos
http://lattes.cnpq.br/3537707069694606
dc.contributor.author.fl_str_mv Belém, Ruan Josemberg Silva
http://lattes.cnpq.br/1956136040044296
dc.subject.por.fl_str_mv Recuperação de Informação
Detecção de imagens ofensivas
Web
Processamento Digital de Imagens
Recuperação de Informação
Detecção de imagens ofensivas
Web Processamento Digital de Imagens
Information recoveing
Offensive image detection
Web
Digital image processing
CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO
topic Recuperação de Informação
Detecção de imagens ofensivas
Web
Processamento Digital de Imagens
Recuperação de Informação
Detecção de imagens ofensivas
Web Processamento Digital de Imagens
Information recoveing
Offensive image detection
Web
Digital image processing
CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO
description A World Wide Web (Web) é uma fonte de informação com grande quantidade e diversidade de conteúdo, incluindo material de caráter ofensivo relacionado á pornografia. Diante deste cenário, existe a necessidade de detectar tal conteúdo ofensivo de maneira a evitar que o mesmo seja indevidamente acessado por crianças ou por funcionários de empresas, onde o acesso a este tipo de conteúdo geralmente não é permitido. Embora este tipo de informação possa estar presente na Web em forma de texto, vídeo ou sons, grande parte deste conteúdo está disponibilizado na forma de imagens. O problema de identificação de imagens ofensivas pode ser visto como um problema de classificação. Como as imagens em questão estão inseridas em páginas web, além das informações que podem ser extraídas da própria imagem, também têm-se as informações textuais encontradas nas páginas que possuem as imagens. Aptos a extração de evidências a classificação é realizada usando-se um classificador baseado em SVM treinado com uma coleção de 1000 imagens ofensivas e 1000 imagens não-ofensivas. Este trabalho apresenta duas abordagens diferentes para detecção de imagens ofensivas na Web: a primeira, baseada no conteúdo da imagem e a segunda, baseada em evidências textuais extraídas das páginas web onde se encontram as imagens. Ambas as abordagens se mostraram efiazes na detecção de imagens ofensivas, apesar de utilizarem algoritmos simples para a extração de informações relacionadas às imagens.
publishDate 2006
dc.date.none.fl_str_mv 2006-05-12
2007-07-06
2015-04-11T14:03:02Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv BELÉM, Ruan Josemberg Silva.Detecção automática de conteúdo ofensivo na web. 2006. 52 f. Dissertação (Mestrado em Informática) - Universidade Federal do Amazonas, Manaus, 2006.
http://tede.ufam.edu.br/handle/tede/2932
identifier_str_mv BELÉM, Ruan Josemberg Silva.Detecção automática de conteúdo ofensivo na web. 2006. 52 f. Dissertação (Mestrado em Informática) - Universidade Federal do Amazonas, Manaus, 2006.
url http://tede.ufam.edu.br/handle/tede/2932
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal do Amazonas
Instituto de Computação
BR
UFAM
Programa de Pós-graduação em Informática
publisher.none.fl_str_mv Universidade Federal do Amazonas
Instituto de Computação
BR
UFAM
Programa de Pós-graduação em Informática
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFAM
instname:Universidade Federal do Amazonas (UFAM)
instacron:UFAM
instname_str Universidade Federal do Amazonas (UFAM)
instacron_str UFAM
institution UFAM
reponame_str Biblioteca Digital de Teses e Dissertações da UFAM
collection Biblioteca Digital de Teses e Dissertações da UFAM
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFAM - Universidade Federal do Amazonas (UFAM)
repository.mail.fl_str_mv ddbc@ufam.edu.br||ddbc@ufam.edu.br
_version_ 1851781265561223168