Método automático para descoberta de funções de ordenação utilizando programação genética paralela em GPU

Detalhes bibliográficos
Ano de defesa: 2014
Autor(a) principal: Coimbra, Andre Rodrigues lattes
Orientador(a): Martins, Wellington Santos lattes
Banca de defesa: Martins, Wellington Santos, Rosa, Thierson Couto, Gonçalves, Marcos André, Camilo Junior, Celso Gonçalves
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Goiás
Programa de Pós-Graduação: Programa de Pós-graduação em Ciência da Computação (INF)
Departamento: Instituto de Informática - INF (RG)
País: Brasil
Palavras-chave em Português:
Palavras-chave em Inglês:
Área do conhecimento CNPq:
Link de acesso: http://repositorio.bc.ufg.br/tede/handle/tede/4525
Resumo: Ranking functions have a vital role in the performance of information retrieval systems ensuring that documents more related to the user’s search need – represented as a query – are shown in the top results, preventing the user from having to examine a range of documents that are not really relevant. Therefore, this work uses Genetic Programming (GP), an Evolutionary Computation technique, to find ranking functions automaticaly and systematicaly. Moreover, in this project the technique of GP was developed following a strategy that exploits parallelism through graphics processing units. Other known methods in the context of information retrieval as classification committees and the Lazy strategy were combined with the proposed approach – called Finch. These combinations were only feasible due to the GP nature and the use of parallelism. The experimental results with the Finch, regarding the ranking functions quality, surpassed the results of several strategies known in the literature. Considering the time performance, significant gains were also achieved. The solution developed exploiting the parallelism spends around twenty times less time than the solution using only the central processing unit.
id UFG-2_e0249cf1c27aad49b3b6e806a1def807
oai_identifier_str oai:repositorio.bc.ufg.br:tede/4525
network_acronym_str UFG-2
network_name_str Repositório Institucional da UFG
repository_id_str
spelling Martins, Wellington Santoshttp://lattes.cnpq.br/3041686206689904Rosa, Thierson CoutoMartins, Wellington SantosRosa, Thierson CoutoGonçalves, Marcos AndréCamilo Junior, Celso Gonçalveshttp://lattes.cnpq.br/5698724675089880Coimbra, Andre Rodrigues2015-05-15T13:37:45Z2014-03-28COIMBRA, A. R. Método automático para descoberta de funções de ordenação utilizando programação genética paralela em GPU. 2014. 97 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Goiás, Goiânia, 2014.http://repositorio.bc.ufg.br/tede/handle/tede/4525Ranking functions have a vital role in the performance of information retrieval systems ensuring that documents more related to the user’s search need – represented as a query – are shown in the top results, preventing the user from having to examine a range of documents that are not really relevant. Therefore, this work uses Genetic Programming (GP), an Evolutionary Computation technique, to find ranking functions automaticaly and systematicaly. Moreover, in this project the technique of GP was developed following a strategy that exploits parallelism through graphics processing units. Other known methods in the context of information retrieval as classification committees and the Lazy strategy were combined with the proposed approach – called Finch. These combinations were only feasible due to the GP nature and the use of parallelism. The experimental results with the Finch, regarding the ranking functions quality, surpassed the results of several strategies known in the literature. Considering the time performance, significant gains were also achieved. The solution developed exploiting the parallelism spends around twenty times less time than the solution using only the central processing unit.Funções de ordenação têm um papel vital no desempenho de sistemas de recuperação de informação garantindo que os documentos mais relacionados com o desejo do usuário – representado através de uma consulta – sejam trazidos no topo dos resultados, evitando que o usuário tenha que analisar uma série de documentos que não sejam realmente relevantes. Assim, utiliza-se a Programação Genética (PG), uma técnica da Computação Evolucionária, para descobrir de forma automática e sistemática funções de ordenação. Além disso, neste trabalho a técnica de PG foi desenvolvida seguindo uma estratégia que explora o paralelismo através de unidades gráficas de processamento. Foram agregados ainda na abordagem proposta – denominada Finch – outros métodos conhecidos no contexto de recuperação de informação como os comitês de classificação e a estratégia Lazy. Sendo que essa complementação só foi viável devido a natureza da PG e em virtude da utilização do paralelismo. Os resultados experimentais encontrados com a Finch, em relação à qualidade das funções de ordenação descobertas, superaram os resultados de diversas estratégias conhecidas na literatura. Considerando o desempenho da abordagem em função do tempo, também foram alcançados ganhos significativos. A solução desenvolvida explorando o paralelismo gasta, em média, vinte vezes menos tempo que a solução utilizando somente a unidade central de processamento.Submitted by Luciana Ferreira (lucgeral@gmail.com) on 2015-05-15T13:33:06Z No. of bitstreams: 2 Dissertação - André Rodrigues Coimbra - 2014.pdf: 5214859 bytes, checksum: d951502129d7be5d60b6a785516c3ad1 (MD5) license_rdf: 23148 bytes, checksum: 9da0b6dfac957114c6a7714714b86306 (MD5)Approved for entry into archive by Luciana Ferreira (lucgeral@gmail.com) on 2015-05-15T13:37:45Z (GMT) No. of bitstreams: 2 Dissertação - André Rodrigues Coimbra - 2014.pdf: 5214859 bytes, checksum: d951502129d7be5d60b6a785516c3ad1 (MD5) license_rdf: 23148 bytes, checksum: 9da0b6dfac957114c6a7714714b86306 (MD5)Made available in DSpace on 2015-05-15T13:37:45Z (GMT). No. of bitstreams: 2 Dissertação - André Rodrigues Coimbra - 2014.pdf: 5214859 bytes, checksum: d951502129d7be5d60b6a785516c3ad1 (MD5) license_rdf: 23148 bytes, checksum: 9da0b6dfac957114c6a7714714b86306 (MD5) Previous issue date: 2014-03-28application/pdfhttp://repositorio.bc.ufg.br/tede/retrieve/19785/Disserta%c3%a7%c3%a3o%20-%20Andr%c3%a9%20Rodrigues%20Coimbra%20-%202014.pdf.jpgporUniversidade Federal de GoiásPrograma de Pós-graduação em Ciência da Computação (INF)UFGBrasilInstituto de Informática - INF (RG)http://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/openAccessProgramação genéticaComputação paralelaSistema de recuperação de informaçãoOrdenação de documentosComputação evolucionáriaCUDAUnidade gráfica de processamentoInteligência computacionalGenetic programmingParallel computingInformation retrieval systemDocument rankingEvolutionary computationCUDAGraphics processing unitMachine learningCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOMétodo automático para descoberta de funções de ordenação utilizando programação genética paralela em GPUAutomatic raking function discovery method using parallel genetic programming on GPUinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis-3303550325223384799600600600-77122667346336447683671711205811204509reponame:Repositório Institucional da UFGinstname:Universidade Federal de Goiás (UFG)instacron:UFGLICENSElicense.txtlicense.txttext/plain; charset=utf-82165http://repositorio.bc.ufg.br/tede/bitstreams/5f891019-e432-4286-bf3a-1b0a93b2e9ea/downloadbd3efa91386c1718a7f26a329fdcb468MD51CC-LICENSElicense_urllicense_urltext/plain; charset=utf-849http://repositorio.bc.ufg.br/tede/bitstreams/ae1c6f3d-7f83-43bb-b5c6-05f52adeabb7/download4afdbb8c545fd630ea7db775da747b2fMD52license_textlicense_texttext/html; charset=utf-822762http://repositorio.bc.ufg.br/tede/bitstreams/5e11cc22-515b-425c-8bc4-3c824bee7574/downloadfda13080e892f3f68def2b8b70227968MD53license_rdflicense_rdfapplication/rdf+xml; charset=utf-823148http://repositorio.bc.ufg.br/tede/bitstreams/b56f4bb0-3496-44df-a93a-6cddf393a51e/download9da0b6dfac957114c6a7714714b86306MD54ORIGINALDissertação - André Rodrigues Coimbra - 2014.pdfDissertação - André Rodrigues Coimbra - 2014.pdfapplication/pdf5214859http://repositorio.bc.ufg.br/tede/bitstreams/51d2231e-82be-4e35-8179-9fcc3f53589d/downloadd951502129d7be5d60b6a785516c3ad1MD55TEXTDissertação - André Rodrigues Coimbra - 2014.pdf.txtDissertação - André Rodrigues Coimbra - 2014.pdf.txtExtracted Texttext/plain185672http://repositorio.bc.ufg.br/tede/bitstreams/daf6c40e-6d3e-40b9-9df1-9b2eafbd7650/download6b849812048a7c9cb7f5206ae3d4cda7MD56THUMBNAILDissertação - André Rodrigues Coimbra - 2014.pdf.jpgDissertação - André Rodrigues Coimbra - 2014.pdf.jpgGenerated Thumbnailimage/jpeg4167http://repositorio.bc.ufg.br/tede/bitstreams/1b797d29-6d28-46b2-bb03-68e0e9025538/download2dd671dc2d0ebd6dfe7260294d760ce1MD57tede/45252015-05-16 03:01:41.632http://creativecommons.org/licenses/by-nc-nd/4.0/Acesso Abertoopen.accessoai:repositorio.bc.ufg.br:tede/4525http://repositorio.bc.ufg.br/tedeRepositório InstitucionalPUBhttp://repositorio.bc.ufg.br/oai/requesttasesdissertacoes.bc@ufg.bropendoar:2015-05-16T06:01:41Repositório Institucional da UFG - Universidade Federal de Goiás (UFG)falseTk9UQTogQ09MT1FVRSBBUVVJIEEgU1VBIFBSw5NQUklBIExJQ0VOw4dBCkVzdGEgbGljZW7Dp2EgZGUgZXhlbXBsbyDDqSBmb3JuZWNpZGEgYXBlbmFzIHBhcmEgZmlucyBpbmZvcm1hdGl2b3MuCgpMSUNFTsOHQSBERSBESVNUUklCVUnDh8ODTyBOw4NPLUVYQ0xVU0lWQQoKQ29tIGEgYXByZXNlbnRhw6fDo28gZGVzdGEgbGljZW7Dp2EsIHZvY8OqIChvIGF1dG9yIChlcykgb3UgbyB0aXR1bGFyIGRvcyBkaXJlaXRvcyBkZSBhdXRvcikgY29uY2VkZSDDoCBVbml2ZXJzaWRhZGUgClhYWCAoU2lnbGEgZGEgVW5pdmVyc2lkYWRlKSBvIGRpcmVpdG8gbsOjby1leGNsdXNpdm8gZGUgcmVwcm9kdXppciwgIHRyYWR1emlyIChjb25mb3JtZSBkZWZpbmlkbyBhYmFpeG8pLCBlL291IApkaXN0cmlidWlyIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyAoaW5jbHVpbmRvIG8gcmVzdW1vKSBwb3IgdG9kbyBvIG11bmRvIG5vIGZvcm1hdG8gaW1wcmVzc28gZSBlbGV0csO0bmljbyBlIAplbSBxdWFscXVlciBtZWlvLCBpbmNsdWluZG8gb3MgZm9ybWF0b3Mgw6F1ZGlvIG91IHbDrWRlby4KClZvY8OqIGNvbmNvcmRhIHF1ZSBhIFNpZ2xhIGRlIFVuaXZlcnNpZGFkZSBwb2RlLCBzZW0gYWx0ZXJhciBvIGNvbnRlw7pkbywgdHJhbnNwb3IgYSBzdWEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvIApwYXJhIHF1YWxxdWVyIG1laW8gb3UgZm9ybWF0byBwYXJhIGZpbnMgZGUgcHJlc2VydmHDp8Ojby4KClZvY8OqIHRhbWLDqW0gY29uY29yZGEgcXVlIGEgU2lnbGEgZGUgVW5pdmVyc2lkYWRlIHBvZGUgbWFudGVyIG1haXMgZGUgdW1hIGPDs3BpYSBhIHN1YSB0ZXNlIG91IApkaXNzZXJ0YcOnw6NvIHBhcmEgZmlucyBkZSBzZWd1cmFuw6dhLCBiYWNrLXVwIGUgcHJlc2VydmHDp8Ojby4KClZvY8OqIGRlY2xhcmEgcXVlIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyDDqSBvcmlnaW5hbCBlIHF1ZSB2b2PDqiB0ZW0gbyBwb2RlciBkZSBjb25jZWRlciBvcyBkaXJlaXRvcyBjb250aWRvcyAKbmVzdGEgbGljZW7Dp2EuIFZvY8OqIHRhbWLDqW0gZGVjbGFyYSBxdWUgbyBkZXDDs3NpdG8gZGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyBuw6NvLCBxdWUgc2VqYSBkZSBzZXUgCmNvbmhlY2ltZW50bywgaW5mcmluZ2UgZGlyZWl0b3MgYXV0b3JhaXMgZGUgbmluZ3XDqW0uCgpDYXNvIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyBjb250ZW5oYSBtYXRlcmlhbCBxdWUgdm9jw6ogbsOjbyBwb3NzdWkgYSB0aXR1bGFyaWRhZGUgZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCB2b2PDqiAKZGVjbGFyYSBxdWUgb2J0ZXZlIGEgcGVybWlzc8OjbyBpcnJlc3RyaXRhIGRvIGRldGVudG9yIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBwYXJhIGNvbmNlZGVyIMOgIFNpZ2xhIGRlIFVuaXZlcnNpZGFkZSAKb3MgZGlyZWl0b3MgYXByZXNlbnRhZG9zIG5lc3RhIGxpY2Vuw6dhLCBlIHF1ZSBlc3NlIG1hdGVyaWFsIGRlIHByb3ByaWVkYWRlIGRlIHRlcmNlaXJvcyBlc3TDoSBjbGFyYW1lbnRlIAppZGVudGlmaWNhZG8gZSByZWNvbmhlY2lkbyBubyB0ZXh0byBvdSBubyBjb250ZcO6ZG8gZGEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvIG9yYSBkZXBvc2l0YWRhLgoKQ0FTTyBBIFRFU0UgT1UgRElTU0VSVEHDh8ODTyBPUkEgREVQT1NJVEFEQSBURU5IQSBTSURPIFJFU1VMVEFETyBERSBVTSBQQVRST0PDjU5JTyBPVSAKQVBPSU8gREUgVU1BIEFHw4pOQ0lBIERFIEZPTUVOVE8gT1UgT1VUUk8gT1JHQU5JU01PIFFVRSBOw4NPIFNFSkEgQSBTSUdMQSBERSAKVU5JVkVSU0lEQURFLCBWT0PDiiBERUNMQVJBIFFVRSBSRVNQRUlUT1UgVE9ET1MgRSBRVUFJU1FVRVIgRElSRUlUT1MgREUgUkVWSVPDg08gQ09NTyAKVEFNQsOJTSBBUyBERU1BSVMgT0JSSUdBw4fDlUVTIEVYSUdJREFTIFBPUiBDT05UUkFUTyBPVSBBQ09SRE8uCgpBIFNpZ2xhIGRlIFVuaXZlcnNpZGFkZSBzZSBjb21wcm9tZXRlIGEgaWRlbnRpZmljYXIgY2xhcmFtZW50ZSBvIHNldSBub21lIChzKSBvdSBvKHMpIG5vbWUocykgZG8ocykgCmRldGVudG9yKGVzKSBkb3MgZGlyZWl0b3MgYXV0b3JhaXMgZGEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvLCBlIG7Do28gZmFyw6EgcXVhbHF1ZXIgYWx0ZXJhw6fDo28sIGFsw6ltIGRhcXVlbGFzIApjb25jZWRpZGFzIHBvciBlc3RhIGxpY2Vuw6dhLgo=
dc.title.por.fl_str_mv Método automático para descoberta de funções de ordenação utilizando programação genética paralela em GPU
dc.title.alternative.eng.fl_str_mv Automatic raking function discovery method using parallel genetic programming on GPU
title Método automático para descoberta de funções de ordenação utilizando programação genética paralela em GPU
spellingShingle Método automático para descoberta de funções de ordenação utilizando programação genética paralela em GPU
Coimbra, Andre Rodrigues
Programação genética
Computação paralela
Sistema de recuperação de informação
Ordenação de documentos
Computação evolucionária
CUDA
Unidade gráfica de processamento
Inteligência computacional
Genetic programming
Parallel computing
Information retrieval system
Document ranking
Evolutionary computation
CUDA
Graphics processing unit
Machine learning
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
title_short Método automático para descoberta de funções de ordenação utilizando programação genética paralela em GPU
title_full Método automático para descoberta de funções de ordenação utilizando programação genética paralela em GPU
title_fullStr Método automático para descoberta de funções de ordenação utilizando programação genética paralela em GPU
title_full_unstemmed Método automático para descoberta de funções de ordenação utilizando programação genética paralela em GPU
title_sort Método automático para descoberta de funções de ordenação utilizando programação genética paralela em GPU
author Coimbra, Andre Rodrigues
author_facet Coimbra, Andre Rodrigues
author_role author
dc.contributor.advisor1.fl_str_mv Martins, Wellington Santos
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/3041686206689904
dc.contributor.advisor-co1.fl_str_mv Rosa, Thierson Couto
dc.contributor.referee1.fl_str_mv Martins, Wellington Santos
dc.contributor.referee2.fl_str_mv Rosa, Thierson Couto
dc.contributor.referee3.fl_str_mv Gonçalves, Marcos André
dc.contributor.referee4.fl_str_mv Camilo Junior, Celso Gonçalves
dc.contributor.authorLattes.fl_str_mv http://lattes.cnpq.br/5698724675089880
dc.contributor.author.fl_str_mv Coimbra, Andre Rodrigues
contributor_str_mv Martins, Wellington Santos
Rosa, Thierson Couto
Martins, Wellington Santos
Rosa, Thierson Couto
Gonçalves, Marcos André
Camilo Junior, Celso Gonçalves
dc.subject.por.fl_str_mv Programação genética
Computação paralela
Sistema de recuperação de informação
Ordenação de documentos
Computação evolucionária
CUDA
Unidade gráfica de processamento
Inteligência computacional
topic Programação genética
Computação paralela
Sistema de recuperação de informação
Ordenação de documentos
Computação evolucionária
CUDA
Unidade gráfica de processamento
Inteligência computacional
Genetic programming
Parallel computing
Information retrieval system
Document ranking
Evolutionary computation
CUDA
Graphics processing unit
Machine learning
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
dc.subject.eng.fl_str_mv Genetic programming
Parallel computing
Information retrieval system
Document ranking
Evolutionary computation
CUDA
Graphics processing unit
Machine learning
dc.subject.cnpq.fl_str_mv CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
description Ranking functions have a vital role in the performance of information retrieval systems ensuring that documents more related to the user’s search need – represented as a query – are shown in the top results, preventing the user from having to examine a range of documents that are not really relevant. Therefore, this work uses Genetic Programming (GP), an Evolutionary Computation technique, to find ranking functions automaticaly and systematicaly. Moreover, in this project the technique of GP was developed following a strategy that exploits parallelism through graphics processing units. Other known methods in the context of information retrieval as classification committees and the Lazy strategy were combined with the proposed approach – called Finch. These combinations were only feasible due to the GP nature and the use of parallelism. The experimental results with the Finch, regarding the ranking functions quality, surpassed the results of several strategies known in the literature. Considering the time performance, significant gains were also achieved. The solution developed exploiting the parallelism spends around twenty times less time than the solution using only the central processing unit.
publishDate 2014
dc.date.issued.fl_str_mv 2014-03-28
dc.date.accessioned.fl_str_mv 2015-05-15T13:37:45Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv COIMBRA, A. R. Método automático para descoberta de funções de ordenação utilizando programação genética paralela em GPU. 2014. 97 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Goiás, Goiânia, 2014.
dc.identifier.uri.fl_str_mv http://repositorio.bc.ufg.br/tede/handle/tede/4525
identifier_str_mv COIMBRA, A. R. Método automático para descoberta de funções de ordenação utilizando programação genética paralela em GPU. 2014. 97 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Goiás, Goiânia, 2014.
url http://repositorio.bc.ufg.br/tede/handle/tede/4525
dc.language.iso.fl_str_mv por
language por
dc.relation.program.fl_str_mv -3303550325223384799
dc.relation.confidence.fl_str_mv 600
600
600
dc.relation.department.fl_str_mv -7712266734633644768
dc.relation.cnpq.fl_str_mv 3671711205811204509
dc.rights.driver.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/4.0/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-nd/4.0/
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal de Goiás
dc.publisher.program.fl_str_mv Programa de Pós-graduação em Ciência da Computação (INF)
dc.publisher.initials.fl_str_mv UFG
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv Instituto de Informática - INF (RG)
publisher.none.fl_str_mv Universidade Federal de Goiás
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFG
instname:Universidade Federal de Goiás (UFG)
instacron:UFG
instname_str Universidade Federal de Goiás (UFG)
instacron_str UFG
institution UFG
reponame_str Repositório Institucional da UFG
collection Repositório Institucional da UFG
bitstream.url.fl_str_mv http://repositorio.bc.ufg.br/tede/bitstreams/5f891019-e432-4286-bf3a-1b0a93b2e9ea/download
http://repositorio.bc.ufg.br/tede/bitstreams/ae1c6f3d-7f83-43bb-b5c6-05f52adeabb7/download
http://repositorio.bc.ufg.br/tede/bitstreams/5e11cc22-515b-425c-8bc4-3c824bee7574/download
http://repositorio.bc.ufg.br/tede/bitstreams/b56f4bb0-3496-44df-a93a-6cddf393a51e/download
http://repositorio.bc.ufg.br/tede/bitstreams/51d2231e-82be-4e35-8179-9fcc3f53589d/download
http://repositorio.bc.ufg.br/tede/bitstreams/daf6c40e-6d3e-40b9-9df1-9b2eafbd7650/download
http://repositorio.bc.ufg.br/tede/bitstreams/1b797d29-6d28-46b2-bb03-68e0e9025538/download
bitstream.checksum.fl_str_mv bd3efa91386c1718a7f26a329fdcb468
4afdbb8c545fd630ea7db775da747b2f
fda13080e892f3f68def2b8b70227968
9da0b6dfac957114c6a7714714b86306
d951502129d7be5d60b6a785516c3ad1
6b849812048a7c9cb7f5206ae3d4cda7
2dd671dc2d0ebd6dfe7260294d760ce1
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFG - Universidade Federal de Goiás (UFG)
repository.mail.fl_str_mv tasesdissertacoes.bc@ufg.br
_version_ 1798045078524002304