A construção de recursos lingüístico-computacionais para o português do Brasil: o projeto Unitex-PB
| Ano de defesa: | 2004 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Biblioteca Digitais de Teses e Dissertações da USP
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | http://www.teses.usp.br/teses/disponiveis/55/55134/tde-19022020-151305/ |
Resumo: | A escassez de recursos linguístico-computacionais é um dos maiores entraves para o avanço das pesquisas, e consequente desenvolvimento de sistemas, na área de Processamento de Língua Natural (PLN) no Brasil. Este trabalho documenta a construção de uma série recursos lingúístico-computacionais para português brasileiro seguindo os formalismos utilizados pela ferramenta de processamento de corpus Unitex. Foram construídos léxicos computacionais, regras de resolução de ambiguidades e bibliotecas para acesso a léxicos compactados, assim como algumas ferramentas para validar esses recursos. Os desafios encontrados durante todo o processo são discutidos nessa dissertação. |
| id |
USP_84098cb04a207ea6d5937fa02b200b03 |
|---|---|
| oai_identifier_str |
oai:teses.usp.br:tde-19022020-151305 |
| network_acronym_str |
USP |
| network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
| repository_id_str |
|
| spelling |
A construção de recursos lingüístico-computacionais para o português do Brasil: o projeto Unitex-PBNot availableNão disponívelNot availableA escassez de recursos linguístico-computacionais é um dos maiores entraves para o avanço das pesquisas, e consequente desenvolvimento de sistemas, na área de Processamento de Língua Natural (PLN) no Brasil. Este trabalho documenta a construção de uma série recursos lingúístico-computacionais para português brasileiro seguindo os formalismos utilizados pela ferramenta de processamento de corpus Unitex. Foram construídos léxicos computacionais, regras de resolução de ambiguidades e bibliotecas para acesso a léxicos compactados, assim como algumas ferramentas para validar esses recursos. Os desafios encontrados durante todo o processo são discutidos nessa dissertação.The lack of computational linguistic resources represents one of the major challenges to the development and research activities related to Natural Language Processing. This work documents the project and development of various computational linguistic resources that support the Brazilian Portuguese language according to the formal methodology used by the corpus processing system called Unitex. The delivered resources include computational lexicons, rules to solve ambiguity, libraries to access compressed lexicons, and additional tools to validate those resources. Some aspects about the main challenges encountered during the course of this project are also addressed.Biblioteca Digitais de Teses e Dissertações da USPNunes, Maria das Graças VolpeMuniz, Marcelo Caetano Martins2004-03-26info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://www.teses.usp.br/teses/disponiveis/55/55134/tde-19022020-151305/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2020-02-19T21:18:02Zoai:teses.usp.br:tde-19022020-151305Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212020-02-19T21:18:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
| dc.title.none.fl_str_mv |
A construção de recursos lingüístico-computacionais para o português do Brasil: o projeto Unitex-PB Not available |
| title |
A construção de recursos lingüístico-computacionais para o português do Brasil: o projeto Unitex-PB |
| spellingShingle |
A construção de recursos lingüístico-computacionais para o português do Brasil: o projeto Unitex-PB Muniz, Marcelo Caetano Martins Não disponível Not available |
| title_short |
A construção de recursos lingüístico-computacionais para o português do Brasil: o projeto Unitex-PB |
| title_full |
A construção de recursos lingüístico-computacionais para o português do Brasil: o projeto Unitex-PB |
| title_fullStr |
A construção de recursos lingüístico-computacionais para o português do Brasil: o projeto Unitex-PB |
| title_full_unstemmed |
A construção de recursos lingüístico-computacionais para o português do Brasil: o projeto Unitex-PB |
| title_sort |
A construção de recursos lingüístico-computacionais para o português do Brasil: o projeto Unitex-PB |
| author |
Muniz, Marcelo Caetano Martins |
| author_facet |
Muniz, Marcelo Caetano Martins |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Nunes, Maria das Graças Volpe |
| dc.contributor.author.fl_str_mv |
Muniz, Marcelo Caetano Martins |
| dc.subject.por.fl_str_mv |
Não disponível Not available |
| topic |
Não disponível Not available |
| description |
A escassez de recursos linguístico-computacionais é um dos maiores entraves para o avanço das pesquisas, e consequente desenvolvimento de sistemas, na área de Processamento de Língua Natural (PLN) no Brasil. Este trabalho documenta a construção de uma série recursos lingúístico-computacionais para português brasileiro seguindo os formalismos utilizados pela ferramenta de processamento de corpus Unitex. Foram construídos léxicos computacionais, regras de resolução de ambiguidades e bibliotecas para acesso a léxicos compactados, assim como algumas ferramentas para validar esses recursos. Os desafios encontrados durante todo o processo são discutidos nessa dissertação. |
| publishDate |
2004 |
| dc.date.none.fl_str_mv |
2004-03-26 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
http://www.teses.usp.br/teses/disponiveis/55/55134/tde-19022020-151305/ |
| url |
http://www.teses.usp.br/teses/disponiveis/55/55134/tde-19022020-151305/ |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.relation.none.fl_str_mv |
|
| dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.coverage.none.fl_str_mv |
|
| dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
| instname_str |
Universidade de São Paulo (USP) |
| instacron_str |
USP |
| institution |
USP |
| reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
| collection |
Biblioteca Digital de Teses e Dissertações da USP |
| repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
| repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
| _version_ |
1815258263707451392 |