Proposição das bases para um dicionário on-line de frasemas : diferenciando locuções de colocações sob a perspectiva lexicográfica da teoria sentido-texto

Detalhes bibliográficos
Ano de defesa: 2025
Autor(a) principal: Carra, Sara Augusto
Orientador(a): Abreu, Sabrina Pereira de
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Palavras-chave em Inglês:
Link de acesso: http://hdl.handle.net/10183/292687
Resumo: Ao escrever a dissertação de mestrado, erigida a partir dos pressupostos teóricos da Teoria Sentido-Texto (TST), notou-se que os dicionários escolares lematizam colocações como se fossem locuções. Então, surgiu o questionamento: será que os dicionários de língua geral também fazem isso? Assim, nasceu essa tese. Para tanto, um dicionário de bastante credibilidade entre a população comum foi escolhido: o Dicionário Eletrônico Houaiss de Língua Portuguesa (DEHLP). Além de verificar essa questão, a tese se propõe também a averiguar a existência de novas funções lexicais e, até, a partir de casos anômalos, como o sentido do todo ser apenas o sentido de um dos elementos constitutivos e quando parece haver uma fusão entre duas colocações, a existência de um novo tipo de frasema. Fora as questões teóricas, há também uma intenção prática: construir um site, onde estará o dicionário feito sob a ótica da TST – a tese apresenta uma versão demo (um demonstrativo) dele. O corpus inicial foi constituído por 11.702 unidades coletadas manualmente do DEHLP, trata-se das unidades que o dicionário entende como locuções que estão no intervalo A-K. Após a coleta, foram retirados do corpus: 6499 unidades que o próprio dicionário reconhecia como termo da área, 91 clichês linguísticos, 316 unidades que entraram prontas de outras línguas e 131 unidades formadas por termos coordenados. Assim, o corpus para análise contou com 4665 unidades. Dessas unidades, 78,4% corresponde a locuções (sendo que, entre elas, 73% corresponde a locuções fortes, 14,6% a semi-locuções e 12,14% a locuções fracas) e 21,6% a colocações (sendo que, entre elas, 92% corresponde a colocações standards e 8% a colocações não standards) – um dado interessante é que 45% das colocações apresenta uma relação de hiperonímia entre base e colocado. Foram encontradas, aplicadas às colocações standards, 08 funções lexicais (FLs) paradigmáticas e 16 FLs sintagmáticas, além de seis combinações de duas FLs sintagmáticas e duas combinações de uma FL paradigmática e uma FL sintagmática – não foram encontradas combinações de duas FLs paradigmáticas. Sobre os casos anômalos, eles acabaram se mostrando residuais, apenas 28 casos em todo o corpus no total, insuficientes para se fazer qualquer tipo de afirmação. Sobre o caso de novas funções lexicais, verificou-se que se trata, na verdade, de uma relação de hiperonímia entre base e colocado (caso que se mostrou bastante produtivo em nossa língua). A versão demo do dicionário online foi construída a partir da análise. Foram inseridas apenas as locuções fortes e as colocações que estivessem, tanto no DEHLP quanto no site, na letra A: assim, a versão demo conta com 96 locuções e 208 colocações, além de 86 lexemas que são base das colocações. Eles apresentam uma estrutura de nicho léxico; cada verbete conta com sua entrada, sua classe gramatical (no caso das locuções, seu uso), a abonação e, em alguns casos, remissivas (colocadas em hiperlink, que redireciona para a palavra/expressão de mesmo sentido – quando a remissiva se refere a lexema ou a locução, use-se ‘Sinônimo’; quando se refere a colocação, usa-se ‘Mesmo que’).
id UFRGS-2_4bea52063a82e8f3bfa84abb1451ddf0
oai_identifier_str oai:www.lume.ufrgs.br:10183/292687
network_acronym_str UFRGS-2
network_name_str Repositório Institucional da UFRGS
repository_id_str
spelling Carra, Sara AugustoAbreu, Sabrina Pereira de2025-06-06T06:58:51Z2025http://hdl.handle.net/10183/292687001258459Ao escrever a dissertação de mestrado, erigida a partir dos pressupostos teóricos da Teoria Sentido-Texto (TST), notou-se que os dicionários escolares lematizam colocações como se fossem locuções. Então, surgiu o questionamento: será que os dicionários de língua geral também fazem isso? Assim, nasceu essa tese. Para tanto, um dicionário de bastante credibilidade entre a população comum foi escolhido: o Dicionário Eletrônico Houaiss de Língua Portuguesa (DEHLP). Além de verificar essa questão, a tese se propõe também a averiguar a existência de novas funções lexicais e, até, a partir de casos anômalos, como o sentido do todo ser apenas o sentido de um dos elementos constitutivos e quando parece haver uma fusão entre duas colocações, a existência de um novo tipo de frasema. Fora as questões teóricas, há também uma intenção prática: construir um site, onde estará o dicionário feito sob a ótica da TST – a tese apresenta uma versão demo (um demonstrativo) dele. O corpus inicial foi constituído por 11.702 unidades coletadas manualmente do DEHLP, trata-se das unidades que o dicionário entende como locuções que estão no intervalo A-K. Após a coleta, foram retirados do corpus: 6499 unidades que o próprio dicionário reconhecia como termo da área, 91 clichês linguísticos, 316 unidades que entraram prontas de outras línguas e 131 unidades formadas por termos coordenados. Assim, o corpus para análise contou com 4665 unidades. Dessas unidades, 78,4% corresponde a locuções (sendo que, entre elas, 73% corresponde a locuções fortes, 14,6% a semi-locuções e 12,14% a locuções fracas) e 21,6% a colocações (sendo que, entre elas, 92% corresponde a colocações standards e 8% a colocações não standards) – um dado interessante é que 45% das colocações apresenta uma relação de hiperonímia entre base e colocado. Foram encontradas, aplicadas às colocações standards, 08 funções lexicais (FLs) paradigmáticas e 16 FLs sintagmáticas, além de seis combinações de duas FLs sintagmáticas e duas combinações de uma FL paradigmática e uma FL sintagmática – não foram encontradas combinações de duas FLs paradigmáticas. Sobre os casos anômalos, eles acabaram se mostrando residuais, apenas 28 casos em todo o corpus no total, insuficientes para se fazer qualquer tipo de afirmação. Sobre o caso de novas funções lexicais, verificou-se que se trata, na verdade, de uma relação de hiperonímia entre base e colocado (caso que se mostrou bastante produtivo em nossa língua). A versão demo do dicionário online foi construída a partir da análise. Foram inseridas apenas as locuções fortes e as colocações que estivessem, tanto no DEHLP quanto no site, na letra A: assim, a versão demo conta com 96 locuções e 208 colocações, além de 86 lexemas que são base das colocações. Eles apresentam uma estrutura de nicho léxico; cada verbete conta com sua entrada, sua classe gramatical (no caso das locuções, seu uso), a abonação e, em alguns casos, remissivas (colocadas em hiperlink, que redireciona para a palavra/expressão de mesmo sentido – quando a remissiva se refere a lexema ou a locução, use-se ‘Sinônimo’; quando se refere a colocação, usa-se ‘Mesmo que’).When writing the Master's thesis, built on the theoretical assumptions of the Meaning-Text Theory (MTT), it was noted that school dictionaries lemmatize collocations as if they were phrases. Then the following question arose: do general language dictionaries do that too? As a result, this thesis came about. In order to do so, a dictionary that is quite credible among the general population was chosen: the digital version of the Houaiss Dictionary of the Portuguese Language (DEHLP - Dicionário Eletrônico Houaiss de Língua Portuguesa). In addition to assessing this matter, this thesis proposes to investigate the existence of new lexical functions and, based on anomalous cases, when the meaning of the whole can be just the meaning of one of its constituent elements and when there seems to be a fusion between two collocations, the existence of a new type of phraseme. Beyond theoretical matters, there is also a practical side to this: to build a website, which shall host the dictionary created based on the MTT postulates - the thesis present a demo version of the software. Our initial corpus consisted of 11,702 unit manually retrieved from the DEHLP; these are units that the dictionary treats as phrases, located in the A-K range. After retrieval, the following was removed from the corpus: 6,499 units that the dictionary itself treated as technical terms, 91 linguistic clichés, 316 units that were borrowed from other languages unchanged, and 131 units composed of coordinated terms. Thus, the corpus subject to analysis consisted of 4,665 units. Of these units, 78.4% of them correspond to phrases (among them, 73% correspond to strong phrases, 14.6% to semi-phrases and 12.14% to weak phrases), 21.6% to collocations (among them, 92% correspond to standard ones and 8% to non standard ones). An interesting fact about these is that 45% of collocations have a hypernymy relationship between base and collocative partner. Applied to standard collocations, 08 paradigmatic lexical functions (LFs) and 16 syntagmatic LFs were found, in addition to six combinations of two syntagmatic LFs and two combinations of one paradigmatic LF and one syntagmatic LF - no combinations of two paradigmatic LFs were found. With regard to the anomalous cases, they were found to be merely residual, with only 28 cases in the entire corpus in total, being insufficient to make any kind of statement. Regarding the case of new lexical functions, we found that there is in fact a hypernymy relationship between base and collocative partner (a case that has proven to be considerably productive in our language). The online demo version of the dictionary was built based on this analysis. We have only added strong phrases and collocations that were, both in the DEHLP and in the website, under the letter A: thus, the demo version has 96 phrases and 208 collocations, in addition to 86 lexemes that serve as the base of the collocations. They have a lexical niche structure: each headword has its entry, its grammatical category (and use, in the case of phrases), quotations/examples and, in some cases, references (with a hyperlink that redirects users to the word/expression with the same meaning – when the reference refers to a lexeme or phrase, ‘Synonym’ is used; when it refers to a collocation, ‘Same as’ is used).application/pdfporFraseologiaLocuçõesColocações lexicaisDicionariosPhrasemesPhrasesCollocationLexical functionDictionariesProposição das bases para um dicionário on-line de frasemas : diferenciando locuções de colocações sob a perspectiva lexicográfica da teoria sentido-textoinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisUniversidade Federal do Rio Grande do SulInstituto de LetrasPrograma de Pós-Graduação em LetrasPorto Alegre, BR-RS2025doutoradoinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001258459.pdf.txt001258459.pdf.txtExtracted Texttext/plain403402http://www.lume.ufrgs.br/bitstream/10183/292687/2/001258459.pdf.txt84fb2adf48acc533e7d15443c4b197dfMD52ORIGINAL001258459.pdfTexto completoapplication/pdf12233414http://www.lume.ufrgs.br/bitstream/10183/292687/1/001258459.pdfc08fa6dfc1d10224f7fd34b3dd5db3c9MD5110183/2926872025-06-07 06:59:06.744293oai:www.lume.ufrgs.br:10183/292687Repositório InstitucionalPUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.bropendoar:2025-06-07T09:59:06Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv Proposição das bases para um dicionário on-line de frasemas : diferenciando locuções de colocações sob a perspectiva lexicográfica da teoria sentido-texto
title Proposição das bases para um dicionário on-line de frasemas : diferenciando locuções de colocações sob a perspectiva lexicográfica da teoria sentido-texto
spellingShingle Proposição das bases para um dicionário on-line de frasemas : diferenciando locuções de colocações sob a perspectiva lexicográfica da teoria sentido-texto
Carra, Sara Augusto
Fraseologia
Locuções
Colocações lexicais
Dicionarios
Phrasemes
Phrases
Collocation
Lexical function
Dictionaries
title_short Proposição das bases para um dicionário on-line de frasemas : diferenciando locuções de colocações sob a perspectiva lexicográfica da teoria sentido-texto
title_full Proposição das bases para um dicionário on-line de frasemas : diferenciando locuções de colocações sob a perspectiva lexicográfica da teoria sentido-texto
title_fullStr Proposição das bases para um dicionário on-line de frasemas : diferenciando locuções de colocações sob a perspectiva lexicográfica da teoria sentido-texto
title_full_unstemmed Proposição das bases para um dicionário on-line de frasemas : diferenciando locuções de colocações sob a perspectiva lexicográfica da teoria sentido-texto
title_sort Proposição das bases para um dicionário on-line de frasemas : diferenciando locuções de colocações sob a perspectiva lexicográfica da teoria sentido-texto
author Carra, Sara Augusto
author_facet Carra, Sara Augusto
author_role author
dc.contributor.author.fl_str_mv Carra, Sara Augusto
dc.contributor.advisor1.fl_str_mv Abreu, Sabrina Pereira de
contributor_str_mv Abreu, Sabrina Pereira de
dc.subject.por.fl_str_mv Fraseologia
Locuções
Colocações lexicais
Dicionarios
topic Fraseologia
Locuções
Colocações lexicais
Dicionarios
Phrasemes
Phrases
Collocation
Lexical function
Dictionaries
dc.subject.eng.fl_str_mv Phrasemes
Phrases
Collocation
Lexical function
Dictionaries
description Ao escrever a dissertação de mestrado, erigida a partir dos pressupostos teóricos da Teoria Sentido-Texto (TST), notou-se que os dicionários escolares lematizam colocações como se fossem locuções. Então, surgiu o questionamento: será que os dicionários de língua geral também fazem isso? Assim, nasceu essa tese. Para tanto, um dicionário de bastante credibilidade entre a população comum foi escolhido: o Dicionário Eletrônico Houaiss de Língua Portuguesa (DEHLP). Além de verificar essa questão, a tese se propõe também a averiguar a existência de novas funções lexicais e, até, a partir de casos anômalos, como o sentido do todo ser apenas o sentido de um dos elementos constitutivos e quando parece haver uma fusão entre duas colocações, a existência de um novo tipo de frasema. Fora as questões teóricas, há também uma intenção prática: construir um site, onde estará o dicionário feito sob a ótica da TST – a tese apresenta uma versão demo (um demonstrativo) dele. O corpus inicial foi constituído por 11.702 unidades coletadas manualmente do DEHLP, trata-se das unidades que o dicionário entende como locuções que estão no intervalo A-K. Após a coleta, foram retirados do corpus: 6499 unidades que o próprio dicionário reconhecia como termo da área, 91 clichês linguísticos, 316 unidades que entraram prontas de outras línguas e 131 unidades formadas por termos coordenados. Assim, o corpus para análise contou com 4665 unidades. Dessas unidades, 78,4% corresponde a locuções (sendo que, entre elas, 73% corresponde a locuções fortes, 14,6% a semi-locuções e 12,14% a locuções fracas) e 21,6% a colocações (sendo que, entre elas, 92% corresponde a colocações standards e 8% a colocações não standards) – um dado interessante é que 45% das colocações apresenta uma relação de hiperonímia entre base e colocado. Foram encontradas, aplicadas às colocações standards, 08 funções lexicais (FLs) paradigmáticas e 16 FLs sintagmáticas, além de seis combinações de duas FLs sintagmáticas e duas combinações de uma FL paradigmática e uma FL sintagmática – não foram encontradas combinações de duas FLs paradigmáticas. Sobre os casos anômalos, eles acabaram se mostrando residuais, apenas 28 casos em todo o corpus no total, insuficientes para se fazer qualquer tipo de afirmação. Sobre o caso de novas funções lexicais, verificou-se que se trata, na verdade, de uma relação de hiperonímia entre base e colocado (caso que se mostrou bastante produtivo em nossa língua). A versão demo do dicionário online foi construída a partir da análise. Foram inseridas apenas as locuções fortes e as colocações que estivessem, tanto no DEHLP quanto no site, na letra A: assim, a versão demo conta com 96 locuções e 208 colocações, além de 86 lexemas que são base das colocações. Eles apresentam uma estrutura de nicho léxico; cada verbete conta com sua entrada, sua classe gramatical (no caso das locuções, seu uso), a abonação e, em alguns casos, remissivas (colocadas em hiperlink, que redireciona para a palavra/expressão de mesmo sentido – quando a remissiva se refere a lexema ou a locução, use-se ‘Sinônimo’; quando se refere a colocação, usa-se ‘Mesmo que’).
publishDate 2025
dc.date.accessioned.fl_str_mv 2025-06-06T06:58:51Z
dc.date.issued.fl_str_mv 2025
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10183/292687
dc.identifier.nrb.pt_BR.fl_str_mv 001258459
url http://hdl.handle.net/10183/292687
identifier_str_mv 001258459
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFRGS
instname:Universidade Federal do Rio Grande do Sul (UFRGS)
instacron:UFRGS
instname_str Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str UFRGS
institution UFRGS
reponame_str Repositório Institucional da UFRGS
collection Repositório Institucional da UFRGS
bitstream.url.fl_str_mv http://www.lume.ufrgs.br/bitstream/10183/292687/2/001258459.pdf.txt
http://www.lume.ufrgs.br/bitstream/10183/292687/1/001258459.pdf
bitstream.checksum.fl_str_mv 84fb2adf48acc533e7d15443c4b197df
c08fa6dfc1d10224f7fd34b3dd5db3c9
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv lume@ufrgs.br
_version_ 1864542924516098048