Metodologia para estruturação de informações de laudos radiológicos

Detalhes bibliográficos
Ano de defesa: 2013
Autor(a) principal: Barbosa, Flavio
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: http://www.teses.usp.br/teses/disponiveis/17/17138/tde-26032014-103153/
Resumo: Introdução: O laudo radiológico com entrada de dados estruturada proporciona precisão na recuperação de informações, todavia, é menos abrangente que o texto-livre e pode impedir o especialista de descrever um achado importante, não contemplado pela estrutura pré-definida. Portanto, a solução está em interpretar o texto escrito pelo especialista e os transportar para uma estrutura computacional ontológica formalizando o conhecimento. Objetivos: Elaborar e avaliar uma metodologia para estruturação de informações de laudos radiológicos em texto livre que contemple as especificidades brasileiras, incluindo a terminologia empregada. Métodos: Coleta de 1701 laudos radiológicos de ressonância magnética da coluna lombossacra em três instituições distintas. Para estruturar a informação, foram utilizadas técnicas de mineração de texto e conceituação ontológica das unidades lexicais. Dez radiologistas especialistas avaliaram a superestrutura textual e a terminologia extraída e conceituada, por meio de questionário eletrônico onde foram sugeridas 3 superestruturas textuais e 30 termos com a descrição do respectivo conceito. Resultados: A metodologia criada é constituída por 6 passos: 1) coleta dos laudos radiológicos de determinado tipo de exame; 2) decomposição textual; 3) normalização das unidades lexicais; 4) identificação das superestruturas textuais; 5) conceituação dos termos candidatos; 6) avaliação das superestruturas identificadas e da terminologia extraída e conceituada pelos especialistas na linguagem de especialidade estudada. Foram identificadas três superestruturas textuais diferentes. Após processamento automático inicial, 6129 unidades lexicais foram normalizadas obtendo 4568 termos candidatos dos quais 4183 foram conceituados e originaram 727 conceitos. Foram estabelecidas 13963 relações entre termos candidatos e conceitos, e 789 relações entre conceitos. Quanto a adequada descrição dos termos, 40% dos avaliadores concordam plenamente que estão adequados, 60% concordam parcialmente que estão adequados e nenhum avaliador discordou que os termos são adequados. Em relação a quantidade de termos utilizados pelos avaliadores, em sua respectiva instituição, 70% utilizam de 24 a 30 termos e 30% de 16 a 23 termos. A conceituação de um termo foi considerada inadequada por dois avaliadores. Conclusão: A metodologia proposta foi avaliada por radiologistas especialistas que identificaram as diferenças das superestruturas textuais entre as instituições e os termos com a descrição do respectivo conceito. Portanto, foi possível estruturar a informação de laudos radiológicos da coluna lombossacra a partir do texto livre identificando as superestruturas textuais, extraindo as unidades lexicais, normalizando as unidades lexicais e conceituando ontologicamente os termos candidatos preservando a referência com as respectivas partes constituintes dos laudos radiológicos produzidos no contexto brasileiro.
id USP_a486c64fb4e57959a0fbc5d65cea28a1
oai_identifier_str oai:teses.usp.br:tde-26032014-103153
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str
spelling Metodologia para estruturação de informações de laudos radiológicosMethodology for structuring information from radiological reportsestruturação da informaçãofree-textLaudo radiológicoontologiaontologyRadiological reportstructuring informationterminologiaterminologytexto livreIntrodução: O laudo radiológico com entrada de dados estruturada proporciona precisão na recuperação de informações, todavia, é menos abrangente que o texto-livre e pode impedir o especialista de descrever um achado importante, não contemplado pela estrutura pré-definida. Portanto, a solução está em interpretar o texto escrito pelo especialista e os transportar para uma estrutura computacional ontológica formalizando o conhecimento. Objetivos: Elaborar e avaliar uma metodologia para estruturação de informações de laudos radiológicos em texto livre que contemple as especificidades brasileiras, incluindo a terminologia empregada. Métodos: Coleta de 1701 laudos radiológicos de ressonância magnética da coluna lombossacra em três instituições distintas. Para estruturar a informação, foram utilizadas técnicas de mineração de texto e conceituação ontológica das unidades lexicais. Dez radiologistas especialistas avaliaram a superestrutura textual e a terminologia extraída e conceituada, por meio de questionário eletrônico onde foram sugeridas 3 superestruturas textuais e 30 termos com a descrição do respectivo conceito. Resultados: A metodologia criada é constituída por 6 passos: 1) coleta dos laudos radiológicos de determinado tipo de exame; 2) decomposição textual; 3) normalização das unidades lexicais; 4) identificação das superestruturas textuais; 5) conceituação dos termos candidatos; 6) avaliação das superestruturas identificadas e da terminologia extraída e conceituada pelos especialistas na linguagem de especialidade estudada. Foram identificadas três superestruturas textuais diferentes. Após processamento automático inicial, 6129 unidades lexicais foram normalizadas obtendo 4568 termos candidatos dos quais 4183 foram conceituados e originaram 727 conceitos. Foram estabelecidas 13963 relações entre termos candidatos e conceitos, e 789 relações entre conceitos. Quanto a adequada descrição dos termos, 40% dos avaliadores concordam plenamente que estão adequados, 60% concordam parcialmente que estão adequados e nenhum avaliador discordou que os termos são adequados. Em relação a quantidade de termos utilizados pelos avaliadores, em sua respectiva instituição, 70% utilizam de 24 a 30 termos e 30% de 16 a 23 termos. A conceituação de um termo foi considerada inadequada por dois avaliadores. Conclusão: A metodologia proposta foi avaliada por radiologistas especialistas que identificaram as diferenças das superestruturas textuais entre as instituições e os termos com a descrição do respectivo conceito. Portanto, foi possível estruturar a informação de laudos radiológicos da coluna lombossacra a partir do texto livre identificando as superestruturas textuais, extraindo as unidades lexicais, normalizando as unidades lexicais e conceituando ontologicamente os termos candidatos preservando a referência com as respectivas partes constituintes dos laudos radiológicos produzidos no contexto brasileiro.Introduction: The radiological report with structured data entry provides precision in information retrieval, however, is less comprehensive than the text-free and may prevent the expert to describe an important finding, not covered by the pre-defined structure. So the solution is to interpret the text written by expert and carry for a computational framework formalizing the ontological knowledge. Objectives: Develop and evaluate a methodology for structuring information in free text radiology reports that contemplates the Brazilian specifications, including terminology. Methods: 1701 radiological reports of lumbosacral MRI were collected in three different institutions. To structure the information we used techniques of text mining and ontological conceptualization of lexical units extracted. Ten dedicated radiologists evaluated the textual superstructure and terminology extracted by the electronic questionnaire which were suggested textual 3 superstructures and 30 terms with the description of its concept. Results: The established methodology consisted of six steps: 1) collection of radiology reports of certain type of examination; 2) textual decomposition; 3) lexical units normalization; 4) textual superstructures identification ; 5) conceptualization of candidate terms; 6) evaluation of identified superstructures and terminology extracted by experts in the specialized language study. We identified three different textual superstructures. After automatic processing initial 6129 lexical units were normalized getting 4568 candidate terms of which 4183 were conceptualized and originated 727 concepts. 13963 were established relations between candidate terms and concepts and 789 relations between concepts. As for adequate description of the terms, 40% of the evaluators agree fully that are appropriate, 60% somewhat agree that they are adequate and no evaluator disagreed that the terms are adequate. Regarding the number of words used by evaluators in their respective institution using 70% between 24 and 30 terms and 30% from 16 to 23 terms. The conceptualization of a term was considered inadequate by two evaluators. The established methodology consisted of six steps: 1) collection of radiology reports of certain type of examination; 2) textual decomposition; 3) lexical units normalization; 4) textual superstructures identification ; 5) conceptualization of candidate terms; 6) evaluation of identified superstructures and terminology extracted by experts in the specialized language study. Conclusions: The proposed methodology was evaluated by radiologists who identified the differences between the textual superstructures institutions and the terms describing the relevant concept. Therefore, it was possible to structure the information of the lumbosacral spine radiology reports from free text by identifying textual superstructures, extracting lexical units, normalizing the lexical units and conceptualizing the terms ontologically candidates preserving the reference to the respective constituent parts of radiology reports produced in the Brazilian context.Biblioteca Digitais de Teses e Dissertações da USPMuglia, Valdair FranciscoBarbosa, Flavio2013-10-25info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttp://www.teses.usp.br/teses/disponiveis/17/17138/tde-26032014-103153/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2016-07-28T16:11:47Zoai:teses.usp.br:tde-26032014-103153Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212016-07-28T16:11:47Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Metodologia para estruturação de informações de laudos radiológicos
Methodology for structuring information from radiological reports
title Metodologia para estruturação de informações de laudos radiológicos
spellingShingle Metodologia para estruturação de informações de laudos radiológicos
Barbosa, Flavio
estruturação da informação
free-text
Laudo radiológico
ontologia
ontology
Radiological report
structuring information
terminologia
terminology
texto livre
title_short Metodologia para estruturação de informações de laudos radiológicos
title_full Metodologia para estruturação de informações de laudos radiológicos
title_fullStr Metodologia para estruturação de informações de laudos radiológicos
title_full_unstemmed Metodologia para estruturação de informações de laudos radiológicos
title_sort Metodologia para estruturação de informações de laudos radiológicos
author Barbosa, Flavio
author_facet Barbosa, Flavio
author_role author
dc.contributor.none.fl_str_mv Muglia, Valdair Francisco
dc.contributor.author.fl_str_mv Barbosa, Flavio
dc.subject.por.fl_str_mv estruturação da informação
free-text
Laudo radiológico
ontologia
ontology
Radiological report
structuring information
terminologia
terminology
texto livre
topic estruturação da informação
free-text
Laudo radiológico
ontologia
ontology
Radiological report
structuring information
terminologia
terminology
texto livre
description Introdução: O laudo radiológico com entrada de dados estruturada proporciona precisão na recuperação de informações, todavia, é menos abrangente que o texto-livre e pode impedir o especialista de descrever um achado importante, não contemplado pela estrutura pré-definida. Portanto, a solução está em interpretar o texto escrito pelo especialista e os transportar para uma estrutura computacional ontológica formalizando o conhecimento. Objetivos: Elaborar e avaliar uma metodologia para estruturação de informações de laudos radiológicos em texto livre que contemple as especificidades brasileiras, incluindo a terminologia empregada. Métodos: Coleta de 1701 laudos radiológicos de ressonância magnética da coluna lombossacra em três instituições distintas. Para estruturar a informação, foram utilizadas técnicas de mineração de texto e conceituação ontológica das unidades lexicais. Dez radiologistas especialistas avaliaram a superestrutura textual e a terminologia extraída e conceituada, por meio de questionário eletrônico onde foram sugeridas 3 superestruturas textuais e 30 termos com a descrição do respectivo conceito. Resultados: A metodologia criada é constituída por 6 passos: 1) coleta dos laudos radiológicos de determinado tipo de exame; 2) decomposição textual; 3) normalização das unidades lexicais; 4) identificação das superestruturas textuais; 5) conceituação dos termos candidatos; 6) avaliação das superestruturas identificadas e da terminologia extraída e conceituada pelos especialistas na linguagem de especialidade estudada. Foram identificadas três superestruturas textuais diferentes. Após processamento automático inicial, 6129 unidades lexicais foram normalizadas obtendo 4568 termos candidatos dos quais 4183 foram conceituados e originaram 727 conceitos. Foram estabelecidas 13963 relações entre termos candidatos e conceitos, e 789 relações entre conceitos. Quanto a adequada descrição dos termos, 40% dos avaliadores concordam plenamente que estão adequados, 60% concordam parcialmente que estão adequados e nenhum avaliador discordou que os termos são adequados. Em relação a quantidade de termos utilizados pelos avaliadores, em sua respectiva instituição, 70% utilizam de 24 a 30 termos e 30% de 16 a 23 termos. A conceituação de um termo foi considerada inadequada por dois avaliadores. Conclusão: A metodologia proposta foi avaliada por radiologistas especialistas que identificaram as diferenças das superestruturas textuais entre as instituições e os termos com a descrição do respectivo conceito. Portanto, foi possível estruturar a informação de laudos radiológicos da coluna lombossacra a partir do texto livre identificando as superestruturas textuais, extraindo as unidades lexicais, normalizando as unidades lexicais e conceituando ontologicamente os termos candidatos preservando a referência com as respectivas partes constituintes dos laudos radiológicos produzidos no contexto brasileiro.
publishDate 2013
dc.date.none.fl_str_mv 2013-10-25
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://www.teses.usp.br/teses/disponiveis/17/17138/tde-26032014-103153/
url http://www.teses.usp.br/teses/disponiveis/17/17138/tde-26032014-103153/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1865491338326179840