A physics based feature engineering framework for trajectory analysis

Detalhes bibliográficos
Ano de defesa: 2022
Autor(a) principal: Mossmann, Eduardo Henrique
Orientador(a): Bordin, José Rafael
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: eng
Instituição de defesa: Universidade Federal de Pelotas
Programa de Pós-Graduação: Programa de Pós-Graduação em Física
Departamento: Não Informado pela instituição
País: Brasil
Palavras-chave em Português:
Área do conhecimento CNPq:
Link de acesso: http://guaiaca.ufpel.edu.br/xmlui/handle/prefix/12963
Resumo: Análise de trajetória é de grande importância para o entendimento de sistemas dinâmicos e suas propriedades. Trajetórias podem descrever a evolução temporal de uma variável em diferentes contextos, como o movimento da célula cancerígenas, a volatilidade de uma ação na bolsa de valores, o crescimento populacional e assim por diante. Nos sistemas físicos, onde estamos interessados na evolução temporal da posição de um ou de um conjunto de corpos, existem sistemas onde a posição desses corpos depende da concentração de matéria em diferentes locais. Nesses contextos, o movimento dos corpos tende a ser no sentido de uma área com alta concentração de matéria para uma região de baixa concentração. Este movimento, tecnicamente chamado de fenômeno de transporte, é chamado de Difusão. Como uma maneira geral de descrever a evolução temporal de um corpo em tais sistemas, usamos o Deslocamento Médio Quadrático. Os tipos de movimento, às vezes chamados de Classes de Difusão, são uma maneira de descrever o movimento de corpos em sistemas onde a Difusão é observada. Para classificar a difusão, a literatura utiliza a dependência temporal do Deslocamento Quadrático Médio. No presente trabalho, apontamos que usar esta dependência temporal como a única grandeza para classificar a Difusão dá origem a um problema imediato, onde podemos ter duas ou mais Classes de Difusão possíveis para o mesmo movimento. Com isso em mente, propusemos uma estrutura de engenharia de atributos baseada em física para análise de trajetória chamada TrajPy como uma possível solução para esse problema. A estrutura contém três componentes principais. A primeira nos permite realizar a análise de trajetórias computando múltiplas quantidades de interesse físico e estatístico para qualquer trajetória, seja essa trajetória retirada de experimentos ou gerada em uma simulação computacional. A segunda componente é uma combinação de duas interfaces gráficas, que são modelos de interface que permite a interação com dispositivos digitais por meio de elementos gráficos como menus e botões. A primeira nos permite calcular as quantidades físicas e estatísticas de forma que não precisamos estar familiarizados com programação em Python. A segunda interface gráfica foi desenvolvida para ser um primeiro passo para uma solução geral para o gargalo tecnológico presente no processo de descoberta de medicamentos. A terceira componente nos permite simular os quatro tipos básicos de movimento (Difusão Normal, Anômala, Confinada e Movimento Direto com Difusão) com uma gama de parâmetros para que possamos usar essas simulações como uma conexão entre análise de trajetórias e algoritmos de classificação externo no contexto de Aprendizado de Máquina para que possamos classificar a Difusão de partículas de uma forma mais geral para que evitemos o problema envolvendo a sobreposição de classes de difusão. Como demonstração da aplicação do TrajPy, realizamos análise de trajetória e classificação de difusão para sistemas que mimetizam a capacidade das células de serem deformadas. Para isso, simulamos vários sistemas, usando Dinâmica Molecular, em uma combinação de valores de pressão e constante de mola relacionada à Lei de Hooke, onde cada sistema é composto por 400 anéis poliméricos bidimensionais. Como resultados, observamos que os anéis poliméricos, uma vez que a pressão atinge um determinado limiar, apresentam uma transição dinâmica de Difusão Normal para Difusão Confinada, ou seja, à medida que a pressão aumenta, os anéis poliméricos ficam confinados dentro de uma região como efeito do aumento da pressão. Em seguida, classificamos a Difusão de cada anel polimérico para cada sistema e observamos o mesmo comportamento sob a perspectiva do algoritmo Random Forest Classifier usando Aprendizado de Máquina.
id UFPL_eb5b1c7d65caf0c30cff23115b5a77ad
oai_identifier_str oai:guaiaca.ufpel.edu.br:prefix/12963
network_acronym_str UFPL
network_name_str Repositório Institucional da UFPel - Guaiaca
repository_id_str
spelling 2024-05-13T12:15:56Z2024-05-102024-05-13T12:15:56Z2022-08-16MOSSMANN, Eduardo Henrique. A physics based feature engineering framework for trajectory analysis. orientador: José Rafael Bordin. coordenador: Maurício Moreira Soares. 2022. 177 f. Dissertação (Mestrado em Física) - Programa de Pós-Graduação em Física, Departamento de Física, Instituto de Física e Matemática, Universidade Federal de Pelotas, Pelotas, 2022.http://guaiaca.ufpel.edu.br/xmlui/handle/prefix/12963Análise de trajetória é de grande importância para o entendimento de sistemas dinâmicos e suas propriedades. Trajetórias podem descrever a evolução temporal de uma variável em diferentes contextos, como o movimento da célula cancerígenas, a volatilidade de uma ação na bolsa de valores, o crescimento populacional e assim por diante. Nos sistemas físicos, onde estamos interessados na evolução temporal da posição de um ou de um conjunto de corpos, existem sistemas onde a posição desses corpos depende da concentração de matéria em diferentes locais. Nesses contextos, o movimento dos corpos tende a ser no sentido de uma área com alta concentração de matéria para uma região de baixa concentração. Este movimento, tecnicamente chamado de fenômeno de transporte, é chamado de Difusão. Como uma maneira geral de descrever a evolução temporal de um corpo em tais sistemas, usamos o Deslocamento Médio Quadrático. Os tipos de movimento, às vezes chamados de Classes de Difusão, são uma maneira de descrever o movimento de corpos em sistemas onde a Difusão é observada. Para classificar a difusão, a literatura utiliza a dependência temporal do Deslocamento Quadrático Médio. No presente trabalho, apontamos que usar esta dependência temporal como a única grandeza para classificar a Difusão dá origem a um problema imediato, onde podemos ter duas ou mais Classes de Difusão possíveis para o mesmo movimento. Com isso em mente, propusemos uma estrutura de engenharia de atributos baseada em física para análise de trajetória chamada TrajPy como uma possível solução para esse problema. A estrutura contém três componentes principais. A primeira nos permite realizar a análise de trajetórias computando múltiplas quantidades de interesse físico e estatístico para qualquer trajetória, seja essa trajetória retirada de experimentos ou gerada em uma simulação computacional. A segunda componente é uma combinação de duas interfaces gráficas, que são modelos de interface que permite a interação com dispositivos digitais por meio de elementos gráficos como menus e botões. A primeira nos permite calcular as quantidades físicas e estatísticas de forma que não precisamos estar familiarizados com programação em Python. A segunda interface gráfica foi desenvolvida para ser um primeiro passo para uma solução geral para o gargalo tecnológico presente no processo de descoberta de medicamentos. A terceira componente nos permite simular os quatro tipos básicos de movimento (Difusão Normal, Anômala, Confinada e Movimento Direto com Difusão) com uma gama de parâmetros para que possamos usar essas simulações como uma conexão entre análise de trajetórias e algoritmos de classificação externo no contexto de Aprendizado de Máquina para que possamos classificar a Difusão de partículas de uma forma mais geral para que evitemos o problema envolvendo a sobreposição de classes de difusão. Como demonstração da aplicação do TrajPy, realizamos análise de trajetória e classificação de difusão para sistemas que mimetizam a capacidade das células de serem deformadas. Para isso, simulamos vários sistemas, usando Dinâmica Molecular, em uma combinação de valores de pressão e constante de mola relacionada à Lei de Hooke, onde cada sistema é composto por 400 anéis poliméricos bidimensionais. Como resultados, observamos que os anéis poliméricos, uma vez que a pressão atinge um determinado limiar, apresentam uma transição dinâmica de Difusão Normal para Difusão Confinada, ou seja, à medida que a pressão aumenta, os anéis poliméricos ficam confinados dentro de uma região como efeito do aumento da pressão. Em seguida, classificamos a Difusão de cada anel polimérico para cada sistema e observamos o mesmo comportamento sob a perspectiva do algoritmo Random Forest Classifier usando Aprendizado de Máquina.Trajectory analysis is of great importance for the understanding of dynamical systems and their properties. Trajectories may describe the time evolution of a variable in different contexts, such as the motion of cancer cell , the volatility of a stock in the stock market, the populational growth and so forth. In physical systems, where we are interested in the time evolution of the position of one or a set of bodies, there are systems where the position of these bodies depends on the concentration of matter at different locations. In such context, the movement of bodies tends to be in the direction of an area with high concentration of matter to a region of low concentration. This motion is called Diffusion. As a general way of describing the time evolution of a body in such systems, we use the Mean Squared Displacement. The motion types, sometimes called the Diffusion Classes, are a way of describing the movement of bodies in systems where Diffusion is observed. To classify the diffusion, the literature uses the time dependence of the Mean Squared Displacement. In the present work, we pointed out that using this time dependence as the only quantity to classify the Diffusion will give rise to an immediate problem, where we can have two or more possible Diffusion Classes for the same motion. With that in mind, we proposed a physics-based feature engineering framework for trajectory analysis called TrajPy as a possible solution to this problem. The framework contains three main components. The first allows us to perform trajectory analysis by computing multiple quantities of physical and statistical interest for any trajectory, whether this trajectory is taken from experiments or generated in a computer simulation. The second component is a combination of two graphical-user interfaces. The first allows us to compute the quantities of the first component in a way that we do not need to be familiar with Python programming. The second graphical-user interface was developed to be a first step towards a general solution to the bottleneck present in the drug discovery process. The third component allows us to simulate the four basic motion types with a range of parameters so that we may use these simulations as a connection between trajectory analysis and Machine Learning, where we aim to classify the Diffusion of particles in a more general way so that we avoid the problem involving the overlapping of diffusion classes. As a demonstration of the application of TrajPy, we performed trajectory analysis and diffusion classification for systems that mimic the capability of cells to be deformed. For this, we simulated multiple systems, using Molecular Dynamics, in a combination of values of pressure and the spring constant related to Hooke’s Law, where each system is composed of 400 two-dimensional polymer rings. As a result, we observed that the polymer rings, once the pressure reaches a certain threshold, present a dynamical transition from Normal Diffusion to Confined Diffusion, i.e., as the pressure increases, the polymer rings become trapped inside a region as an effect of the increase in pressure. Then, we classified the Diffusion of each polymer ring for every system and observed the same behavior from the perspective of the Random Forest Classifier algorithm using Machine Learning.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPESengUniversidade Federal de PelotasPrograma de Pós-Graduação em FísicaUFPelBrasilCC BY-NC-SAinfo:eu-repo/semantics/openAccessCIENCIAS EXATAS E DA TERRAFISICAAprendizado de máquinaAnálise de trajetóriasDifusãoMachine learningTrajectory analysisDiffusionA physics based feature engineering framework for trajectory analysisinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisSoares, Maurício MoreiraBordin, José RafaelMossmann, Eduardo Henriquereponame:Repositório Institucional da UFPel - Guaiacainstname:Universidade Federal de Pelotas (UFPEL)instacron:UFPELORIGINALDissertacao_Eduardo Henrique Mossmann.pdfDissertacao_Eduardo Henrique Mossmann.pdfapplication/pdf7785436http://guaiaca.ufpel.edu.br/xmlui/bitstream/prefix/12963/1/Dissertacao_Eduardo%20Henrique%20Mossmann.pdf4dad5409cd72a4b83fd912f4a106bb0cMD51open accessLICENSElicense.txtlicense.txttext/plain; charset=utf-867http://guaiaca.ufpel.edu.br/xmlui/bitstream/prefix/12963/2/license.txtfbd6c74465857056e3ca572d7586661bMD52open accessTEXTDissertacao_Eduardo Henrique Mossmann.pdf.txtDissertacao_Eduardo Henrique Mossmann.pdf.txtExtracted texttext/plain285848http://guaiaca.ufpel.edu.br/xmlui/bitstream/prefix/12963/3/Dissertacao_Eduardo%20Henrique%20Mossmann.pdf.txt502b4644ec25cc9ce582cfc8f415e1e9MD53open accessTHUMBNAILDissertacao_Eduardo Henrique Mossmann.pdf.jpgDissertacao_Eduardo Henrique Mossmann.pdf.jpgGenerated Thumbnailimage/jpeg1174http://guaiaca.ufpel.edu.br/xmlui/bitstream/prefix/12963/4/Dissertacao_Eduardo%20Henrique%20Mossmann.pdf.jpg9e7cba52fc8e3b50c3f12e72fc8cb779MD54open accessprefix/129632024-05-14 03:02:25.736open accessoai:guaiaca.ufpel.edu.br:prefix/12963VG9kb3Mgb3MgaXRlbnMgZGVzc2EgY29tdW5pZGFkZSBzZWd1ZW0gYSBsaWNlbsOnYSBDcmVhdGl2ZSBDb21tb25zLg==Repositório InstitucionalPUBhttp://repositorio.ufpel.edu.br/oai/requestrippel@ufpel.edu.br || repositorio@ufpel.edu.br || aline.batista@ufpel.edu.bropendoar:2024-05-14T06:02:25Repositório Institucional da UFPel - Guaiaca - Universidade Federal de Pelotas (UFPEL)false
dc.title.pt_BR.fl_str_mv A physics based feature engineering framework for trajectory analysis
title A physics based feature engineering framework for trajectory analysis
spellingShingle A physics based feature engineering framework for trajectory analysis
Mossmann, Eduardo Henrique
CIENCIAS EXATAS E DA TERRA
Aprendizado de máquina
Análise de trajetórias
Difusão
Machine learning
Trajectory analysis
Diffusion
FISICA
title_short A physics based feature engineering framework for trajectory analysis
title_full A physics based feature engineering framework for trajectory analysis
title_fullStr A physics based feature engineering framework for trajectory analysis
title_full_unstemmed A physics based feature engineering framework for trajectory analysis
title_sort A physics based feature engineering framework for trajectory analysis
author Mossmann, Eduardo Henrique
author_facet Mossmann, Eduardo Henrique
author_role author
dc.contributor.advisor-co1.fl_str_mv Soares, Maurício Moreira
dc.contributor.advisor1.fl_str_mv Bordin, José Rafael
dc.contributor.author.fl_str_mv Mossmann, Eduardo Henrique
contributor_str_mv Soares, Maurício Moreira
Bordin, José Rafael
dc.subject.cnpq.fl_str_mv CIENCIAS EXATAS E DA TERRA
topic CIENCIAS EXATAS E DA TERRA
Aprendizado de máquina
Análise de trajetórias
Difusão
Machine learning
Trajectory analysis
Diffusion
FISICA
dc.subject.por.fl_str_mv Aprendizado de máquina
Análise de trajetórias
Difusão
Machine learning
Trajectory analysis
Diffusion
dc.subject.cnpq1.pt_BR.fl_str_mv FISICA
description Análise de trajetória é de grande importância para o entendimento de sistemas dinâmicos e suas propriedades. Trajetórias podem descrever a evolução temporal de uma variável em diferentes contextos, como o movimento da célula cancerígenas, a volatilidade de uma ação na bolsa de valores, o crescimento populacional e assim por diante. Nos sistemas físicos, onde estamos interessados na evolução temporal da posição de um ou de um conjunto de corpos, existem sistemas onde a posição desses corpos depende da concentração de matéria em diferentes locais. Nesses contextos, o movimento dos corpos tende a ser no sentido de uma área com alta concentração de matéria para uma região de baixa concentração. Este movimento, tecnicamente chamado de fenômeno de transporte, é chamado de Difusão. Como uma maneira geral de descrever a evolução temporal de um corpo em tais sistemas, usamos o Deslocamento Médio Quadrático. Os tipos de movimento, às vezes chamados de Classes de Difusão, são uma maneira de descrever o movimento de corpos em sistemas onde a Difusão é observada. Para classificar a difusão, a literatura utiliza a dependência temporal do Deslocamento Quadrático Médio. No presente trabalho, apontamos que usar esta dependência temporal como a única grandeza para classificar a Difusão dá origem a um problema imediato, onde podemos ter duas ou mais Classes de Difusão possíveis para o mesmo movimento. Com isso em mente, propusemos uma estrutura de engenharia de atributos baseada em física para análise de trajetória chamada TrajPy como uma possível solução para esse problema. A estrutura contém três componentes principais. A primeira nos permite realizar a análise de trajetórias computando múltiplas quantidades de interesse físico e estatístico para qualquer trajetória, seja essa trajetória retirada de experimentos ou gerada em uma simulação computacional. A segunda componente é uma combinação de duas interfaces gráficas, que são modelos de interface que permite a interação com dispositivos digitais por meio de elementos gráficos como menus e botões. A primeira nos permite calcular as quantidades físicas e estatísticas de forma que não precisamos estar familiarizados com programação em Python. A segunda interface gráfica foi desenvolvida para ser um primeiro passo para uma solução geral para o gargalo tecnológico presente no processo de descoberta de medicamentos. A terceira componente nos permite simular os quatro tipos básicos de movimento (Difusão Normal, Anômala, Confinada e Movimento Direto com Difusão) com uma gama de parâmetros para que possamos usar essas simulações como uma conexão entre análise de trajetórias e algoritmos de classificação externo no contexto de Aprendizado de Máquina para que possamos classificar a Difusão de partículas de uma forma mais geral para que evitemos o problema envolvendo a sobreposição de classes de difusão. Como demonstração da aplicação do TrajPy, realizamos análise de trajetória e classificação de difusão para sistemas que mimetizam a capacidade das células de serem deformadas. Para isso, simulamos vários sistemas, usando Dinâmica Molecular, em uma combinação de valores de pressão e constante de mola relacionada à Lei de Hooke, onde cada sistema é composto por 400 anéis poliméricos bidimensionais. Como resultados, observamos que os anéis poliméricos, uma vez que a pressão atinge um determinado limiar, apresentam uma transição dinâmica de Difusão Normal para Difusão Confinada, ou seja, à medida que a pressão aumenta, os anéis poliméricos ficam confinados dentro de uma região como efeito do aumento da pressão. Em seguida, classificamos a Difusão de cada anel polimérico para cada sistema e observamos o mesmo comportamento sob a perspectiva do algoritmo Random Forest Classifier usando Aprendizado de Máquina.
publishDate 2022
dc.date.issued.fl_str_mv 2022-08-16
dc.date.accessioned.fl_str_mv 2024-05-13T12:15:56Z
dc.date.available.fl_str_mv 2024-05-10
2024-05-13T12:15:56Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv MOSSMANN, Eduardo Henrique. A physics based feature engineering framework for trajectory analysis. orientador: José Rafael Bordin. coordenador: Maurício Moreira Soares. 2022. 177 f. Dissertação (Mestrado em Física) - Programa de Pós-Graduação em Física, Departamento de Física, Instituto de Física e Matemática, Universidade Federal de Pelotas, Pelotas, 2022.
dc.identifier.uri.fl_str_mv http://guaiaca.ufpel.edu.br/xmlui/handle/prefix/12963
identifier_str_mv MOSSMANN, Eduardo Henrique. A physics based feature engineering framework for trajectory analysis. orientador: José Rafael Bordin. coordenador: Maurício Moreira Soares. 2022. 177 f. Dissertação (Mestrado em Física) - Programa de Pós-Graduação em Física, Departamento de Física, Instituto de Física e Matemática, Universidade Federal de Pelotas, Pelotas, 2022.
url http://guaiaca.ufpel.edu.br/xmlui/handle/prefix/12963
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv CC BY-NC-SA
info:eu-repo/semantics/openAccess
rights_invalid_str_mv CC BY-NC-SA
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Pelotas
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Física
dc.publisher.initials.fl_str_mv UFPel
dc.publisher.country.fl_str_mv Brasil
publisher.none.fl_str_mv Universidade Federal de Pelotas
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFPel - Guaiaca
instname:Universidade Federal de Pelotas (UFPEL)
instacron:UFPEL
instname_str Universidade Federal de Pelotas (UFPEL)
instacron_str UFPEL
institution UFPEL
reponame_str Repositório Institucional da UFPel - Guaiaca
collection Repositório Institucional da UFPel - Guaiaca
bitstream.url.fl_str_mv http://guaiaca.ufpel.edu.br/xmlui/bitstream/prefix/12963/1/Dissertacao_Eduardo%20Henrique%20Mossmann.pdf
http://guaiaca.ufpel.edu.br/xmlui/bitstream/prefix/12963/2/license.txt
http://guaiaca.ufpel.edu.br/xmlui/bitstream/prefix/12963/3/Dissertacao_Eduardo%20Henrique%20Mossmann.pdf.txt
http://guaiaca.ufpel.edu.br/xmlui/bitstream/prefix/12963/4/Dissertacao_Eduardo%20Henrique%20Mossmann.pdf.jpg
bitstream.checksum.fl_str_mv 4dad5409cd72a4b83fd912f4a106bb0c
fbd6c74465857056e3ca572d7586661b
502b4644ec25cc9ce582cfc8f415e1e9
9e7cba52fc8e3b50c3f12e72fc8cb779
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFPel - Guaiaca - Universidade Federal de Pelotas (UFPEL)
repository.mail.fl_str_mv rippel@ufpel.edu.br || repositorio@ufpel.edu.br || aline.batista@ufpel.edu.br
_version_ 1862741440227966976