Teoría de conexiones funcionales

La teoría de conexiones funcionales (TCF) es un marco matemático diseñado para la interpolación funcional. Introduce un método para derivar un funcional capaz de transformar problemas de optimización con restricciones en problemas equivalentes sin restricciones. Esta transformación permite la aplicación de la TCF a diversos problemas matemáticos, incluida la resolución de ecuaciones diferenciales. En este contexto, la interpolación funcional se refiere a la construcción de funcionales que siempre satisfacen las restricciones dadas, sin importar la expresión de la función interna (libre).

De la interpolación a la interpolación de funcionales

Para proporcionar un contexto general para la TCF, considere un problema de interpolación genérico que involucra restricciones, como una ecuación diferencial sujeta a un problema de valores limite. Independientemente de la ecuación diferencial, estas restricciones pueden ser consistentes o inconsistentes. Por ejemplo, en un problema sobre el dominio , las restricciones y son inconsistentes, ya que producen valores diferentes en el punto compartido . Si las restricciones son consistentes, se puede construir una función que interpole estas restricciones seleccionando funciones de soporte linealmente independientes, como los monomios, . El conjunto de funciones de soporte elegido puede o no ser coherente con las restricciones dadas. El problema de la consistencia se aborda examinando casos de restricciones, interpolación e interpolación funcional, incluidos escenarios en los que las condiciones de contorno implican derivadas de cizallamiento y mixtas.[1]​ Por ejemplo, las restricciones y son incompatibles con las funciones de apoyo, , como se puede comprobar fácilmente. Si las funciones de soporte son consistentes con las restricciones, el problema de interpolación puede resolverse, dando lugar a un interpolante—una función que satisface todas las restricciones. Elegir un conjunto diferente de funciones de soporte resultaría en un interpolante diferente. En principio, cuando se resuelve un problema de interpolación y se determina un interpolante inicial, todos los interpolantes posibles pueden generarse realizando el proceso de interpolación con cada conjunto distinto de funciones de soporte linealmente independientes consistentes con las restricciones. Sin embargo, este método es impráctico, ya que el número de posibles conjuntos de funciones de soporte es infinito.

Este desafío se abordó mediante el desarrollo del TCF, un marco analítico para realizar interpolación funcional introducido por Daniele Mortari en la Universidad Texas A&M . [2]​ El enfoque implica construir un modelo funcional que satisface las restricciones dadas para cualquier expresión arbitraria de , denominada función libre. Este funcional, conocido como funciónal restringido, proporciona una representación completa de todos los interpoladores posibles. Variando , es posible generar todo el conjunto de interpolantes, incluidos aquellos que son discontinuos o parcialmente definidos.

Diagrama de flujo de funciones e interpolación de funcionales

La interpolación de funciones produce una única función interpolante, mientras que la interpolación funcional genera una familia de funciones interpolantes representadas a través de un funcional. Este funcional define el subespacio de funciones que satisfacen inherentemente las restricciones dadas, reduciendo efectivamente el espacio de soluciones a la región donde se encuentran las soluciones del problema de optimización con restricciones. Al emplear estos funcionales, los problemas de optimización con restricciones pueden reformularse como problemas sin restricciones. Esta reformulación permite métodos de solución más simples y eficientes, mejorando a menudo la precisión, robustez y fiabilidad. Dentro de este contexto, la Teoría de Conexiones Funcionales (TCF) proporciona un marco sistemático para transformar problemas con restricciones en problemas sin restricciones, simplificando así el proceso de solución.

La TCF aborda restricciones univariantes que involucran puntos, derivadas, integrales y cualquier combinación lineal de estos. [3]​ La teoría también se extiende para acomodar restricciones infinitas y multivariantes, y se aplica a la resolución de ecuaciones ordinarias, parciales e integro-diferenciales. La versión univariante de la TCF puede expresarse en una de las siguientes dos formas:

dónde representa el número de restricciones lineales, es la función libre, y son funciones de soporte linealmente independientes y definidas por el usuario. Los términos son los coeficientes funcionales, son funciones de conmutación (que toman un valor de 1 cuando se evalúan en su respectiva restricción y 0 en otras restricciones), y son funcionales de proyección que expresan las restricciones en términos de la función libre.

Un ejemplo racional

Para mostrar cómo TFC generaliza la interpolación, considere las restricciones, y . Una función de interpolación que satisface estas restricciones es,

como se puede comprobar fácilmente. Debido a esta propiedad de interpolación, la derivada de la función,

desaparece en y , para cualquier función, . Por lo tanto, añadiendo a , se obtiene un funcional que todavía satisface las restricciones,

No importa qué es. Debido a esta propiedad, esta función se denomina función restringida . El requisito clave para que el funcional funcione como está previsto es que los términos y esten finidos. Una vez cumplida esta condición, lel funcional es libre de tomar cualquier valor arbitrario más allá de las restricciones especificadas, gracias a la infinita flexibilidad proporcionada por .

Ejemplo: una animación funcional restringida univariante que utiliza dos restricciones absolutas y una restricción relativa.

Es importante destacar que esta flexibilidad no se limita a las restricciones específicas elegidas en este ejemplo. Más bien, se aplica universalmente a cualquier conjunto de restricciones. Esta universalidad ilustra cómo TCF realiza la interpolación de funcionales: construye una función que satisface las restricciones dadas y al mismo tiempo permite una completa libertad de comportamiento en otras partes a través de la elección de . En esencia, este ejemplo demuestra que la función restringida captura todas las funciones posibles que cumplen las restricciones dadas, mostrando el poder y la generalidad de TCF en el manejo de una amplia variedad de problemas de interpolación.


Aplicaciones del TFC

La TCF se ha extendido y empleado en varias aplicaciones, incluido su uso en problemas de derivadas mixtas y de tipo cortante, el análisis de operadores fraccionarios, [4]​ la determinación de geodésicas para problemas de valores limite en espacios curvos, [5]​ y la contribución a los métodos de continuación . [6][7]​ Además, la TCF se ha aplicado al control óptimo indirecto, [8][9]​ al modelado de cinética química rígida, [10]​ y al estudio de la dinámica epidemiológica. [11]​ También ha demostrado potencial en programación no lineal [12]​ y mecánica estructural [13][14]​ y transferencia radiativa [15]​, entre otras áreas. Una caja de herramientas de TCF eficiente y gratuita está disponible en https://github.com/leakec/tfc .

De particular interés es la aplicación de TCF en redes neuronales, donde se ha demostrado una eficiencia excepcional, [16][17]​ especialmente al abordar problemas de alta dimensión y al mejorar el rendimiento de redes neuronales basadas en la física [18]​ al eliminar de manera efectiva las restricciones del proceso de optimización, un desafío que las redes neuronales tradicionales a menudo tienen dificultades para abordar. Esta capacidad mejora significativamente la eficiencia y la precisión computacional, lo que permite resolver problemas complejos con mayor facilidad. La TCF se ha empleado con redes neuronales basadas en la física y técnicas de regresión simbólica [19]​ para el descubrimiento físico de sistemas dinámicos . [20][21]

Diferencia con los métodos espectrales

A primera vista, TCF y los métodos espectrales pueden parecer similares en su enfoque para resolver problemas de optimización restringida . Sin embargo, existen dos distinciones fundamentales entre ellos:

  • Representación de soluciones: Los métodos espectrales representan la solución como una suma de funciones base, mientras que la TCF representa la función libre como una suma de funciones base. Esta distinción permite que la TCF satisfaga analíticamente las restricciones, mientras que los métodos espectrales tratan las restricciones como datos adicionales, aproximándolas con una precisión que depende de los residuos.
  • Enfoque computacional en problemas de valor límite: En problemas lineales de valor límite, las estrategias computacionales de los dos métodos difieren significativamente. Los métodos espectrales generalmente emplean técnicas iterativas, como el método de disparo, para reformular el problema como un problema de valor inicial, lo que lo hace más sencillo de resolver. Por el contrario, la TCF aborda directamente estos problemas a través de técnicas de mínimos cuadrados lineales, evitando la necesidad de procedimientos iterativos.

Ambos métodos pueden realizar la optimización utilizando el método de Galerkin, que garantiza que el vector residual sea ortogonal a las funciones base elegidas, o el método de colocación, que minimiza la norma del vector residual.

Diferencia con la técnica de multiplicadores de Lagrange

El método de los multiplicadores de Lagrange es un enfoque ampliamente utilizado para imponer restricciones en un problema de optimización. Esta técnica introduce variables adicionales, conocidas como multiplicadores, que deben ser calculadas para imponer las restricciones. Mientras que el cálculo de estos multiplicadores es sencillo en algunos casos, puede ser desafiante o incluso prácticamente inviable en otros, lo que añade una complejidad significativa al problema. En contraste, la TCF no añade nuevas variables y permite la derivación de funcionales con restricciones sin enfrentar dificultades insuperables. Sin embargo, es importante señalar que el método de los multiplicadores de Lagrange tiene la ventaja de manejar restricciones de desigualdad, una capacidad que la TCF actualmente no posee.

Una limitación notable de ambos enfoques es su tendencia a producir soluciones que corresponden a óptimos locales en lugar de óptimos globales garantizados, especialmente en el contexto de problemas no convexos. En consecuencia, pueden ser necesarios procedimientos de verificación adicionales o métodos alternativos para evaluar y confirmar la calidad y validez global de la solución obtenida. En resumen, aunque la TCF no reemplaza completamente el método de los multiplicadores de Lagrange, sirve como una alternativa poderosa en casos donde el cálculo de los multiplicadores se vuelve excesivamente complejo o inviable, siempre que las restricciones se limiten a igualdades.

Referencias

  1. Mortari, Daniele (January 2022). «Theory of Functional Connections Subject to Shear-Type and Mixed Derivatives». Mathematics (en inglés) 10 (24): 4692. ISSN 2227-7390. doi:10.3390/math10244692. 
  2. Mortari, Daniele (December 2017). «The Theory of Connections: Connecting Points». Mathematics (en inglés) 5 (4): 57. ISSN 2227-7390. arXiv:1702.06862. doi:10.3390/math5040057. 
  3. De Florio, Mario; Schiassi, Enrico; D’Ambrosio, Andrea; Mortari, Daniele; Furfaro, Roberto (September 2021). «Theory of Functional Connections Applied to Linear ODEs Subject to Integral Constraints and Linear Ordinary Integro-Differential Equations». Mathematical and Computational Applications (en inglés) 26 (3): 65. ISSN 2297-8747. doi:10.3390/mca26030065. 
  4. Mortari, Daniele; Garrappa, Roberto; Nicolò, Luigi (January 2023). «Theory of Functional Connections Extended to Fractional Operators». Mathematics (en inglés) 11 (7): 1721. ISSN 2227-7390. doi:10.3390/math11071721. 
  5. Mortari, Daniele (August 2022). «Using the Theory of Functional Connections to Solve Boundary Value Geodesic Problems». Mathematical and Computational Applications (en inglés) 27 (4): 64. ISSN 2297-8747. doi:10.3390/mca27040064. 
  6. Wang, Yang; Topputo, Francesco (1 February 2022). «A TFC-based homotopy continuation algorithm with application to dynamics and control problems». Journal of Computational and Applied Mathematics 401: 113777. ISSN 0377-0427. arXiv:1911.04899. doi:10.1016/j.cam.2021.113777. 
  7. Campana, Claudio Toquinho; Merisio, Gianmario; Topputo, Francesco (June 2024). «Low-energy Earth–Moon transfers via Theory of Functional Connections and homotopy». Celestial Mechanics and Dynamical Astronomy (en inglés) 136 (3). ISSN 0923-2958. doi:10.1007/s10569-024-10192-5. 
  8. D’Ambrosio, Andrea; Schiassi, Enrico; Johnston, Hunter; Curti, Fabio; Mortari, Daniele; Furfaro, Roberto (15 June 2022). «Time-energy optimal landing on planetary bodies via theory of functional connections». Advances in Space Research 69 (12): 4198-4220. ISSN 0273-1177. doi:10.1016/j.asr.2022.04.009. 
  9. Schiassi, Enrico; D’Ambrosio, Andrea; Furfaro, Roberto (2023). «An Overview of X-TFC Applications for Aerospace Optimal Control Problems». The Use of Artificial Intelligence for Space Applications. Studies in Computational Intelligence (en inglés) 1088. Springer Nature Switzerland. pp. 199-212. ISBN 978-3-031-25754-4. doi:10.1007/978-3-031-25755-1_13. 
  10. De Florio, Mario; Schiassi, Enrico; Furfaro, Roberto (1 June 2022). «Physics-informed neural networks and functional interpolation for stiff chemical kinetics». Chaos: An Interdisciplinary Journal of Nonlinear Science 32 (6). ISSN 1054-1500. PMID 35778155. doi:10.1063/5.0086649. 
  11. Schiassi, Enrico; De Florio, Mario; D’Ambrosio, Andrea; Mortari, Daniele; Furfaro, Roberto (January 2021). «Physics-Informed Neural Networks and Functional Interpolation for Data-Driven Parameters Discovery of Epidemiological Compartmental Models». Mathematics (en inglés) 9 (17): 2069. ISSN 2227-7390. doi:10.3390/math9172069. 
  12. Mai, Tina; Mortari, Daniele (1 de mayo de 2022). «Theory of functional connections applied to quadratic and nonlinear programming under equality constraints». Journal of Computational and Applied Mathematics 406: 113912. ISSN 0377-0427. arXiv:1910.04917. doi:10.1016/j.cam.2021.113912. 
  13. Yassopoulos, Christopher; Leake, Carl; Reddy, J. N.; Mortari, Daniele (1 November 2021). «Analysis of Timoshenko–Ehrenfest beam problems using the Theory of Functional Connections». Engineering Analysis with Boundary Elements 132: 271-280. ISSN 0955-7997. doi:10.1016/j.enganabound.2021.07.011. 
  14. Yassopoulos, Christopher; Reddy, J. N.; Mortari, Daniele (1 March 2023). «Analysis of nonlinear Timoshenko–Ehrenfest beam problems with von Kármán nonlinearity using the Theory of Functional Connections». Mathematics and Computers in Simulation 205: 709-744. ISSN 0378-4754. doi:10.1016/j.matcom.2022.10.015. 
  15. De Florio, Mario; Schiassi, Enrico; Furfaro, Roberto; Ganapol, Barry D.; Mostacci, Domiziano (1 January 2021). «Solutions of Chandrasekhar's basic problem in radiative transfer via theory of functional connections». Journal of Quantitative Spectroscopy and Radiative Transfer 259: 107384. ISSN 0022-4073. doi:10.1016/j.jqsrt.2020.107384. 
  16. Leake, Carl; Mortari, Daniele (March 2020). «Deep Theory of Functional Connections: A New Method for Estimating the Solutions of Partial Differential Equations». Machine Learning and Knowledge Extraction (en inglés) 2 (1): 37-55. ISSN 2504-4990. PMC 7259480. PMID 32478283. doi:10.3390/make2010004. 
  17. Schiassi, Enrico; Furfaro, Roberto; Leake, Carl; De Florio, Mario; Johnston, Hunter; Mortari, Daniele (7 October 2021). «Extreme theory of functional connections: A fast physics-informed neural network method for solving ordinary and partial differential equations». Neurocomputing 457: 334-356. ISSN 0925-2312. doi:10.1016/j.neucom.2021.06.015. 
  18. Raissi, M.; Perdikaris, P.; Karniadakis, G. E. (1 February 2019). «Physics-informed neural networks: A deep learning framework for solving forward and inverse problems involving nonlinear partial differential equations». Journal of Computational Physics 378: 686-707. ISSN 0021-9991. doi:10.1016/j.jcp.2018.10.045. 
  19. Cranmer, Miles (21 November 2024). «MilesCranmer/PySR». GitHub. 
  20. Daryakenari, Nazanin Ahmadi; Florio, Mario De; Shukla, Khemraj; Karniadakis, George Em (12 March 2024). «AI-Aristotle: A physics-informed framework for systems biology gray-box identification». PLOS Computational Biology (en inglés) 20 (3): e1011916. ISSN 1553-7358. PMC 10931529. PMID 38470870. doi:10.1371/journal.pcbi.1011916. 
  21. De Florio, Mario; Kevrekidis, Ioannis G.; Karniadakis, George Em (1 November 2024). «AI-Lorenz: A physics-data-driven framework for Black-Box and Gray-Box identification of chaotic systems with symbolic regression». Chaos, Solitons & Fractals 188: 115538. ISSN 0960-0779. arXiv:2312.14237. doi:10.1016/j.chaos.2024.115538.