Publication:
Functional linear models

Loading...
Thumbnail Image
Identifiers
Publication date
2015-07
Defense date
2015-07-21
Tutors
Journal Title
Journal ISSN
Volume Title
Publisher
Impact
Google Scholar
Export
Research Projects
Organizational Units
Journal Issue
Abstract
This work aims at the exposition of two different results we have obtained in Functional Data Analysis. The first is a variable selection method in Functional Regression which is an adaptation of the well known Lasso technique. The second is a brand new Random Walk test for Functional Time Series. Being the results afferent to different areas of Functional Data Analysis, as well as of general Statistics, the introduction will be divided in three parts. Firstly we expose the fundamentals of Functional Data Analysis. Then we will recall some variable selection methods in ordinary Linear Regression. Finally we will review some basics of Time Series analysis and brie y review some existing Random Walk tests. These introductory sections will motivate our research putting it in a general framework. Since Functional Data Analysis can be seen as a data reduction method we will talk incidentally of Big Data and we will provide some comments on the current definition of it. All results of our research are supported by extensive computer simulations and in general, all of FDA is based on extensive computer deployment so some attention will be given to software and computation methods. The Lasso has been used in Functional Regression before this work, our contribution is twofold, we provide a reduction of Lasso in Functional Regression from a functional optimization problem to a numerical one via algebraic manipulations, no sampling is required. Then, we augment the Lasso with a post hoc analysis method which helps deciding which regressors have to be dropped, we called this augmented strategy The Shaked Lasso. About testing if a Functional Autoregressive Process can be considered a Random Walk, our proposed test, as far as we could establish, is the first one in literature.
En esta tesis se abordan dos problemas relacionados con el análisis de datos funcionales. El primero consiste en selección de variables en un problema de regresión con respuesta funcional adaptando la técnica conocida como Lasso. El segundo problema pretende abrir una línea nueva de investigación proponiendo un test para contrastar si una serie temporal funcional puede ser considerada como un camino aleatorio. Como los resultados que se muestran en esta tesis están relacionados con áreas diferentes del análisis de datos funcionales y de la estadística en general, la Introducción está dividida en tres partes. En primer lugar, se exponen los fundamentos del análisis de datos funcionales. En la segunda sección se revisan algunos métodos de selección de variables en regresión lineal y por último, se recopilan brevemente las bases de series temporales así como los contrastes de hipótesis que se han utilizado en la literatura para contrastar caminos aleatorios. Estas secciones introductorias ayudan a motivar las aportaciones de la tesis encuadrándolas en su entorno de investigación. Además, ya que el análisis de datos funcionales se puede ver como un método de reducción de la dimensión de los datos, se incluirán algunos comentarios sobre Big Data y sus definiciones. Todos los resultados de nuestra investigación están soportados por un extenso trabajo de simulación y, puesto que en los métodos estadísticos aplicados a datos funcionales es esencial la parte de computación, se ha prestado especial atención a todos los aspectos relacionados con el software y la modelización. El procedimiento Lasso de selección de variables se ha aplicado anteriormente en la literatura de regresión funcional pero no a los modelos que se analizan en la tesis. Las contribuciones en este aspecto son dos: por una parte se proporciona un método de selección de variables Lasso para un problema de regresión con respuesta funcional convirtiendo un problema de optimización funcional a un problema de optimización numérica vía manipulaciones algebraicas y sin necesidad de remuestreo. Después de ejecutar el problema de optimización, como segunda contribución se propone un análisis de las soluciones para decidir los regresores que deben ser eliminados. Este segundo análisis se ha denominado The Shaked Lasso porque se basa en alterar un parámetro del proceso de optimización para observar cómo se mueven las soluciones. Respecto al segundo capítulo de contribuciones de la tesis, se propone un contraste de hipótesis para testear si un proceso autoregresivo funcional se puede considerar como un camino aleatorio. Hasta lo que nosotros conocemos en la literatura en este campo, es el primer test de este tipo que se propone en la literatura.
Description
Keywords
Functional data analysis, Functional regression, Functional time series, Random walks
Bibliographic citation
Collections