Publication:
Análisis de datos de conducción aplicando modelos de regresión funcional

Thumbnail Image
Authors
Rocha-Clavijo, Daniel M.
Embargoed Until
Advisor
Lorenzo-González, Edgardo
College
College of Arts and Sciences - Sciences
Department
Department of Mathematics
Degree Level
M.S.
Publisher
Date
2019-05-15
Abstract
Studies in transportation engineering carried out in simulators seek to analyze the behavior of drivers given the characteristics of the driver and different scenarios resulting from the consideration of design elements on the road. These studies collect information at short time intervals (for instance, every 0.016 seconds), which implies that the number of observations is extremely large at the end of the study, compared to traditional ones. Currently, the practices of analyzing these data involve i) dividing the domain of the experiment or route into zones or segments, ii) reducing the data of each segment to a descriptive measure, usually the mean, and iii) applying conventional data analysis techniques to the reduced data, such as generalized linear models or mixed effect models. However, this practice of data analysis is inefficient because it does not consider the nature of the simulator data. Therefore, this work proposes functional regression models with functional response and scalar covariables in order to analyze the data of driving simulators. The proposed models are based on the functional data theory, which assumes that the phenomenon being observed follows a smooth function but is observed discreetly in a fine grid. One of the advantages of the proposed models is that the behavior of the drivers can be completely characterized through time using average curves and the behavior change while driving can be studied using the first derivatives of the curves. Comparisons of driving behavior between groups can also be carried out efficiently using all the information collected. In this work, simulation studies were carried out to determine the adjustment parameters of the models in the application to a set of real data from the driving simulator of the University of Puerto Rico at Mayagüez (UPRM). The simulations indicate that the models present lower estimation error with 10 and 15 bases of P-splines (B-splines penalized) for the functional response and the global functional intercept, respectively. In the analysis of the application using the proposed approach, after a model selection process, it was concluded that a reasonable model to determine variables significantly related to driving speed is a functional linear mixed-effect model with functional random intercept of the driver, smooth effects of day time, lane width and scalar effect of the limit speed.

Estudios en ingeniería de transportación llevados a cabo en simuladores buscan analizar el comportamiento de los conductores dado las características del conductor y diferentes escenarios que resultan al considerar elementos de diseño en la carretera. Estos estudios recolectan información en intervalos cortos de tiempo (por ejemplo, cada 0.016 segundos), lo cual implica que al final del estudio el número de observaciones es extremadamente grande comparado a estudios tradicionales. Actualmente, las prácticas de análisis de estos datos involucran ii) dividir el dominio del experimento o recorrido en zonas o segmentos, i) reducir los datos de cada segmento a una medida descriptiva, usualmente la media, y iii) aplicar técnicas de análisis de datos convencionales tales como modelos lineales generalizados o modelos de efectos mixtos a los datos reducidos. Sin embargo, esta práctica de análisis de datos es ineficiente ya que no tiene en cuenta la naturaleza de los datos de los simuladores. Por lo tanto, este trabajo propone modelos de regresión funcional con respuesta funcional y covariables escalares para analizar los datos de simuladores de conducción. Los modelos propuestos se basan en la teoría de datos funcionales, los cuales asumen que el fenómeno siendo observado sigue una función suave pero se observa discretamente en una grilla fina. Una de las ventajas de los modelos propuestos es que el comportamiento de los conductores se puede caracterizar completamente a través del tiempo usando curvas promedio y el cambio de comportamiento al conducir se puede estudiar usando, por ejemplo, las derivadas de las curvas. Comparaciones del comportamiento al conducir entre grupos también se pueden llevar a cabo de manera eficiente usando toda la información recolectada. En este trabajo se llevan a cabo estudios de simulación para determinar los parámetros de ajuste de los modelos en la aplicación a un conjunto de datos reales del simulador de conducción de la Universidad de Puerto Rico en Mayagüez (UPRM). Las simulaciones indican que los modelos presentan menor error de estimación con $10$ y $15$ bases de \textit{P-splines} (\textit{B-splines} cúbicos penalizados) para la respuesta funcional y el intercepto funcional global, respectivamente. En el análisis de la aplicación usando el enfoque propuesto, después de un proceso de selección de modelos, se concluyó que un modelo razonable para determinar las variables significativamente relacionadas a la velocidad al conducir es un modelo funcional lineal mixto con intercepto aleatorio funcional del conductor, efectos suaves del tiempo del día, ancho del carril y efecto escalar de la velocidad límite.
Keywords
Simulation methods,
Drivers,
Functional regression,
Data analysis
Cite
Rocha-Clavijo, D. M. (2019). Análisis de datos de conducción aplicando modelos de regresión funcional [Thesis]. Retrieved from https://hdl.handle.net/20.500.11801/2489