Publication:
A neural networks method to predict activity coefficients for binary systems based on molecular functional group contribution

Thumbnail Image
Authors
Rodríguez-Vallés, Harry
Embargoed Until
Advisor
Ramírez-Beltrán, Nazario D.
College
College of Engineering
Department
Department of Industrial Engineering
Degree Level
M.S.
Publisher
Date
2006
Abstract
Artificial neural network (ANN) techniques and functional group contributions were used to develop an algorithm to predict chemical activity coefficients. The ANN algorithm was trained using experimental data for more than 900 binary systems obtained from DECHEMA, a phase-equilibrium database. All experimental data binary systems used in this study are isothermal. The prediction scheme is based on the fact that the atoms in a chemical compound can be grouped in a functional group with its own physical and chemical properties. Thus, almost any chemical compound can be built by combining the right number of functional groups. The functional group interactions among the components in a mixture are estimated and the combination of functional group interactions provides the intermolecular relationship among the components of a mixture and consequently the activity coefficients can be predicted. The intramolecular interactions were not considered in this study. The four-suffix Margules equation was used as the base thermodynamic model to calculate the activity coefficients. The Margules equation is good for modeling enthalpic contributions to the activity coefficient but is not good for modeling entropic contributions to the activity coefficient. The design of functional groups based on quantum mechanics was adopted to develop a method for predicting activity coefficients. ANN techniques are especially useful for modeling a highly nonlinear interaction among the functional groups and the corresponding activity coefficient. One of the major contributions of this research is to propose a method to identify the initial point and the structure of an ANN. The minimum mean squared prediction error criterion was implemented to determine both a suitable initial point and the structure of the ANN. A random search method was used to determine the optimal initial point and the Levenberg-Marquardt algorithm was used to train the ANN to generate a sample of prediction values and the trim mean based on 20% data elimination was selected as the best representation of the ensemble prediction of the Margules equation parameters. The algorithm was validated with nineteen vapor-liquid equilibrium systems and results show that the ANN provides a relative improvement over the UNIFAC method. The scope of this study is limited to some chemical compound families (i.e. alcohols, phenols, aldehydes, ketones and ethers), it is required to include more experimental data to cover additional chemical compound families such as carboxylic acids, anhydrides, esters, aliphatic hydrocarbons and halogens.

Se utilizaron redes neuronales artificiales y la contribución de grupos funcionales se utilizaron para desarrollar un algoritmo para predecir coeficientes de actividad. El algoritmo de la red neuronal se adiestró utilizando datos experimentales para más de 900 sistemas obtenidos de DECHEMA, una base de datos de equilibrio líquido-vapor. Todos los sistemas binarios de data experimental utilizados son isotermales. El esquema de predicción se basó en el hecho de que los átomos de un compuesto químico se pueden agrupar formando grupos funcionales con propiedades químicas y físicas únicas. Por lo tanto, cualquier compuesto se puede construir a partir de la combinación exacta de grupos funcionales. Las interacciones de grupos funcionales entre los compuestos de una mezcla son estimadas y la combinación de las interacciones de grupos funcionales provee información sobre las relaciones intermoleculares entre los componentes de la mezcla de modo que los coeficientes de actividad se pueden predecir. Las interacciones intramoleculares no fueron consideradas en este estudio. La ecuación de Margules fue utilizada como el modelo termodinámico base para calcular los coeficientes de actividad. La ecuación de Margules es eficaz para modelar las contribuciones entálpicas al coeficiente de actividad pero no es eficaz para modelar las contribuciones entrópicas. Se adoptó un diseño de grupos funcionales basados en mecánica cuántica para desarrollar el método de predecir coeficientes de actividad. Las técnicas de redes neuronales son útiles para modelar las relaciones no lineales entre los grupos funcionales y su correspondiente coeficiente de actividad. Una de las contribuciones de mayor importancia de esta investigación es el desarrollo de un método para identificar el punto inicial y la estructura de la red neuronal. El criterio del promedio del cuadrado de los errores se utilizó para determinar tanto el punto inicial óptimo como la estructura óptima de la red neuronal. Un método basado en una búsqueda aleatoria se utilizó para determinar el punto inicial óptimo y el algoritmo de Levenberg-Marquardt se utilizó para entrenar la red neuronal generando una muestra de valores de predicción para la cual el promedio de muestra reducida basado en la eliminación de 20% de los datos se seleccionó como la mejor representación de la predicción de los parámetros de la ecuación de Margules. El algoritmo desarrollado se validó con 19 sistemas de equilibrio líquido-vapor y los resultados muestran que el método de redes neuronales provee una mejora notable sobre el método UNIFAC. Este estudio esta limitado a algunas familias de los compuestos químicos (alcoholes, fenoles, aldehídos, cetonas y éteres), es requerido incluir datos experimentales adicionales para cubrir familias de compuesto químicos adicionales tales como ácidos carboxílicos, anhídridos, esteres, hidrocarburos alifáticos y halógenos.
Keywords
Artificial neural network,
Functional group,
Chemical activity coefficients
Cite
Rodríguez-Vallés, H. (2006). A neural networks method to predict activity coefficients for binary systems based on molecular functional group contribution [Thesis]. Retrieved from https://hdl.handle.net/20.500.11801/1528