Data mining in organic geochemistry: Case study in Potiguar Basin

Sarah Barron Torres; Ítalo de Oliveira Matias; Francisco Fábio de Araújo Ponte; Erica Tavares de Morais; Ygor dos Santos Rocha; Mario Duncan Rangel; Fabiano Galdino Leal

Ayuda

Data mining in organic geochemistry: Case study in Potiguar Basin

Sarah Barron Torres ^[1] ; Ítalo de Oliveira Matias ^[1] ; Francisco Fábio de Araújo Ponte ^[1] ; Erica Tavares de Morais ^[2] ; Ygor dos Santos Rocha ^[2] ; Mario Duncan Rangel ^[2] ; Fabiano Galdino Leal ^[2]
1. [1] Pontifical Catholic University. Brasil
2. [2] CENPES. Petrobras Research and Development Center. Brasil
Localización: Geociencias, ISSN-e 1980-900X, ISSN 0101-9082, Vol. 41, Nº 1, 2022, págs. 105-114
Idioma: inglés
Títulos paralelos:
- Mineração de dados na geoquímica orgânica: estudo de caso na Bacia Potiguar
Enlaces
- Texto completo
Resumen
- English
  The amount of data from geochemical analysis using samples collected in oil wells grows simultaneously to the investment in the exploration and production sector. On the other hand, the treatment and interpretation of these results are still very dependent on experts and demand time. With the generation of extensive databases, data mining presents itself as a good alternative to explore them through statistical methods and computational algorithms, providing technological differential and agility to the system. In an experimental way, with data from 200 oils from the Potiguar Basin, these tools were implemented, with the consequent suggestion of a workflow that would, in the end, return a reasonable accuracy in predicting their genetic classification. Using multidimensional scaling (MDS) and clustering (dendrogram and k-means types), from 60 initial attributes, the optimal set was reduced to 26. Applying Machine Learning, 92.50% of median accuracy were obtained in the Decision Tree algorithm, 95.00% in Random Forest and 87.50% in Artificial Neural Network. Comparing to an analysis previously presented at the pertinent literature, the benefits in terms of efficiency can be realized with the adoption of the methodology herein proposed
- português
  A quantidade de dados provenientes de análises geoquímicas de amostras coletadas em poços de petróleo cresce simultaneamente ao investimento no setor de exploração e produção. Por outro lado, o tratamento e a interpretação desses resultados ainda são muito dependentes de especialistas, e demandam tempo. Com a geração de extensas bases de dados, a mineração de dados se apresenta como uma boa alternativa para explorá-los por meio de métodos estatísticos e computacionais, proporcionando diferencial tecnológico e agilidade ao sistema. De forma experimental, com dados de 200 óleos da Bacia Potiguar, essas ferramentas foram implementadas, com a consequente sugestão de um fluxo de trabalho que, ao final, pôde retornar uma precisão razoável na previsão da classificação genética das amostras. Usando escalonamento multidimensional (MDS) e agrupamentos (dos tipos dendrograma e k-means), de 60 atributos iniciais, o conjunto ideal foi reduzido para 26. Aplicando aprendizado de máquinas, 92,50% de acurácia mediana foram obtidos no algoritmo de Árvore de Decisão, 95,00% na Floresta Aleatória e 87,50% em Rede Neural Artificial. Comparando a uma análise previamente apresentada na literatura pertinente, os benefícios em termos de eficiência podem ser percebidos com a adoção da metodologia aqui proposta.

Acceso de usuarios registrados

¿Olvidó su contraseña?

¿Es nuevo? Regístrese

Ventajas de registrarse

Dialnet Plus

Opciones de compartir

Opciones de entorno

Sugerencia / Errata

Coordinado por: