IEEE ACCESS//(VOL. 7, SPECIAL SECTION ON ARTIFICIAL INTELLIGENCE IN CYBERSECURITY)
Volumen: 7, Numero: 1, Páginas: [18] p.
In the field of information security, there are several areas of study that are under development. Social engineering is one of them that addresses the multidisciplinary challenges of cyber security. Nowadays, the attacks associated with social engineering are diverse, including the so-called Advanced Persistent Threats (APTs). These have been the subject of numerous investigations; however, cybernetic attacks of similar nature as grooming have been excluded from these studies. In the last decade, various efforts have been made to understand the structure and approach of grooming from the field of computer science with the use of computational learning algorithms. Nevertheless, these studies are not aligned with information security. In this work, the study of grooming is formalized as a social engineering attack, contrasting its stages or phases with life cycles associated with APTs. To achieve this goal, we use a database of real cyberpedophile chats; this information was refined and the Latent Dirichlet Allocation (LDA) topic modeling was applied to determine the stages of the attack. Once the number of stages was determined, we proceed to give them a linguistic context, and with the use of machine learning, a linear model was trained to obtain 97.6% of training accuracy. With these results, it was determined that the study of grooming could support research associated with social engineering and contribute to new fields of information security
En el campo de la seguridad de la información, existen varias áreas de estudio que están en desarrollo.La ingeniería social es una de ellas que aborda los retos multidisciplinares de la ciberseguridad. En la actualidad, los ataques asociados a la ingeniería social son diversos, entre ellos los denominados Persistentes Avanzados.Amenazas (APT). Estos han sido objeto de numerosas investigaciones; sin embargo, los ataques cibernéticos denaturaleza similar como el aseo han sido excluidos de estos estudios. En la última década, varios esfuerzos hanhecho para entender la estructura y enfoque del grooming desde el campo de la informática conel uso de algoritmos de aprendizaje computacional. Sin embargo, estos estudios no están alineados con la informaciónseguridad. En este trabajo se formaliza el estudio del grooming como un ataque de ingeniería social, contrastando suetapas o fases con ciclos de vida asociados a APTs. Para lograr este objetivo, utilizamos una base de datos de chats reales de ciberpedófilos; esta información fue refinada y el modelado del tema Latent Dirichlet Allocation (LDA) fueaplicado para determinar las etapas del ataque. Una vez determinado el número de etapas, se procede a darles dio un contexto lingüístico, y con el uso de aprendizaje automático, se entrenó un modelo lineal para obtener un 97.6%de la precisión del entrenamiento. Con estos resultados se determinó que el estudio del grooming podría apoyar la investigaciónasociados con la ingeniería social y contribuir a nuevos campos de la seguridad de la información