The Influence of Students' Gender on the Use of Virtual Campuses. A Case Study

La influencia del sexo en el uso de los campus virtuales. Estudio de caso

 Dr. Daniel David Martínez Romera. Profesor ayudante doctor. Universidad de Cádiz. España

 Dr. Manuel Cebrián de la Serna. Catedrático de Universidad. Universidad de Málaga. España

 Dra. Gloria Priego de Montiano. Profesora ayudante doctor. Universidad de Córdoba. España

 

Recibido: 2020/03/17 Revisado: 2020/05/05 Aceptado: 2020/10/10 Preprint: 2020/12/08 Publicado: 2021/01/01

Como citar:

Martínez-Romera, D., Cebrián de la Serna, M., & Priego de Montiano, G. (2021). The Influence of Students' Gender on the Use of Virtual Campuses. A Case Study. [La influencia del sexo en el uso de los campus virtuales. Estudio de caso]. Píxel-Bit. Revista de Medios y Educación, 60, 169-210. | https://doi.org/10.12795/pixelbit.78445

 

ABSTRACT

A comparative analysis has been carried out in order to study the similarities and differences in the use and management of space and time by students, based on their gender. The study analyses the data records generated by students from three different degree courses in two universities, throughout four academic years. The methodology includes exploratory statistical analysis and learning analytics for the detection of spatial, temporal and behavioural patterns. Results show a consistent convergence in most cases, although they also show marginal behavioral trends, both for the days of the week, the hours of the day, and for the different contents of the virtual campuses. This is more evident in its spatial aspect, which highlights some clear differences in the processes of distribution and concentration of the events under study: at least in this case, women do not act in the same way as men. Ultimately, the study proposes new forms of synergy between educational work and the application of the Social Sciences’ disciplinary contents thus strengthening the transfer of knowledge from specific didactics on both educational curriculum and teacher training.

 

RESUMEN

Se estudian los registros de datos generados por estudiantes de tres titulaciones distintas de dos universidades, en cuatro cursos académicos, a través de sus campus virtuales. La metodología ha considerado el análisis estadístico exploratorio y las analíticas de aprendizaje, especialmente la minería de datos, para la detección de patrones de espaciales, temporales y de comportamiento. Los resultados han mostrado una convergencia consistente en la mayoría de casos, si bien ha evidenciado tendencias marginales de comportamiento para los días de la semana, las horas del día, y distintos contenidos de los campus virtuales. Ha permitido discriminar algunas diferencias en los procesos de distribución y concentración espacial: las mujeres no se mueven de la misma forma que los hombres y presentan diferencias secundarias en la gestión del tiempo. En última instancia, el estudio plantea nuevas formas de sinergia entre el trabajo educativo y la aplicación de los contenidos disciplinares de las Ciencias Sociales; fortaleciendo así la transferencia del conocimiento desde las didácticas específicas tanto sobre el currículo educativo como en la formación del profesorado.

 

PALABRAS CLAVES · KEYWORDS

Higher education; Student behaviour; Social Sciences; Comparative analysis; Data processing

Enseñanza superior; Comportamiento del alumno; Ciencias Sociales; Análisis comparativo; Procesamiento de datos

 

 

1. Introduction

When, in 2002, Martin Dougiamas, unhappy with the available software and motivated by the desire to incorporate pedagogical constructivism into it, released Moodle, i.e. the first version of his LCMS (Learning Content Management System), there were no indications that would become a de facto standard, thus putting virtual digital support at the forefront of education, especially at university level.

Nowadays, whether open source or not, it is unthinkable for a university subject, and also increasingly so in secondary education, not to have a virtual campus that is used as a preferential or exclusive way of work. This makes even more sense considering the new formats of educational analysis offered by this platform (Hamotoglu et al., 2020; Cantabella et al., 2019; Quintanas Mendes et al., 2019; Fakir & Touya, 2014; Lu & Law, 2012), the analytical techniques that can be used (Álvarez Vázquez et al, 2020; Charanya & Kesavan, 2019; Cohen, Rahimi & Zilka, 2019; Manne, Yelisetti, Kakarla, & Fátima, 2014) and the social and behavioural dimensions that can be addressed (Pakanen, Alavesa, Arhippainen & Ojala, 2020; Castro, Menacho & Pérez-Molina, 2018; Cerezo, Esteban, Sánchez-Santillán, & Núñez, 2017; Parise, 2016).

In our opinion, the two most relevant educational advantages are: the teaching spatial-temporal delocalisation, be it partial or total; and those originating from the interaction through technology, both among users and with the contents of the subject.

With regards to the former, it is clear that the man-machine symbiosis that was predicted at the beginning of computing (Licklider, 1960), is constantly increasing. Although the effects have not yet been well explored, they have been perceived for some time in Education (Orostica Verdugo, 2020; Desai, Chavan & Tendulkar, 2020; Cabanillas, Luengo & Carvalho, 2019; Morales, Infante-Moro & Gallardo-Pérez, 2019; Ballesteros Regaña et. al, 2010; Correa & Paredes, 2009), Geography (Capel, 2009) and other Social Sciences (Sarduy Domíngez et al. 2020; Arias & Defiore, 2019; Gómez Collado, Contreras Orozco & Gutiérrez Linares, 2016). The school timetable and calendar, i.e. the class time and weekly distribution of the teaching programme, is still organised with the same rationale that was used prior to the current technological reality. The traditional spatial-temporal concurrence of the three elements of the educational system (teacher, student and object of study) can be delocalised with LCMSs, making it very flexible. This means perceiving it as a new object of study, imbued with a chrono geographic (Tartia, 2020; Thulin, Vihelmson & Scwanen, 2020; Vega Valverde, 2017) and behavioural complexity clearly different to the one devised during the institutionalisation of education of the 19th century and even to the current one which is regulated by subsequent regulatory frameworks.

As for the latter, teachers are still largely unaware of the new technical tools that can be used to teach and work together on a school subject. Be it the use of cloud-based collaborative tools, or the possibility of consulting learning material at any time and place, the truth is that the way students interact with content and tasks has nothing to do with what was possible, and available, just one or two generations ago.

Spain's entry into the European Higher Education Area (BOE, Spain's Official Bulletin, no. 224 of 18 September 2003) highlighted the importance of these issues. The introduction of the ECTS (European Credit Transfer System) credits was an attempt to calculate not only the traditional learning time in class, but also the hours of study, tutorials, seminars, work and any other dedicated time necessary or required to pass a subject.

Controlling the progress of students outside the classroom does not seem to be a reasonable or desirable solution. Also, focusing on objective results (exam notes, presentations, assignments, etc.) casts doubts on the importance of the process of continuous training and teacher-student feedback required by all modern educational system. Teachers are often questioned about these processes; hence they are now required to have additional skills (Sola-Martinez et al., 2020; Abbott, 2011). This is especially true from the perspective of learning analytics which is what this work is based on, given its versatility (Ruipérez-Valiente et. Al. 2020; Papoušek, Pelánek & Stanislav, 2016; Sclater, Peasgood & Mullan, 2016; Gašević, Dawson & Siemens, 2015; Siemens & Long, 2011).

This is why there is a need to analyse students' (digital) behaviour patterns on virtual campuses as an indirect way of finding out about their learning performance and spatial-temporal behaviour. This is not necessarily an invasive process if basic ethical considerations are set out in line with the humanist approaches already established in Geography (Tuan, 1977 & 1990).

Each identified user, while on a virtual campus, generates a multitude of data records that provide information on the place, time and actions (opening a link, a presentation, a document, writing a comment on a forum, handing in an assignment, etc.). Each piece of record is called an event (Caballé & Xhafa, 2013). This is very interesting information to which it is possible to add other variables such as gender taken from the user's ID data, thus enriching the content.

The data can be analysed starting from a modest statistical base, to then incorporate the latest techniques and methodologies, thanks to which the work and the result achievement schedules are clearly feasible when it comes to evaluating or even rectifying the didactic strategy (Badilla Quintana, Vera Sagredo & Lytras, 2017; Minguillón, Santanach & Appel, 2016).

In view of the above, the goal is carrying out a comparative analysis between the sexes in order to check the potential similarities and differences in the use of virtual campuses. This will be done from three perspectives: the time of use, the place of use and the content visited. This is in line with other research that points to the relevance of exploring this type of variables crossover to adequately understand student behaviour on virtual campuses (Álvarez Vázquez, 2019; Cabanillas García et al., 2019; De la Iglesia-Villasol, 2019).

 

2. Methodology

This study analyses the data collected from more than 1000 students over a 4-year period, between the 2016/17 and 2019/20 academic years. The students were divided into 14 groups belonging to 4 undergraduate and postgraduate subjects of three degrees in 2 Spanish universities. Three of the subjects belong to the field of Social Sciences Didactics and a fourth one to School Didactics and Organisation:

 

·           Didactic and Technological Resources in Education in Pedagogy Degree (A1 - P-RDTE)

·           Geography and History Curriculum in Master's Degree in Teaching (B1 - M-CCSS-C)

·           Design and Development of Geography and History Programmes and Training Activities in the Teaching Master's Degree (B2 - M-CCSS-D)

·           Didactics of Social Sciences in Infant Education (C1 - I-DCCSS)

 

Table 1

Events generated by subject and group

Patrón de fondo

Descripción generada automáticamente

Caption: Ab indicates the number of initial students; Af after cleansing and normalisation. M/F: breakdown by gender (Male / Female).

 

Table 1 contains the fundamental descriptors of each subject (year, students, and total number of events), in order to establish the dimensions of the reference scenario. Nevertheless, given the internal heterogeneity of the variables (students and events), a proportional form of comparison (evaluations / students) must be used in order to define the relevance of each interaction with the platform when working on a subject. In this way, and using teachers as a sorting criterion, the result would be: A (281.4), C (140.7) and B (119.0); with a joint average of 180.4 events per subject and person.

Using these data, an attempt is made to detect behavioural patterns among the different groups, as well as the individual characteristics, by taking into account the nature of the contents researched, the moment the consultation takes place and whether the gender has any influence on this behaviour (Martínez Romera, 2017). This is therefore a Big Data analytical context, part of Learning Analytics in education (Siddiqa et al. 2016; Tsai, Lai, Chao & Vasilakos, 2015; Sin and Muthu, 2015).

An important aspect, and one common to all subjects, is that the majority of the students are females, especially in the subject of Early Childhood Education, something that must be taken into account in the internal and external comparison processes. In this study, it implies the normalisation of the variables according to the sex, before comparing them.

Data mining has proved to be a useful tool, especially in educational contexts where it is produced in large quantities (Koedinger et al., 2015; Sin & Muthu, 2015). This is clearly the case in the situation under study, and in general in teaching-learning processes supported by virtual environments. Therefore, two applications will be used for data analysis:

Orange (v3.19), an open source software for the application of data mining and learning machines successfully used on large volumes of data, such as the one under study (Demsar et al., 2013; Demsar et al., 2004). The user relationship model is the visual programming language (VPL), which makes it especially interesting in social or educational research contexts where computer or statistical-mathematical skills are unique, especially in Geography (Dobesova, 2011).

Weka (v3.8), a software which focuses on the same analytical areas as the previous one, but with a higher degree of specialisation in terms of the number and diversity of implemented and implementable algorithms (Sebastian & Puthiyidam, 2015; Ahmadi & Ahmad, 2013). It is more procedural and less interactive, but its design is suitable for higher data volumes under the same technical (hardware) conditions as Orange.

Because of the differences in the configuration of Moodle (the LCMS that was used to build all the virtual campuses of the universities involved in this study) and the need to carry out an initial data control, a cleansing and normalisation process is carried out beforehand. This is done using a database in which data is manipulated using SQL, regular expressions, edit distance, and data mining. The overall process is defined by the knowledge discovery in databases (KDD) strategy, and involves a sequence of chained tasks: selection, pre-processing (cleansing), transformation, mining and interpretation (García et al., 2016; Ramírez-Gallego et al., 2016; Taleb, Dssouli & Serhani, 2015). The following step is the selection and re-classification of variables, as well as the evaluation of their possible use in future analysis.

Five variables are created from other pre-existing ones in order to provide functionality to the analyses: genders are assigned, time structures are simplified (hour and day of the week) and the modal values of the events generated are reorganised. In addition, each set of events for the same subject and academic year receives a unique identifier (Subject). The results of the process prior to the start of the analysis are shown in Table 2.

 

Table 2

Cleansing, standardisation of variables and final reference scenario

 

The technological support required and has been completed with the use of specialised hardware for massive calculations, thanks to the supercomputing services of the Information Systems Area of the parent university. The methods and techniques used for the development of the research have been diverse, and applied according to the phase of analysis:

1.     Data collection: downloads from Moodle were compiled with spreadsheets, then entered into a database.

2.     Cleansing and normalisation: advanced editing filters, SQL language, edit distances, regular expressions, and manual editing in borderline cases.

3.     Data manipulation: SQL and Python languages.

4.     IP decoding through renowned specialized services (IPInfo.io).

5. Data mining: descriptive statistics and selection of learning automata for data mining based on ideas developed by Kaur, Singh & Josan (2015).

3. Analysis

3.1. Weekly Structure

Group A subjects generally show a clear concentration on Tuesdays, which is a school day. The behaviour by gender at this time is quite similar. The days before and after offer modest values, but somewhat higher than in the rest of the week, during which the time of use is scarce, below 2-3%. Only in A4 and A5 is there a clear increase in the previous days (Saturday to Monday) and a more modest one for the rest of the days.

In the subjects of the first academic year the data show occasional deviations, but in the whole of the week they tend to converge in brackets of 2-3 percentage points; whereas, during the last year, females students clearly work more frequently every day of the week, except Saturdays and Sundays, when there is a significant reversal. Sunday is the most relevant day for this with 21.53% male to 9.14% female interactions.

Group B subjects were taught consecutively on the same days (Monday and Tuesday). B2 had an additional session on Wednesdays. The correspondence with class days is noticeable in almost all academic years, except for the third, where there is a peak in activities on Thursdays. In any case, a downward trend is observed as the week goes by, until the day before classes. The time distribution is more homogeneous than in the previous case (with peaks above 60 and 70%), with maximums always below 25% and minimums above 6%.

The behavioural patterns by gender reveal occasional differences, however, it is not possible to detect clear trends: it is more likely that the relative maximum of interactions is performed by males during school time and females outside school time. However, there are sufficient exceptions to explain the lack of inverse correlation.

Group C had lessons from Monday to Wednesday. The time distribution is more similar to group B than to group A, as it shows more moderate absolute maximums, except for the first year, with a male peak on Tuesdays close to 45%. The lack of female presence is especially noteworthy. For the rest, as with group B, there is a moderate downward trend with a small reduction or reversal only on Sundays.

As with group B, there is greater consistency in female trends (changes are less abrupt), which is particularly evident in the first year. The probability of a relative maximum for men compared to women is again higher at the weekend, especially in the last two years, and the opposite is true on the other days. Overall, Figure 1 data indicate that the subject most influenced by the time structure is A, while B and C develop more complex behaviours, especially when gender is included as a variable. However, this initial time analysis leads to a second, more detailed one of the daily pattern of students.

 

Figure 1

Standardised weekly structure by gender and ordered by ID (columns)

 

Translation: Women – Men / Monday Tuesday Wednesday Thursday Friday Saturday Sunday / Day of the week

 

3.2. Daily Structure

The subject of reference (A) presents a very homogeneous behaviour between men and women in almost all academic years, with the clear exception of the final one. Besides the deviations from the most critical hours, associated mainly with the specific lecture time, it is possible to establish a clear daily structure: night and early morning, from midnight to 8 A.M., with no or very little use, and when there, is it is probably by a man; the morning hours, from 9 A.M. to 2 P.M., and the afternoon, from 3 P.M. to 8 P.M., are clearly the times of high interaction; after lunch, at 2 P.M., and dinner time, from 9 to 11 P.M., when the first is a clear relative minimum, similar to mid-morning breakfast (around 11 A.M.), while the second is a time of low, mainly female interaction in the first three years and both genders in the last two years.

There is also a gradual depolarisation of the time structure as we move into the last academic years. Thus, at 12 noon the absolute maximums in the first year are close to 30% for men and 20% for women, while in the final year they have fallen to 12% for men at 12 noon and almost 15% for women at 6 P.M.

The subjects in group B only partially replicate the time coherence of both genders observed in A. Both the night and the early morning have a small but clear relevance, with some academic years close to a 3% interaction for both genders.  Therefore, despite the modest values, it has been observed that the hours of the night when there is no one working on the virtual campus are rare. There is no clear gender-linked behaviour in this time frame. The structure of the rest of the day is much more chaotic, the moments of impasse are not always detectable (breakfast, approximately between 11 A.M. and 12 A.M.), although this is more the case during more formal meals such as lunch (between 2 P.M. and 3 P.M.) and dinner (9 P.M. to 10 P.M.).

The absolute peaks do not coincide in three of the four academic years and the relative peaks tend to be displaced, except in the first case:

During the first year, women recorded an absolute maximum at 11 A.M. and two relative maximums at 6 P.M. and 11 P.M., while men have an absolute maximum at 4 P.M. and two relative maximums at 11 A.M. and 11 P.M. The convergence of absolute and relative minimums is very significant: at 6 A.M. in the first case, and at 3 P.M. and 10 P.M. for the second. Women predominate in the central morning hours (9 A.M. to 1 P.M.) and men in the afternoon (5 P.M. to 10 P.M.).

The second year shows the most divergent behaviour of the four cases, both because of the lack of presence between maximums and minimums by gender, and because of the general time structure. Women start working at 6 A.M. and constantly increase the use of the platform until 8 P.M., with an absolute maximum at 5 P.M. and a relative minimum at 11 A.M. On the other hand, men begin working on the virtual campus at 8 A.M. and reach a relative maximum at 10 A.M., before steadily decreasing until 2 P.M., when a second increase begins, culminating at 7 P.M. with an absolute maximum. Between 6 A.M. and 9 P.M., there are four major shifts in the frequency of use, with differences of around 8 percentage points and usually around 2-3 percentage points.

The third year shows again a great convergence between men and women in all the identified periods, with the exception of the relative minimum of men at 10 A.M., much more intense than that of women, with a difference of more than 3 percentage points (3.19% compared to 6.48%). To a lesser degree, this happens again at the relative minimum at 3 P.M., or at the relative maximum of 6 P.M. to 7 P.M. The relative maximum at 9 P.M. is clearly male dominated (8% compared to 5.55%).

The fourth year is a mixed scenario: the first section, from night to dawn, is relatively similar. Women start work earlier (6 A.M.) than men (8 A.M.). The former do so incrementally until 12 noon, with an absolute maximum, while the latter show a moment of great activity concentrated in 2 hours (from 8 A.M. to 10 A.M.), and then remain below or similar to the female behaviour during the rest of the day. With specific exceptions, two maximums, a relative one at 2 P.M. and an absolute at 6 P.M., which coincide with the relative minimums for women. The male absolute maximum takes place at 7 P.M., and only clearly exceeds the female maximum at 10 P.M.

The subjects of group C offer two useful groups for the study, since the time structure obtained after the cleansing of the third-year data is clearly inconsistent, as it is an almost perfect linear distribution.

In the first year, there is a time structure for women that has already been detected in other cases: they increase a little before the start of the interactions and continue to do so for the best part of the day, in this case until 4 P.M., the absolute maximum, at which time they slow down until the early hours of the following morning. On the other hand, men begin their work one hour later, at 7 A.M., but stop at 11 A.M. after a modest relative maximum of 2.60%, they increase significantly until 3 P.M. (22.40%) and slow down almost with the same curve, except for the relative maximum at 5 P.M.  The absolute maximum, at 10 P.M., shows the same pattern of work concentration. Thus, in two hours of peak activity men concentrate almost half of all their daily work, while women do so more homogeneously throughout the day.

The second case reflects a high degree of concomitance, especially at night. Absolute and relative maximum levels are simultaneous and similar or have one hour gaps. Overall, only three moments of clear discrepancy are identified: two male peaks, an absolute one at 1 P.M. and a relative one at 9 P.M., which do not take place with women, and a relative low, at 7 P.M., which also deviates from the female trend by almost 2 percentage points. All of the above is shown in the graphical analysis of the data tabulation (Figure 2).

 

Figure 2

Daily event structure according to gender and ordered by ID (columns)

Translation: Women – Men / Time of day

 

3.3. Spatial Structure

The IP (Internet Protocol) is an analysis variable that has proven to be relatively weak, especially after cleansing. The number of women under study is reduced to 861 (96,9%) and, above all, the number of men falls to 159 (53,9%). The remaining values in this field are either null, not adjusted to the format of the protocol (x.x.x.x, with x=[0..255]), or not geographically equivalent (not included in the spatial databases).

IPInfo.io, a specialised service of recognised prestige in the sector, has been used for this decoding. The 12902 valid IPs outline the following structure by ID and gender (Table 3):

 

Table 3

Description of IP behaviour by ID and gender

Patrón de fondo

Descripción generada automáticamente

 

The range of the overall ratio is set between 5.5 (A5) and 22.5 (C1), with an interval width of 17 and more than four times the minimum value. Therefore, it is an unconcentrated distribution, strongly influenced by ID and marginally by gender. With one notable exception, C1 (23.1 vs 3.6). Absolute values are not useful, given the internal gender disproportion, especially in the IDs of Group A and C. When such samples are less polarized (group B) the averages tend to converge.

The geolocation process has further reduced the number of usable IPs (9176), the rest could not be properly decoded. From smallest to biggest, the final description of spatial variables is as follows: countries (13); regions (41); towns (629); post codes (ZIP): 668. Geographical coordinates and time zone are added to this.

The geographical distribution by country is not very significant, 99.29% of the IPs used by women and 97.88% of those used by men are found within Spain. The United States have marginal relevance for men (1.73%), and Great Britain is added for women (0.31% and 0.24% respectively). The rest are purely testimonial.

It is however possible to detect spatial patterns of concentration by region on the basis the data attached (Table 4):

 

Table 4

Description of IP behaviour by ID and gender

 

 

Madrid and Andalusia are the two most relevant regions, followed at a distance by Catalonia and Valencia. England is listed as the first foreign region, ahead of Melilla and Ceuta, the least relevant in quantitative terms in the whole country.

By gender, small discrepancies in the distribution can be observed: Madrid is more relevant for women than for men, with a difference of more than 8 percentage points. The opposite takes place in Andalusia, with a similar difference. Most IPs are activated by women in almost all other regions except Galicia, the Balearic Islands, the Basque Country, Extremadura, Navarra, Virginia and Cantabria. The rest are not statistically representative for our sample.

The towns with the highest activity correspond in part to the regions with highest activity, although secondary regions are also present, indicating a high degree of concentration in the internal distribution of the latter. Madrid and Seville clearly stand out (27.1 and 11.7% respectively), followed by Malaga (4.1%), Barcelona (3.9%), Cordoba (1.5%), Valencia and Granada (both with 1.3%).  The rest show values of less than 1%.

The IPs used by women are again in the majority in Madrid (27.7% vs 20.3%), along with Seville and Barcelona (12% vs 8%, and 3.9% vs 3.7%)., The trend is reversed in the following towns: Malaga (3.7% vs 8.6%), Cordoba (1.3% vs 1.7%), Valencia (1.3% vs 1.7%) and Granada (1.2% vs 1.9%), although the differences, except in the first case, are not significant. A heat mapping technique has been used to demonstrate the usage intensity according to spatial distribution (Figure 3):

 

Figure 3

Heat map of the IPs

 

 

 

The colour scale has been adjusted in order to identify the local patterns of lesser intensity, as the concentration of the first two cities is very high. A marginal pattern is thus detected, linked to the Mediterranean coast all the way to the Bay of Cadiz. On this stretch important local concentrations can be observed (Costa del Sol and Levante), with the area around Barcelona (Mataró, Sabadell, Sitges) clearly standing out.

It is also possible to ascertain that in inland areas one-off situations are the norm, even in the surroundings of important cities such as Valladolid, Salamanca, Zamora or León. Areas of minor concentration are again detected around Galician cities, especially Coruña, Santiago de Compostela and Vigo.

3.4. Data Mining

Considering the heterogeneity of the data, four learning automata were used to validate such data before searching for patterns in Orange: logistic regression, random forest for classification, support vector machine (SVM) and Naive Bayes. Additionally, REPTree was used in Weka. The user manuals of each application were used to analyse and implement the results of the algorithms.

The objective variable was Gender. When a variable produced another derived variable, the latter was chosen, and the former was excluded from the matrix. Considering this scenario, the overall results of the methods were those shown in Table 5.

 

Table 5

Statistics of the methods tested on the gender category

Patrón de fondo

Descripción generada automáticamente

 

The best classifier for all indicators is RFL. According to Tape (n.d.), it is a good classifier, being in the .80-.90 bracket. Therefore, gender is a useful variable to determine the behaviour of students on the Virtual Campus. However, values above .90 would be desirable if solid patterns are to be established, as the false positive rate is high for men, as described in their confusion matrix (Table 6).

The classification of women is clearly more correct than that of men (success ratio of 0.97 to 0.35). Therefore, the female behaviour is more statistically consistent than the male one, although the weakness of the second sample may imply errors of interpretation due to inconsistency. It should be taken into account that men are a small percentage compared to women.

 

Table 6

Confusion matrix for RFL

Imagen que contiene cielo, estrella, oscuro, computer

Descripción generada automáticamente

Caption: the values indicate the number of events. The meaning of the statistics is available on https://bit.ly/2MfBCJN.

 

The data mining has not yielded clear results due to the interference of the weekly and daily structure of the different subjects. Nevertheless, it is possible to point out some common trends: women are more likely to be working on the Virtual Campus both at the beginning of the week and at the beginning of the day. On the other hand, those who access or work on the Virtual Campus at night are more likely to be men.

An in-depth study of each academic year does lead to clear sets of rules by using a priori algorithms, both for the detection of general patterns, which affect a large part of the class, and marginal ones, useful for the detection of homogeneous subgroups. Clear examples of both situations are given for ID = B3. Ten rules of behaviour by gender were found to have an effect on the “Workshop” work component, nine for women and one for men.

In the first case they are recurrent, each involving 15 to 25 students for specific days and times (Monday, Tuesday, and/or Wednesday at 9 A.M., 7 P.M. and/or 8 P.M.) or for a specific time without day restriction (8 P.M.). There is only a partial overlap, so it establishes a set of behavioural patterns for most women, and accuracy values ranging from 0.98 to 0.99.

As for men, the rule affects seven students, i.e. less than a third of them. It is therefore a small group of well-defined behaviour (accuracy of 0.96) within a heterogeneous subset.

 

4. Discussion

The analysis of the relationship between the weekly calendar and gender has highlighted some interesting aspects. Although in general there is a high degree of similarity between the two patterns, especially at times of greater intensity, the situation shows nuances when the attention is focused on marginal situations. Moreover, this has been quite consistent over time.

It is interesting to note that in the subjects of the Pedagogy degree (group A), a change of pattern can be observed in the last year: women work more on the virtual campus during the week, while men clearly do so during the weekend, always in relative terms. The reasons for this break in the similarity pattern are not clear: both the teaching staff, the subject and its time structure are the same. Unfortunately, longitudinal cohort studies are not possible here, so the influence of the student context is both conditioning and undetermined.

The results of the subjects in group B correspond to a postgraduate degree for students in Geography and History. These are therefore older students who, in principle, study fewer subjects compared to an undergraduate degree. We believe that this aspect can explain the greater homogeneity of their patterns.  Here, absolute and relative maximums never exceed 25%, whereas in the previous case they almost reach 80% in some academic years.

Their weekly work is less concentrated and, although not exempt from general trends, it must be carefully differentiated by gender: in half of the cases there is female pre-eminence in weekend work, in another case it is the opposite, and the last one shows female pre-eminence only on one of the two days, Saturday. There are no significant differences during the week either, except for Monday, when, in three of the four courses, males show more participation.

Group C subjects belong to a Teaching degree and, against expectations, they reveal a pattern of behaviour more similar to B than to A. This is remarkable since A and B share a curriculum clearly linked to Education, while B's material is specifically designed for students of the faculties of Humanities, hence, without a previous regulated didactic background. However, some clearly exceptional situations, such as that observed in first-year students on Tuesdays, could not be explained on the basis of the structure of the campus or teachers’ understanding of the ongoing situation.

Although the analysis of comparative behaviour by gender and time of day were expected to be clearer, concomitance has been in fact the main feature: the hourly concentration has again been more relevant in the subjects of group A and clearly lower in those of B and C, with a difference of 10 percentage points or more in their absolute maximums.

It is only when dealing with marginal, sometimes even main, behaviours that differences between genders can be observed: absolute peaks, i.e. moments of high intensity of work, are usually dominated by men, while women generally show higher average values in time brackets close to these peaks, which means that they work for longer stretches of time.

Overall, and in the sample studied, the analysis reveals the existence of both daily time patterns specific to each subject and gender patterns linked to specific academic years, but not in a structural way: there are academic years in which similarities in behaviour by gender explain much more than the differences do: However, in other years the differences are clear, and in such cases they are usually characterised by the tendency for men's work to be concentrated and women's work to be more evenly distributed over time.

The IP has proven to be a variable of great interest for geographical analysis and comparison by gender. Some clear differences have been found with regard to both dispersion and spatial concentration, which indicate a greater mobility of women outside their original locations, although with a greater tendency towards concentration in the destinations. On the other hand, the men under study show less mobility, but do so to a greater number of destinations; in both cases proportionally.

 

5. Conclusions

The study of learning behaviour on virtual campuses is a field of study still in its infancy in Higher Education, especially in the Didactics of Geography and Social Sciences. However, despite its complexity, the knowledge and insights it brings to the table make it useful, relevant and necessary. The time students spend in front of computer screens as part of their learning process cannot be ignored, especially in line with the European ECTS credit format.

The methodology used needs to be developed, especially with regard to data mining. This approach has proved interesting in an aspect that is particularly difficult to perceive: the homogeneous marginal behaviour, i.e. small group trends that are hard to detect because of their very nature.

It has become clear that the robustness of this type of analysis is based on the availability of significant volumes of data. Therefore, a correct data recording and unification is a key element that may question whether certain data should be included or not, as has happened with one of the subjects in group C.

The location analysis of the IPs is, in our opinion, an opportunity to take advantage of interesting geographic information, both from a basic and applied perspective. It requires, and opens the door to, future research that exploits its potential from totally heterogeneous perspectives such as humanist geography (Tuan, op. cit.) or quantitative geography (Hägerstrand, 1985).

The focus on the main variable, i.e. gender, has also been a determining factor in a context, i.e. education, where women are in the majority. This allows for the research of one part of the population but questions the analytical soundness of the other. This is why prediction errors in the confusion matrix are so disproportionate between men and women.

Nonetheless, the introduction of this analysis is presented in a natural way and retrieves a set of data not much used in the geographical or educational context. Beyond the similarities and discrepancies found from this comparative perspective, to which it is necessary to add further analysis before obtaining solid explanatory arguments, the study does appear to offer sufficient richness to be researched systematically, at least from the didactic perspective of geography.

In conclusion, we believe it necessary to continue with this type of research, and to add case studies that will allow future developments of more robust studies on the consistency of patterns divided by general and unique profiles. Research should also complement this type of results with explanatory analyses, for example, on the reasons why men and women have different behaviours, on the learning difficulties that can be detected in this subject field and what relationship all this has with the academic performance on the curriculum.


 

La influencia del sexo en el uso de los campus virtuales. Estudio de caso

 

1. Introducción

Cuando Martin Dougiamas liberó la primera versión de su LCMS (Learning Content Management System) en 2002, Moodle, descontento por la presencia del software disponible y motivado por el deseo de incorporar el constructivismo pedagógico, nada hacía pensar que se convertiría en un estándar de facto, y con ello pondría en primera línea de interés didáctico el soporte digital virtual, especialmente el universitario.

Hoy día, se opte por formas propietarias o libres, es impensable que una asignatura universitaria, y cada vez más en la enseñanza media, no tenga asociada un campus virtual, si no es que se lo utiliza como vía preferente o exclusiva de trabajo. Algo que cobra especial sentido gracias a las nuevas formas de análisis educativo que ofrece esta plataforma (Hamotoglu et al., 2020; Cantabella et al., 2019; Quintanas Mendes et al., 2019; Fakir & Touya, 2014; Lu & Law, 2012), las técnicas analíticas que permite introducir (Álvarez Vázquez et al., 2020; Charanya & Kesavan, 2019; Cohen, Rahimi & Zilka, 2019; Manne, Yelisetti, Kakarla, & Fátima, 2014) y las dimensiones sociales y conductuales que hace posible abordar (Pakanen, Alavesa, Arhippainen & Ojala, 2020; Castro, Menacho & Pérez-Molina, 2018; Cerezo, Esteban, Sánchez-Santillán, & Núñez, 2017; Parise, 2016).

Bajo nuestro criterio, dos conjuntos de ventajas docentes se presentan como más relevantes: las que derivan de la deslocalización espaciotemporal del acto educativo, sea de forma parcial o total; y las que se originan en la forma tecnológica de interactuar, tanto entre los usuarios como con los contenidos de la asignatura.

Respecto a las primeras, es evidente que la simbiosis hombre-máquina que ya se intuyera en los inicios de la computación (Licklider, 1960), ha pasado a ser un hecho en expansión y de efectos todavía no bien explorados, aunque sí percibido desde hace tiempo en Educación (Orostica Verdugo, 2020; Desai, Chavan & Tendulkar, 2020; Cabanillas, Luengo & Carvalho, 2019; Morales, Infante-Moro & Gallardo-Pérez, 2019; Ballesteros Regaña et. al, 2010; Correa & Paredes, 2009), Geografía (Capel, 2009) y otras ciencias sociales (Sarduy Domíngez et al. 2020; Arias & Defiore, 2019; Gómez Collado, Contreras Orozco & Gutiérrez Linares, 2016). El horario y calendario escolar, entendidos como horario de clase y distribución semanal de la carga lectiva, se sigue planteando bajo una lógica previa a la vigente realidad tecnológica. La tradicional concurrencia espacio-temporal de los tres elementos del acto educativo (docente, discente y objeto de estudio) encuentra una alternativa deslocalizadora en los LCMS, que posibilita una concepción ubiquista de aquél. Ello implica concebirlo como un nuevo objeto de estudio, impregnado de una complejidad cronogeográfica (Tartia, 2020; Thulin, Vihelmson & Scwanen, 2020; Vega Valverde, 2017) y conductual claramente distinta a la que fue concebida en el siglo XIX, durante la institucionalización educativa, y aún a la regulada en la actualidad por los sucesivos marcos normativos.

Respecto a las segundas, los nuevos medios técnicos para aprender y colaborar en una asignatura son un espacio todavía ignoto en buena medida para el docente. Sea por el uso de herramientas colaborativas con base en la nube (Internet), sea por la posibilidad de consultar las fuentes docentes en cualquier momento y lugar, lo cierto es que la forma en que el alumnado interactúa con los contenidos y las tareas no tiene nada que ver con las formas posibles, y disponibles, apenas una o dos generaciones atrás.

La entrada de España en el Espacio Europeo de Educación Superior (BOE nº 224 de 18 de septiembre de 2003) puso estas cuestiones en primera línea de interés reflexivo docente. Ya que la introducción de los créditos ECTS (European Credit Transfer System) supone un intento de cómputo no sólo de la carga lectiva tradicional (en clase), sino de las horas de estudio, tutorías, seminarios, trabajos y cualesquiera otra dedicación necesaria o requerida para la superación de una asignatura.

Controlar el devenir del alumnado fuera de clase no parece una solución razonable ni deseable, y centrarse en los resultados objetivos (notas de examen, de exposiciones, trabajos...) plantea dudas sobre el carácter enfático que todos los modelos educativos modernos demandan sobre los procesos de formación continua y de retroalimentación docente-discente; mediante los que frecuentemente es cuestionado un profesorado que ahora requiere de capacidades adicionales (Sola-Martínez et al., 2020; Abbott, 2011). Especialmente bajo el prisma de las analíticas de aprendizaje (learning analytics) en el que nos apoyamos en la presente, dada su versatilidad (Ruipérez-Valiente et. Al. 2020; Papoušek, Pelánek & Stanislav, 2016; Sclater, Peasgood & Mullan, 2016; Gašević, Dawson & Siemens, 2015; Siemens & Long, 2011).

Es por ello que consideramos necesario explorar el análisis de patrones de comportamiento (digital) del alumnado en los campus virtuales como una forma indirecta de conocimiento de desempeño discente y comportamiento espaciotemporal, no necesariamente invasivo si se establecen consideraciones éticas elementales, en línea con enfoques humanistas ya consolidados en Geografía (Tuan, 1977 & 1990).

Cada usuario identificado en un campus virtual, durante el uso que hace del mismo, genera multitud de registros de datos que informan del lugar, la hora y sus acciones (abrir un enlace, una presentación, un documento, realizar un comentario en un foro, entregar una tarea…); a cada uno de estos registros se le denomina evento (Caballé & Xhafa, 2013). Información muy interesante, a la que se pueden añadir incluso más variables, como el sexo, a partir de los propios datos de identificación del usuario, para dotar de mayor riqueza a la fuente.

Su análisis puede hacerse partiendo de un bagaje estadístico modesto, hasta incorporar las técnicas y metodologías de vanguardia. Gracias a estas últimas los tiempos de trabajo, y de obtención de resultados, pueden ser claramente factibles de cara al momento de evaluación o, incluso, de rectificación de la estrategia didáctica (Badilla Quintana, Vera Sagredo & Lytras, 2017; Minguillón, Santanach & Appel, 2016).

A tenor de todo lo anterior, nuestro objetivo es realizar un análisis comparativo entre sexos con la intención de comprobar las posibles semejanzas y diferencias en el uso de los campus virtuales desde tres perspectivas: el momento de uso, el lugar de uso y el contenido visitado. En línea con otras investigaciones que señalan la pertinencia de explorar este tipo de cruce de variables para conocer de forma adecuada la conducta del alumnado en los campus virtuales (Álvarez Vázquez, 2019; Cabanillas García et al., 2019; De la Iglesia-Villasol, 2019).

 

2. Metodología

El presente estudio analiza los datos recogidos sobre más de 1000 alumnos en un periodo de 4 años, entre los cursos 2016/17 y 2019/20; organizados en 14 grupos de clase pertenecientes a 4 asignaturas de grado y posgrado de tres titulaciones, pertenecientes a 2 universidades españolas. Tres de las asignaturas pertenecen al Área de conocimiento de la Didáctica de las Ciencias Sociales y una cuarta a Didáctica y Organización Escolar:

 

·           Recursos Didácticos y Tecnológicos en Educación en Grado de Pedagogía (A1 - P-RDTE).

·           Currículo de Geografía e Historia en Máster de Profesorado (B1 - M-CCSS-C).

·           Diseño y Desarrollo de Programaciones y Actividades Formativas de Geografía e Historia en Máster de Profesorado (B2 - M-CCSS-D).

·           Didáctica de las Ciencias Sociales en Grado de Educación Infantil (C1 - I-DCCSS).

 

La Tabla 1 recoge los descriptores fundamentales de cada asignatura (curso, alumnado y número total de eventos), con objeto de establecer las dimensiones del universo de referencia. Pero dada la heterogeneidad interna de las variables (alumnado y eventos), es necesario recurrir a una forma proporcional de comparación (Evaluaciones / Alumnado), para definir cómo de relevante es en cada caso la interacción con la plataforma en el desarrollo de la asignatura. En este sentido, y usando a los docentes como criterio de ordenación, el resultado sería: A (281,4), C (140,7) y B (119,0); con una media conjunta de 180,4 eventos por asignatura y persona.

A partir de estos datos se intenta detectar patrones de comportamiento común entre los diferentes grupos, así como singularidades propias, atendiendo a la naturaleza de los contenidos consultados, el momento en que se produce la consulta y la influencia, o no, del sexo en dicho comportamiento (Martínez Romera, 2017). Estamos, por tanto, en un contexto analítico propio del Big Data, como parte del Learning Analytics, en educación (Siddiqa et al. 2016; Tsai, Lai, Chao & Vasilakos, 2015; Sin y Muthu, 2015).

 

Tabla 1

Eventos generados por asignatura y grupo

Patrón de fondo

Descripción generada automáticamente

Leyenda: Ab indica número de alumnos iniciales; Af tras depuración y normalización. M/F: desglose por sexos (Masculino / Femenino).

 

Un aspecto importante, y común a todas las asignaturas, es la clara feminización de la población, muy especialmente en la asignatura de Educación Infantil. Hecho que ha de ser tenido en cuenta en los procesos de comparación interna y externa, y que implica, en el presente estudio, la normalización por sexo de variables previa a su cotejo.

La minería de datos (Data Mining) ha demostrado ser un instrumento útil, especialmente en contextos educativos donde hay producción masiva (Koedinger et al., 2015; Sin & Muthu, 2015), algo claramente aplicable a la situación planteada, y en general a los procesos de enseñanza-aprendizaje apoyados en entornos virtuales. En consecuencia, para el análisis de datos se recurrirá a dos aplicaciones:

Orange (v3.19), software de código abierto para la aplicación de minería de datos y máquinas de aprendizaje utilizado con éxito en volúmenes significativos de datos, como el que nos ocupa (Demsar et al., 2013; Demsar et al., 2004). El modelo de relación con el usuario es el de programación visual (visual programming language, VPL), algo que lo hace especialmente interesante en contextos de investigación social o educativa donde las destrezas informáticas o estadístico-matemáticas son singulares, especialmente en Geografía (Dobesova, 2011).

Weka (v3.8), software centrado en los mismos ámbitos analíticos que el anterior, pero con un mayor grado de especialización en cuanto al número y diversidad de algoritmos implementados e implementables (Sebastian & Puthiyidam, 2015; Ahmadi & Ahmad, 2013). Presenta un modelo más procedural y menos interactivo, pero su diseño es apto para volúmenes de datos superiores a igualdad de condiciones técnicas (hardware), respecto al primero.

Debido a las diferencias de configuración de Moodle, el LCMS sobre el que se han construido todos los campus virtuales de este estudio, entre las universidades implicadas, así como por la necesidad de realizar un control de datos inicial, se plantea un procedimiento de depuración y normalización previo a la explotación. Se recurre para ello a un contexto de base de datos en el que se manipulan los datos mediante SQL, expresiones regulares, distancias de edición y minería de datos. El proceso global queda definido por la estrategia knowledge discovery in databases (KDD), e implica una secuencia de tareas encadenadas: selección, preproceso (depuración), transformación, minería e interpretación (García et al., 2016; Ramírez-Gallego et al., 2016; Taleb, Dssouli & Serhani, 2015). Se realiza un proceso de selección y reclasificación de variables, así como de calificación respecto a su posible utilidad en los análisis posteriores.

Se construyen 5 variables a partir de otras preexistentes con objeto de dotar de funcionalidad a los análisis: se asignan sexos, se simplifican las estructuras temporales (hora y día de la semana) y se reorganizan los valores modales de los eventos generados. Además, cada conjunto de eventos para una misma asignatura y curso recibe un identificador único (Asignatura). Con todo ello, los resultados del proceso previo al inicio del análisis se recogen en la Tabla 2.

 

Tabla 2

Depuración, estandarización de variables y universo final de referencia

Patrón de fondo

Descripción generada automáticamente

 

El soporte tecnológico se ha completado con, y ha requerido, el uso de hardware especializado para cálculo masivo, gracias a los servicios de supercomputación del Área de Sistemas de Información de la universidad matriz. Los métodos y técnicas utilizados para el desarrollo de la investigación han sido diversos, y aplicados en función de la fase de análisis:

 

·           Obtención de los datos: descargas desde Moodle, se hicieron a partir de hojas de cálculo, posteriormente integradas en una base de datos.

·           Depuración y normalización: filtros avanzados de edición, lenguaje SQL, distancias de edición, expresiones regulares y edición manual en casos marginales.

·           Manipulación de datos: lenguajes SQL y Python.

·           Decodificación de IP mediante servicios especializados de reconocido prestigio (IPInfo.io).

·           Explotación de datos: estadística descriptiva y selección de autómatas de aprendizaje para minería de datos a partir de las ideas desarrolladas por Kaur, Singh & Josan (2015).

 

3. Análisis

3.1. Estructura semanal

Las asignaturas del grupo A presentan en términos generales una clara concentración los martes, día de clase. El comportamiento por sexos en ese momento es bastante semejante. Los días previo y posterior ofrecen valores modestos, pero algo más elevados que en el resto de la semana, tiempo en el que es testimonial su uso con valores por debajo del 2-3%. Sólo en A4 y A5 hay un claro repunte de los días previos (sábado a lunes) y uno más modesto para el resto de días.

En las asignaturas del primer curso los datos presentan desviaciones puntuales, pero que en el conjunto de la semana tienden a converger en horquillas de 2-3 puntos porcentuales; mientras que en el último las féminas interactúan claramente con mayor frecuencia todos los días de la semana, excepto sábados y domingos, momento en el que se produce una fuerte inversión. Es el domingo el día más relevante para ello: 21,53% de interacciones masculinas por 9,14% femeninas.

Las asignaturas del grupo B se impartían de forma consecutiva los mismos días (lunes y martes). B2 contaba con una sesión adicional los miércoles. La correspondencia con los picos de clase es notable en casi todos los cursos, con la salvedad del tercero, en el que el jueves es claramente un dia de mayor uso relativo. En todo caso se observa la preeminencia de una tendencia descendente según transcurre la semana, hasta el día previo al inicio de las clases. La distribución temporal es más homogénea que en el caso anterior (con picos superiores al 60 y 70%), con máximos inferiores siempre al 25% y mínimos superiores al 6%.

Los patrones de comportamiento por sexo expresan diferencias puntuales, pero no permiten discernir modelos claros: es más probable que en periodo lectivo el máximo relativo de interacciones sea masculino y que en periodo no lectivo sea femenino; sin embargo, existen excepciones suficientes que explican la inexistencia de correlación inversa.

La asignatura del grupo C se impartía de lunes a miércoles. La distribución temporal de eventos es más semejante al grupo B que al A, en tanto que presenta máximos absolutos más moderados, excepción hecha del primer curso, con un pico masculino los martes, próximo al 45%. Especialmente llamativo por la inexistencia de reflejo femenino. Para el resto, al igual que sucede con B, se observa una tendencia descendente moderada que sólo encuentra reducción o inversión, pequeña en el mejor de los casos, el domingo.

Al igual que sucede con el grupo B, se observa una mayor constancia en las tendencias femeninas (cambios bruscos menos acusados), algo especialmente claro en el primer curso. Así como vuelve a constatarse una mayor probabilidad de máximo relativo masculino frente al femenino durante el fin de semana, especialmente en los dos últimos cursos, y lo contrario durante el resto de días. En conjunto, Figura 1, los datos reflejan que la asignatura más influenciada por la estructura temporal es la A, mientras que B y C desarrollan comportamientos más complejos, especialmente cuando se incluye el sexo como variable. Con todo, este primer análisis temporal deriva en un segundo, de mayor detalle, relativo al patrón diario del alumnado.

3.2. Estructura diaria

La asignatura de referencia (A) presenta un comportamiento muy homogéneo entre hombres y mujeres en casi todos los cursos, con la clara excepción del último. Más allá de las desviaciones en el centro de gravedad sobre las horas más relevantes, asociadas fundamentalmente con la hora específica de clase, es posible establecer una estructura diaria clara: la noche y la madrugada, de 0 a 8h, de nula o muy escasa relevancia en el uso, cuando éste se produce se trata probablemente de un hombre; la jornada laboral de mañana, de 9 a 14h y la jornada laboral de tarde, de 15 a 20h, son momentos en los que se concentran claramente las interacciones; y la sobremesa, 14h, y la cena, de 21 a 23h, en el que el primero es un mínimo relativo claro, con cierto reflejo a media mañana con el desayuno (alrededor de las 11h), mientras que el segundo es un momento de baja interacción de preeminencia femenina en los tres primeros cursos y mixta en los dos últimos.

 

Figura 1

Estructura semanal normalizada por sexo y ordenada por ID (columnas)

 

 

También se observa una paulatina despolarización de la estructura temporal según avanzamos a los cursos más recientes. Así, los máximos absolutos del primer curso están próximos al 30% en el caso de los hombres, a las 12h, y al 20% para las mujeres, en el mismo tiempo, mientras que en el último curso ha descendido hasta fijarse en un 12% para los hombres a las 12h, y de casi 15% para las mujeres a las 18h.

Las asignaturas del grupo B emulan solo parcialmente la coherencia temporal de ambos sexos observadas en A. Tanto la noche como el inicio de la madrugada tienen una relevancia pequeña pero clara, con interacciones que rozan el 3% en algunos cursos para ambos sexos. Así, pese a los valores modestos, se constata que son raras las horas de la noche en las que no hay alguien trabajando con el campus virtual. No se observa un comportamiento ligado a sexo claro en esta franja. La estructura del resto del día es mucho más caótica, los momentos de impasse no son siempre detectables (desayuno, de forma relativa entre 11 y 12h), pero sí algo más en los de naturaleza más formal almuerzo (entre 14 y 15h) y cena (21 a 22h).

Los máximos absolutos no coinciden en tres de los cuatro cursos y los relativos tienden a estar desplazados, salvo en el primer caso:

Durante el primer curso las mujeres registran un máximo absoluto a las 11h y dos relativos, a las 18h y 23h. Mientras que los varones presentan su máximo absoluto a las 16h y dos máximos relativos a las 11h y 23h. La convergencia de mínimos absolutos y relativos es muy significativa: a las 6h en el primer caso, y a las 15h y 22h para los segundos. Se observa una preeminencia de las mujeres en las horas centrales de la mañana (9 a 13h) y de los hombres por la tarde (17 a 22h).

Durante el segundo curso se detecta el comportamiento más divergente de los cuatro casos, tanto por la falta de reflejo entre máximos y mínimos por sexo, como por la estructura temporal general. Las mujeres inician las interacciones a las 6h e incrementan de forma constante el uso de la plataforma hasta las 20h, con un máximo absoluto a las 17h y un mínimo relativo a las 11h. Por su parte, los hombres inician el trabajo con el campus virtual a las 8h y alcanzan un máximo relativo a las 10h, para descender de forma sostenida hasta las 14h, momento en el que se inicia un segundo incremento que culmina a las 19h con máximo absoluto. Entre las 6h y las 21h, se producen cuatro inversiones de preeminencia en la frecuencia de uso, con diferencias que llegan a rondar los 8 puntos porcentuales y que suelen estar alrededor de los 2-3 puntos porcentuales.

El tercer curso vuelve a mostrar una gran convergencia entre hombres y mujeres en todos los tramos definidos, con la salvedad del mínimo relativo de los hombres a las 10h, mucho más acusado que el de las mujeres, entre los que median más de 3 puntos porcentuales (3,19% frente a 6,48%). De forma menos relevante esto vuelve a suceder en el mínimo relativo de las 15h, o en el máximo relativo de 18 a 19h. El máximo relativo de 21h sí está claramente masculinizado (8% frente a 5,55%).

El cuarto curso presenta una situación mixta: el primer tramo, noche a madrugada, es relativamente similar. Las mujeres inician el trabajo antes (6h) que los hombres (8h). Las primeras lo hacen de forma creciente hasta las 12h, con un máximo absoluto, mientras que los varones presentan un momento de gran actividad concentrado en 3h (de 8 a 10h), para quedar por debajo o similar al comportamiento femenino el resto del día. Con excepciones puntuales, dos máximos, relativo a 14h y absoluto a las 18h, que coinciden con mínimos relativos femeninos. El máximo absoluto masculino se localiza a las 19h, y sólo volverá a superar claramente al femenino en su máximo relativo de las 22h.

Las asignaturas del grupo C presentan dos grupos útiles para el estudio, ya que la estructura temporal obtenida tras la depuración del tercer curso es claramente inconsistente, al tratarse de una distribución lineal casi perfecta.

En el primer curso se observa una estructura temporal femenina ya detectada en otros casos: incrementan un poco antes el inicio de las interacciones y éstas experimentan un incremento sostenido durante buena parte del día, en este caso hasta las 16h, máximo absoluto, momento en el que inicia un lento declive hasta las primeras horas de la madrugada. Por su parte los varones inician una hora después sus interacciones, a las 7h, pero las interrumpen a las 11h tras un modesto máximo relativo de 2,60%, para incrementarse exponencialmente hasta las 15h (22,40%) y descender casi con la misma pendiente, salvedad hecha del máximo relativo de las 17h. El máximo absoluto, a las 22h, refleja el mismo esquema de concentración en las interacciones. Así, en dos horas de máxima actividad los hombres concentran casi la mitad de todas sus interacciones del día, mientras que las mujeres interactúan de forma más homogénea a lo largo del día.

El segundo caso refleja un alto grado de concomitancia, especialmente en las horas nocturnas. Los máximos absolutos y relativos son simultáneos y semejantes, o presentan decalajes de una hora. En conjunto sólo se identifican tres momentos de discrepancia clara: dos máximos masculinos, absoluto a las 13 y relativo a las 21h que no encuentran un reflejo semejante en las féminas, y un mínimo relativo, a las 19h, que también se aleja de la tendencia femenina en casi 2 puntos porcentuales. Todo lo anterior es reflejo del análisis gráfico derivado de la tabulación de datos (Figura 2).

Figura 2

Estructura diaria de eventos normalizada por sexo y ordenada por ID (columnas)

 

3.3. Estructura espacial

La IP (Internet Protocol) es una variable de análisis que se ha mostrado relativamente débil, especialmente tras la depuración. Reduce a 861 (96,9%) las mujeres controladas, pero sobre todo a los hombres, que descienden a 159 (53,9%). El resto presentan en dicho campo valores nulos, no ajustados al formato de dicho protocolo (x.x.x.x, con x=[0..255]), o sin equivalencia geográfica (no figuran en las bases de datos espaciales).

Para dicha decodificación se ha recurrido a IPInfo.io, servicio especializado de reconocido prestigio en el sector. Las 12902 IP distintas válidas describen la siguiente estructura por ID y sexo (Tabla 3):

 

 

Tabla 3

Descripción del comportamiento de IP por ID y sexo

Patrón de fondo

Descripción generada automáticamente

 

El rango de la ratio general se fija entre 5,5 (A5) y 22,5 (C1), con una amplitud de intervalo de 17 y superior al cuádruple del valor mínimo. Por tanto, se trata de una distribución no concentrada, fuertemente influenciada por ID y de forma marginal por el sexo. Con una salvedad notable, C1 (23,1 vs 3,6). Los valores absolutos no son útiles, dada la desproporción interna por sexos, especialmente en las ID del grupo A y C. Cuando dichas muestras están menos polarizadas, grupo B, las medias tienden a la convergencia.

El proceso de geolocalización ha reducido aún más el número de IP utilizables (9176), el resto no han podido ser debidamente decodificadas. La descripción de variables espaciales final es la siguiente, de menor a mayor escala: países (13); regiones (41); núcleos urbanos (629); códigos postales (ZIP): 668. A los que se suman las coordenadas geográficas y la zona horaria.

La distribución geográfica por países es poco significativa, el 99.29% de las IP utilizadas por mujeres y el 97.88% de las utilizadas por varones son se encuentran dentro de España. Estados unidos tiene relevancia marginal para éstos últimos (1.73%), y se añade Gran Bretaña en el caso de las mujeres (0.31% y 0.24% respectivamente). El resto tienen carácter testimonial.

Por regiones sí es posible detectar patrones espaciales de concentración a partir de los datos agregados (Tabla 4).

 

Tabla 4

Descripción del comportamiento de IP por ID y sexo

 

 

Imagen que contiene oscuro, grande, tabla, computer

Descripción generada automáticamente

Madrid y Andalucía son las dos comunidades más relevantes, seguidas a distancia por Cataluña y Valencia. Inglaterra, considerada aquí por el servicio debido a su integración estatal en Gran Bretaña, figura como primera región extranjera. Por delante de Melilla y Ceuta, las menos relevantes cuantitativamente de todo el país.

Por sexos, es posible comprobar pequeñas discrepancias en la distribución: Madrid es más relevante para las mujeres que para los hombres, con más de 8 puntos porcentuales de diferencias. Situación que se invierte con Andalucía, con una diferencia similar. Las IP activadas por mujeres son mayoría en casi todas las demás regiones, salvo Galicia, Islas Baleares, País Vasco, Extremadura, Navarra, Virginia y Cantabria. El resto carecen de representatividad estadística para la muestra.

Los núcleos urbanos más visitados corresponden en parte con las regiones más visitadas, pero también aparecen otros de regiones secundarias, lo que indica un elevado grado de concentración en la distribución interna de estas últimas. Así, encontramos Madrid y Sevilla claramente destacadas (27,1 y 11,7% respectivamente), seguidas por Málaga (4,1%), Barcelona (3,9%), Córdoba (1,5%), Valencia y Granada (ambas con 1,3%). El resto presenta valores inferiores al 1%.

Las IP usadas por mujeres vuelven a ser mayoría en Madrid (27,7% vs 20,3%), así como en Sevilla y Barcelona (12% vs 8%, y 3,9% vs 3,7%). En el resto de las citadas se invierte la tendencia: Málaga (3,7% vs 8,6%), Córdoba (1,3% vs 1,7%), Valencia (1,3% vs 1,7%) y Granda (1,2% vs 1,9%), si bien las diferencias, salvo en el primer caso, son poco significativas. Para comprender la intensidad local de este fenómeno en su distribución espacial, se ha recurrido a la técnica de mapa de calor (Figura 3):

 

 

Figura 3

Mapa de calor de las IP

 

 

La rampa de color ha sido ajustada para permitir discernir los patrones locales de menor intensidad, ya que la concentración de las dos primeras ciudades es muy alta. Se detecta así un patrón marginal ligado a la costa mediterránea, que se extiende hasta la bahía de Cádiz. En dicho recorrido es posible señalar concentraciones locales de cierta entidad (costa del sol y levante), y entre las que destaca, claramente, el entorno de Barcelona (Mataró, Sabadell, Sitges).

También permite comprobar que en las zonas de interior las situaciones puntuales son la norma, incluso en el entorno de ciudades relevantes como Valladolid, Salamanca, Zamora o León). Áreas de concentración menor se vuelven a detectar en torno a las ciudades gallegas, especialmente Coruña, Santiago de Compostela y Vigo.

 

3.4. Minería de datos

Ante la heterogeneidad de datos, cuatro autómatas de aprendizaje se lanzaron contra los mismos para realizar su validación, previa a la búsqueda de patrones en Orange: regresión logística, bosque aleatorio de clasificación, support vector machine (SVM) y Naive Bayes. Y uno adicional en Weka, REPTree. Para la aplicación y análisis de resultados de los distintos algoritmos se recurrió a los manuales de uso de cada aplicación.

La variable objetivo fue Sexo. Y en los casos en que una variable dio origen a otra derivada, se optó por la segunda y se excluyó de la matriz a la primera. Bajo dicho escenario, los resultados generales de los métodos fueron los reflejados en la Tabla 5.

 

Tabla 5

Estadísticos de los métodos probados sobre la clase sexo

 

El mejor clasificador, para todos los indicadores, es RFL. Siguiendo a Tape (s.f.), es un clasificador bueno, al encontrarse en la horquilla .80-.90. En consecuencia, el sexo es una variable útil para determinar el comportamiento en Campus Virtual del alumnado. No obstante, valores por encima de .90 serían deseables si se quiere establecer patrones sólidos, ya que la tasa de falsos positivos es elevada en el caso de los hombres, como describe su matriz de confusión (Tabla 6).

 

Tabla 6

Matriz de confusión para RFL

Interfaz de usuario gráfica, Texto

Descripción generada automáticamente

Leyenda: los valores expresan número de eventos. El significado de los estadísticos se encuentra disponible en https://bit.ly/2MfBCJN.

 

La clasificación de mujeres es claramente más correcta que la de hombres (ratio de aciertos de 0,97 frente a 0,35). Por tanto, es más coherente estadísticamente el comportamiento femenino que el masculino, si bien la debilidad de la segunda muestra puede inferir errores de interpretación por inconsistencia. Los hombres son una fracción pequeña en comparación con las mujeres, y debe ser tenido en cuenta.

La minería realizada no arroja resultados claros, debido a la interferencia de la estructura semanal y diaria de las diferentes asignaturas. Con todo, es posible señalar algunas tendencias comunes: tanto al principio de la semana, como al principio del día, es más probable encontrar a una mujer trabajando con el Campus Virtual. Es más probable que sea un hombre quien acceda o trabaje en Campus Virtual durante la noche.

El estudio pormenorizado por cursos sí permite establecer conjuntos de reglas claras mediante algoritmos de carácter apriorístico. Tanto para la detección de patrones generales, que afectan a buen aparte de la clase, como marginales, útiles para la detección de subgrupos homogéneos. Ejemplos claros de ambas situaciones aparecen para ID = B3. Se encontraron 10 reglas de comportamiento por sexo con efecto sobre la componente de trabajo ‘Taller’, 9 para mujeres y 1 para hombres.

En el primer caso tienen carácter recurrente, cada una implica de 15 a 25 alumnas para días y horas específicos (lunes, martes o miércoles a las 9, 19 o 20h) o para una hora específica sin restricción de día (08h). Con solape solo parcial, de modo que establece un conjunto de patrones de comportamiento para la mayor parte de las mujeres, y valores de exactitud que oscilan entre 0,98 y 0,99.

Para los segundos la regla afecta a 7 alumnos, menos de un tercio de los mismos. Por tanto, se trata de un pequeño grupo de comportamiento bien definido (exactitud de 0.96) dentro de un subconjunto heterogéneo.

 

4. Discusión

El análisis de la relación entre calendario semanal y sexo ha señalado algunos aspectos interesantes. A pesar de que en líneas generales podemos hablar de un alto grado de semejanza entre ambos patrones, especialmente en los momentos de mayor intensidad, la situación ofrece matices cuando se centra la atención en las situaciones marginales. Algo que además ha sido bastante consistente en el tiempo.

En este sentido es interesante señalar que en las asignaturas de grado de pedagogía, grupo A, se observa un cambio de patrón en el último año: durante la semana las mujeres trabajan más en el campus virtual, mientras que los hombres lo hacen claramente más durante el fin de semana, siempre en términos relativos. Las razones de la ruptura del patrón de semejanza detectado no están claras: el profesorado es el mismo, así como la asignatura y su estructura temporal. Lamentablemente, los estudios longitudinales basados en cohortes no son posibles aquí, por lo que la influencia del contexto estudiantil es tan condicionante como indeterminada.

Los resultados exhibidos por las asignaturas del grupo B corresponden a un posgrado para alumnado Geografía e Historia, se trata por tanto de alumnado de una edad mayor y en un contexto de dedicación, en principio, a un número reducido de asignaturas si se compara con un curso académico de grado. Entendemos que este aspecto puede explicar la mayor homogeneidad de sus patrones. Ya que máximos absolutos y relativos nunca rebasan el 25%, cuando en el caso anterior casi llegan a suponer el 80% en algunos cursos.

Realizan un trabajo semanal menos concentrado, no exento pese a todo de tendencias generales, pero cuya matización por sexos debe realizarse con prudencia: en la mitad de los casos hay una preeminencia femenina en el trabajo de fin de semana, en otro es al contrario y la última expresa preeminencia femenina sólo en uno de los dos días, el sábado. Y durante la semana tampoco se constatan diferencias significativas, salvo para el lunes, que en tres de los cuatro cursos es momento de mayor interacción masculina.

Las asignaturas del grupo C pertenecen a un grado de magisterio, y en contra de lo que habría podido suponerse, expresan un patrón de comportamiento más semejante a B que A. Algo que es destacable ya que A y B comparten una naturaleza curricular claramente vinculada a la Educación, mientras que B es una concreción explícitamente diseñada para estudiantes de las facultades de Filosofía y Letras, por tanto, sin un bagaje didáctico previo reglado. Con todo, alguna situación excepcional clara, como la que observable los martes del primer curso, no han podido ser explicadas a partir de la estructura del campus ni del conocimiento docente sobre la realidad del momento.

Aunque se esperaba que el análisis del comportamiento comparado por sexos y hora del día fuese más claro, lo cierto es que nuevamente la concomitancia ha sido la característica: la concentración horaria ha sido nuevamente más relevante en las asignaturas del grupo A y claramente inferior en las del B y C, a 10 puntos porcentuales o más de diferencia en sus máximos absolutos.

Sólo al abordar los comportamientos marginales, en ocasiones incluso principales, se observan diferencias entre los sexos: los máximos absolutos, momentos de gran intensidad de trabajo, suelen estar copados por los varones, mientras que, en términos generales, las mujeres presentan valores medios más elevados en horquillas temporales próximas a dichos máximos, expresando así una interacción más prolongada en el tiempo.

En conjunto, y para la muestra estudiada, el análisis revela la existencia tanto de patrones temporales diarios propios de cada asignatura como de patrones de sexo ligados a cursos específicos, pero no de forma estructural: hay cursos en los que la semejanza en el comportamiento por sexo explica mucho más que las diferencias; pero hay otros en los que las diferencias son claras, y en dichos casos se caracterizan habitualmente por la tendencia a la concentración de las interacciones de los hombres y la mayor distribución temporal de las interacciones por parte de las mujeres.

La IP se ha mostrado como una variable de gran interés para el análisis geográfico y la comparación por sexos. Se han constatado algunas diferencias claras tanto respecto a la dispersión como concentración espacial, que indican una mayor movilidad de las mujeres fuera de las localizaciones originales, si bien con una mayor tendencia a la concentración en los destinos. Por su parte, los hombres del presente estudio presentan una menor movilidad hacia el exterior, pero lo hacen sobre un mayor número de destinos; en ambos casos de forma proporcional.

 

5. Conclusiones

El estudio del comportamiento discente en los campus virtuales es un ámbito de estudio todavía en ciernes en el ámbito de la Educación Superior, especialmente en la Didáctica de la Geografía y las Ciencias Sociales. Sin embargo, a pesar de la complejidad que introduce, los elementos de conocimiento y reflexión que pone sobre la mesa lo hacen tanto útil como pertinente y necesario. No se puede ignorar el tiempo dedicado por los discentes ante terminales de todo tipo como parte de su proceso de aprendizaje, especialmente en consonancia con el modelo de créditos europeo ECTS.

La metodología utilizada necesita ser ampliada, especialmente en lo relativo a la minería de datos. Aproximación que ha demostrado ser interesante en un aspecto especialmente complejo de percibir: el de los comportamientos marginales homogéneos; es decir, el de las tendencias de pequeño grupo, difíciles de detectar por su propia naturaleza.

Se ha puesto de manifiesto que la robustez de este tipo de análisis se basa en la disponibilidad de volúmenes significativos de datos. Por ello, la correcta grabación y unificación de datos es un elemento clave que puede llegar a cuestionar la inclusión de los mismos, como ha ocurrido en una de las asignaturas del grupo C.

El análisis locacional a partir de la IP es, bajo nuestro criterio, una oportunidad para aprovechar información geográfica de gran interés, tanto desde una perspectiva básica como aplicada. Abre las puertas a, y requiere, futuras investigaciones que aprovechen su potencial desde perspectivas tan heterogéneas como la geografía humanista (Tuan, op. cit.) o la cuantitativa (Hägerstrand, 1985).

También ha sido determinante el sesgo de la variable principal, sexo, en un contexto, el educativo, donde la feminización es muy acusada. Esto facilita la exploración de una parte de la población, pero cuestiona la solidez analítica de la otra. Por ello, los errores de predicción en la matriz de confusión son tan desproporcionados entre hombres y mujeres.

En todo caso, la introducción de este análisis se presenta de forma natural y recupera un conjunto de datos no demasiado utilizado en el contexto geográfico o el educativo. Más allá de las semejanzas y discrepancias encontradas desde esta perspectiva comparada, a la que es necesario añadir ulteriores análisis antes de obtener argumentos explicativos sólidos, parece evidente que sí ofrece una riqueza suficiente como para ser investigada de forma sistemática, al menos, desde la didáctica de la geografía.

En conclusión, entendemos necesario seguir profundizando en este tipo de investigaciones, e ir sumando aportaciones de casos que permitan en un futuro el desarrollo de estudios más robustos sobre la consistencia de patrones por perfiles generales y singulares. O que complementen resultados de este tipo con análisis explicativos sobre las razones que, por ejemplo, llevan a hombres y mujeres a tener comportamientos divergentes, qué dificultades de aprendizaje en la especialidad pueden detectarse a partir de ahí y qué relación guarda todo ello con el rendimiento académico sobre el currículo.

 

Referencias.

Abbott, M. L. (2011). Understanding educational statistics using microsoft excel and SPSS (1st ed.). John Wiley & Sons Inc. URL: https://bit.ly/31FpWbQ

Ahmadi, F., & Ahmad, S. (2013). Data mining in teacher evaluation system using WEKA. International Journal of Computer Applications, 63(10), 14-18. https://doi.org/10.5120/10501-5268

Álvarez Vázquez, M. P., Álvarez-Méndez, A., Bravo-Llatas, C., Barrios, J. & Angulo Carrere, T. (2020). Tipologías de estudiantes de fisioterapia según el uso que hacen del campus virtual. RIDU 12, 74-81. https://doi.org/10.1344/RIDU2020.12.8

Álvarez Vázquez, M. P. (2019). Estudiantes y Campus Virtual. Utilidad del Learning Analytics para identificar luces y sombras y caminar hacia metodologías adaptativas. Proyecto de Innovación y Mejora de la Calidad Docente, convocatoria 2019/20. Universidad Complutense, Madrid. https://bit.ly/2NMEBK7

Arias, F., & Defiore, C. (2019). Avances y actualizaciones en torno al Campus Virtual de la Facultad de Ciencias Sociales de la UBA. XXI Congreso de la Red de Carreras de Comunicación Social y Periodismo. https://bit.ly/3ina0kg

Badilla Quintana, M. G., Vera Sagredo, A., & Lytras, M. D. (2017). Pre-service teachers’ skills and perceptions about the use of virtual learning environments to improve teaching and learning. Behaviour & Information Technology, 36(6), 575-588. https://doi.org/10.1080/0144929X.2016.1266388

Ballesteros Regaña, C., Cabero Almenara, J., Llorente Cejudo, M., & Morales Lozano, J. A.. (2010). Usos del e-learning en las universidades andaluzas: estado de la situación y análisis de buenas prácticas. Pixel-Bit. Revista de Medios y Educación, 37, 7-18.

Caballé, S., & Xhafa, F. (2013). Distributed-based massive processing of activity logs for efficient user modeling in a Virtual Campus. Cluster computing, 16(4), 829-844. https://doi.org/10.1007/s10586-013-0256-9

Cabanillas, J. L., Luengo, R., & Carvalho, J. L. (2019). Análisis de los objetos de aprendizaje y de la percepción docente del campus virtual de la Universidad de Extremadura. International Journal of Information Systems and Software Engineering for Big Companies (IJISEBC), 6(2), 41-61.

Cantabella, M., Martínez-España, R., Ayuso, B., Yáñez, J. A. & Muñoz, A. (2019). Analysis of student behavior in learning management systems through a Big Data framework. Future Generation Computer Systems, 90, 262-272. https://doi.org/10.1016/j.future.2018.08.003

Capel, H. (2009). La enseñanza digital, los campus virtuales y la Geografía. Ar@cne, 125.  https://bit.ly/2NO9EIn.

Castro, M., Menacho, A., & Perez-Molina, C. (2018, April). Mining LMS students' data on online task-based master degree studies. 2018 IEEE Global Engineering Education Conference (EDUCON) (pp. 661-668). IEEE. https://doi.org/10.1109/EDUCON.2018.8363294.

Cerezo, R., Esteban, M., Sánchez-Santillán, M., & Núñez, J. C. (2017). Procrastinating behavior in computer-based learning environments to predict performance: A case study in moodle. Frontiers in Psychology, 8. https://doi.org/10.3389/fpsyg.2017.01403.

Charanya, R. & Kesavan, M. (2019). Analysis of Factors Influencing the Virtual Learning Environment in a Sri Lankan Higher Studies Institution. 2019 International Research Conference on Smart Computing and Systems Engineering (SCSE), 240-244. Colombo: Sri Lanka. https://doi.org/10.23919/SCSE.2019.8842719

Cohen, R., Rahimi, I. D., & Zilka, G. C. (2019). Self-efficacy, challenge, threat and motivation in virtual and blended courses on multicultural campuses. Issues in Informing Science and Information Technology, 16, 71-95. https://doi.org/10.28945/4295

Correa, J. M., & Paredes, J. (2009). Cambio tecnológico, usos de plataformas de e-learning y transformación de la enseñanza en las universidades españolas: la perspectiva de los profesores. Revista de Psicodidáctica, 14(2), 261-277.

De la Iglesia-Villasol, M.C. (2019). Huellas de los estudiantes en las plataformas virtuales. Aplicación para evaluar una metodología de aprendizaje activo. Revista Electrónica Interuniversitaria de Formación del Profesorado, 22(3), 173-191. http://dx.doi.org/10.6018/reifop.22.3.371341

Demsar J, Curk T, Erjavec A, Gorup C, Hocevar T, Milutinovic M, Mozina M, Polajnar M, Toplak M, Staric A, Stajdohar M, Umek L, Zagar L, Zbontar J, Zitnik M, & Zupan B (2013) Orange: Data Mining Toolbox in Python. Journal of Machine Learning Research, 14(Aug), 2349−2353.

Demšar, J., Zupan, B., Leban, G., & Curk, T. (2004, September). Orange: From experimental machine learning to interactive data mining. In European Conference on Principles of Data Mining and Knowledge Discovery (pp. 537-539). Springer.

Desai, R., Chavan, A. & Tendulkar, H. (2020). Virtual Campus. Studies in Indian Place Names, 40(53), 268-270.

Dobesova, Z. (2011). Visual programming language in geographic information systems. Proceedings of the 2nd international conference on Applied informatics and computing theory, pp. 276-280. World Scientific and Engineering Academy and Society (WSEAS). URL: https://bit.ly/2MoDWxY.

Fakir, M., & Touya, K. (2014). Mining students' learning behavior in moodle system. Journal of Information Technology Research (JITR), 7(4), 12-26. https://doi.org/10.1109/ICCCT2.2014.7066695

García, S., Ramírez-Gallego, S., Luengo, J., Benítez, J. M., & Herrera, F. (2016). Big data preprocessing: methods and prospects. Big Data Analytics, 1(1), 9. https://doi.org/10.1186/s41044-016-0014-0

Gašević, D., Dawson, S., & Siemens, G. (2015). Let’s not forget: Learning analytics are about learning. TechTrends, 59(1), 64-71. https://doi.org/10.1007/s11528-014-0822-x.

Gómez Collado, M. E., Contreras Orozco, L., & Gutiérrez Linares, D. (2016). El impacto de las tecnologías de la información y la comunicación en estudiantes de ciencias sociales: un estudio comparativo de dos universidades públicas. Innovación educativa, 16(71), 61-80.

Hägerstrand, Torsten (1985). Time geography: focus on the corporeality of man, society and environment. Aida, Shūhei, ed. The science and praxis of complexity: contributions to the symposium held at Montpellier, France, 9–11 May, 1984. United Nations University Press. pp. 193-216.

Hamutoglu, N., Gemikonakli, O., Duman, I., Kirsekiz, A. & Kiyici, M. (2020). Evaluating students experiences using a virtual learning environment: satisfaction and preferences. Educational Technology Research and Development, 68, 437–462. https://doi.org/10.1007/s11423-019-09705-z

Kaur, P., Singh, M. & Josan, G. (2015). Classification and Prediction Based Data Mining Algorithms to Predict Slow Learners in Education Sector. Procedia Computer Science, 57, 500-508. https://doi.org/10.1016/j.procs.2015.07.372.

Koedinger, K. R., D'Mello, S., McLaughlin, E. A., Pardos, Z. A., & Rosé, C. P. (2015). Data mining and education. Wiley Interdisciplinary Reviews: Cognitive Science, 6(4), 333-353. https://doi.org/10.1002/wcs.1350

Licklider, J. C. R. (1960). Man-computer symbiosis. IRE Transactions on Human Factors in Electronics, HFE-1, 4-11. https://goo.gl/1AjMzS

Lu, J., & Law, N. W. Y. (2012). Understanding collaborative learning behavior from moodle log data. Interactive Learning Environments, 20(5), 451-466. https://doi.org/10.1080/10494820.2010.529817

Manne, S., Yelisetti, S., Kakarla, M., & Fatima, S. (2014). Mining VRSEC student learning behaviour in moodle system using datamining techniques. International Conference on Computing and Communication Technologies. India, Hyderabad, pp. 1-7. https://doi.org/10.1109/ICCCT2.2014.7066695

Martínez Romera, D. D. (2017). Profesorado en Formación y Ambientes Educativos Virtuales. Campus Virtuales, 6(2), 69-78.

Minguillón, J., Santanach, F., & Appel, M. C. (2016). Using learning analytics to support applied research and innovation in higher education. EUA 2016 Annual Conference, Galway, April 7th. URI: http://hdl.handle.net/10609/47501

Morales Salas, R. E., Infante-Moro, J. C., & Gallardo-Pérez, J. (2019). La mediación e interacción en un AVA para la gestión eficaz en el aprendizaje virtual. Campus Virtuales, 8(1), 49-61.

Orostica Verdugo, K. V. (2020). Entornos Virtuales de Aprendizaje: Campus UVM ONLINE. UTE  1, 6-21. https://doi.org/10.17345/ute.2019.1

Pakanen, M., Alavesa, P., Arhippainen, L., & Ojala, T. (2020). Stepping out of the classroom: Anticipated user experiences of web-based mirror world like virtual campus. International Journal of Virtual and Personal Learning Environments (IJVPLE), 10(1), 1-23. https://doi.org/10.4018/IJVPLE.2020010101

Papoušek, J., Pelánek, R., & Stanislav, V. (2016). Adaptive geography practice data set. Journal of Learning Analytics, 3(2), 317-321. https://doi.org/10.18608/jla.2016.32.17

Parise, P. (2016). A preliminary look at online learner behavior: What can the moodle logs tell us? Bulletin of Kanagawa Prefectural Institute of Language and Culture Studies (6), 15-31.

Quintas Mendes, A., Bastos, G., Amante, L., Lebres, L., & Cardoso, T. (2019). Virtual pedagogical model: development scenarios. Universidade Aberta.

RamírezGallego, S., García, S., MouriñoTalín, H., MartínezRego, D., BolónCanedo, V., AlonsoBetanzos, A., & Herrera, F. (2016). Data discretization: taxonomy and big data challenge. Wiley Interdisciplinary Reviews: Data Mining and Knowledge Discovery, 6(1), 5-21. https://doi.org/10.1002/widm.1173

Ruipérez-Valiente, J. A., Halawa, S., Slama, R. & Reich, J. (2020). Using multi-platform learning analytics to compare regional and global MOOC learning in the Arab world. Computer & Education, 146,. https://doi.org/10.1016/j.compedu.2019.103776

Sarduy Domínguez, Y., Vialart Vidal, N., Vidal Leo, M. & Paredes Esponda, E. (2020). Estrategias para el desarrollo de repositorios de recursos educativos abiertos del campus virtual de salud pública. XVIII Convención y Feria Internacional de Informática en Salud. Habana: Cuba.

Sclater, N., Peasgood, A., & Mullan, J. (2016). Learning analytics in higher education. Jisc.  https://bit.ly/2tnQyig 

Sebastian, S., & Puthiyidam, J. J. (2015). Evaluating students’ performance by artificial neural network using WEKA. International Journal of Computer Applications, 119(23), 36-39. https://doi.org/10.5120/21380-4370

Siddiqa, A., Hashem, I. A. T., Yaqoob, I., Marjani, M., Shamshirband, S., Gani, A., & Nasaruddin, F. (2016). A survey of big data management: Taxonomy and state-of-the-art. Journal of Network and Computer Applications, 71, 151-166. https://doi.org/10.1016/j.jnca.2016.04.008

Siemens, G. & Long, P. (2011). Penetrating the Fog: Analytics in Learning and Education. EDUCAUSE Review, 46(5).

Sin, K., & Muthu, L. (2015). Application of big data in education data mining and learning analytics - A literature review. ICTACT Journal on Soft Computing, 5(4), 1035-1049. https://doi.org/10.21917/ijsc.2015.0145

Sola-Martínez, T., Cáceres-Reche, M. P., Romero-Rodríguez, J. M., & Navas-Parejo, M. R. (2020). Estudio Bibliométrico de los documentos indexados en Scopus sobre la Formación del Profesorado en TIC que se relacionan con la Calidad Educativa. Revista Electrónica Interuniversitaria de Formación del Profesorado, 23(2). https://doi.org/10.6018/reifop.418611

Taleb, I., Dssouli, R., & Serhani, M. A. (2015). Big data pre-processing: A quality framework. In 2015 IEEE International Congress on Big Data (pp. 191-198). IEEE. https://doi.org/10.1109/BigDataCongress.2015.35

Tape, T. G. (s.f.). Interpreting diagnostic tests. University of Nebraska Medical Center. URL: https://bit.ly/2NESlcs.

Tartia, J. (2020). The Temporality and Rhythmicity of Lived Street Space. Tampere University.

Tsai, C. W., Lai, C. F., Chao, H. C., & Vasilakos, A. V. (2015). Big data analytics: a survey. Journal of Big data, 2(1), 21. https://doi.org/10.1186/s40537-015-0030-3

Tuan, Y. F. (1990). Topophilia: A study of environmental perceptions, attitudes, and values. Columbia University Press.

Tuan, Y. F. (1977). Space and place: The perspective of experience. University of Minnesota Press.

Thulin, E., Vilhelmson, B. & Schwanen, T. (2020). Absent Friends? Smartphones, Mediated Presence, and the Recoupling of Online Social Contact in Everyday Life. Annals of the American Association of Geographers, 110(1), 166-183. https://doi.org/10.1080/24694452.2019.1629868

Vega Valverde, M. (2017). Aplicaciones didácticas de la Cronogeografía. A propósito de nuestra relación espacio - tiempo. Repositorio Abierto de la Universidad de Cantabria. http://hdl.handle.net/10902/