Escritura, creatividad e inteligencia artificial. ChatGPT en el contexto universitario


RESUMEN

La investigación persigue estudiar las posibilidades creativas de los sistemas de Inteligencia Artificial (IA) para el desarrollo de la escritura en el contexto educativo. Se persigue aportar evidencias en el uso de la IA y contribuir al conocimiento de su integración en las aulas como apoyo al proceso de enseñanza-aprendizaje. Se establecen dos tipos de diseño: una investigación de corte cuantitativo no experimental de tipo descriptivo y comparativo, y un estudio cuasi-experimental de tipo pretest-postest. La muestra estuvo compuesta por 20 sistemas de IA y 193 estudiantes universitarios, a los cuales se les aplicaron los juegos 2 y 3 del test español PIC-A («Prueba de Imaginación Creativa para Adultos»). El alumnado repitió los juegos con ayuda de ChatGPT, con el fin de comparar la posible mejora de sus producciones. Los resultados destacan la existencia de diferencias estadísticamente significativas entre las IA y el alumnado en los indicadores de fluidez, flexibilidad y originalidad narrativa del juego 2. Además, se encuentran diferencias significativas entre las puntuaciones del pretest y postest del alumnado en fluidez, flexibilidad y originalidad narrativa del juego 2, así como en fluidez del juego 3. Finalmente, se pone de manifiesto la ayuda que la IA proporciona en tareas de escritura y creatividad verbal, lo que debería ser tenido en cuenta en la enseñanza de lenguas; en cualquier caso, la IA no puede reemplazar a la inteligencia y la creatividad humana.

Palabras clave

Inteligencia artificial, escritura, enseñanza de lenguas, creatividad verbal, ChatGPT, modelos de lenguaje extensivos

Keywords

Artificial intelligence, writing, language teaching, verbal creativity, ChatGPT, Large Language Models

ABSTRACT

The main objective of the research is to study the creative potential of Artificial Intelligence (AI) for writing skills in an educational context. The research aims to provide evidence on the use of AI and contribute to its integration in the classroom as a support for the teaching-learning process. Two types of research designs were established: a descriptive and comparative non-experimental quantitative research, and a quasi-experimental pretest-posttest study. The sample consisted of 20 AI systems and 193 university students who were given Games 2 and 3 of the Spanish PIC-A test (“Creative Imagination Test for Adults”). The students repeated the games, assisted by ChatGPT, to compare the possible improvement of their productions. The findings reveal statistically significant differences between the AIs and the students in the indicators of fluency, flexibility, and narrative originality in Game 2. Furthermore, significant differences are found between students’ pre-test and post-test scores in fluency, flexibility, and narrative originality in Game 2 and in fluency in Game 3. Finally, the assistance provided by AI in writing tasks and verbal creativity is highlighted, and this should be considered in language teaching; in any case, AI cannot replace human intelligence and creativity.

Palabras clave

Inteligencia artificial, escritura, enseñanza de lenguas, creatividad verbal, ChatGPT, modelos de lenguaje extensivos

Keywords

Artificial intelligence, writing, language teaching, verbal creativity, ChatGPT, Large Language Models

Introducción

El veloz desarrollo de la Inteligencia Artificial (IA) es una realidad que conlleva múltiples oportunidades, riesgos y desafíos en el ámbito educativo, que hasta el presente han ido superando las políticas y marcos legislativos. En este sentido, la UNESCO (2019) se comprometió a aprovechar el potencial de las tecnologías de la IA, con el fin de avanzar hacia el Objetivo de Desarrollo Sostenible 4 (garantizar una educación inclusiva, equitativa y de calidad y promover oportunidades de aprendizaje durante toda la vida para todos) y lograr la Agenda Educación 2030. En origen, la IA surgió con el propósito de simular y mecanizar los procesos de pensamiento humano (Turing, 1950). Hoy en día, se ha convertido en la gramática básica de nuestro siglo, se persigue el desarrollo de la alfabetización y las competencias en IA por parte de la ciudadanía (UNESCO, 2021). Por otra parte, la UNESCO pretende alcanzar un enfoque centrado en el ser humano, basado en principios de inclusión y equidad, con la finalidad de no ampliar las brechas tecnológicas y garantizar una «AI for all» en términos de innovación y conocimiento. En este sentido, uno de los desafíos más importantes es garantizar que la IA sea diseñada y utilizada de manera ética y responsable, con el fin de evitar un uso malicioso de la tecnología o el aumento de las desigualdades existentes en la sociedad (UNESCO, 2022a).

Recientemente, la OCDE (2021) se plantea cómo las tecnologías inteligentes cambian la educación en el aula y la gestión de las organizaciones y sistemas educativos. En la actualidad, son ya diversos los modos en los que la IA puede involucrarse en la enseñanza, desde la recomendación de contenido REA (Recursos Educativos Abiertos), la detección de las emociones de los estudiantes, los sistemas de tutoría inteligente, los asistentes de enseñanza impulsados por IA, hasta la calificación automática de exámenes y monitoreo automático de foros (Flores-Vivar & García-Peñalvo, 2023).

Existen diversos sistemas de IA que se emplean para generar texto automáticamente («Large Language Model» o LLM). Su origen se remonta a 2017, momento en el que se presenta la arquitectura de los Transformer Models (Vaswani et al., 2017), redes neuronales que pueden aprender mediante mecanismos de atención. Los experimentos realizados a partir de dos tareas de traducción automática demostraron que estos modelos son altamente eficientes en cuanto a calidad de resultados y menor entrenamiento. Este modelo puede aprender contexto por medio de datos secuenciales, lo que es considerado por expertos como el inicio de los LLM. Posteriormente, en 2018, Google lanzó un proyecto de investigación basado en el Natural Language Processing (NLP), cuya tecnología buscaba la interacción entre el dialecto del ser humano y el de los ordenadores, uniendo las disciplinas de Lingüística Aplicada, Informática e IA. Google presentó BERT («Bidirectional Encoder Representations from Transformers»), sistema NLP de última generación que ayudaría al trabajo de búsquedas a través de su conocido motor. Por tanto, los LLM son un algoritmo de aprendizaje profundo que pueden reconocer, resumir, traducir, predecir y generar texto u otro contenido basado en el conocimiento adquirido de conjuntos de datos masivos. Este aprendizaje es no supervisado, pues aporta un determinado número de datos a una IA sin instrucciones explícitas sobre qué hacer con ellos. Entre las diversas aplicaciones de este gran modelo de lenguaje (Lee, 2023), se encuentran ChatGPT y otros sistemas, que han sido entrenados para responder preguntas o seguir específicas instrucciones de escritura.

Estos sistemas de IA son capaces de escribir en un tono determinado (humorístico, familiar, profesional, ingenioso, amistoso), reescribir o parafrasear secciones de texto dado, escribir a partir de un título o redactar en el estilo de Shakespeare. Suponen un importante desafío para la enseñanza de lenguas y, en concreto, para el trabajo de la expresión escrita y el desarrollo de la escritura creativa. La creatividad es una capacidad de la mente humana (Csikszentmihaly, 1998; Guilford, 1950; Sternberg, 1999), pero los ordenadores y la creatividad pueden ser interesantes compañeros, según ya indicaba Boden (2004), en dos sentidos: para la comprensión de la creatividad humana y para producir creatividad computacional. Esta autora explica la creatividad desde un enfoque científico que emplea conceptos computacionales procedentes del campo de la IA, conceptos que permiten construir y probar hipótesis sobre las estructuras y procesos que pueden estar involucrados en el pensamiento humano.

Con respecto a la creatividad computacional, se ha de destacar que el ser humano juega un papel fundamental en la programación, la elección de modelos y el ajuste de los sistemas de IA. Sin embargo, si se contemplan los tres tipos de creatividad (combinatoria, exploratoria y transformacional) que Boden (2004) describe, los ordenadores pueden generar ideas que, al menos, parezcan creativas. Además, afirma que los ordenadores pueden producir nuevas ideas y ayudar a las personas a hacerlo; tanto sus fracasos como sus éxitos permiten pensar más claramente sobre el poder creativo del ser humano. Por su parte, Miller (2019) también se cuestiona si la IA puede ser creativa, a partir de la revisión de diversas aplicaciones en los ámbitos de las artes visuales, la música, el texto y el teatro musical. Dicho autor identifica los factores esenciales para el proceso creativo, desde la necesidad de introspección hasta la capacidad de descubrir el problema clave, y finaliza exponiendo que las computadoras podrán ser tan creativas como los humanos. Por otra parte, Ward (2020) sugiere que la creatividad computacional no es (y no necesita ser) equivalente a la creatividad humana, sino que podría ser distinta y contribuir, incluso, a nuevos procesos y resultados que sería posible considerar creativos; las máquinas no tienen que parecerse más a los humanos, sino que los humanos podrían reconocer las capacidades creativas inherentes a lo mecánico. Por tanto, esta es la dirección que interesaría tomar en la nueva era de la IA para el desarrollo de los procesos de enseñanza y aprendizaje.

En este sentido, la enseñanza de lenguas no ha de dar la espalda a los sistemas de IA, teniendo en cuenta la creciente expansión de entornos digitales para la escritura y la significativa presencia de dichos entornos en contexto educativo. Escritura, IA y creatividad se convierten en objetivos fundamentales de los nuevos modelos de enseñanza de lenguas. Además, la creatividad no puede desligarse de la cultura y del uso o aprendizaje de una lengua (Argondizzo, 2012). En esta línea, el pensamiento creativo ha cobrado una importante dimensión educativa al haberse incluido como nueva competencia evaluable en PISA (OCDE, 2019); dicho programa evalúa el área de la expresión creativa (donde se ubica el dominio de la expresión tanto escrita como visual), además del área de creación de conocimiento y solución creativa de problemas. Más allá de encontrar la creatividad en prácticas artísticas e inventivas, esta es una herramienta eficaz para la resolución de problemas en todo tipo de situaciones que suponen un reto (Rodrigo-Martín et al., 2022), motivo por el que resulta aconsejable su desarrollo en el ámbito educativo. Por otra parte, se destaca que el pensamiento creativo es identificado como una de las competencias previas cuya adquisición debe ser promovida por los Estados Miembros para la educación en materia de IA, según la UNESCO (2022a).

Teniendo en cuenta lo dicho anteriormente, los chatbots y la interacción comunicativa que permiten los sistemas de IA suponen un reto para la práctica docente del profesorado de lenguas. Diversos estudios han demostrado que la integración de la IA mejora la calidad y la eficacia de la enseñanza de lenguas extranjeras, pues favorece un estilo de aprendizaje individualizado y cooperativo (Sun et al., 2021; Yanhua, 2020). En este sentido, dada la variedad de herramientas, programas y recursos al alcance del alumnado, urge el estudio de sus posibilidades, limitaciones y modos de uso, en beneficio tanto de la adecuada adquisición de las competencias necesarias, como de un empleo ético. Además, en el ámbito educativo, los sistemas de IA han de estar sujetos a requisitos estrictos de supervisión, evaluación de las capacidades o predicción de los comportamientos del alumnado. La IA debe velar por el proceso de aprendizaje sin reducir las capacidades cognitivas. Por otra parte, la información recogida por el estudiante en sus interacciones con los sistemas de IA no será objeto de uso ilícito, apropiación indebida o explotación delictiva (UNESCO, 2022a).

Son diversas las iniciativas que han ido dando respuesta a su posible uso educativo. Por ejemplo, la UNESCO (s.f.) está desarrollando el portal «Teaching AI for K-12» (estudiantes entre 5 y 18 años de edad), en el que se incluyen recursos para ser utilizados por el profesorado. Además, con el fin de que las herramientas de apoyo a la escritura en el ámbito de la IA utilicen un español correcto, la Real Academia Española (RAE, s.f.) ha liderado el proyecto «Lengua Española e Inteligencia Artificial» (LEIA). También se ha desarrollado el proyecto MarIA (Gutiérrez-Fandiño et al., 2022), una familia de modelos de lenguaje grandes en español, puestos a disposición de la industria y la investigación, que utiliza los modelos RoBERTa-base, RoBERTa-large, GPT2 y GPT2-large para su construcción. MarIA ha sido creada para resolver el conflicto existente con idiomas en GPT, ya que la mayoría de los desarrolladores de LLM han sido construidos en inglés.

Además, la IA ya está siendo utilizada como compañera de trabajo en ciertas empresas, según explica Montero (2023), quien señalaba recientemente que se había incluido el chat de OpenAI en un proyecto de diseño en el que se encuentra trabajando. En el ámbito educativo, se está empezando a experimentar también con la IA, como es el caso de Hendrickson, profesora de Medios Digitales de la Universidad de Leeds, quien hace que sus estudiantes usen tanto ChatGPT como otros modelos lingüísticos de IA en sus tareas de redacción para mejorar su escritura académica, al mismo tiempo que comprueban cómo funciona esta tecnología, lo que posibilita que los estudiantes reflexionen y cuestionen de forma crítica este recurso generador de texto (Renbarger, 2023). De modo similar, la presente investigación persigue acercarse al empleo de la IA en las aulas, también como compañera de trabajo y apoyo, con el fin de integrar su uso y comprobar qué tipo de ayuda puede proporcionar. Ante una falta de evidencias sólidas y contrastadas sobre la eficacia y el impacto de la IA en el logro académico del alumnado, resulta necesario investigar en esta línea. Se ha de trabajar en un futuro que aún está por definir, pues la IA es una tecnología muy poderosa y el desafío consiste en «descubrir formas de usarla con sentido y conciencia» (Selwyn et al., 2022: 143).

Por ello, el objetivo general de la presente investigación se dirige a estudiar las posibilidades creativas de los sistemas de IA para el desarrollo de la escritura en el contexto educativo. Este objetivo general se articula en los siguientes objetivos específicos:

  • Conocer el nivel de los indicadores de la creatividad (fluidez, flexibilidad y originalidad narrativa) de los sistemas de IA y del alumnado, en función de la muestra de la Prueba de Imaginación Creativa para Adultos (PIC-A) de Artola et al. (2012).

  • Comparar la creatividad de los sistemas de IA con la del alumnado, a partir de los indicadores de fluidez, flexibilidad y originalidad narrativa.

  • Comparar las puntuaciones de los indicadores de la creatividad obtenidos por el alumnado en las dos fases de aplicación de las pruebas, la primera sin ningún tipo de ayuda y la segunda a partir del uso de un sistema IA (ChatGPT).

Metodología

Diseño

Con el fin de responder a los objetivos formulados, se establecen dos tipos de diseño. En primer lugar, se llevó a cabo una investigación de corte cuantitativo no experimental o ex post-facto de tipo descriptivo y comparativo, en la cual se analizó el nivel de creatividad alcanzado tanto por los sistemas de IA como por el alumnado, y se estudió el grado de relación entre la creatividad de las IA y los estudiantes.

En segundo lugar, se realizó un estudio cuasi-experimental de tipo pretest-postest, donde se evaluaron y compararon los indicadores de creatividad obtenidos por el alumnado, tanto de manera previa como posteriormente a una intervención de aprendizaje con ayuda de ChatGPT.

Muestra y participantes

La muestra estuvo compuesta por 20 sistemas de Modelo de Lenguaje Grande (IA) con tecnología OpenAI/GPT-3 (excepto Dupla.ai, una extensión de Chrome), que tienen la función de generar texto automáticamente a partir de una instrucción dada (Tabla 1). En la selección de los sistemas de IA se tuvieron en cuenta los siguientes criterios de inclusión: acceso abierto (gratuidad de los sistemas o «Freemium») y ejecución en línea sin descarga previa. Dichos criterios se explican por el uso que se pretende de la IA en el contexto educativo.

De igual modo, participaron 193 estudiantes (153 mujeres y 40 hombres) de entre 18 y 50 años de edad, matriculados en el Grado en Educación Primaria y el Máster Universitario en Investigación e Innovación en Educación Infantil y Educación Primaria de la Universidad de Murcia, el Grado en Bellas Artes de la Universidad de Salamanca y el doble Grado en Comunicación Audiovisual y Periodismo de la Universidad Miguel Hernández de Elche. Se ha seguido un procedimiento de muestreo intencional no probabilístico, por conveniencia.

https://typeset-prod-media-server.s3.amazonaws.com/article_uploads/bf77dc73-d754-49eb-97c0-886bde36b134/image/af901c68-6251-4bc4-87f7-e01708104f0a-u04-01.png

Instrumentos

El instrumento empleado fue la Prueba de Imaginación Creativa para Adultos (PIC-A) de Artola et al. (2012). De los cuatro juegos que componen la prueba, se han utilizado el segundo y el tercero, pues son los que se centran exclusivamente en el texto verbal. Las instrucciones de los juegos son las siguientes:

  • Juego n.º 2. Haz una lista de todas las cosas para las que podría servir un tubo de goma. Piensa en cosas interesantes y originales. Apunta todos los usos que tú le darías, aunque sean imaginados. Puedes utilizar el número y tamaño de tubos que tú quieras. Ejemplo: «Como tubería para el agua».

  • Juego n.º 3. Imagina y contesta lo que tú crees que pasaría si fuera cierto lo que dice esta frase: ¿Qué ocurriría si las personas nunca dejasen de crecer? Ejemplo: «Que la ropa elástica se vendería mucho más».

Los indicadores de la creatividad, evaluados tanto en el segundo como en el tercer juego, son los siguientes:

  • Fluidez: aptitud para producir gran número de ideas. Una puntuación elevada en fluidez responde a ser capaz de realizar gran cantidad de asociaciones ante un estímulo.

  • Flexibilidad: aptitud para producir respuestas muy variadas, relacionadas con campos diversos. Una puntuación elevada en flexibilidad se relaciona con la habilidad para buscar soluciones mediante distintas alternativas y la capacidad para cambiar de perspectiva.

  • Originalidad narrativa: aptitud para producir ideas alejadas de lo evidente o establecido. Una respuesta se considera original cuando su frecuencia de aparición es muy baja.

Por último, la fiabilidad fue calculada mediante el Alfa de Cronbach, que determinó que tanto el juego 2 (α=.803) como el juego 3 (α=.853) mostraban una consistencia interna alta.

Procedimiento

En primer lugar, se solicitó a cada uno de los sistemas de IA la realización de los dos juegos de la PIC-A. Se escribió en los chats y las cajas de texto de los sistemas la instrucción de cada prueba y se recogió la respuesta proporcionada. Dada la rapidez con la que los sistemas generan texto, en lugar de usar el tiempo establecido por el instrumento, se solicitó la información en tres ocasiones continuadas, enviando la misma instrucción en cada una de ellas. Posteriormente, se corrigió el texto automático generado, en función de los indicadores de fluidez, flexibilidad y originalidad narrativa, según el cuaderno de corrección establecido en el instrumento (Artola et al., 2012). Debe destacarse que, teniendo en cuenta que la IA aprende sobre interacciones previas, los dos juegos de la PIC-A se realizaron como primera acción una vez que se accedió al sistema, con el fin de que ninguna circunstancia pudiera influir en su respuesta.

Con respecto al estudio con el alumnado, se emplearon sesiones de una hora en cada uno de los grupos. Primeramente, en la fase de pretest, el alumnado realizó los dos juegos de creatividad, siguiendo las instrucciones y duración que contempla el manual (10 minutos para cada uno). En segundo lugar, los estudiantes se registraron en ChatGPT (IA seleccionada por su importante difusión frente a otras diseñadas anteriormente, su impacto mediático y la actualidad del debate en torno a su empleo en el terreno educativo), se explicó su funcionamiento y estos le realizaron consultas de prueba. En tercer lugar, el alumnado volvió a realizar los juegos (fase de postest), esta vez con ayuda de las respuestas facilitadas por ChatGPT; se le explicó que debía mejorar el contenido que había escrito cuando realizó la prueba por primera vez, por lo que no se trataba de realizar de nuevo las pruebas sin tener en cuenta lo hecho anteriormente. El alumnado podía preguntarle al chat lo que considerara con el fin de mejorar su texto, tanto pedirle de manera literal la instrucción de la prueba, como otra serie de consultas que pudieran dirigirse a la mejora de sus producciones escritas. Los participantes fueron informados de la confidencialidad de los datos y objetivos de investigación, siguiendo los estándares éticos que indica el Código de Buenas Prácticas en Investigación de la Universidad de Murcia (2022), y fueron atendidas las dudas que surgieron en el momento de la aplicación.

Análisis de datos

Las puntuaciones de los indicadores de creatividad fueron calculadas según las instrucciones de corrección y el sistema de categorías del manual de Artola et al. (2012). Las puntuaciones directas se calculan a partir de las siguientes indicaciones: a) La fluidez se obtiene contando el número total de respuestas diferentes dadas; b) La flexibilidad se refiere al número de categorías distintas (según baremo establecido) en las que se clasifique al menos una respuesta; c) La originalidad narrativa es el resultado de multiplicar el número de respuestas de cada categoría por el coeficiente otorgado a dicha categoría y su suma total. Por otra parte, la determinación de una creatividad alta o baja se realiza a partir de la tabla de medias de los indicadores en los diferentes juegos, ofrecida por el manual del instrumento (Artola et al., 2012: 86). Una vez realizada la corrección, se analizaron los estadísticos descriptivos de las distintas variables, con el fin de conocer el nivel de creatividad de los sistemas de IA y del alumnado, según el primer objetivo específico. A continuación, se aplicó la prueba de normalidad de Kolmogorov-Smirnov para determinar la pertinencia del uso de pruebas paramétricas. Esta prueba mostró que la fluidez (p<.05), la flexibilidad (p<.05) y la originalidad narrativa (p<.05) no atendían a una distribución normal. Así, con el fin de comparar la creatividad de los sistemas de IA y del alumnado, según persigue el segundo objetivo específico, se realizó la prueba U de Mann-Whitney. Por último, para dar respuesta al tercer objetivo específico, se realizó la prueba Wilcoxon.

Resultados

A continuación, se exponen los resultados en función de los objetivos específicos formulados. El primer objetivo específico se centró en conocer el nivel de los indicadores de la creatividad de los sistemas de IA y del alumnado, para lo que se llevó a cabo el análisis estadístico descriptivo de las puntuaciones obtenidas tras la corrección de los juegos realizados por los sistemas de IA y del alumnado en fluidez, flexibilidad y originalidad narrativa. En primer lugar, con respecto a los sistemas de IA (Tabla 2), se observó que las medias obtenidas en el juego 2 son superiores a las medias indicadas en el manual del instrumento para los indicadores de fluidez (M=15,54), flexibilidad (M=9,75) y originalidad narrativa (M=11,15). Sin embargo, en el juego 3, las medias son inferiores a las dadas por el manual en fluidez (M=13,78), flexibilidad (M=8,75) y originalidad narrativa (M=8,12) (Artola et al., 2012: 86).

https://typeset-prod-media-server.s3.amazonaws.com/article_uploads/bf77dc73-d754-49eb-97c0-886bde36b134/image/fc64d393-c0c7-4532-8d1c-ac672ed2872d-u04-02.png

En el juego 2, ninguna de las IA se encuentra por debajo de las medias de fluidez y originalidad narrativa indicadas en el manual. En fluidez destacan ASKtoAI (PD-puntuación directa: 81), Youchat (PD: 65), Writesonic (PD: 41) y Dupla (PD: 40). En originalidad narrativa sobresalen ASKtoAI (PD: 87), ChatGPT (PD: 85), Copy.AI (PD: 60), Unbounce (PD: 49) y Anyword (PD: 47). En flexibilidad, no todas las IA superan la media del manual, aunque deben mencionarse las puntuaciones de Dupla (PD: 29), Magic Write de Canva (PD: 19) y Anyword (PD: 18). En el juego 3, las IA con puntuaciones altas en fluidez son Neuroflash (PD: 30), ASKtoAI (PD: 20) y Jasper (PD: 20). En flexibilidad destacan Neuroflash (PD: 20), Writesonic (PD: 11), ChatGPT (PD: 10), ASKtoAI (PD: 10) y Nichesss (PD: 10). En originalidad narrativa sobresalen las puntuaciones de ChatGPT (PD: 25), ASKtoAI (PD: 22) y Neuroflash (PD: 18).

En segundo lugar, tras realizar el análisis estadístico descriptivo de las puntuaciones del alumnado (Tabla 3), se descubrió que la muestra del presente estudio presenta unos valores por debajo de las medias de fluidez y flexibilidad de los dos juegos, así como por debajo de las medias de originalidad narrativa del juego 2, indicadas en el manual de la Prueba de Imaginación Creativa para Adultos (Artola et al., 2012: 86).

https://typeset-prod-media-server.s3.amazonaws.com/article_uploads/bf77dc73-d754-49eb-97c0-886bde36b134/image/e61f3d5e-1d84-422e-92d9-2d500d20cd19-u04-03.png

Sin embargo, la media de originalidad narrativa del juego 3 se situó por encima de la media indicada por el instrumento referido. Si se atiende a las puntuaciones según sexo, las mujeres obtienen mejor media en la originalidad narrativa de ambos juegos, con respecto a la que presenta el manual del instrumento. De modo general, en la muestra del presente estudio, las mujeres muestran mejor media que los hombres en todos los indicadores de la creatividad.

Con respecto al segundo objetivo específico, con el fin de comparar la creatividad de los sistemas de IA y del alumnado, se realizó la prueba U de Mann-Whitney, que muestra que existen diferencias estadísticamente significativas en los indicadores de fluidez, flexibilidad y originalidad del juego 2 (Tabla 4).

https://typeset-prod-media-server.s3.amazonaws.com/article_uploads/bf77dc73-d754-49eb-97c0-886bde36b134/image/24d68347-dd30-405f-96ca-a2f6d4eb3074-u04-04.png

Por otra parte, no se encuentran diferencias estadísticamente significativas en los indicadores del juego 3, lo que indica unos niveles similares entre el alumnado (inteligencia humana) y la IA. No obstante, es preciso comentar que el alumnado muestra una mayor media en el indicador de originalidad narrativa del juego 3. Asimismo, la fluidez y la originalidad narrativa del juego 2 presentan un tamaño del efecto moderado, mientras que en el resto de indicadores del juego 2 y el juego 3 los tamaños del efecto son bajos.

https://typeset-prod-media-server.s3.amazonaws.com/article_uploads/bf77dc73-d754-49eb-97c0-886bde36b134/image/32db083a-a5cc-4cd0-a20c-6c0fd3667466-u04-05.png

A continuación, para dar respuesta al tercer objetivo específico, dirigido a comparar las puntuaciones de los indicadores de la creatividad obtenidos por el alumnado en las dos fases de aplicación de las pruebas, se realizó la prueba Wilcoxon, que reveló la existencia de diferencias estadísticamente significativas entre las puntuaciones del pretest y postest en fluidez, flexibilidad y originalidad del juego 2, así como en fluidez del juego 3 (Tabla 5). Por otra parte, en la fluidez y la originalidad narrativa del juego 2 se observa un tamaño del efecto moderado, mientras que tanto el indicador de flexibilidad del juego 2 como los tres indicadores del juego 3 presentan un tamaño del efecto bajo.

Discusión y conclusiones

La presente investigación ha pretendido acercarse al estudio de las posibilidades creativas de los sistemas de IA para el desarrollo de la escritura en el contexto educativo. Se ha conseguido aportar una evidencia didáctica en el uso de la IA y contribuir al conocimiento de su integración en las aulas como apoyo educativo. Se comprueba el papel que pueden asumir los sistemas de IA en el nuevo marco tecnológico, donde el trinomio escritura-creatividad-IA puede empezar a contemplarse en los nuevos modelos de enseñanza de lenguas.

En primer lugar, se advierte que las medias obtenidas por las IA en los tres indicadores del juego 2 son superiores a las medias indicadas en el manual del instrumento, mientras que, por el contrario, las medias alcanzadas en los indicadores del juego 3 son inferiores. Dicha situación se relaciona con el tipo de instrucción solicitada en cada uno de los juegos y pone de manifiesto la diferencia entre los sistemas de IA y los seres humanos. Mientras que en el juego 2 se exploran los posibles usos de un objeto real, el enunciado del juego 3 parte de una situación inverosímil y pretende evaluar un aspecto fantasioso de la imaginación, forma de pensamiento fundamental en el comportamiento creativo. Los sujetos poco creativos no son capaces de concebir tales posibilidades en ese contexto y tropiezan al realizar este juego (Artola et al., 2012), según les ha ocurrido a los sistemas de IA. Además, el juego implica penetrar en la experiencia y, aunque ciertas consecuencias son sencillas de descubrir, otras requieren profundización y penetración en la materia y los problemas (Guilford, 1950). Csikszentmihalyi (1998) ya sostenía que la creatividad no sucede en una mente aislada, sino en la interacción de la persona con un contexto sociocultural, con unas reglas simbólicas establecidas y un ámbito de expertos que reconocen la innovación. Asimismo, teniendo en cuenta que la fantasía (comparada con la invención, la creatividad y la imaginación) es aquella actividad que se presenta como la más libre, siendo la creatividad la suma de la fantasía y la invención (Munari, 2018), se observa que la IA responde de forma más eficaz a la invención, buscando soluciones prácticas. En relación con estos resultados, llama la atención que exista una IA (pymetrics.ai), según describe Sadin (2018), dedicada a seleccionar personal para empresas, en función de su creatividad, adaptabilidad y flexibilidad. En esta línea, Miller (2019) afirma que, para ser verdaderamente creativas, las máquinas deberán entrar en el mundo.

Con respecto al alumnado, al igual que se advierte en otros estudios (Donolo & Elisondo, 2007), las mujeres poseen mejor nivel que los hombres de la muestra en todos los indicadores de creatividad, así como mejor nivel en la originalidad narrativa de ambos juegos en relación con el baremo de medias del manual del instrumento. De forma general, puede decirse que las diferencias de sexo en el ámbito de la creatividad dependen de factores sociales y culturales (Aleksić et al., 2016; Hora et al., 2022).

Por otra parte, tras comparar la creatividad de los sistemas de IA con la del alumnado, las puntuaciones de las IA en los indicadores del juego 2 destacaron de manera significativa sobre las puntuaciones del alumnado, mientras que en el juego 3 los indicadores de la creatividad mostraron unos niveles similares en ambos grupos. Este resultado se muestra en coherencia con lo referido anteriormente, al sobresalir las puntuaciones de las IA en el juego 2. Las IA disponen de una gran cantidad de información, superior a la que una persona puede manejar y, según ya afirmaban Goleman et al. (2016), tener datos precisos y abundantes es esencial en el proceso creativo, pues cuanto mayor sea el conocimiento de los detalles de un problema, mayores serán las probabilidades de encontrar una solución. Con respecto al juego 3, el alumnado supera, aunque no de modo significativo, a la IA en originalidad narrativa. El ser humano no posee la rigidez que han presentado los sistemas de IA, al no ser capaces de distanciarse del enunciado del juego 3 y encontrar respuestas que pudieran ser encasilladas en categorías sorprendentes, nuevas, alejadas de lo evidente y valiosas (Boden, 2004; 2018).

Además, se ha puesto de manifiesto la mejora significativa de las producciones escritas del alumnado tras el empleo de ChatGPT, concretamente en todos los indicadores del juego 2 y la fluidez del juego 3. Se destaca el potencial de la colaboración humano-IA en el proceso de escritura, pues la «IA es un medio, no un fin» (Breton, 2021) y ha sido una herramienta que ha funcionado en calidad de asistente al alumnado en el juego 2, el cual se alinea con las posibilidades productivas de la tecnología IA, lo que no ha ocurrido con la flexibilidad y originalidad del juego 3, pues ya se ha comprobado que las IA no han sido capaces de imaginar los efectos de una situación fantasiosa. Además de las explicaciones ya ofrecidas, este resultado también puede deberse a lo que se denomina «problema de marco», que alude a que los sistemas programados con un objetivo específico funcionan mejor, aunque no son capaces de realizar de forma exitosa otra actividad para la que no están programados (Bonami et al., 2020).

A la luz de estas conclusiones, escribir con asistencia computacional sugiere un replanteamiento de la forma en la que se concibe la escritura y la creatividad. Existen incógnitas y preocupaciones con la honestidad académica y el plagio, según reflejan recientes publicaciones tanto de carácter científico (Else, 2023; O'Connor y ChatGPT, 2023) como de difusión general (Sánchez, 2023; Vázquez, 2023); y, de hecho, de modo paralelo al crecimiento de las IA, se están desarrollando métodos para detectar los textos escritos por ellas, como es el caso de «Classifier» (OpenAI, 2023). En cualquier caso, la prohibición de los sistemas de IA en el ámbito educativo (Peirón, 2023) sería una batalla perdida, por lo que, en lugar de fingir que la IA no existe, es el momento de capacitar al alumnado para que trabaje con ella; de la misma forma que herramientas como ChatGPT se están utilizando en la ciencia y diversos investigadores confirman su uso (Hutson, 2022). Así pues, el profesorado deberá reflexionar acerca de las habilidades que enseña y cómo la IA podría ayudar al alumnado en la generación de ideas y el desarrollo de su creatividad al abordar tareas de escritura.

Por otra parte, una vez comprobada la ayuda que la IA proporciona en términos de creatividad verbal, ha de indicarse que la IA no puede reemplazar a la inteligencia y la creatividad humana. Montero (2023) señalaba que la IA carece de criterio y afirmaba que la creatividad no es tener ideas, sino que es saber cuándo no se debe tener más. La máquina carece de contexto y no sabe lo que es bueno para ser valorado. Por ello, se debe fomentar la participación activa del alumnado en su proceso de aprendizaje y perseguir que sea capaz de actuar con decisión, criterio y responsabilidad. Se requiere de una inteligencia colaborativa humano-máquina, según subraya el Instituto Nacional de Tecnologías Educativas y Formación del Profesorado (INTEF, 2022), al advertir la compleja relación entre las personas y la IA, pues hay funciones específicas que solo pueden ser realizadas por los humanos y para las que deben estar formados (Holmes et al., 2019). En esta línea, el estudio de Fyfe (2022), de modo similar a la presente investigación, planteó al alumnado universitario la realización de un ensayo mediante el uso de una IA. En un inicio, aplicar la IA a la escritura pudo parecer un atajo, pero el texto generado artificialmente era difícil de controlar, se desviaba del tema y tenía que ser revisado en sus diferentes muestras, lo que no permitía integrar de manera automática la información al tratarse de un género de extenso desarrollo como el ensayo.

A partir del estudio realizado, interesa seguir investigando en el ámbito de la escritura, ampliando el estudio de la creatividad con ayuda de la IA por medio de tareas de composición narrativa; en esta línea están empezando a aparecer en el mercado libros sobre el uso de ChatGPT para escribir y estructurar textos extensos (Gade, 2023). Además, conviene ampliar la muestra humana participante con otras titulaciones o áreas profesionales. Del mismo modo, es posible contemplar futuras investigaciones que profundicen en los diferentes dominios de la creatividad, en línea con el rápido avance de la IA en la creación de gran variedad de productos. Así, la presente investigación puede completarse con otros estudios enfocados a la creación de imágenes o secuencias musicales a través del uso de la IA. En definitiva, son necesarios los estudios que profundicen en el uso y aprovechamiento de la IA y, en concreto, de ChatGPT en contexto educativo, pues las propias editoriales de libros de textos están empezando a incorporar estos recursos en sus plataformas de contenidos, como es el caso del asistente inteligente de Edelvives que integra ChatGPT (Edelvives, 2023).

Finalmente, el uso de la IA debe ir dirigida al empoderamiento del profesorado y no se contempla el reemplazo o desplazamiento del mismo (UNESCO, 2022b). Se requiere de un Plan de Alfabetización IA que forme al profesorado tanto en capacidades técnicas como en debates éticos-filosóficos (Flores-Vivar & García-Peñalvo, 2023; UNESCO, 2022a). Del mismo modo, los cambios en la práctica educativa de los próximos años estarán determinados por los avances de la IA y habrá de apostar por una investigación en plena colaboración con docentes, líderes educativos y alumnado, con el fin de garantizar la puesta en marcha de adecuadas políticas educativas (OCDE, 2021). (1)