No sé si podré estar esta tarde pero me gustaría hacer una pequeña reflexión entorno a ChatGPT y a todo lo que se nos viene entorno al procesamiento del lenguaje y otros campos en los que el aprendizaje automático incidirá directamente.
El avance imparable de los algoritmos y su análisis de datos para obtener conclusiones es ya una realidad.
Sin embargo, en este contexto cabe hacerse 2 preguntas:
⁉️¿Son sus conclusiones tan ciertas como se pintan?
⁉️¿Son realmente un problema para la educación y/o el empleo?
La respuesta a estas dos preguntas es, sin duda, compleja y con muchas aristas.
Empecemos por la primera.
La respuesta corta a si las conclusiones de estas IAs son fiables sería "Depende" pero, vayamos a la respuesta larga.
Los resultados de un sistema de aprendizaje automático tiene dos grandes patas: Los datos que los alimentan y el algoritmo que se utiliza.
Respecto a lo primero, los datos, no debemos olvidar que estos encierran, habitualmente una gran incertidumbre y, dependiendo del campo, muchos sesgos heredados de años y años de discriminaciones capacitistas, racistas, machistas o de cualquier otro tipo.
En la medida que los datos tengan un mayor sesgo o encierren una mayor variabilidad y, por tanto, mayor incertidumbre, será más difícil que la respuesta sea fiable.
Así, si estamos hablando de identificar un animal o un objeto en una imagen y la base de datos son cientos de miles de imágenes con la etiqueta bien puesta sobre esos elementos, los datos tendrán poca incertidumbre y posiblemente la interpretación de una nueva imagen también.
Aun así, si las imágenes están sesgadas en los datos de entrenamiento, y unos objetos se relacionan más con un tipo de imágenes que con otras, habra poca incertidumbre, pero mucho sesgo.
Para muestra, este botón de @biko2 por @ujue y @patxangas google.com/search?client=…
En ChatGPT pasa algo parecido. Hay muchos textos y el algoritmo aprende rápido a redactar bien... pero los datos que tiene no los saben todo y, como tiene que contestar, lo que no sabe, se lo inventa. newtral.es/chatgpt-veraci… espanol.almayadeen.net/news/technolog…
Un ejemplo con poca incertidumbre y poco sesgo en los datos es la identificación proteínas, un campo donde estos algoritmos realmente están siendo de gran ayuda porque, además, no hay nada más que permita ir tan rápido en la investigación.
Donde queda mucho mucho mucho por hacer respecto a los datos es en salud.
Los sistemas de salud a lo largo de Europa (por no decir del mundo entero) tienen una diversidad considerable y eso se refleja en que la forma en la que se guardan los datos es también muy diversa.
Solo en España tenemos, al menos, 17 formas diferentes de guardar los datos. Campos distintos, descriptores diferentes de los diagnósticos. Formas diferentes de medir ciertas variables...
Pretender informar con estos datos a un algoritmo es todavía inviable... por lo que estamos lejos de una herramienta diagnóstica general para salud. Mucho menos si lo queremos hacer con búsquedas de internet como intentó google para la gripe eldiario.es/tecnologia/dia…
Y llegamos así al segundo gran problema de la credibilidad de las respuestas. Los algoritmos.
Los algoritmos son una mezcla de metodología Estadística y Matemática con Computación, que permiten analizar grandes bases de datos en tiempo record.
El problema es que es muy importante pararse a pensar en el tipo de datos que tenemos y las conclusiones que queremos obtener para elegir el método que mejor funciona para dar la respuesta adecuada.
Sin embargo, una tendencia extendida es pensar que todos los datos son "normales" y cualquier cosa vale porque tenemos muchos datos.
En este sentido, una vez escuché decir a alguien que si se estrujaba un papel siempre se obtenía una bola... y que con los datos era lo mismo.
Un método usado para unos datos para los que no sirve, incluir etiquetas de genero o de etnia en el modelo o olvidar considerar el error que tienen los datos, son solo algunos de los ejemplos que pueden hacer que el resultado de un algoritmo sea nefasto bbc.com/mundo/noticias…
Pero entonces ¿son útiles o no lo son? ¿Las usamos o no? ¿cómo afectaran a las profesiones? ¿Qué hacemos con ChatGPT en clase?
Estos productos deben tratarse como una herramienta que será más útil cuanto mejores sean los datos y más cuidado se haya puesto en la construcción del algoritmo
No podemos renegar de su existencia y demonizarlas, pero tampoco ensalzarlas a la categoría de verdad absoluta.
No nos van a robar el trabajo, como no nos lo robaron las maquinas en la revolución industrial. El trabajo cambiará y se especializará pero será un cambio secuencial para el cual, eso sí, debemos empezar a prepararnos desde ya.
Y esa preparación enlaza con varias cuestiones que ya he comentado otras veces pero, en particular, con la pregunta de @imgende para el #debatedominguero de las #CharlasEducativas.
vamos a ellas:
Primero de todo. Incluyamos estos conocimientos en el aula de forma transversal.
Se me ocurre, por ejemplo, que los ejemplos de chatGPT pueden ser útiles para aprender a construir textos
¿Qué pasa si le digo a ChatGPT que me escriba un cuento?
¿Qué partes tiene?
¿Qué conectores utiliza?
¿Y si le digo que escriba una carta formal?
¿Y si le pido que incluya las fuentes?
En este último sentido, podemos apoyarnos en él para hablar de la importancia de las fuentes. ¿Qué son las revistas cientificas?¿Qué información es fiable?
¿Veis la cantidad de sentido crítico que se puede fomentar?
Tenemos miedo de que luego hagan los trabajos de clase con ChatGPT. Pero Quizás es momento de 1. apoyarse más en la evaluación oral 2. pedir menos deberes para casa y trabajar más en el aula (cc @bpalop) 3. enseñarles a ser críticos con lo que hacen y leen
Estas nuevas tecnologías también nos pueden servir para fundamentar la importancia del uso correcto de la Estadística, enfocando a los datos.
Hacer análisis de datos a nuestro alrededor. Ver los sesgos que contienen. Aprender a usar las técnicas de contraste de hipótesis...
Eso supondría un enorme adelanto cuando vienen a la universidad y... si no vienen, ya lo llevarían aprendido para el día a día, para leer la prensa de otra forma.
Y para terminar. El aula es el momento idoneo para concienciarles de que los sesgos se quitan incluyendo diversidad en los equipos.
Que la IA es también una herramienta para cuidar en la que tenemos que caber todos y todas.
Otra forma maravillosa de promocionar las profesiones STEM😜entre los niños y, sobre todo, las niñas.
Y me quedo aquí.
Espero que os haya resultado útil y, si es así, que compartáis para llegar a más gente.
• • •
Missing some Tweet in this thread? You can try to
force a refresh
Me apetece un montón hacer un hilo con los libros que voy a leer en este 2023... Porque siempre que termino uno digo "tengo que contar que es una pasada" y luego se me pasa.
¡Empiezo!🧵
Este lo acabé en 2022 pero es que es una pasada y no puedo dejar de contároslo: Hermanito de Ibrahima Balde (el protagonista) y Amets Arzallus Antia, Ed @BlackieBooks
Desgarrador y necesario relato del viaje de Ibrahima a la busca de su hermano pequeño desde Guinea hasta Europa
Ojalá leyeran "Hermanito" quienes aun piensan que migrar es un capricho y hablan de cosas como la "migración ordenada".
Este libro lo conocí a través del equipo de @carnecrudaradio a quienes agradezco infinito que cuenten este tipo de cosas.
Hoy estoy enfadada, muy enfadada y como no se dónde quejarme pues voy a quejarme aquí.
Estoy harta de la doble moral con la que se trata a la Estadística...
Dejadme que me explique.
Siempre que voy a dar cursos de formación permanente de Estadística hay un montón de investigadores juniors y senior de áreas como la biología, la biotecnología, la psicología, la economía, la educación, las ciencias del deporte etc.
Salta a la vista que necesitan el Estadística como el agua y muchas veces las preguntas que me hacen acaban teniendo que ver con sus investigaciones, porque lo necesitan.
Algunas personas han aprendido muchísimo por su cuenta pero puedes notar como las bases flojean.
El concepto de ciudadanía tiene un sesgo androéentrico que debería cambiar si queremos evitar la crisis en los cuidados. Interesantísimo lo que nos está contando Toya Vázquez
Brutal escuchar a Ruth Mestre sobre lo que nos hace sujetos políticos y como se ha definido el trabajo y dejado fuera el ámbito de los cuidado y por tanto a las mujeres
Hoy he dado la clase que más me gusta de toda la asignatura de probabilidad... pero también la más triste porque marca el momento en que vamos cara al final
Ley de los grandes números y teorema central del límite😍😍😍😍
¿Queréis que os deje por aquí alguno de los gif que uso?
Perdón! Que estaba en una reunión!
Empecemos:
Para hablar de la ley de los grandes números les cuento la idea de que la media muestral de n elementos puede entenderse como una variable y que puedo calcularla para cualquier tipo de variable (cuantitativa)... da igual cual sea su distribución
Imaginad que os quiero vender una casa… os cuento todas las cosas bonitas que tiene. Pero llegáis a ella y os dais cuenta que para entrar a vivir tenéis que esforzaros mucho… no os importa porque os gusta… pero al poco os dais cuenta que no solo vale con el esfuerzo…
Hay cosas que ir arreglando pero la burocracia no os deja hacer nada. Sabéis que podéis trabajar duro para ir mejorándola pero también que os tendréis que ir a vivir a otra casa para poder volver, quizás, alguna vez… no es seguro que podáis vivir allí tranquilas….
¿La compraríais? Seguramente no, verdad? Sobretodo si llevan toda la vida insinuando que tenéis que ser vosotras las que criéis a vuestros hijos en esa casa… seguramente queréis algo más seguro en lo que entrar a vivir, aunque os guste menos….