Saltar la navegación

Funcionamiento · Funzionamento · How it works · Funcionamento

¿Cómo se crea una IA?

entrenamiento IA

Crear una IA no significa “programar todas las respuestas”, sino diseñar un sistema capaz de aprender a partir de datos.

La mayoría de las IAs actuales funcionan mediante algo llamado red neuronal artificial.

 

¿Qué es una red neuronal?

Una red neuronal es un modelo matemático inspirado —de forma muy simplificada— en el cerebro humano.

Está formada por neuronas artificiales (pequeñas unidades de cálculo) organizadas en capas y conectadas entre sí. Cada conexión tiene asociado un número, llamado peso, que indica la importancia de esa señal.
Aprender consiste, precisamente, en ajustar esos pesos.

Cuando se crea una red neuronal, los pesos se inicializan con valores pequeños y aleatorios. La red empieza, por tanto, “sin saber nada” y aprende ajustando esos valores automáticamente mediante un algoritmo matemático llamado retropropagación del error (backpropagation).

¿Cómo aprende una red neuronal?

El proceso básico es el siguiente:

  • La red recibe un input (por ejemplo, una imagen).
  • Produce un output (por ejemplo: “perro”).
  • Se compara con la respuesta correcta (por ejemplo: “gato”).
  • Se calcula el error.
  • Ese error se propaga hacia atrás por la red.
  • Se ajustan ligeramente los pesos para reducir ese error.
  • Este proceso, repetido millones de veces, se llama entrenamiento.

Tipos de aprendizaje

Existen distintos tipos de aprendizaje:

Aprendizaje supervisado: El modelo aprende con ejemplos previamente etiquetados. Propone una respuesta y la compara con la correcta; si falla, ajusta sus parámetros.

Aprendizaje por refuerzo: No hay una etiqueta correcta directa. El modelo aprende por ensayo y error: realiza una acción, recibe una recompensa o penalización y ajusta su estrategia en función del resultado.

 

¿Cómo se entrenan los modelos de lenguaje?

En modelos como los desarrollados por OpenAI, el entrenamiento suele tener varias fases:

  • Primero aprenden a predecir la siguiente palabra en millones (o miles de millones) de textos.
  • Después se ajustan mediante aprendizaje supervisado.
  • Finalmente, se afinan con aprendizaje por refuerzo a partir de evaluaciones humanas, con el objetivo de mejorar la calidad, utilidad y seguridad de las respuestas.
     

¿Por qué necesitan tanta potencia de cálculo?

Las redes modernas pueden tener millones o incluso miles de millones de parámetros (pesos). Cada ajuste implica enormes cálculos matemáticos que se realizan mediante GPUs (procesadores gráficos) ubicadas en grandes centros de datos.

¿Cómo sabemos que ha aprendido bien?

Se prueba el modelo con datos nuevos que no ha visto durante el entrenamiento. Si funciona bien con esos datos, decimos que ha generalizado de lo contrario solo habrá memorizado.

La caja negra

Cuando interaccionamos con una IA, conocemos la capa de entrada, el prompt con el que hacemos una solicitud y la capa de salida: la respuesta producida. Pero no los procesos que se realizan entre esos dos puntos y que suele nominarse de forma inquietante como la caja negra; las redes neuronales artificiales son tan complejas matemáticamente (con miles de millones de parámetros) que para un humano es imposible seguir exactamente qué combinaciones concretas llevaron a una determinada respuesta, qué unidades de cálculo fueron las más decisivas o cómo interactuaron entre sí.

¿Quieres profundizar más?

Profundizar en le IA

Los pesos

Los pesos son números reales (positivos o negativos), generalmente muy pequeños y con bastantes decimales, como 0.8, −1.37, 0.0021, −0.00045.

Cada peso indica cuánta influencia tiene una señal sobre la siguiente neurona (unidad de cálculo).

Si el peso es grande y positivo → esa señal influye mucho.
Si es pequeño → influye poco.
Si es negativo → reduce o invierte la influencia.

Un ejemplo sencillo: imagina que queremos predecir si alguien aprobará un examen. La red recibe tres datos:

  • horas de estudio
  • horas de sueño
  • uso del móvil

Y ajusta a cada uno de ellos un peso:

  • estudio → 0.9
  • sueño → 0.4
  • móvil → −0.8

Eso significa que:

  • Estudiar influye mucho y positivamente
  • Dormir ayuda un poco
  • Usar mucho el móvil perjudica

Pero todo esto ocurre como cálculo matemático, no como “juicio moral”.

Durante el entrenamiento, los pesos se ajustan muy poco a poco.

En modelos grandes actuales puede haber miles de millones de pesos, y cada uno es un número decimal. Por eso se necesitan superordenadores para manejarlos. Una red neuronal no guarda ideas, guarda números. Y, sin embargo, esos números permiten escribir poemas, resolver problemas o describir emociones.

El descenso del gradiente

El  ajuste de los pesos, se realiza utilizando una técnica matemática llamada descenso del gradiente. Veamos cómo funciona con un ejemplo muy sencillo, con un solo peso y sin fórmulas complicadas.

Vamos a suponer que nos marcamos el objetivo de que nuestro modelo sea capaz de devolvernos, como respuesta, una cifra que sea el doble de la que recibe en la entrada.

El modelo matemático que diseñamos será muy simple y responderá a la fórmula:

Salida = peso × entrada

Solo hay un peso. Ese peso es el número que queremos hallar para que las respuestas que obtenemos sean ciertas.

Paso 1

Se empieza por un peso aleatorio, en nuestro ejemplo, el 1.

Paso 2

La IA prueba con un dato de entrada, por ejemplo, el 3 y hace el cálculo:

Salida = 1 (peso) × 3 = 3

Pero la respuesta correcta era 6. ❌

Paso 3

La máquina, entonces calcula el error:

Error = resultado correcto − resultado del modelo

Error = 6 − 3 = 3

El modelo se ha quedado corto.

Necesitamos aumentar el peso.

Paso 4: aplicamos la idea del descenso del gradiente

Si el error es positivo, significa que debemos subir el peso. Pero el ajuste será pequeño. Supongamos que utiliza un ajuste de 0,1.

Nuevo peso = peso anterior + (0,1 × error)

Nuevo peso = 1 + (0,1 × 3)

Nuevo peso = 1 + 0,3 = 1,3

 

Paso 5: repetición del cálculo

Volvemos a probar con entrada = 3

Salida = 1,3 × 3 = 3,9

Todavía no es 6, pero hemos mejorado.

Nuevo error = 6 − 3,9 = 2,1

Paso 6 Volvemos a ajustar:

Nuevo peso = 1,3 + (0,1 × 2,1)

Nuevo peso = 1,3 + 0,21 = 1,51

Paso 7 Seguimos repitiendo…

1 → 1,3 → 1,51 → 1,657 → 1,7599 → 1,831930→ 1,882351→ 1,917646→ 1,942352→ 1,959646→ 1,971752→ 1,980227→ 1,986159→ 1,990311→ 1,993218→ 1,995253→ 1,996677→ 1,997674→ 1,998372→ 1,998860→ 1,999202→ 1,999441→ 1,999609→ 1,999726

Como se puede observar, el peso se va acercando cada vez más al 2 aunque no llegue a él. Pero como todos los sistemas tienen una precisión limitada y redondean llegaríamos a obtener el número 6. Y ahí se detiene el aprendizaje.  No se busca la perfección absoluta, sino que el error sea insignificante.

Salida = 1,999726 x 3= 5.999178 ≈ 6

Error = 0.000822 ≈ 0

El modelo ha descubierto el peso correcto (2), mediante cálculos, reduciendo el error poco a poco utilizando el descenso del gradiente.

Este ejemplo tan simple, debemos escalarlo. En un modelo de IA en lugar de un peso existen millones y en lugar de una multiplicación se realizan millones de operaciones encadenadas.

Creado con eXeLearning (Ventana nueva)