Tipos de IA

Existen varias formas de clasificar los distintos tipos de inteligencia artificial. Veamos algunas de ellas:

POR CAPACIDAD

La IA débil o IA estrecha (ANI) está diseñada para realizar una tarea concreta. No comprende el mundo, ni puede actuar fuera de la función para la que fue creada. Todos los sistemas actuales, como los asistentes virtuales o los sistemas de recomendación, pertenecen a esta categoría.

La IA fuerte o Inteligencia Artificial General (AGI) es un tipo de IA teórica que tendría la capacidad de razonar, aprender y adaptarse de forma similar a un ser humano, pudiendo enfrentarse a situaciones nuevas. Por ahora, no existe en la realidad y sigue siendo un objetivo de investigación a corto o medio plazo para organizaciones como OpenAI o DeepMind.

La IA superinteligente (ASI) es también una idea teórica: sería una IA que supera la inteligencia humana en todos los aspectos, no solo en algunos.

POR FUNCIONAMIENTO

Máquinas reactivas: Son las más simples. No tienen memoria, solo reaccionan. Un buen ejemplo sería un programa de ajedrez básico que no recordara partidas anteriores.

IA con memoria limitada. Es la más común hoy. Puede usar datos del pasado.

IA con teoría de la mente (no existe aún) Sería capaz de entender:emociones, intenciones y pensamientos como hacemos los humanos.

IA autoconsciente (no existe) Sería consciente de sí misma y tendría identidad como una persona.

POR SU FORMA DE CONSTRUCCIÓN

IA simbólica: Usa reglas como: "SI pasa esto → ENTONCES haz esto"

Machine Learning: la IA aprende con ejemplos, por ejemplo es capaz de reconocer un gato después de haber sido entrenada viendo miles de fotos.

Deep Learning: es una forma avanzada basada en redes neuronales que trata de imitar el cerebro. Mediante procesos complejos es capaz de generar imágenes, reconocer voz o traducir idiomas, por ejemplo.

IA generativa: Es la más conocida. Crea cosas nuevas: textos, imágenes o música. Como, por ejemplo ChatGPT o DALL-E.

POR TIPO DE MODELO

LLM es el acrónimo de Large Language Model (Modelo grande de lenguaje). Son modelos de IA generativa entrenados mediante deep learning. OpenAI GPT, Gemini o Claude son ejemplos de LLM. Trabajan con texto y aprenden gramática, significado y relaciones entre palabras lo que les permite escribir, resumir, traducir o explicar.

Los modelos razonadores son una evolución de los LLM optimizados para razonar paso a paso, resolver problemas complejos y pensar antes de responder. Son capaces de resolver problemas matemáticos, programar y hacer deducciones.

Un modelo multimodal es una inteligencia artificial que puede recibir, comprender y generar información en diferentes formatos, como texto e imágenes al mismo tiempo. No solo “lee” palabras, también puede “ver” imágenes o “escuchar” sonidos. Gemini, la IA de Google, al contrario que ChatGPT, nació en diciembre del 2023 como una IA multimodal nativa, lo que significa que se entrenó desde el principio con texto, imágenes, etc.

Un modelo de difusión es un tipo de inteligencia artificial generativa que crea imágenes nuevas aprendiendo primero a destruirlas y luego a reconstruirlas. Estos modelos se entrenan en dos fases opuestas. En la primera, los investigadores toman una imagen, por ejemplo, un gato y le van añadiendo ruido poco a poco hasta que la imagen original desaparece. En la segunda fase la IA aprende a hacer el proceso inverso: eliminar el ruido hasta reconstruir la imagen. Este entrenamiento repetido en el tiempo consigue que surja la magia y la IA aprende a crear imágenes que nunca han existido a partir de ruido puro. Dos ejemplos de este tipo de inteligencia artificial son Stable Diffusion, desarrollado por Stability AI y el generador de imágenes DALL·E, de OpenAI, ambos del 2022.

Modelos de visión: están diseñados para analizar e interpretar imágenes o vídeos.Detectan patrones, identificar formas, clasificar objetos o reconocer rostros. Pueden reconocer caras, detectar enfermedades en radiografías, identificar objetos en una calle, leer matrículas, etc. Por citar algunos ejemplos, el sistema Face ID del iPhone utiliza modelos de visión para reconocer el rostro mientras herramientas como Google Photos, son capaces de agrupar fotos por personas, reconocer lugares, buscar elementos a partir de una solicitud en texto, etc.

Los modelos de recomendación son modelos diseñados para predecir qué te puede gustar o interesar mediante la detección de patrones en tus decisiones anteriores. Analizan lo que ves, lo que compras, lo que escuchas, cuánto tiempo miras algo..., y lo comparan con millones de personas similares. Es utilizado por empresas como Netflix, Spotify, TikTok para decidir qué mostrarnos.

Los modelos de refuerzo aprenden por ensayo y error. Prueban, se equivocan, ajustan y lo vuelven a intentar. Reciben recompensas cuando hacen algo bien. Con el tiempo, aprenden la mejor estrategia. El ejemplo más famoso es el de
AlphaGo, desarrollado por Google DeepMind bajo la dirección de Demis Hassabis. En 2016 venció a campeones humanos del juego Go. Aprendió jugando millones de partidas contra sí mismo. También los coches autónomos aprenden a mejorar su conducción mediante técnicas de refuerzo.