- DeepMind usa aprendizaje profundo y por refuerzo para resolver tareas complejas.
- Modelos como AlphaGo y AlphaFold han revolucionado los juegos y la medicina.
- Veo permite la creación de vídeos realistas con simple texto o imágenes.
- Herramientas como Gemma Scope ayudan a entender el pensamiento de las IAs.
La inteligencia artificial ha captado el interés del mundo entero gracias a sus sorprendentes avances, y entre las empresas que lideran este panorama, Google DeepMind destaca como una de las más innovadoras. Fundada en 2010 y adquirida por Google en 2014, esta compañía con sede en Reino Unido ha desarrollado diferentes tecnologías que han dejado huella en campos tan diversos como la medicina, la eficiencia energética, los juegos y hasta la generación de contenido audiovisual.
Pero, ¿qué es exactamente DeepMind y cómo se puede utilizar? Para entender su funcionamiento, usos reales y su impacto en la vida cotidiana, vamos a sumergirnos en su historia, su estructura tecnológica, sus principales desarrollos y cómo hoy estamos viendo aplicaciones tangibles de estas ideas que hace años parecían ciencia ficción.
¿Qué es DeepMind y de dónde surge?
DeepMind es un laboratorio de investigación en inteligencia artificial que tiene como misión desarrollar sistemas que puedan aprender de forma autónoma y resolver problemas sin necesidad de reglas preprogramadas. Fue creado por tres investigadores británicos con experiencia en neurociencia y computación. Su enfoque disruptivo en IA llamó la atención rápidamente, tanto que Google (ahora Alphabet) compró la empresa por cerca de 400 millones de libras esterlinas en 2014.
Desde entonces, DeepMind ha crecido hasta formar un equipo de más de 700 profesionales distribuidos por oficinas en varias partes del mundo. Con acceso a la infraestructura técnica de Google, han podido extender sus investigaciones a campos como medicina, eficiencia energética, neurociencia, robótica y algoritmos aplicados a juegos.
Cómo funciona la tecnología detrás de DeepMind
El núcleo de la IA de DeepMind se basa en dos pilares fundamentales: el aprendizaje profundo y el aprendizaje por refuerzo. Las redes neuronales que desarrollan están diseñadas para imitar el funcionamiento del cerebro humano mediante capas de nodos interconectados que aprenden a partir de datos.
Uno de los enfoques clave utilizados es el aprendizaje Q sin modelos, una técnica donde el sistema ajusta sus respuestas para maximizar las recompensas recibidas. Esta forma de entrenamiento permite a DeepMind evolucionar en entornos complejos sin instrucciones predefinidas.
Por ejemplo, entrenaron su IA con videojuegos de Atari. Al principio no sabía jugar, pero tras millones de repeticiones llegó a superar a jugadores humanos. Esto es posible porque la IA es capaz de identificar patrones óptimos y corregir errores a lo largo del tiempo.
Logros destacados de DeepMind en diferentes áreas
Desde su creación, DeepMind ha conseguido desarrollos que han marcado un antes y un después en el campo de la inteligencia artificial. Aquí te contamos los más importantes:
AlphaGo: dominando lo imposible
El juego de mesa Go es conocido por su enorme complejidad estratégica. DeepMind desarrolló AlphaGo, la primera IA en derrotar a un jugador humano profesional y luego al campeón mundial en 2016. Esta hazaña mostró que la IA podía abordar tareas que requieren intuición, creatividad y pensamiento estratégico a largo plazo.
AlphaFold: revoluciona la medicina
Uno de los avances más disruptivos ha sido AlphaFold, una IA capaz de predecir cómo se pliegan las proteínas, un problema biológico que llevaba décadas sin solución. Esta herramienta ha facilitado la creación de nuevos tratamientos y fármacos, incluso colaborando en la lucha contra la COVID-19 y enfermedades como el Alzheimer.
AlphaZero: el sistema que domina múltiples juegos
AlphaZero es capaz de aprender y jugar a nivel experto en ajedrez, shogi y Go. No requiere datos previos: solo aprende de jugar consigo misma millones de veces. En pocos días, superó a los motores de ajedrez más avanzados del mundo como Stockfish.
DeepMind en eficiencia energética
La IA de DeepMind también ha mejorado cómo usamos los recursos. Aplicada en los centros de datos de Google, redujo el consumo energético de refrigeración en un 40% gracias a un sistema de aprendizaje por refuerzo que optimizaba en tiempo real.
Avances en robótica
DeepMind ha trabajado en robots como Robocat, capaz de aprender a manejar diferentes brazos robóticos con solo unas pocas demostraciones. El sistema se entrena con datos generados por sí mismo, lo que mejora su eficiencia conforme se enfrenta a nuevos retos.
Nuevas fronteras: IA generativa con DeepMind
Una de las novedades más impactantes es Veo, un modelo de inteligencia artificial generativa para vídeo. Se presentó durante el evento Google I/O 2024 y promete transformar la creación audiovisual.
¿Qué puede hacer Veo?
Veo es capaz de generar vídeos de alta calidad en 1080p en múltiples contextos a partir de texto, imágenes o secuencias de vídeo previas. Su intuición a la hora de capturar detalles complejos lo convierte en una herramienta ideal para creadores, cineastas y publicistas.
Ofrece funciones como:
- Edición enmascarada: Permite modificar áreas específicas de un vídeo existente.
- Creación de vídeos basados en imágenes: A partir de una imagen y un texto se genera un vídeo con coherencia estética y narrativa.
- Expansión de clips: Crea vídeos de más de 60 segundos con continuidad visual.
Casos de uso reales de Veo
El cineasta Donald Glover trabajó junto a Google para probar la capacidad creativa de Veo. Usaron esta IA para visualizar tomas complejas antes de rodarlas, ahorrando tiempo y recursos. Esta previsualización rápida permite a los equipos ajustar planos y enfoques con antelación, elevando el nivel de producción.
También se ha usado en publicidad, educación e incluso medicina. Veo puede simular entornos realistas para entrenamientos o crear vídeos educativos impactantes que faciliten la comprensión de temas complicados.
¿Cómo funciona Veo?
El modelo combina varias tecnologías previas como Generative Query Network, Imagen-Video y VideoPoet. Utiliza codificadores para texto e imagen y los combina en un único “input” que pasa por un modelo de difusión latente. Este genera un vídeo comprimido que se decodifica en alta resolución.
Además, todos los vídeos llevan una marca de agua invisible mediante SynthID, una herramienta propietaria que garantiza que los contenidos generados por IA sean rastreables y seguros.
Gemma Scope: entender cómo piensan las IAs
Uno de los retos de la IA es saber qué pasa exactamente dentro de ella. Para resolver esta incógnita, el equipo de DeepMind ha desarrollado Gemma Scope, una herramienta dentro del campo de la interpretabilidad mecanicista. Su función es mostrar cómo una IA llega a sus conclusiones.
Mediante autocodificadores dispersos, es posible ver qué neuronas se activan con ciertos estímulos, como si observáramos el cerebro de la IA bajo un microscopio. Por ejemplo, preguntarle por un chihuahua puede activar el patrón “perros”.
Estas herramientas ayudan a detectar errores internos y sesgos. Por ejemplo, si un modelo dice que 9.11 es más grande que 9.8, es porque ha relacionado erróneamente esos números con versículos bíblicos o fechas como el 11-S. Con esta información, los ingenieros pueden ajustar comportamientos incorrectos.
También se han explorado funciones como detectar sentimientos humanos, como la vergüenza ajena, o incluso el engaño, aunque este último sigue siendo complejo de aislar.
DeepMind ha abierto estas herramientas al público a través de GitHub y plataformas como Neuronpedia. Esto permite que más expertos colaboren para entender cómo funcionan los modelos y puedan aplicar ingeniería inversa a sus algoritmos.
Gracias a la constante evolución de DeepMind, sus tecnologías están traspasando el ámbito de la investigación para convertirse en soluciones aplicables a problemas reales, desde el descubrimiento de fármacos hasta el cine o la educación. Su enfoque ético, su compromiso con la transparencia y la creación de herramientas que permitan comprender la IA demuestran que aún queda mucho por explorar, y que estamos apenas rascando la superficie del potencial de este tipo de inteligencia artificial.