Avance tecnológico: DeepSeek potencia su modelo de IA con nuevas mejoras

El chatbot chino pretende mejorar su eficiencia ante los usuarios juzgando por sí mismo sus respuestas.

Ciencia & Tecnología11/04/2025

WRV5DH3GPREELPSWVLCPHHNGZE

La 'startup' china de inteligencia artificial DeepSeek ha introducido una nueva forma de mejorar la capacidad de razonamiento de los grandes modelos lingüísticos (LLM) para ofrecer resultados mejores y más rápidos frente a sus competidores.

DeepSeek provocó un frenesí en enero cuando apareció en escena con R1, un modelo de inteligencia artificial (IA) con un chatbot que, según la empresa, era más barato y funcionaba tan bien como su principal rival, ChatGPT de OpenAI.

En colaboración con investigadores de la universidad china de Tsinghua, DeepSeek afirma en su último artículo publicado el pasado viernes que ha desarrollado una técnica para mejorar por sí misma los modelos de IA. La tecnología subyacente entrena a la IA para que desarrolle sus propias reglas para juzgar contenidos y luego las utilice para mejorar en sus respuestas.

multimedia.normal.9c3229d9f1bfdde3.MDkwOTI0LXNhbmNoZXotdmlhamUtY2hpbmExNF9ub3JtYWwud2VicA%3D%3DEspaña busca una "relación equilibrada" de la UE con China

Normalmente, para mejorar la IA es necesario aumentar el tamaño de los modelos durante el entrenamiento, lo que requiere mucho esfuerzo humano y potencia de cálculo. En cambio, DeepSeek ha creado un sistema con un 'juez' incorporado que evalúa las respuestas de la IA en tiempo real. Cuando se hace una pregunta, el juez compara la respuesta prevista de la IA con las reglas básicas de la IA y con lo que debería ser una buena respuesta. Si la respuesta es similar, la IA recibe una respuesta positiva que le ayuda a mejorar.

DeepSeek denomina a este sistema de mejora automática DeepSeek-GRM. Los investigadores afirman que esto ayudará a que los modelos funcionen mejor que los de competidores como Gemini de Google, Llama de Meta y GPT-4o de OpenAI. DeepSeek tiene previsto ofrecer estos modelos avanzados de inteligencia artificial como software de código abierto, pero no ha dado plazos.

La publicación del documento se produce cuando se rumorea que DeepSeek está a punto de desvelar su último chatbot R2. La empresa no ha hecho ningún comentario público al respecto.

Con información de Euronews

Más noticias
Destacadas

Recibí información en tu mail