Avance tecnológico: DeepSeek potencia su modelo de IA con nuevas mejoras
El chatbot chino pretende mejorar su eficiencia ante los usuarios juzgando por sí mismo sus respuestas.
La 'startup' china de inteligencia artificial DeepSeek ha introducido una nueva forma de mejorar la capacidad de razonamiento de los grandes modelos lingüísticos (LLM) para ofrecer resultados mejores y más rápidos frente a sus competidores.
DeepSeek provocó un frenesí en enero cuando apareció en escena con R1, un modelo de inteligencia artificial (IA) con un chatbot que, según la empresa, era más barato y funcionaba tan bien como su principal rival, ChatGPT de OpenAI.
En colaboración con investigadores de la universidad china de Tsinghua, DeepSeek afirma en su último artículo publicado el pasado viernes que ha desarrollado una técnica para mejorar por sí misma los modelos de IA. La tecnología subyacente entrena a la IA para que desarrolle sus propias reglas para juzgar contenidos y luego las utilice para mejorar en sus respuestas.
Normalmente, para mejorar la IA es necesario aumentar el tamaño de los modelos durante el entrenamiento, lo que requiere mucho esfuerzo humano y potencia de cálculo. En cambio, DeepSeek ha creado un sistema con un 'juez' incorporado que evalúa las respuestas de la IA en tiempo real. Cuando se hace una pregunta, el juez compara la respuesta prevista de la IA con las reglas básicas de la IA y con lo que debería ser una buena respuesta. Si la respuesta es similar, la IA recibe una respuesta positiva que le ayuda a mejorar.
DeepSeek denomina a este sistema de mejora automática DeepSeek-GRM. Los investigadores afirman que esto ayudará a que los modelos funcionen mejor que los de competidores como Gemini de Google, Llama de Meta y GPT-4o de OpenAI. DeepSeek tiene previsto ofrecer estos modelos avanzados de inteligencia artificial como software de código abierto, pero no ha dado plazos.
La publicación del documento se produce cuando se rumorea que DeepSeek está a punto de desvelar su último chatbot R2. La empresa no ha hecho ningún comentario público al respecto.
Con información de Euronews
Te puede interesar
Investigación devela que los pumas comenzaron a cazar pingüinos en la Patagonia
Un estudio científico indicó que la creación de un parque nacional en la costa patagónica permitió la recuperación simultánea de grandes carnívoros y aves marinas, generando un singular caso de coevolución depredador-presa.
El cometa 3I/ATLAS se encuentra a menos de 48 horas de alcanzar su punto más cercano a la Tierra
no de los momentos más esperados por los científicos tendrá lugar el viernes 19 de diciembre, cuando el cometa 3I/ATLAS se ubique a 270 millones de kilómetros de la Tierra.
El día que Pokémon desató una epidemia en Japón
El 16 de diciembre de 1997, la emisión del capítulo 38 de Pokémon causó una crisis sanitaria sin precedentes en Japón al provocar ataques de epilepsia fotosensitiva en más de 700 niños.
Detectan 368 sismos glaciares bajo la Antártida Occidental
Un nuevo estudio científico publicado en ESS Open Archive detectó 368 terremotos glaciares ocultos bajo el hielo de la Antártida Occidental, principalmente cerca de los cruciales glaciares Thwaites y Pine Island.
Advierten que humo de incendios forestales podría alterar el clima
Un estudio de la Escuela de Ingeniería y Ciencias Aplicadas de Harvard revela que el humo de incendios forestales intensos que alcanza los 15 kilómetros de altura podría alterar el clima terrestre.
Argentina inicia pruebas preclínicas de una vacuna ARNm contra la gripe aviar H5N1
Sinergium Biotech comenzará los ensayos en laboratorio con apoyo de CEPI, la OMS y la OPS. El proyecto busca preparar a la región ante futuras pandemias y apunta a iniciar estudios en humanos en 2026.