Portada » Lanzan nuevo modelo de DeepSeek y estas son las características que superan a la versión anterior

Lanzan nuevo modelo de DeepSeek y estas son las características que superan a la versión anterior

Las inteligencias artificiales, además de ser el tema del momento, parecen una cuestión inagotable por el amplio impacto que tienen sobre la economía mundial, el enfrentamiento tecnológico entre China y Estados Unidos, los efectos ambientales y en el uso diario que se instaló rápidamente en las áreas laborales y educativas de las poblaciones. Y, además, no dejan de salir actualizaciones que prometen superar las anteriores. Esto es lo que está pasando con DeepSeek ahora mismo.

Capacidades superiores. DeepSeek es una startup china que desarrolló una IA del mismo nombre, cuyo lanzamiento provocó un gran alboroto en la industria por tener un código de acceso abierto, superar varias de las capacidades de ChatGPT y por su bajo costo. Además, utiliza una técnica de aprendizaje por refuerzo para entrenar a su sistema de razonamiento R1.

Ahora el mundo está conociendo a DeepSeek-V3-0324, un modelo optimizado del fundador y que se publicó en la plataforma de IA de código abierto Hugging Face recientemente. Este nuevo modelo cuenta con 685.000 millones de parámetros y trae licencia MIT, que permite el uso, modificación y redistribución del software sin restricciones comerciales. Esta es el tipo de licencia más frecuente en GitHub.

Las novedades del nuevo modelo. Entre sus especialidades, los usuarios destacan su precisión en matemáticas, su capacidad para generar código funcional a gran escala y su asistente de escritura en chino (con funciones como «reescritura interactiva»).

Si de puntuación hablamos, el V3 alcanzó 59,4 puntos en la American Invitational Mathematics Examination (AIME), lo que supera los 39,6 alcanzados por la versión anterior. Respecto a pruebas de programación, en LiveCodeBench logró una mejora de 10 puntos, alcanzando 49,2.

Por otra parte, es capaz de generar más de 800 líneas de código sin errores y más de 20 tokens por segundo, gracias a un incomparable sistema de cuantificación de 4 bits, que reduce el tamaño del modelo de 641 GB a 352 GB en disco. En fin, que todos esperan que el V3 sea el allanamiento del camino para un eventual R2. ¿Será así o a DeepSeek se le adelantará alguna otra IA?

Fuente: Xataka.com.ar

Share this content:

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *