DeepSeek es un laboratorio de IA chino que causó una gran disrupción en la industria a principios de 2025 cuando lanzó modelos que rivalizan con la calidad de GPT-4 a una fracción del costo — y los hizo de código abierto. Los modelos DeepSeek R1 y V3 están disponibles completamente gratis a través de la interfaz web en chat.deepseek.com sin límites de uso, y los pesos del modelo se pueden descargar y ejecutar localmente o con fines comerciales.
Los logros técnicos son notables: DeepSeek V3 se entrenó por un costo reportado de 6 millones de dólares — en comparación con cientos de millones para modelos comparables de OpenAI — utilizando una novedosa arquitectura de mezcla de expertos que activa solo una fracción de los parámetros por consulta. En benchmarks estándar como MMLU, HumanEval y MATH, los modelos DeepSeek igualan o superan el rendimiento de GPT-4o, especialmente en matemáticas, programación y razonamiento lógico.
La principal preocupación es la privacidad de los datos. DeepSeek opera desde China y está sujeto a las leyes de datos chinas, lo que significa que las conversaciones pueden ser accesibles para las autoridades chinas. Para uso personal, investigación general o desarrollo de código abierto, esto suele ser aceptable. Para contenido empresarial sensible, código propietario o datos confidenciales, se recomiendan encarecidamente alternativas con sede en EE. UU. como Claude, GPT-4 o un modelo local autoalojado.
Dejar una reseña
Las reseñas se publican tras moderación. No compartimos tu email.