Liang Wenfeng, el fundador de DeepSeek, asitía a una sesión con presidente chino, Xi Jinping, la semana del 20 de enero. Ese día lanzó su plataforma de inteligencia artificial (IA) que conmocinó a Silicon Valley y Wall Street en Estados Unidos. Siempre fue un joven destacado.
Liang nació en 1985 en Guangdong (la antigua Cantón), al sureste de China y en la vecindad de Hong Kong. Creció en Zhanjiang, en esa provincia, una ciudad portuaria que comercia con el mundo desde hace siglos.
Hijo de un maestro de escuela, fue un excelente estudiante. Incluso, empezó a estudiar cálculo por su cuenta en secundaria. En 2006 se graduó de la Universidad de Zhejiang en ingeniería eléctrica con especialidad en visión de máquinas. No se quedó ahí.
LEA MÁS: Qué es DeepSeek, la plataforma china de inteligencia artificial que compite con ChatGPT
Al año siguiente inició un posgrado en ingeniería de información y comunicación, especializado en visión artificial y luego formó un equipo que empezó a acumular datos sobre mercados financieros.
Liang, además, estudió comercio cuantitativo y aprendizaje automático, escribió algoritmos de IA para seleccionar acciones y terminó su maestría en 2010. Su tesis: algoritmos de seguimiento de objetivos.
Con el título en la mano investigó aplicaciones de IA en diversos campos. Se trasladó a Chengdu, capital de la provincia de Sichan, en el centro de China. Aunque sus primeros intentos no fueron exitosos, la aplicación de la IA al campo financiero fue determinante.
En finanzas
En 2013 Liang fundó Jacobi, una empresa de inversiones que lleva el nombre del matemático alemán Carl Jacobi, uno de sus inspiradores.
Dos años después, junto con dos excompañeros de la Universidad de Zhejiang, creó un fondo de cobertura cuantitativo: High-Flyer. Ahí utilizó IA y matemáticas. Fue fue pionera en China en aplicar las nuevas técnicas para absorber grandes volúmenes de datos y detectar patrones significativos. Liang refinó los algoritmos para hacerlos más inteligentes al seleccionar las acciones e identificar riesgos.
Dormía en la oficina con sus colaboradores para apresurar los proyectos, sin importarle su ropa ni el peinado. Sus decisiones se basaban en fórmulas y cálculos. Le dio resultados.
High-Flyer llegó a gestionar $15.000 millones, convirtiéndose en el primer fondo en alcanzar ese volumen en China. En los últimos cinco años, al menos cinco fondos gestionados por High-Flyer obtuvieron retornos de más de 20% en promedio en comparación con los índices de referencia del mercado.
Aunque desde 2021 la cifra bajó a $8.000 millones, es aún uno de los fondos de cobertura cuantitativos más importantes de ese país, reportó The Wall Street Journal. Una mala interpretación del desempeño de algunos los sectores de la industria y las medidas drásticas del regulador afectaron a los fondos de cobertura en China y a High Flyer en particular. Pero Liang tenía la mira en otra parte.
Desde el inicio, la firma acumuló unidades de procesamiento gráfico (GPU, por sus siglas en inglés) y construyó supercomputadoras Fire-Flyer para el análisis de datos financieros. Además, creó una compañía con ese nombre dedicada a la investigación de IA, específicamente de aprendizaje profundo, y comenzó a construir un grupo de chips. Los recursos venían del negocio financiero.
Liang estaba atento, además, a las cada vez mayores restricciones de EE. UU. contra China. En 2021 asistió a la conferencia anual de Nvidia en San José, California. Saliendo de ahí, adquirió 10.000 GPU de alta gama de esa firma, que utilizó para entrenar sus modelos de lenguaje. Bajo la manga, tenía otros ases.
Directo al top
Liang y su equipo se obligaron a ser altamente eficientes y buscar alternativas a las restricciones estadounidenses.
Entre 2020 y 2021 invirtió otros 1.200 millones de yuanes para desarrollar la infraestructura de computación que necesitaba, incluyendo la compra de los GPU de Nvidia.
En octubre de 2022, Liang y su equipo —un grupo de expertos en optimizar el rendimiento de estos chips, según Financial Times— crearon métodos más eficientes para entrenar los modelos. El lanzamiento de ChatGPT ese año, lo empujó a otro paso.
Liang, a quien le encanta el fútbol, decidió invertir en una nueva empresa llamada DeepSeek y lanzar su propia plataforma de IA de bajo costo, alto rendimiento y código abierto.
Para él la clave es innovar y ser original (en lugar de imitar), posicionar a China como un contribuyente (no un seguidor), reducir las brechas tecnológicas, competir con fuerza y democratizar el acceso a la IA rompiendo el monopolio de las grandes firmas tecnológicas, según Bloomberg y otras fuentes.
“A menudo decimos que hay una brecha de uno o dos años entre la IA china y la estadounidense, pero la brecha real es entre la originalidad y la imitación”, señaló Liang en una entrevista con The China Academy.
Congruente con esa visión, contrató jóvenes ingenieros chinos, graduados de los últimos dos años de las universidades de Pekín y Tsinghua. Apostó, como otras firmas chinas de su generación, a priorizar el avance tecnológico a largo plazo y no apresurarse a la comercialización.
La firma se ubicó en el centro tecnológico de Hangzhou, la misma ciudad donde tiene su sede el gigante tecnológico Alibaba, cerca de la costa del Pacífico y de Shanghái.
Su producto, DeepSeek, costó menos de $6 millones, apenas un 4% de lo que se invirtió en ChatGPT y mucho menos de lo que consumió Claude, de Antropic, que se estima en hasta $1.000 millones.
Logró diseños técnicos que hacen que los modelos de DeepSeek sean más rentables, al necesitar menos recursos. Por ejemplo, para entrenar su modelo, requirió una décima parte de la potencia computacional del Llama 3.1 de Meta.
LiveBench, un servicio estadounidense independiente de evaluación de IA, ubicó a DeepSeek en junio de 2024 como la séptima plataforma por sus modelos matemáticos y de programación, sus tecnologías multimodales y el desarrollo del lenguaje natural. De segunda en matemáticas, sexta en codificación y quinta en razonamiento. El desempeño menos bueno fue en lenguaje y análisis de datos.
El momento clave fue el 20 de enero. Ese día, Liang estuvo en un panel de expertos sobre innovación en una sesión con el presidente chino Xi Jinping.
En paralelo lanzó la nueva versión de su DeepSeek-R1. Deslumbró a usuarios. Fue la app más descargada en Apple Store. Logró elogios del fundador de OpenAI y ChatGPT, Sam Altman, y otros inversores y líderes de firmas tecnológicas por su capacidad para resolver problemas y competirle al mismo ChatGPT, Gemini, Copilot y Claude. Llamó la atención de Donald Trump. Y conmocionó a la bolsa de Nueva York.
DeepSeek se convirtió en “un actor poco convencional”, según la revista Wired. A Liang, lo llaman el Sam Altman de China.