¿Cómo compite la startup china de IA DeepSeek con OpenAI y Google?

El día después de Navidad Una pequeña startup china llamada DeepSeek ha lanzado un nuevo sistema de inteligencia artificial que puede igualar las capacidades de los chatbots de última generación de empresas como OpenAI y Google. Eso por sí solo es un gran paso adelante. Pero el equipo detrás del sistema, llamado DeepSeek-V3, describe un paso adelante aún mayor. En un artículo de investigación que describe cómo crearon la tecnología, los ingenieros de DeepSeek dijeron que utilizaron sólo una fracción de los chips informáticos altamente especializados que las principales empresas de IA utilizan para entrenar sus sistemas. Los chips están en el centro de una tensa competencia tecnológica entre Estados Unidos y China, como dice el gobierno estadounidense. Trabajando para mantener el liderazgo del país en la carrera global de IA, también está tratando de limitar la cantidad de chips potentes. Como los fabricados por la empresa Nvidia de Silicon Valley. Se puede vender a China y otros competidores, pero el desempeño del modelo DeepSeek plantea dudas sobre las consecuencias no deseadas de las restricciones comerciales del gobierno estadounidense. Estos controles han obligado a los investigadores en China a ser creativos con una variedad de herramientas disponibles gratuitamente en Internet. y programar sus propias computadoras para que sean tan capaces como cualquier otra cosa en el mercado. Las pruebas de referencia utilizadas por las empresas estadounidenses de IA se crearon a bajo precio y desafían la idea existente de que Sólo las empresas más grandes de la industria tecnológica Todos los cuales tienen su sede en los Estados Unidos. Sólo se pueden crear los sistemas de IA más avanzados. Los ingenieros chinos dicen que sólo necesitan unos 6 millones de dólares en potencia informática bruta para construir el nuevo sistema. Eso es aproximadamente 10 veces menos que el gigante tecnológico Meta, que está construyendo la última tecnología de inteligencia artificial. «El número de empresas con 6 millones de dólares es mayor que el número de empresas con 100 millones o mil millones de dólares para gastar», dice Chris V Nicholson, inversor de. Firma de capital riesgo centrada en IA Page One Ventures Desde que OpenAI desató el auge de la IA en 2022 con el lanzamiento de ChatGPT, muchos expertos e inversores han llegado a la conclusión de que ninguna otra empresa puede competir. con los líderes del mercado sin gastar cientos de millones de dólares en chips especializados. Las principales empresas de inteligencia artificial del mundo entrenan chatbots utilizando 16.000 o más supercomputadoras basadas en chips. A su vez, los ingenieros de DeepSeek dijeron que solo necesitan alrededor de 2.000 chips de computadora especializados de Nvidia. en China han dificultado a los ingenieros de DeepSeek «entrenar el chip de manera más eficiente». seguir siendo competitivos”, dijo Jeffrey Ding, profesor asistente de la Universidad George Washington que se especializa en tecnología emergente y relaciones internacionales. a principios del mes pasado La administración Biden ha emitido nuevas reglas destinadas a impedir que China obtenga chips de inteligencia artificial avanzados a través de otros países. Las reglas se basan en varias rondas de restricciones anteriores. Esto impide que las empresas chinas compren o produzcan chips informáticos de última generación. El presidente Trump aún no ha indicado si seguirá la norma o la derogará. El gobierno estadounidense está tratando de evitar que los chips avanzados caigan en manos de empresas chinas. debido a la preocupación de que los chips puedan usarse con fines militares en respuesta Algunas empresas de China han estado acumulando miles de chips. mientras que otras empresas Obtenido de un próspero mercado clandestino de contrabandistas. Dirigida por una empresa comercial cuantitativa llamada High Flyer, en 2021 la empresa había aumentado sus ganancias comprando miles de chips Nvidia, que se utilizaron para entrenar modelos anteriores. empresa, que no respondió a una solicitud de comentarios. China se ha hecho conocida por reclutar talentos emergentes de las mejores universidades con la promesa de altos salarios. y la capacidad de abordar las preguntas de investigación que más les interesen. Los ingenieros que trabajaron en versiones anteriores de DeepSeek dijeron que la compañía también contrató a personas sin experiencia en informática para ayudar a la tecnología a comprender y crear poemas y preguntas inteligentes sobre los notoriamente populares exámenes de ingreso a la universidad en China. DeepSeek no ha creado ningún producto para los consumidores. dejando ingenieros Centrarse plenamente en la investigación Eso significa que la tecnología no está limitada por las regulaciones de IA más estrictas de China. Esto requiere que la tecnología orientada al consumidor cumpla con los controles de datos gubernamentales. Las principales empresas estadounidenses siguen estando a la vanguardia de la IA. En diciembre, OpenAI lanzó un nuevo sistema de “razonamiento” llamado O3 que supera el rendimiento de las tecnologías existentes. Si bien aún no está muy extendido fuera de la empresa, DeepSeek sigue demostrando que no se queda atrás. Este mes publicó su propio modelo de razonamiento impresionante (The New York Times demandó a OpenAI y a Microsoft, que es un aliado). (Microsoft los ha acusado de infracción de derechos de autor de contenido de noticias relacionado con su sistema de inteligencia artificial. OpenAI y Microsoft han negado esas afirmaciones). Una parte importante de este mercado global que cambia rápidamente es una vieja idea: el software de código abierto. Como muchas otras empresas, DeepSeek utiliza los últimos sistemas de inteligencia artificial de código abierto. Esto significa que la empresa comparte el código subyacente con otras empresas e investigadores. Esto permite que otros creen y distribuyan sus propios productos utilizando la misma tecnología. Mientras tanto, los empleados de las grandes empresas tecnológicas chinas no pueden trabajar con sus pares. “Si trabajas en código abierto Trabajará con gente talentosa de todo el mundo”, afirmó Yineng Zhang, ingeniero jefe de software de Baseten en San Francisco. Trabajando en el proyecto de código abierto SGLang, ayuda a otras personas y empresas. La creación de productos utilizando el sistema de DeepSeek, un ecosistema de código abierto para IA, adoptó Steam en 2023, cuando Meta compartió libremente un sistema de IA llamado LLama. Muchos pensaron que la comunidad solo prosperaría si empresas como Meta, un gigante tecnológico, lo lanzaran con grandes cantidades de datos. centros llenos de chips especializados DeepSeek y otros han continuado con el código abierto de su tecnología, pero DeepSeek y otros han demostrado que también pueden ampliar el poder de la tecnología de código abierto”. Muchos ejecutivos y expertos sostienen que las principales empresas estadounidenses no deberían abrir el código fuente de su tecnología. Debido a que podría usarse para difundir desinformación o causar otros problemas graves, podría ser peligroso. Algunos estados han explorado la posibilidad de prevenir o regular la práctica, pero otros argumentan que si los reguladores obstaculizan el progreso de la tecnología de código abierto en los Estados Unidos. China tendrá una ventaja significativa. Si la mejor tecnología de código abierto viene de China Sostienen que los desarrolladores estadounidenses construirá sus sistemas sobre esas tecnologías. A largo plazo, esto podría colocar a China en el centro de la investigación y el desarrollo de la IA. «El centro de la comunidad de código abierto se ha trasladado a China», dijo Ion Stoica, profesor de informática. La Universidad de California en Berkeley “Esto podría ser muy peligroso para Estados Unidos”, porque permitiría a China acelerar el desarrollo de nuevas tecnologías, horas después de la inauguración. El presidente Trump rescindió la orden ejecutiva de Biden que amenazaba con regular la tecnología de código abierto. El Dr. Stoica y sus estudiantes construyeron recientemente un sistema de inteligencia artificial llamado Sky-T1 que igualó el rendimiento de un sistema OpenAI reciente llamado OpenAI o1 en pruebas comparativas. Requieren sólo 450 dólares en potencia de procesamiento. Lo hacen mediante la creación de dos tecnologías de código abierto lanzadas por el gigante tecnológico chino Alibaba. No es tan poderoso como la tecnología de OpenAI o el nuevo sistema de DeepSeek, y es poco probable que las técnicas que utilizan produzcan un sistema que supere el rendimiento de las tecnologías líderes. Pero este proyecto demuestra que incluso operaciones con recursos mínimos pueden crear sistemas competitivos. Reuven Cohen, un consultor de tecnología en Toronto, ha estado utilizando DeepSeek-V3 desde finales de diciembre. Dice que es comparable a los sistemas recientes de OpenAI, Google y la startup Anthropic, con sede en San Francisco. Y es mucho más barato de usar. «DeepSeek es una forma de ahorrar dinero», dijo. «Es el tipo de tecnología que la gente como yo quiere usar».