La start-up chinoise DeepSeek a annoncé vendredi le lancement très attendu d’un nouveau modèle d’intelligence artificielle (IA), présenté comme très économique et comme l’un des plus performants du monde, un tournant selon des experts. La course à l’IA a intensifié la rivalité entre la Chine et les Etats-Unis. Alors que le lancement du nouveau modèle de DeepSeek était attendu incessamment, la Maison-Blanche a accusé jeudi des entités chinoises de mener un effort massif pour voler des technologies d’intelligence artificielle américaines. Pékin a rejeté des accusations « infondées ».
En janvier 2025, DeepSeek avait stupéfié le monde et rebattu les cartes de l’IA avec la sortie d’un agent conversationnel rivalisant, à moindre coût, avec ses concurrents américains Gemini (de Google), ChatGPT (d’OpenAI) ou Claude (d’Anthropic). L’industrie mondiale de la tech guettait depuis plusieurs semaines l’annonce de vendredi, baromètre des ambitions chinoises dans le secteur. « Aujourd’hui, la pré-version de notre toute nouvelle série de modèles, DeepSeek-V4, est officiellement mise en ligne et publiée en open source », a indiqué la compagnie dans un communiqué. L’une des principales nouveautés réside dans les capacités de traitement: « DeepSeek-V4 dispose d’un contexte ultra-long », a indiqué la compagnie. Cette nouvelle version prend ainsi en charge une longueur de contexte d’un million de « tokens », de petites unités lexicales, généralement un mot, un bout de mot ou un signe de ponctuation. Cette performance la place au niveau de Gemini. La longueur de « contexte » détermine la quantité d’informations qu’un modèle peut assimiler pour l’aider à accomplir des tâches. Exemple concret : en lui donnant des centaines de pages de texte, l’équivalent de plusieurs romans, DeepSeek-V4 serait capable de répondre à des questions précises sur l’ensemble sans rien oublier entre le début et la fin.
« Evénement majeur »
Cette capacité est d’ordinaire fortement gourmande en calculs mais DeepSeek assure avoir rendu le procédé plus rapide et moins cher. Les capacités de long contexte du nouveau modèle sont « parmi les meilleures au monde », a affirmé vendredi DeepSeek. « Bienvenue dans l’ère du contexte d’un million (de tokens) à moindre coût », a-t-elle souligné sur le réseau social X. Ce nouveau modèle est proposé en deux versions: DeepSeek-V4-Pro et DeepSeek-V4-Flash, plus économique. La dernière avancée de la start-up chinoise représente un « événement majeur », estime Max Liu, expert reconnu du secteur de l’IA. Selon lui, si le nouveau modèle de la start-up chinoise atteint réellement les performances des meilleurs modèles occidentaux, ce sera « tout aussi fracassant que la sortie initiale de DeepSeek » début 2025. « Cela permettra de proposer de meilleurs modèles aux utilisateurs chinois, et on peut désormais s’attendre à beaucoup de choses: davantage de produits, un marché plus concurrentiel et un taux d’adoption de l’IA plus élevé », dit M. Liu. En janvier 2025, l’agent conversationnel R1 de DeepSeek, doté d’une capacité de raisonnement hors norme, avait fait trembler Wall Street, provoquant une chute des valeurs technologiques américaines.
« Totalement infondées »
Présenté comme multimodal, c’est-à-dire capable de générer textes, images et vidéos, DeepSeek-V4 a le potentiel de secouer à nouveau les titres de ses rivaux américains, selon des experts du secteur. La société américaine OpenAI, propriétaire de ChatGPT, a dévoilé jeudi son propre nouveau modèle d’IA, qui se veut le plus avancé du marché. GPT-5.5 est la nouvelle génération du modèle sur lequel est construit ChatGPT, interface d’IA générative désormais utilisée par près d’un milliard de personnes. L’annonce de DeepSeek vendredi marque « un véritable point d’inflexion », estime Zhang Yi, fondateur du cabinet iiMedia. « Si la prise en charge des contextes ultra-longs devient une fonctionnalité standard, le traitement des longs textes ne devrait plus rester cantonné aux grands laboratoires de recherche, mais entrer dans le quotidien des applications commerciales grand public », prédit-il.
L’IA, jugée cruciale pour l’économie du futur, est source d’intense rivalité entre Pékin et Washington. Dans ce contexte, la Maison Blanche a accusé jeudi des entités chinoises, sans mentionner DeepSeek, de mener des campagnes « à l’échelle industrielle » pour copier clandestinement les modèles d’intelligence artificielle américains. Des allégations « totalement infondées » qui « constituent une campagne de diffamation calomnieuse à l’encontre des réussites de l’industrie chinoise de l’intelligence artificielle », a réagi Guo Jiakun, un porte-parole de la diplomatie chinoise.
Source:
www.cbnews.fr





