Kimi K3 de Moonshot AI prévu pour un lancement au T3 2026 avec 2,5T+ de paramètres et un contexte de 1 million de jetons lors des tests

Message de Gate News, 27 avril — Moonshot AI prévoit de lancer Kimi K3 au T3 2026 (juillet-septembre), selon des informations. Le modèle comportera plus de 2.5T de paramètres, et des tests internes révèlent des capacités de fenêtre de contexte dépassant 1 million de jetons.

Cependant, la question de savoir si le contexte de 1M sera disponible dans la version publique reste incertaine. Les principales contraintes limitant le déploiement du contexte de 1M sont les ressources de calcul plutôt que la capacité technique, indiquent des sources. La version publique actuelle de Kimi, K2.6, conserve une fenêtre de contexte de 256K.

Le développement intervient alors que DeepSeek V4 a déjà positionné le contexte de 1M comme une offre publique, relevant ainsi le niveau des capacités de long contexte dans les modèles à poids ouverts. Si Kimi K3 apporte le contexte de 1M à sa version publique, Moonshot se alignerait sur DeepSeek V4 à la fois en termes d’échelle du modèle et de performance en long contexte.

Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'avertissement.

Articles similaires

OpenAI et AWS pour accueillir un événement client le 28 avril

Message de Gate News, 27 avril — Les dirigeants d’(AWS) d’OpenAI et d’Amazon Web Services accueilleront un événement client demain, 28 avril, selon The Information. OpenAI a déclaré qu’il peut désormais fournir l’ensemble de ses produits aux clients de tout fournisseur de services cloud

GateNewsIl y a 2m

Microsoft cesse de verser un partage des revenus à OpenAI et sécurise des droits de licence jusqu’en 2032

Message de Gate News, 27 avril — Microsoft ne versera plus de partage des revenus à OpenAI, d’après des rapports de marché. La société continuera de détenir une licence portant sur la propriété intellectuelle d’OpenAI jusqu’en 2032. La licence OpenAI que Microsoft a obtenue a été convertie d’exclusive à non exclusive, marquant un changement dans les conditions commerciales du partenariat.

GateNewsIl y a 10m

Google DeepMind rejoint le K-Moonshot sud-coréen pour relever des défis scientifiques avec l’IA

Google DeepMind a conclu un partenariat avec la Corée du Sud afin de fournir l’infrastructure technique à l’initiative K-Moonshot du pays, un ambitieux programme national conçu pour résoudre les défis scientifiques les plus complexes du siècle grâce à l’IA. Résumé Google DeepMind s’associe avec Sout

CryptonewsIl y a 1h

Gate organise une table ronde Space sur le trading avec l’IA le 28 avril : explorer l’IA comme moteur du prochain cycle Web3

Message d’actualités Gate, 27 avril — Gate organisera une table ronde en direct sur Space consacrée au Trading avec l’IA le 28 avril à 20h, réunissant des experts du secteur pour explorer si l’intégration approfondie de l’IA dans les flux de travail de trading marque le véritable point de départ du prochain cycle Web3. La discussion examinera A

GateNewsIl y a 1h

Mac Studio : tests en conditions réelles de modèles à grande échelle : attente pour M3 Ultra, solutions en cluster et M5 Ultra

En avril 2026, des modèles de niveau 1 兆 paramètre, tels que DeepSeek V4 Pro, Kimi K2.6, etc., ont été publiés les uns après les autres, rendant l’idée de « faire tourner un LLM open-source de pointe sur sa propre machine » une option viable. Pour les ingénieurs et les petites équipes qui ne veulent pas construire une station de travail H100, mais qui souhaitent disposer de capacités complètes d’inférence locale, \\Mac Studio M3 Ultra 256GB\\ est, à ce stade, la solution mono-machine la plus rentable, avec, en complément, un cluster via Thunderbolt 5 permettant d’aller jusqu’à des domaines de 1T paramètres. Cet article regroupe des données d’expérimentation sur l’exécution de modèles à grande échelle avec le M3 Ultra, des solutions de cluster, les avantages du framework MLX, ainsi que le calendrier prévu pour le M5 Ultra. État actuel des spécifications du M3 Ultra : mémoire unifiée de 256GB, 819

ChainNewsAbmediaIl y a 2h

Musk poursuit OpenAI, Microsoft pour un changement de mission à but non lucratif

La sélection du jury doit commencer dans le cadre du procès de 2024 intenté par Elon Musk contre OpenAI, Sam Altman, Greg Brockman et Microsoft, les accusant d’avoir trahi la mission à but non lucratif d’OpenAI en créant une entité à but lucratif en 2019, selon Reuters. Musk réclame $150 billion de dollars US de dommages et intérêts pour OpenAI's

CryptoFrontierIl y a 2h
Commentaire
0/400
Aucun commentaire