Message de Gate News, 27 avril — DeepSeek a annoncé une réduction de 75 % sur son nouveau modèle V4-Pro pour les développeurs et a réduit les prix des caches de requêtes d’entrée sur l’ensemble de sa gamme d’API à un dixième des niveaux précédents.
Le modèle V4, publié le 25 avril en versions Pro et Flash, a été optimisé pour les processeurs Ascend de Huawei. DeepSeek a déclaré que V4-Pro surpasse les autres modèles open source sur des benchmarks de connaissances mondiales et se classe deuxième seulement derrière Gemini-Pro-3.1, le modèle propriétaire de Google. La famille V4 est conçue spécifiquement pour les agents IA qui gèrent des tâches complexes au-delà des capacités d’un chatbot.
Les coûts de l’API V4-Pro sont déjà inférieurs à ceux des principaux concurrents occidentaux : 3,48 $ pour un million de tokens de sortie, contre $30 pour GPT-4.5 d’OpenAI. La tarification V4-Flash s’élève à 0,14 $ par million de tokens d’entrée et à 0,28 $ par million de tokens de sortie, ce qui pourrait permettre des applications rentables telles que l’examen de l’ensemble d’une base de code ou de documents réglementaires en une seule requête.
Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'
avertissement.
Articles similaires
Améliorer la productivité avec l’IA ou réduire les coûts ? Une efficacité multipliée par cent n’a pas entraîné des revenus multipliés par cent, mais personne en Silicon Valley n’ose dire stop.
五源資本合伙人孟醒,近日发表一份关于硅谷考察的报告,提出了一个连他自己都让改变记笔记习惯的判断:硅谷正在进入一个连造浪的人都被浪淹没的阶段。AI 的迭代速度已经从“按月”变成“按週”,连硅谷自己都跟不上自己。
当 AI 把一个团队的生产力放大五倍,你可以减少八成人力以维持原本产出,也可以保持人數做五倍的事。孟醒这次在硅谷的观察,等于是现场给出了答案的初稿:当 100 倍效率没有换来 100 倍营收,当 token 预算逼近人力成本,当蒸汽机还跑不过马车却没人敢停下,硅谷现在选的是“先把速度冲上去再说”。但这条路最终会走到“扩张能力”还是“压缩成本”,目前没有定论。
YC 从领先指标变成落后指标
孟醒今年
ChainNewsAbmediaIl y a 34m
Les partenaires de YC expliquent comment utiliser l’IA pour créer une entreprise de zéro ; les startups devraient considérer l’IA comme un système d’exploitation plutôt que comme un outil
L’impact de l’IA sur les jeunes pousses ne consiste plus seulement à permettre aux ingénieurs de coder plus vite, à automatiser des processus de service client, ou à ajouter un Copilot à un produit existant. Récemment, l’associée de YC, Diana, a souligné que le véritable changement réside dans le fait que l’IA est en train de réécrire « la façon dont une entreprise devrait être créée à partir de zéro ». Pour les fondateurs en phase initiale, l’IA ne devrait pas être uniquement un outil d’efficacité utilisé de temps en temps par l’entreprise : elle devrait être conçue dès le premier jour pour devenir le système d’exploitation de toute la société.
La perspective de la productivité est déjà dépassée ; l’IA est en train de réécrire le point de départ de la conception d’une entreprise
Diana estime qu’aujourd’hui, lorsque le marché parle d’IA, il s’attarde encore trop souvent sur le cadre de « l’amélioration de la productivité », par exemple : les ingénieurs peuvent écrire du code plus rapidement, l’équipe peut automatiser davantage de processus, l’entreprise peut déployer plus de fonctionnalités. Mais cette approche sous-estime en réalité le changement structurel que l’IA apporte. Elle indique que la bonne combinaison de personnes et d’IA 工
ChainNewsAbmediaIl y a 44m
L’agent Cursor AI a fait une erreur critique ! En une seule ligne de code, 9 secondes pour vider la base de données de l’entreprise, les contrôles de sécurité deviennent de vaines paroles.
Le fondateur de PocketOS, Jer Crane, a indiqué que l’agent d’IA Cursor exécutait lui-même une maintenance dans l’environnement de test, abusant d’un token API ajouté/retiré pour un domaine réseau personnalisé, afin d’envoyer une instruction de suppression à l’API GraphQL de Railway. En 9 secondes, les données et l’instantané de la même zone ont été entièrement détruits, et la restauration la plus récente possible ramène à trois mois en arrière. L’agent reconnaît avoir enfreint des règles d’opérations irréversibles, ne pas avoir lu les documents techniques, ne pas avoir vérifié l’isolation de l’environnement, etc. Les victimes sont des clients du secteur de la location de voitures : les réservations et toutes les données ont disparu, et l’ingénierie de rapprochement a pris beaucoup de temps. Crane propose cinq réformes : confirmation manuelle, autorisations d’API à granularité fine, séparation des sauvegardes et des données principales, publication d’un SLA, et mécanismes de contrainte au niveau inférieur.
ChainNewsAbmediaIl y a 46m
DeepSeek V4 Pro sur Ollama Cloud : connectez Claude Code en un clic
Selon les tweets d’Ollama, DeepSeek V4 Pro a été publié le 24/04, et est désormais intégré au répertoire d’Ollama en mode cloud. Une seule commande suffit pour appeler des outils tels que Claude Code, Hermes, OpenClaw, OpenCode, Codex, etc. V4 Pro : 1,6T paramètres, 1M context, Mixture-of-Experts ; l’inférence via le cloud ne télécharge pas les poids sur votre appareil local. Pour l’utiliser localement, il faut récupérer les poids et les exécuter avec INT4/GGUF et plusieurs GPU. Les tests de vitesse initiaux ont été influencés par la charge du cloud : le débit normal est d’environ 30 tok/s, le pic à 1,1 tok/s. Il est recommandé de l’utiliser d’abord via le prototype cloud ; pour la production en série, effectuez ensuite votre propre inférence ou utilisez une API commerciale.
ChainNewsAbmediaIl y a 1h
Coachella se tourne vers l’IA DeepMind de Google pour réimaginer les concerts au-delà de la scène
Coachella s’est associé à Google DeepMind pour tester de nouveaux outils d’IA qui transforment la manière dont les performances de musique live sont créées et vécues.
Résumé
Coachella a testé des outils d’IA avec Google DeepMind pour transformer les performances live en environnements numériques interactifs.
Trois prototypes ont été construits,
CryptonewsIl y a 1h