雷军:MiMo-V2-Pro上线后 遭到全世界开发者的广泛存眷 【CNMO科技动静】3月29日,小米开办人雷军发文称:“MiMo-V2-Pro上线后,遭到全世界开发者的广泛存眷,Agent能力备受好评。感激开发者撑持,咱们将首周限免勾当延伸到4月2日。各人养龙虾的时辰可以尝尝”。MiMo-V2-Pro如下是部门开发者的评价:“MiMo-V2-Pro的Agent能力比拟MiMo-V2-Flash晋升重要表现于面向一样平常使命场景,好比 【CNMO科技动静】3月27日,小米官方发文称,自研年夜模子XiaomiMiMo-V2-Pro于OpenRouter平台最新周榜中位列第一,成为该平台首个周Token耗损量跨越3万亿的模子,模子利用市占率跨越30%。据小米技能官方先容,MiMo-V2-Pro是一款面向Agent时代需求的旗舰基座模子,总参数达万亿范围,采用混淆专家(MoE)架构,激活参数为420亿, 【CNMO科技动静】3月19日,小米集团开创人雷军经由过程社交媒体公布,公司旗下的年夜模子MiMo-V2-Pro于全世界最年夜的年夜模子API聚合平台OpenRouter上,前后登顶日榜与周榜榜首。小米MiMo-V2-Pro据CNMO相识,此前,一款代号为“HunterAlpha”的匿名模子已经于OpenRouter上激发广泛存眷,其挪用量一起走高,累计已经冲破1万亿tokens,后证明 【CNMO科技动静】12月16日,CNMO留意到,小米MiMo官方公布:MiMo-V2-Flash的总参数为309B,活跃参数为15B。于架构设计上,小米MiMo-V2-Flash采用了混淆留意力机制。其混淆模块设计包罗8个混淆块,此中每一5个滑动窗口留意力(SWA)层对于应1个全局留意力层。于上下文撑持能力上,该模子原生撑持32K的练习,而且可以或许扩大到256K的