











业务咨询
400-893-8989
行政总机
010-64303888
微信扫描二维码 立即在线咨询
官宣定档 | 6月19日,明略科技AdEff即将发布
2025-06-16

推荐阅读
Mac 能替代 GPU 服务器吗?Apple Silicon 量化推理正在改写规则
2026-05-15
2026 年春天,三件事同时发生:企业按 token 付费的 AI 推理总支出持续攀升,尤其在高频调用场景下账单增长显著;Apple M5 Pro/Ultra 搭载的 INT8 TensorOps 硬件单元首次被第三方开源 SDK 成功调用,迅速获得开发者社区关注;欧盟 AI Act 各条款陆续生效,“数据不出境”从企业 preferences 变成合规刚需。 这三个信号指向同一个问题:当云端 API 越来越贵、数据监管越来越严、本地芯片越来越强——Mac 能不能替代 GPU 服务器,成为 AI 推理的主力设备?答案是:可以,但需要一把钥匙。 Apple Silicon 的统一内存架构和 INT8 TensorOps 硬件,本就是为端侧推理而生的架构。但问题是,你的 Mac 芯片有大量算力被锁在保险箱里——MLX 原生只做权重量化,计算仍走 FP16 GEMM。明略科技(Mininglamp)开源的 Cider SDK 补上了这个缺口,通过 W8A8/W4A8 激活量化,让 Apple M5 的 INT8 算力满血释放,prefill 速度提升最高约 1.9×,内存降低约 40%,且精度几乎无损。
了解更多
关于防范不法分子冒用“明略科技”名义实施招聘诈骗的公众知悉函
2026-05-14
近期,我司(明略科技集团,以下简称“明略科技”或“我司”)发现,社会上频繁出现不法分子冒用“明略”及旗下子公司、关联公司名义,通过电话、邮件、短信等多种渠道,假借招聘、面试、录用等名义,要求求职者下载不明APP、点击不明链接、缴纳费用、提供个人敏感信息或进行其他可能产生信息泄露的操作,实施诈骗活动。此类行为已严重侵害我司商誉,并严重威胁广大求职者的财产安全与隐私安全。
了解更多
MLX 推理加速:一行代码释放 Mac 芯片被锁住的 INT8 算力
2026-05-13
MLX 原生只做权重量化,不支持激活量化——这意味着你的 Apple M5 芯片有大量 INT8 算力处于闲置状态。明略科技(Mininglamp)开源的 Cider SDK 补上了这个缺口。它不是独立框架,而是 MLX 的 W8A8 / W4A8 激活量化扩展,通过一行 convert_model() 调用即可将任意 MLX 模型的 prefill 速度提升 1.5×–1.86×,同时把内存占用降低约 40%,且精度几乎无损。 更重要的是,Cider 让端侧推理从“能用”变成“好用”——速度快(prefill 加速最高达 1.86×)、省 token(不调用云端 API,推理成本趋近于零)、隐私可控(所有输入在 Mac 本地完成推理,数据永不离开设备)。基于 custom primitives 构建,与 MLX 的 lazy evaluation 和 graph scheduling 无缝融合。MIT 协议开源,GitHub 地址:github.com/Mininglamp-AI/cider。
了解更多联系我们
关注明略
在线咨询
销售热线
400-893-8989
投资者关系
ir@mininglamp.com
媒体联络
pr@miningalmp.com
Copyright@2025 北京明略软件系统有限公司 京ICP备15016868号 京公网安备11010802024262
信息填写
