活水模型（42model）新品发布会成功举办

2026 年 6 月 27 日下午 2 点至 5 点，活水模型（42model）新品发布会在北京东三环成功举办，线上线下同步。会上，活水 AI 实验室（42ailab）正式发布 活水模型（42model）——你的 AI 模型引擎。这是继 42md（AI 知识快刀）、42plugin（AI 插件管家）、42cc（AI 配置助手）之后推出的又一款新产品，定位为一款面向知识工作者的本地 AI 大模型推理引擎，主打本地运行、私密优先、越用越懂你。

时代背景

从 2023 到 2026，消费级电脑本地已能运行生产力级别的大模型——相当于 2023 年 GPT-4 以上的能力，而当年这需要多张 GPU 才能部署。这一变化源于三大力量的协同：硬件厂商改善本地算力（如 Apple 统一内存架构、NVIDIA DGX Spark），大模型团队提供开源底座（Gemma、GPT、Mistral、DeepSeek、Qwen、ChatGLM 等），以及开源社区在端侧推理、量化格式、动态量化、多 Token 预测、蒸馏、分片流式等方向的持续贡献。

本地大模型的能力已远超 2023 年的 GPT-4，可用性不断提升。但从「可用」到「好用」，仍有一系列工程问题待解：如何甄选优质模型、如何简单上手、如何持续稳定运行，以及尤为关键的——如何形成一个用户自己拥有知识产权的模型。活水模型正是围绕这些问题给出的一套新解法。

产品定位与四大特点

活水模型面向以知识工作者为代表的广泛人群，聚焦「一个更好的本地 AI 大模型推理引擎」，其特点可概括为四个「更」。

更傻瓜：一个引擎，支持多种模型架构

活水模型以单一引擎同时支持翻译、转录、OCR、对话、检索、编程等多种模型架构，未来还将纳入更多。界面极简，引擎以单端口常驻方式（默认 11520）安静运行于本地。

更友好：以「能力」为入口

开源社区模型数量庞大且持续更新，普通用户难以判断某一领域当前更优的模型。活水模型在「模型」之上新增「能力」入口，用户只需知道要做什么（翻译、转录、OCR、编程等），引擎会依据后端自动评测体系按硬件推荐合适的模型。产品将机型分为入门（约 8G 内存）、主力（约 16G）、高配（24G / 48G / 128G）三档，各配一款精选模型并定期更新。

更快速：自研量化与 Rust 引擎

活水模型以 Rust 构建推理引擎，在内存占用与性能上具备优势；并结合精选的量化方案压缩模型体积，实现更小的文件与更快的速度。

更懂你：极简自助微调

活水模型提供桌面端自助微调：用户选择微调方案（食谱）、按格式准备数据，系统在上传前自动校验格式与数据量（如方案要求至少 30 条，不足会提示补足），随后在云端炼制、进度实时可见，完成后回传本地。由此，用户可获得一个携带自身数据、知识产权清晰的专属模型。该功能具备四大特色：云端算力支持、严格的许可证审查与清晰的商用许可、一次微调多次复用，以及借助云端模型生成合成数据。

独特价值

零 token 费用：智能翻译、转录、OCR、对话、检索、编程等本地能力均免费使用。
高隐私保护：数据全程不出本机，尤其适合政府、军队等高保密场景，以及医疗、法律等合规行业与航天、航海等离线需求。
低延迟体验：基于公开的向量检索研究成果，产品可对本地文件实现毫秒级语义检索，且索引文件体积极小——数百篇文档的索引通常仅约 800 KB，建索引为秒级、检索为毫秒级。

定价

活水模型的本地推理能力免费，云端微调能力收费，定价方案如下：

Free（¥0）：免费使用全部本地能力。
Pro（¥199/年）：每月约 1 小时云端算力（A10 级 GPU），支持云端微调与基础食谱。
Pro+（¥499/年）：每月 3 小时云端算力，支持高级食谱与优先炼制。
加油包（¥42/算力）：按需补充云端算力，多退少补。

据介绍，每月 1 小时云端算力通常足以微调一个中等规模的模型。付费用户还可比免费用户提前 42 小时下载新模型与高级食谱。

上线现状

发布当日，活水模型已上线 40 余款精选模型，支持六类能力（涵盖十余种模型架构），精选自国内外优秀的模型团队。

活水 AI 实验室强调本地大模型、开源大模型、本地推理与数据主权，为知识工作者提供一条不一样的本地 AI 路径。欢迎下载桌面版体验。