活水模型(42model)新品发布会成功举办
2026 年 6 月 27 日下午,活水模型(42model)新品发布会在北京东三环成功举办、线上线下同步。活水 AI 实验室正式发布「活水模型——你的 AI 模型引擎」:一款面向知识工作者、本地运行、私密优先、越用越懂你的本地 AI 大模型推理引擎。
2026 年 6 月 27 日下午 2 点至 5 点,活水模型(42model)新品发布会在北京东三环成功举办,线上线下同步。会上,活水 AI 实验室(42ailab)正式发布 活水模型(42model)——你的 AI 模型引擎。这是继 42md(AI 知识快刀)、42plugin(AI 插件管家)、42cc(AI 配置助手)之后推出的又一款新产品,定位为一款面向知识工作者的本地 AI 大模型推理引擎,主打本地运行、私密优先、越用越懂你。
时代背景
从 2023 到 2026,消费级电脑本地已能运行生产力级别的大模型——相当于 2023 年 GPT-4 以上的能力,而当年这需要多张 GPU 才能部署。这一变化源于三大力量的协同:硬件厂商改善本地算力(如 Apple 统一内存架构、NVIDIA DGX Spark),大模型团队提供开源底座(Gemma、GPT、Mistral、DeepSeek、Qwen、ChatGLM 等),以及开源社区在端侧推理、量化格式、动态量化、多 Token 预测、蒸馏、分片流式等方向的持续贡献。
本地大模型的能力已远超 2023 年的 GPT-4,可用性不断提升。但从「可用」到「好用」,仍有一系列工程问题待解:如何甄选优质模型、如何简单上手、如何持续稳定运行,以及尤为关键的——如何形成一个用户自己拥有知识产权的模型。活水模型正是围绕这些问题给出的一套新解法。
产品定位与四大特点
活水模型面向以知识工作者为代表的广泛人群,聚焦「一个更好的本地 AI 大模型推理引擎」,其特点可概括为四个「更」。
更傻瓜:一个引擎,支持多种模型架构
活水模型以单一引擎同时支持翻译、转录、OCR、对话、检索、编程等多种模型架构,未来还将纳入更多。界面极简,引擎以单端口常驻方式(默认 11520)安静运行于本地。
更友好:以「能力」为入口
开源社区模型数量庞大且持续更新,普通用户难以判断某一领域当前更优的模型。活水模型在「模型」之上新增「能力」入口,用户只需知道要做什么(翻译、转录、OCR、编程等),引擎会依据后端自动评测体系按硬件推荐合适的模型。产品将机型分为入门(约 8G 内存)、主力(约 16G)、高配(24G / 48G / 128G)三档,各配一款精选模型并定期更新。
更快速:自研量化与 Rust 引擎
活水模型以 Rust 构建推理引擎,在内存占用与性能上具备优势;并结合精选的量化方案压缩模型体积,实现更小的文件与更快的速度。
更懂你:极简自助微调
活水模型提供桌面端自助微调:用户选择微调方案(食谱)、按格式准备数据,系统在上传前自动校验格式与数据量(如方案要求至少 30 条,不足会提示补足),随后在云端炼制、进度实时可见,完成后回传本地。由此,用户可获得一个携带自身数据、知识产权清晰的专属模型。该功能具备四大特色:云端算力支持、严格的许可证审查与清晰的商用许可、一次微调多次复用,以及借助云端模型生成合成数据。
独特价值
- 零 token 费用:智能翻译、转录、OCR、对话、检索、编程等本地能力均免费使用。
- 高隐私保护:数据全程不出本机,尤其适合政府、军队等高保密场景,以及医疗、法律等合规行业与航天、航海等离线需求。
- 低延迟体验:基于公开的向量检索研究成果,产品可对本地文件实现毫秒级语义检索,且索引文件体积极小——数百篇文档的索引通常仅约 800 KB,建索引为秒级、检索为毫秒级。
定价
活水模型的本地推理能力免费,云端微调能力收费,定价方案如下:
- Free(¥0):免费使用全部本地能力。
- Pro(¥199/年):每月约 1 小时云端算力(A10 级 GPU),支持云端微调与基础食谱。
- Pro+(¥499/年):每月 3 小时云端算力,支持高级食谱与优先炼制。
- 加油包(¥42/算力):按需补充云端算力,多退少补。
据介绍,每月 1 小时云端算力通常足以微调一个中等规模的模型。付费用户还可比免费用户提前 42 小时下载新模型与高级食谱。
上线现状
发布当日,活水模型已上线 40 余款精选模型,支持六类能力(涵盖十余种模型架构),精选自国内外优秀的模型团队。
活水 AI 实验室强调本地大模型、开源大模型、本地推理与数据主权,为知识工作者提供一条不一样的本地 AI 路径。欢迎下载桌面版体验。