首页
安全
资讯
社区
AI
关于
登录
注册
投稿
扫码查看手机版
程序园首页
专栏
社区
赞助
代码教程
软件工具
程序源码
申请VIP
投稿
HOT
公众号矩阵
移动端
登录
/注册
首页
资讯
网络安全
人工智能
区块链
社区
程序园
广播
专栏
账号
自动登录
找回密码
密码
登录
立即注册
搜索
搜索
热搜
程序源码
软件工具
代码教程
网络安全
人工智能
区块链
资讯
本版
文章
帖子
用户
好友
收藏
道具
勋章
相册
分享
设置
我的收藏
退出
程序园
»
社区
›
原创专区
›
投稿
›
零成本养虾!谷歌 Gemma 4「本地部署」保姆级教程 ...
返回列表
零成本养虾!谷歌 Gemma 4「本地部署」保姆级教程
[复制链接]
作者:
admin
|
时间:
2026-4-7 03:10:04
|
阅读:73
|
显示全部楼层
马上注册,让你轻松玩转程序园
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
昨天聊了 Gemma 4,今天教你把它装进本地电脑里。
养龙虾终于不用花钱了。
谷歌最新的开源模型 Gemma 4,原生支持 function calling。装在你自己的电脑上,接入 OpenClaw,token 成本直接归零。
划重点,Gemma 4 是 Gemma 家族第一次用 Apache 2.0 协议开源。商用、魔改、二次分发,都没问题。再加上 Ollama 最近更新了大版本。Apple Silicon 上直接用苹果自家的 MLX 框架推理,速度翻倍。
三步搞定。Mac、Windows、Linux 都可以。
先看看你的电脑有多少内存。
Gemma 4 一共四个版本,下面都以 4-bit 量化为例。
最小的 E2B,23 亿参数,4-bit 量化后约 4 GB 内存。支持图片、音频输入,128K 上下文。手机和树莓派都能跑。
E4B,45 亿参数,约 5.5 GB。同样支持图片和音频,128K 上下文。适合日常聊天。
26B 是混合专家架构(MoE),总参数 252 亿,每次推理只激活 38 亿。4-bit 量化后占 16-18 GB 内存。256K 上下文,支持图片,不支持音频。速度接近小模型,质量接近满血版,性价比最高。24 GB 内存的 Mac 或 24 GB 显存的显卡就能带得动。
满血版 31B,307 亿参数全激活。17-20 GB 内存。256K 上下文。Arena AI 开源排行榜第三,AIME 2026 数学推理 89.2%,编程 LiveCodeBench 80.0%。跑分最猛,24 GB 能跑但比较紧,32 GB 更舒服。
一句话总结,「4 GB 跑 E2B,6 GB 跑 E4B,18 GB 跑 26B,20 GB 以上跑 31B。」
Mac 用户,先去 ollama.com 下载、安装 Ollama。用 Homebrew 也行。
brew install --cask ollama-app Ollama 是目前跑本地模型最简单的工具(之一)。模型下载、推理引擎、API 服务,一个 App 就搞定。
装好后启动 Ollama。打开终端,运行:
open -a Ollama 菜单栏会出现一个羊驼图标,等几秒钟初始化完成。根据你的内存选一个模型拉取。以 26B 为例。
ollama run gemma4:26b
Ollama 会自动下载模型并启动对话。26B 大约 18 GB,耐心等。
下载完成后直接进入聊天界面。随便问一句,看到回答就成功了。
可以用下面这个命令查看模型运行状态。
ollama ps 你会看到 CPU/GPU 的推理分配比例,比如「14%/86% CPU/GPU」。以 Apple Silicon 为例,大部分计算跑在 GPU 上,速度比纯 CPU 快得多。
三步,搞定。
Windows 用户同理,先下载安装 Ollama。可以直接用客户端,也可以打开 PowerShell,一行命令搞定。
irm
https://ollama.com/install.ps1
| iex
装完后打开一个新的 PowerShell 窗口,运行:
ollama run gemma4:26b 有 NVIDIA 显卡的话,Ollama 会自动调用 CUDA 加速。没独显也能跑,就是慢一些。
后面是一样的流程。
NVIDIA 用户划重点。Ollama 0.19 新增了 NVFP4 格式支持,用更少的显存跑模型,精度损失很小。RTX 40 系及以上的显卡自动生效。
如果你已经养了一只龙虾,不管是在自己电脑上还是云服务器上,上面这些命令完全不用自己敲。直接给龙虾发消息,它会帮你搞定。
以一台云服务器上的 OpenClaw 为例。全程不碰终端。
先对龙虾说,「在服务器上安装 Ollama。运行这条命令:curl -fsSL
https://ollama.com/install.sh
| sh」。
龙虾先是发现缺少 zstd 依赖,自己装好之后重新运行安装脚本。
接着拉取模型。
17 GB 的模型文件,校验通过。
然后让它测试。「跟 Gemma 4 聊一句试试:ollama run gemma4:26b "你好,你是什么模型?简单介绍一下自己。"」
Gemma 4 跑起来了。
但纯 CPU 推理,26B 属实有点勉强。
让龙虾换成 E4B。
速度快多了。
理论上还能更进一步。
让龙虾把自己的模型后端切到本地 Gemma 4,API 端点指向 localhost:11434,从此不再需要云端 API。但更推荐满血版作为主力模型,小模型更适合端侧。
龙虾帮你部署了一个免费模型,最后还能把自己也接上去。
最后附上 Ollama 常用命令。
回复
使用道具
举报
提升卡
置顶卡
沉默卡
喧嚣卡
变色卡
千斤顶
照妖镜
返回列表
发表新帖
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
热门 WordPress 重定向插件暗藏休眠后门多年
“快速页面 / 文章重定向”(Quick Page/Post Redirect)插件安装量超 7 万,5 年前被植入后门,可向用户网
官方 SAP npm 软件包遭入侵,用于窃取凭证
多个官方 SAP npm 软件包疑似遭 TeamPCP 供应链攻击,被入侵后用于窃取开发者系统中的凭证和身份验证令牌。
开源电子病历软件 OpenEMR 发现 38 个漏洞
应用安全公司 Aisle 在开源电子病历平台 OpenEMR 中发现了数十个漏洞,其中包括一些可被利用来窃取敏感患者
数百面向互联网的 VNC 服务器暴露 ICS/OT
Forescout 的研究显示,数百万远程访问的 RDP 和 VNC 服务器暴露在互联网上,其中数百台可能提供对工业控制
朝鲜新一轮攻击:利用 AI 植入 npm 恶意软件、虚假公司和远程访问木马 ...
网络安全研究人员在一个 npm 软件包中发现了恶意代码,该恶意软件包作为依赖项被引入到由 Anthropic 公司的
cPanel 与 WHM 紧急更新修复关键认证绕过漏洞
一个严重漏洞影响了除最新版本之外的所有 cPanel 及 WebHost Manager(WHM)控制面板版本,该漏洞可被利用
Robinhood 账户创建漏洞遭利用,被用于发送网络钓鱼邮件
在线交易平台罗宾汉(Robinhood)的账户创建流程被威胁行为者利用,他们将网络钓鱼信息注入合法邮件,诱使
ShinyHunters 宣称盗走超 900 万条记录,Medtronic 随后证实安全事件 ...
在黑客组织 ShinyHunters 宣称窃取了超 900 万条记录后,美敦力(Medtronic)证实其公司 IT 系统遭遇了网络
admin
关注Ta
主题 229
帖子 225
积分 589
程序园专栏内容编辑
•
招聘中 产品经理 12-24K
•
电脑进入bios关闭网卡的技巧
•
强制git pull覆盖本地文件的方法
•
52吃瓜网落地页
•
泛x程序,适合做x领域的泛程序
•
色界导航站程序源码
•
Cloudreve网盘系统
•
mip百度泛目录程序源码
阅读作者更多精彩帖子
2026年4月全球和全国数据库系统最新排行榜
一、全球最新使用排名(2026 年 4 月)1. DBEngines 流行度(综合市场份额) [*]Oracl
Zed正式发布1.0版本:新增DeepSeek-V4支持
开源代码编辑器 Zed 日前正式发布 1.0 版本。开发团队表示,这并不意味着产品已经“完
新加坡国立大学研究人员发现关键蛋白或可逆
美国《科技日报》4月21日文章,原题:科学家发现一种可能有助于逆转脱发的“保护者”
Hermes WebUI可视化面板,5分钟安装,彻底
Hermes可视化WebUI · 告别命令行5分钟装好|浏览器管理AI|全功能面板亮点:一键安装
热门 WordPress 重定向插件暗藏休眠后门多
“快速页面 / 文章重定向”(Quick Page/Post Redirect)插件安装量超 7 万,5 年前被
官方 SAP npm 软件包遭入侵,用于窃取凭证
多个官方 SAP npm 软件包疑似遭 TeamPCP 供应链攻击,被入侵后用于窃取开发者系统中的
开源电子病历软件 OpenEMR 发现 38 个漏洞
应用安全公司 Aisle 在开源电子病历平台 OpenEMR 中发现了数十个漏洞,其中包括一些可
数百面向互联网的 VNC 服务器暴露 ICS/OT
Forescout 的研究显示,数百万远程访问的 RDP 和 VNC 服务器暴露在互联网上,其中数
朝鲜新一轮攻击:利用 AI 植入 npm 恶意软
网络安全研究人员在一个 npm 软件包中发现了恶意代码,该恶意软件包作为依赖项被引入
cPanel 与 WHM 紧急更新修复关键认证绕过漏
一个严重漏洞影响了除最新版本之外的所有 cPanel 及 WebHost Manager(WHM)控制面板