登录
/
注册
首页
论坛
其它
首页
科技
业界
安全
程序
广播
Follow
关于
导读
排行榜
资讯
发帖说明
登录
/
注册
账号
自动登录
找回密码
密码
登录
立即注册
搜索
搜索
关闭
CSDN热搜
程序园
精品问答
技术交流
资源下载
本版
帖子
用户
软件
问答
教程
代码
写记录
写博客
小组
VIP申请
VIP网盘
网盘
联系我们
发帖说明
道具
勋章
任务
淘帖
动态
分享
留言板
导读
设置
我的收藏
退出
腾讯QQ
微信登录
返回列表
首页
›
业界区
›
科技
›
HRM(Hierarchical Reasoning Model)部署训练记录
HRM(Hierarchical Reasoning Model)部署训练记录
[ 复制链接 ]
孓访懔
2025-8-7 02:00:21
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
前两天朋友刷到HRM这个27M模型的文章,想让我试着部署训练一下。此文用于记录部署过程
前期准备
克隆仓库
sapientinc/HRM
安装CUDA
我的CUDA是已经安装好的12.8版本,安装过程不再赘述
安装torch
torch版本如下 Version: 2.7.1+cu128
pip install torch torchvision torchaudio -f https://mirrors.aliyun.com/pytorch-wheels/cu128/
这里贴出的链接为CUDA12.8版本的阿里云镜像torch安装
安装Flash Attention
这里由于我的系统是windows所以我使用flash-attention-for-windows
github地址
Pip install flash_attn-2.8.2+cu128torch2.7.1cxx11abiFALSEfullbackward-cp311-cp311-win_amd64.whl
这里cu128指CUDA12.8
torch版本为2.7.1
python版本3.11
安装依赖
pip install -r requirements.txt
注册并创建wandb key
由于项目使用wandb记录数据,所以此处需要注册wandb并且在训练时要保持网络畅通
pip install wandb
安装好后使用key登录
wandb login
安装triton
虽然原文没有提到,但是我在部署过程中发现需要,故此添加安装
需要注意triton版本、torch版本以及CUDA版本需要对应
同样我这里使用的windows版
github链接
此处我使用的为3.3版本 Version: 3.3.1.post19
pip install -U "triton-windows
HRM
Hierarchical
Reasoning
Model
部署
相关帖子
K3s 高可用集群实操笔记:3 Master + 外部 PostgreSQL-15 部署全流程
Spring AI 代码分析(二)--Model 领域
Redis有哪些部署方案?了解哨兵机制吗?
MySQL主从复制:原理、部署、运维与选型全指南
实物部署【Switching Sampling Space of Model Predictive Path-Integral Controller
docker-compse部署docker容器示例
Flask 应用部署实战:Nginx 反向代理配置指南
SeaTunnel(2.3.12)部署及其Demo(含CDC实时采集demo)
一键部署!一款开源自托管的照片画廊神器!
Tomcat部署zrlog——处理动态数据的环境
回复
使用道具
举报
提升卡
置顶卡
沉默卡
喧嚣卡
变色卡
千斤顶
照妖镜
相关推荐
安全
K3s 高可用集群实操笔记:3 Master + 外部 PostgreSQL-15 部署全流程
1
527
粹脍誊
2025-11-12
安全
Spring AI 代码分析(二)--Model 领域
2
697
馏栩梓
2025-11-19
业界
Redis有哪些部署方案?了解哨兵机制吗?
1
692
单于易槐
2025-11-20
业界
MySQL主从复制:原理、部署、运维与选型全指南
1
331
尚腱埂
2025-11-28
业界
实物部署【Switching Sampling Space of Model Predictive Path-Integral Controller
2
1026
唯棉坜
2025-11-29
安全
docker-compse部署docker容器示例
2
409
乐敬
2025-12-01
业界
Flask 应用部署实战:Nginx 反向代理配置指南
1
926
盒礁泅
2025-12-11
业界
SeaTunnel(2.3.12)部署及其Demo(含CDC实时采集demo)
1
628
溧久苟
2025-12-11
安全
一键部署!一款开源自托管的照片画廊神器!
2
275
莅耸
2025-12-12
安全
Tomcat部署zrlog——处理动态数据的环境
0
217
予捻
2025-12-15
回复
(3)
瞧蛀
2025-10-30 01:43:30
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
不错,里面软件多更新就更好了
郗新语
2025-11-27 12:41:41
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
鼓励转贴优秀软件安全工具和文档!
左丘纨
7 天前
回复
使用道具
举报
照妖镜
程序园永久vip申请,500美金$,无限下载程序园所有程序/软件/数据/等
感谢,下载保存了
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
回复
本版积分规则
回帖并转播
回帖后跳转到最后一页
浏览过的版块
安全
代码
业界
签约作者
程序园优秀签约作者
发帖
孓访懔
7 天前
关注
0
粉丝关注
17
主题发布
板块介绍填写区域,请于后台编辑
财富榜{圆}
3934307807
991124
anyue1937
9994893
kk14977
6845357
4
xiangqian
638210
5
韶又彤
9998
6
宋子
9983
7
闰咄阅
9993
8
刎唇
9993
9
俞瑛瑶
9998
10
蓬森莉
9951
查看更多
今日好文热榜
338
【节点】[Adjustment-WhiteBalance节点]原
298
上海专业建筑维修服务解析:标准化流程如何
942
【分析式AI】-带你弄懂XGBoost模型
728
【分析式AI】-带你弄懂XGBoost模型
48
【分析式AI】-带你弄懂XGBoost模型
270
C语言之统计天数
237
如何使用DashVector的多向量检索
270
【分析式AI】-朴素贝叶斯算法模型
215
【分析式AI】-朴素贝叶斯算法模型
933
【睿擎派】EtherCAT总线之IO模块读写
587
python3.13 3.14 新特性 好好好
783
Python新利器:用uv轻松管理venv虚拟环境和
956
Open-AutoGLM项目衍生自研app测试思路
180
.Net-Avalonia学习笔记(目录)
435
PoloAPI 绘画接口全攻略:从参数详解到实战
144
剑指offer-50、数组中重复的数字
179
嫌 Google 的 TCREI 太复杂?RACE 会更适合
975
Spring Boot中HTTP请求参数转换和请求体JSO
531
AI手机的“简单替换陷阱”与Hadoop、Cloude
474
用C#重现Gin风格:极简、效率与可扩展性设