登录
/
注册
首页
论坛
其它
首页
科技
业界
安全
程序
广播
Follow
园子
关于
博客
发1篇日志+1圆
记录
发1条记录+2圆币
发帖说明
登录
/
注册
账号
自动登录
找回密码
密码
登录
立即注册
搜索
搜索
关闭
CSDN热搜
程序园
精品问答
技术交流
资源下载
本版
帖子
用户
软件
问答
教程
代码
VIP申请
网盘
联系我们
道具
勋章
任务
设置
我的收藏
退出
腾讯QQ
微信登录
返回列表
首页
›
业界区
›
安全
›
MNN 手机本地部署 DeepSeek R1 和多模态大模型,告别服 ...
MNN 手机本地部署 DeepSeek R1 和多模态大模型,告别服务器繁忙!
[ 复制链接 ]
钨哄魁
6 天前
在
Phi-3
大模型发布之际,我们基于
Termux
应用,在我的小米手机部署了
Phi-3
模型:文章地址
Termux
应用是一个终端模拟器,它允许我们安装 Linux 操作系统,然后在 Linux 操作系统中安装 Ollama,最后基于 Ollama 下载和推理大模型,虽然方法可行,但是存在一些局限:
操作步骤繁琐,用户体验较差:安装 Linux 操作系统、启动系统、安装和启动 Ollama 等操作,都需要通过命令行完成,体验较差。
资源消耗较大:手机内存有限,Termux 应用、Linux 操作系统、Ollama 框架等都需要消耗资源,推理速度较慢,资源吃紧
DeepSeek R1 很火爆,导致在使用 DeepSeek R1 时,老牛同学经常会遇到“服务器繁忙,请稍后重试。”的问题:
今天老牛同学推荐一款更加先进的应用:
MNN Chat
,它是由阿里巴巴开源的全功能多模态模型应用。
仅需一台手机即可运行: 完全在设备本地运行,确保数据隐私,无需将信息上传至外部服务器。
CPU 推理优化: 在安卓平台上,MNN-LLM 展现了卓越的 CPU 性能,预填充速度相较于 llama.cpp 提高了 8.6 倍,相较于 fastllm 提升了 20.5 倍,解码速度分别快了 2.3 倍和 8.9 倍。
多模态支持: 提供多种任务功能,包括文本生成文本、图像生成文本、音频转文本及文本生成图像。
广泛的模型兼容性: 支持多种领先的模型提供商,包括 Qwen、Gemma、Llama(涵盖 TinyLlama 与 MobileLLM)、Baichuan、Yi、DeepSeek、InternLM、Phi、ReaderLM 和 Smolm 等。
官网地址:https://www.mnn.zone
GitHub 源码地址:https://github.com/alibaba/MNN
接下来,我们在手机上部署试用一下,老牛同学的手机配置如下:
1.安装 MNN 应用
对于 Android 手机,我们可以直接下载和安装最新版本:下载地址
或者,我们也可以按照以下步骤,自己编译 Android 和 iOS 应用:
Android 编译和使用
克隆 MNN 源代码:git clone https://github.com/alibaba/MNN.git
构建库:
cd project/android
mkdir build_64
../build_64.sh "-DMNN_LOW_MEMORY=true -DMNN_CPU_WEIGHT_DEQUANT_GEMM=true -DMNN_BUILD_LLM=true -DMNN_SUPPORT_TRANSFORMER_FUSE=true -DMNN_ARM82=true -DMNN_USE_LOGCAT=true -DMNN_OPENCL=true -DLLM_SUPPORT_VISION=true -DMNN_BUILD_OPENCV=true -DMNN_IMGCODECS=true -DLLM_SUPPORT_AUDIO=true -DMNN_BUILD_AUDIO=true -DMNN_BUILD_DIFFUSION=ON -DMNN_SEP_BUILD=ON"
复制代码
复制到 LLM Android 应用项目:
mkdir -p ../../../apps/Android/MnnLlmChat/app/src/main/jniLibs/arm64-v8a
find . -name "*.so" -exec cp {} ../../../apps/Android/MnnLlmChat/app/src/main/jniLibs/arm64-v8a \;
复制代码
构建 Android 应用项目并安装:
cd ../../../apps/Android/MnnLlmChat
./gradlew installDebug
复制代码
iOS 应用编译和使用
克隆 MNN 源代码:git clone https://github.com/alibaba/MNN.git
编译 MNN.framework:
cd MNN/
sh package_scripts/ios/buildiOS.sh "-DMNN_ARM82=true -DMNN_LOW_MEMORY=true -DMNN_SUPPORT_TRANSFORMER_FUSE=true -DMNN_BUILD_LLM=true -DMNN_CPU_WEIGHT_DEQUANT_GEMM=true
-DMNN_METAL=ON
-DMNN_BUILD_DIFFUSION=ON
-DMNN_BUILD_OPENCV=ON
-DMNN_IMGCODECS=ON
-DMNN_OPENCL=OFF
-DMNN_SEP_BUILD=OFF
-DMNN_SUPPORT_TRANSFORMER_FUSE=ON"
复制代码
拷贝 framework 到 iOS 项目中:
mv MNN-iOS-CPU-GPU/Static/MNN.framework /apps/iOS/MNNLLMChat/MNN.framework
复制代码
确保 Link Binary With Libraried 中包含 MNN.framework,和其他三个 Framework:
如果没有包含,可以手动添加 MNN.framework:
修改 iOS 签名并编译项目
cd /apps/iOS/MNNLLMChat
open MNNLLMiOS.xcodeproj
复制代码
在 Xcode 项目属性中 Signing & Capabilities > Team 输入自己的账号和 Bundle Identifier:
等待 Swift Package 下载完成之后,进行编译使用。
2.下载模型文件
手机上安装好
MNN Chat
应用之后,我们打开应用,就可以看到它所兼容的模型列表,包括文本、音频、图像等:
点击即可下载,老牛同学想体验一下文本和图片识别,下载了
DeepSeek-R1-7B-Qwen-MNN
和
Qwen2-VL-2B-Instruct-MNN
这 2 个大模型,等待下载完成。
3. MNN 模型推理
先试用一下
DeepSeek-R1-7B-Qwen-MNN
文本模型,输入提示词:
同样是一年,为什么阳历固定12个月,而阴历却有闰月?
复制代码
DeepSeek R1 开始思考,分析阳历和阴历的计算方法,最终得出结论:
从手机的推理速率来看,总体还算不错,比通过
Termux
应用的方式推理效率高多了。
接下来,看看
Qwen2-VL-2B-Instruct-MNN
图片多模态大模型,老牛同学让它进行车牌识别:
可以看到,识别的结果是很不错的!
还有其他的大模型,包括音频、图片生成(Stable Diffusion)等,大家可以体验一下。
Cocos 3D 小游戏:
01.技术选型 丨 02.研发流程 丨 03.小游戏框架丨 04.核心架构设计丨 05.分包构建发布
Transformers 框架序列:
01.包和对象加载中的设计巧思与实用技巧
02.AutoModel 初始化及 Qwen2.5 模型加载全流程
03.Qwen2.5 大模型的 AutoTokenizer 技术细节
04.Qwen2.5/GPT 分词流程与 BPE 分词算法技术细节详解
05.嵌入(Embedding)机制和 Word2Vec 实战
06.位置嵌入(Positional Embedding)
Pipeline NLP 任务序列:
零·概述 丨 01.文本转音频 丨 02.文本分类 丨 03.词元分类和命名实体识别 丨 04.问答 丨 05.表格问答 | 06.填充蒙版
往期推荐文章:
Cline 免费插件 + Qwen2.5 大模型,零经验也能开发“对联王”微信小程序
使用 Cursor + Qwen2.5 大模型 零经验研发微信小程序:自由构建个性化节拍器应用实战
Bolt.new 用一句话快速构建全栈应用:本地部署与应用实战(Ollama/Qwen2.5 等)
基于 Qwen2.5-Coder 模型和 CrewAI 多智能体框架,实现智能编程系统的实战教程
vLLM CPU 和 GPU 模式署和推理 Qwen2 等大语言模型详细教程
基于 Qwen2/Lllama3 等大模型,部署团队私有化 RAG 知识库系统的详细教程(Docker+AnythingLLM)
使用 Llama3/Qwen2 等开源大模型,部署团队私有化 Code Copilot 和使用教程
基于 Qwen2 大模型微调技术详细教程(LoRA 参数高效微调和 SwanLab 可视化监控)
ChatTTS 长音频合成和本地部署 2 种方式,让你的“儿童绘本”发声的实战教程
来源:程序园用户自行投稿发布,如果侵权,请联系站长删除
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!
回复
使用道具
举报
提升卡
置顶卡
沉默卡
喧嚣卡
变色卡
千斤顶
照妖镜
相关推荐
如何优雅上线、下线?原来 大厂应用 是这样 优雅发布的!
在 .NET 中将 EF Core 升级到 9.0.5 MySQL 连接提示 get_LockReleaseBehavior
开源情报中批判性思维因人工智能而逐渐衰落
sshd服务
AppFreeze与资源泄漏能力开放及常见问题定位方法介绍
【UAP】使用 .NET Core App 编写 UAP
人工智能将如何影响语言的演变?
HarmonyOS 5.0 分布式数据协同与跨设备同步
微软又退出中国。。。
【一步步开发AI运动APP】一、写在最前
Datawhale速通百炼RAG应用-Task1
不是哥们,26 岁程序员,去种头发了?
记录---前端图像五兄弟:网络 URL、Base64、Blob、ArrayBuffer、本地路径,全整明白!
MOSN(Modular Open Smart Network)是一款主要使用 Go 语言开发的云原生网络代理平台
【鸿蒙生态学堂03】应用程序框架基础
在Ubuntu中部署.NET 8 Minimal WebAPI项目
JavaScript基础
华为云昇腾专区重磅上线!带你入门昇腾AI技术与DeepSeek实践
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
回复
本版积分规则
回帖并转播
回帖后跳转到最后一页
浏览过的版块
代码
业界
签约作者
程序园优秀签约作者
发帖
钨哄魁
6 天前
关注
0
粉丝关注
10
主题发布
板块介绍填写区域,请于后台编辑
财富榜{圆}
敖可
9990
处匈跑
9998
斜素欣
9996
4
森萌黠
9996
5
堵赫然
9996
6
凶契帽
9996
7
柴古香
9996
8
背竽
9996
9
恐肩
9994
10
都硎唷
9994
查看更多