0 代码微调大模型火了，只需 5 步，成本低至 150 块

来源：量子位 2023-07-08 14:02:03

0 代码微调一个大模型，成本不到 20 美元（人民币约 144 元）？

过程也非常简单，只需 5 步。

【资料图】

如 LLaMA、GPT、StableLM 等爆火的开源生成式模型，都能搞定。

这就是Monster API，一个最新火起来的 API 平台。有人觉得这个开源领域的新工作，能改写 AI 开发的游戏规则，加速 AI 应用的速度。还有人兴奋提问，之后会接入 GPT-3/GPT-4 吗？所以，它具体是怎么实现的？

五步零代码搞定

简单理解，Monster API 就是将微调步骤尽可能简易化，让开发者不用再手动进行一系列设置，同时也提供便宜的 GPU 资源及内存优化。

具体过程如下：

第一步，选择一个模型进行微调。

比如 LLaMA-7B、GPT-J-6B、StableLM-7B 等，Monster API 提供了至少 10 个基础大模型。

第二步，选择或创建微调任务。比如指令微调、文本分类等，或者自定义任务。第三步，选择一个 HuggingFace 数据集。

Monster API 可以无缝集成 HuggingFace 数据集，可选择范围很大；还可以根据任务类型推荐数据集。

并且不用自己手动操作，就能自动设置好格式。

第四步，设置超参数。第五步，检查和提交。

在设置好如上所有步骤后，确定没有错误就可以提交了。

Monster API 表示可以通过 WandB 上的日志来监测任务。

在其博客中写道，用 DataBricks Dolly 15k 微调 LLaMA-7B 完成 3 个 epouch，成本仅需不到 20 美元（折合人民币约 144 元）。

官网显示，注册用户后会赠送 2500 积分。会员分为三档，收费分别是每月 9 美元 /29 美元 /39 美元。

除了微调以外，Monster API 还提供各种生成式 AI 的 API 接口，并表示成本比其他方案低 80%。背后公司已获 110 万美元融资

消息显示，Monster API 背后公司拿下了110 万美元的种子前资金（pre-seed funding）。

这家 AI 初创公司给自己的定位是要做 "GPU 领域的爱彼迎 "，把全世界分散的 GPU 资源实现灵活调度，让开发者们能够以更低的价格使用。

创始人是两兄弟 Gaurav Vij 和 Saurabh Vij。

其中 Gaurav Vij 还创立了一家 CV 公司，正是因为 CV 公司需要面临巨大的云计算资本，才启发了他们要做这样一个平台。

Saurabh Vij 之前是欧洲核研究中心的粒子物理学家，同时也研究分布式计算。

兄弟俩表示在经过多轮技术迭代后，他们优化了消费级 GPU 在机器学习任务上的性能，使得运行 Whisper AI 模型的成本相较于 AWS 平台降低了 90%，所以他们就想着为什么不利用这个方法来帮助数以万计的开发者们。

同时他们透露公司的一个客户使用他们的分散的 GPU 计算资源，已经节省了 30 万美元。

参考链接：

[ 1 ] https://blog.monsterapi.ai/no-code-fine-tuning-llm/

[ 2 ] https://www.enterpriseai.news/2023/06/09/monster-api-launches-the-airbnb-of-gpus-with-1-1m-pre-seed/

关键词：