计算器就能跑类ChatGPT模型,资源消耗低到逆天!GPT4 All开源啦!

添加书签

专注AIGC领域的专业社区,关注GPT-4、百度文心一言、华为盘古等大语言模型(LLM)的发展和应用落地,以及国内LLM的发展和市场研究,欢迎关注!

话不多说,直接看演示视频吧。

GPT4 All的问答演示

一位名叫Andriy Mulyar的在社交平台上,用一台2004年的ti-84计算器演示了其团队开发的类ChatGPT的开源项目——GPT4 All。(开源地址:https://github.com/nomic-ai/gpt4all

GPT4 All是基于LLaMa模型演变而来拥有70亿参数,同时借助GPT-3.5-Turbo搜集了800k数据,包含代码、文本等对其模型进行训练。

GPT4 All在回答问题准确率、推理逻辑、响应等方面可与GPT-3.5Turbo相媲美。

Mulyar认为,对于个人、小公司和特定业务场景而言,并非模型参数越大越好。虽然功能方面提升了但算力消耗非常大,不是一般企业能玩的起的。

GPT4 All希望可以在满足相同功能的情况下,将资源消耗降到极致,使得人人都能训练自己的“ChatGPT”模型。

做一个不恰当的比喻,我们可以把大语言模型看成搅拌机,GPT-3.5模型就像大型的混凝土搅拌机,不只是水泥、沙子,白菜、木棍、塑料统统都能帮你搅的稀碎。虽然功能强大,资源消耗也非常惊人。

如果我们想吃饺子,难道还要把肉和菜放进混凝土搅拌机吗?当然不会了,用普通家用的绞肉机就足够用了,GPT4All就相当于“家用绞肉机”。在保证能达到类似目的的情况下,使用资源消耗最低的,才是最适合普通人的选择。

前不久彭博面向金融领域只有500亿参数的Bloomberg GPT就是最实际的例子。该模型主要面向金融领域构建了3630亿个标签的数据集,相比参数训练数据更重要,因为没有丰富的数据资源,再好的大语言模型也无法发挥其功能。

Andriy不仅在ti-84计算器上展示了GPT4 All,任天堂的DS lite、DSi 和3DS同样可以丝滑的运行GPT4 All项目。

在任天堂设备上使用GPT4 A

诚然,上面的演示只是为了增加GPT4 All的噱头。根据其开源说明文档来看,普通的笔记本就能很好的运行GPT4 All,例如,苹果的M1,在响应方面非常出色。

GPT4 All展示了一系列类ChatGPT的问答功能。

例如,如何练习抬腿动作?

列出10只狗?

帮我写一首关于凯撒大帝陨落的诗

需要主意的是,由于GPT4 All是基于LLaMa模型开发而成,而LLaMa目前无法用于商业用途。所以,GPT4 All开源项目只适用于个人用途。

前不久,斯坦福大学研究中心开源的类Open AI的GPT-3.5大语言模型Alpaca,震惊了各大研究机构。

原来大语言模型可以满足用户ChatGPT功能的情况下,可以将资源消耗降到极致,这给研究学者们带来了灵感。随后各种资源消耗极低的类ChatGPT模型被不断地挖掘出来。

本文素材来源GPT4 All,如有侵权请联系删除

END

加入AIGC开放社区交流群

添加微信:13331022201 ,备注“职位信息&名字”

管理员审核后加入讨论群