AI大模型今年大放异彩,今天我们在这里帮大家盘点梳理一下AI大模型的一些进展,简单回溯今年以来取得的进展。
首 先
诺德基金:无法回避的第一个AI大模型就是OpenAI的GPT大模型。
OpenAI在今年3月份发布了GPT-4语言模型,相对于GPT-3,GPT-4具有更强大的语言理解与生成能力,更好的多语言支持与机器翻译能力,在图像识别与生成能力方面显著突破,在代码生成与编程辅助方面也进步明显,且OpenAI在与人类对齐和安全性方面下了很大功夫,加大了其与追赶者的领先优势。
最近ChatGPT代码解释器(Code interpreter)测试版正式向所有Plus用户开放,即使不是程序员,只需要用自然语言向ChatGPT下达指令,也可以完成需要复杂编程技术的任务。无论是代码编写还是数据分析、图表生成、执行数学运算,甚至是生成视频、分析股票市场,都能得到非常高质量的结果。
其 次
我们看看谷歌给产业带来的惊喜:北京时间5月11日凌晨,Google I/O 2023开发者大会上发布了PaLM 2,一般认为这是谷歌目前最先进的语言模型。
PaLM 2拥有四种不同规模的版本,从小到大依次是壁虎、水獭、野牛、独角兽。其中“壁虎”版本是最轻量级的,能在移动设备上快速运行,离线状态下每秒可处理20个token。
大语言模型PaLM2是谷歌全面AI化的核心引擎,也是与微软竞争的对策之一,谷歌CEO桑达尔·皮查伊称其在部分任务上已超过GPT-4。
PaLM 2接受了100多种语言的训练,不仅能对成语、诗歌和谜语理解,还能够通过很高级别的语言能力考试,相比去年的PaLM模型,PaLM 2 在多语言处理、推理和编码能力上有了很大的提升。
然 后
我们谈谈Meta的进展,这几乎是活生生的“Open AI”。
7月份,Meta发布了最新一代开源大模型Llama 2,相较于今年2月发布的Llama 1,训练所用的token翻了一倍至2万亿,同时对于使用大模型最重要的上下文长度限制,Llama 2也翻了一倍。
Llama2家族中包含多个模型规模,包括70亿、130亿、340亿(暂未发布)和700亿参数量的多个版本,覆盖了不同的应用场景需求,这为初创企业和其他企业提供了一个强大的免费选择,以取代OpenAI和谷歌出售的昂贵的专有模型。
据介绍,Llama 2模型在大多数基准测试中表现优于其他开源模型,包括编码、推理、知识、精通性测试等。Meta CEO马克·扎克伯格将Llama 2称为大模型的“次世代”产品,称之为开源大语言模型的下一代产品。尽管Meta 在其研究论文中承认,Llama 2 仍与GPT-4 存在较大的性能差距,但对于许多应用场景来说不需要 GPT-4。
我们也将拭目以待Meta Llama 2的开源是否会成为大模型的“安卓时刻”,看其是否能经受住市场和用户的考验。
最 后
我们关注一下国内的进展。
在7月份举办的上海世界人工智能大会(WAIC)上,30余款大模型齐聚,今年5月底举行的中关村论坛上发布的《中国人工智能大模型地图研究报告》显示,中国10亿级参数规模以上大模型已发布了79个,毫不夸张地说国内已经是 “百模大战”。
移动互联网时代我们经历过 “百团大战”,彼时整个互联网圈都还在喊:“所有行业都值得用互联网重做一遍。”如今,口号换成了“所有行业都值得用大模型重做一遍。”
7月份,国家网信办联合国家发展和改革委员会、教育部、科技部、工业和信息化部、公安部、国家广电总局公布《生成式人工智能服务管理暂行办法》,自今年8月15日起施行。该《办法》的出台既是促进生成式人工智能健康发展的重要要求,也是防范生成式人工智能服务风险的现实需要,有望为国内人工智能大模型的应用铺平道路。
“百模大战”到底谁能胜出,还是要接受市场检验,实践是检验真理的唯一标准,我们拭目以待国内大模型谁能笑到最后。
从海外大模型厂商的“你追我赶”到国内的“百模大战”,大模型产业欣欣向荣,但我们要看到目前仅有OpenAI的GPT模型开始了真正的规模商用,AI大模型产业依然处在产业爆发的初期。
我们建议多一点耐心,给产业以时间,积极地在产业百花齐放、百家争鸣的过程中,挖掘投资机会捕捉时代红利。