更理性的预测2024年的AI行业

添加书签

AIGC开放社区
2024-01-15

专注AIGC领域的专业社区，关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型（LLM）的发展和应用落地，聚焦LLM的市场研究和AIGC开发者生态，欢迎关注！

回顾过去或者评价当前是容易的，预测未来总是困难的，但方法总比困难多，让我们来预测一下2024年AI行业可能会发生哪些大事件？

01 选择预测方法

预测未来的方法一般有以下几种：

第一种是采用统计分析的方法，分析过去几年AI技术的发展趋势，如机器学习、深度学习、自然语言处理等领域的发展情况，再构造一个模拟和预测模型，使用数据分析和模拟模型来预测AI可能的发展路径和未来事件；
第二种是参考专家意见的方法，参考领域内专家、研究机构和主要公司的预测报告和分析；
第三种是调研方法，就是通过线上或线下的方式，访问足够多的人，获取足够多的样本数据，基于人们的反馈结果来获得AI的发展预测；
第四种类比法，当我们面对AI这样的新技术的时候，可以将它与计算机、互联网或移动通信等先前的技术之前的发展历史进行比较，因为这些历史技术革新在某些方面与AI的发展轨迹会十分相似。但需要注意的是，预测总是带有不确定性，特别是在快速发展和高度不确定的领域如人工智能。

这次我们更倾向于采用第四种类比的方法，通过选择一个类似的参照物，参考它的历史演进规律来预测AI这项技术。因为，历史已经充分体现了某项技术的发展过程和发展规律，比如技术接受曲线、创新的扩散过程等。其他几种方法为什么不适合呢？因为统计模型方法过会过分依赖历史数据，但是AI领域可找寻的历史太少，由于AI又会受到各种外部因素的影响，例如政治、经济和社会因素等，这个预测模型也很难建立；

专家法的预测方法可能受到专家个人经验和观点的影响，或者大家的立场也会带来偏见，另外不同专家也可能有截然不同的预测，这会导致预测结果的混乱；调研方法可能受制于普通大众缺乏对AI技术深入的理解，使得他们的预测不够准确，另外调研的样本偏差，样本不足或不具代表性，也无法带来合理的结果。

02 选择参照对象

既然选择了类比方法，就需要选择一个类似的参照物来类比，对比与人类在历史上的几次大的科技变革，从规模、影响力等方面分析，虽然AI在某些方面也与电力、计算机和智能手机的发展有很多相似之处，但它作为一个跨行业、全球性影响力巨大的信息技术革命，它与互联网的发展轨迹有更多共通之处。主要理由有如下几点：

AI和互联网都是信息技术领域的重要组成部分，它们都对信息的处理、传播和使用方式产生了深远的影响。
从各行业的渗透率来看，也很相似。互联网最初在特定领域获得应用，随后逐渐影响了几乎所有行业。AI也正在遵循这样的模式，从专业应用扩展到广泛的行业应用。
站在技术融合和创新的角度，互联网的普及催生了无数新的技术和商业模式，如电子商务、社交媒体等。AI也正在与不同的技术和行业、各种业务场景相融合，可以创造出更多新的应用和服务。
从全球影响和政策关注度来看，互联网在全球范围内产生了深远的社会和文化影响，引发了关于隐私、安全和监管的广泛讨论。AI也正面临类似的全球性影响和政策挑战。
从技术演进的裂变范围来看，互联网自诞生以来，伴随着个人电脑、云计算等基础技术的发展，各种应用场景不断发展和演变。而AI技术也在持续进步，其能力和应用范围也在产生着类似的扩展。

03 回顾互联网的发展历史

接下来，再让我们看看，今天的AI处于互联网的哪个发展阶段。首先我们回顾一下互联网整个的技术演化史。

第一个阶段是1960到1970年代的早期阶段，起源于1960年代末的美国国防部项目ARPANET，但是军方希望创建一个健壮、无中心的通信网络。在技术方面，数据分组交换的概念被引入，这也是现代互联网的基础。
第二个阶段是1980年代的发展与扩张阶段，代表事件是1983年，TCP/IP协议的诞生，为互联网的发展奠定了基础，在应用范围上来看，各大学和研究机构开始广泛接入网络。
第三个阶段是1990年代的商业化与普及阶段，典型事件是1991年，蒂姆·伯纳斯-李发明了万维网，即使3w，极大地促进了互联网对普通用户的普及。随着浏览器的发明和网络服务提供商的兴起，互联网开始真正的进入了商业领域。后来各种技术和服务创新开始出现，例如电子邮件、在线论坛、门户和新闻网站等，Google搜索就是出现在那个年代。
第四个阶段是互联网的成熟阶段，在2000年以后。在2000年前后，首先是出现了互联网泡沫的一次破裂，随后市场又开始逐渐恢复。随着网民的逐步增多，社交媒体开始兴起，如Facebook、Twitter等。后来，随着Iphone只能手机的产生，带来了一次移动互联网的大发展，如微信、滴滴打车等，这改变了人们对互联网的使用方式，也让更多普通人有机会参与到互联网中。
第五阶段，是2010年以后，直到今天的数据和智能化阶段，随着4G和5G的推广，云计算和基于数据算法驱动的互联网应用成为主流，例如抖音、小红书等。

04 与AI的横向对比

横向对比，我们可能会发现AI目前处于类似于互联网90年代的阶段。当前AI技术（尤其是深度学习、机器学习）正在迅速发展和成熟，与90年代互联网的迅速发展相似。我们可以从技术应用普及和商业模式两个方面进行近似的对比。

技术应用普及

AI今天的发展类似于互联网在90年代初步的商业化过程。今天的AI也正在从学术和研究领域逐渐转向更广泛的商业和消费者应用。在1990年代，互联网技术主要给人们带来的，还是在信息的沟通和信息的获取方式的改变，类似于今天人们获取知识方式的改变。有两个例子说明：

一个例子是电子邮件的出现，将主要用于学术和研究的通信方式变成了广泛应用于个人和商业领域的工具。就如同原来用于学术研究的底层AI大模型转变为可以与用户对话的ChatGPT，大大普及了人们对于大模型的认知和感知。

另一个例子是90年代出现的，以Google为代表的搜索引擎，改变了人们获取信息的方式，从原来门户网站那种被动的搜索，转变成为用户主动的获取，并且世界上所有的信息通过链接的方式关联了起来。就好像今天的大模型压缩了整个世界的知识，通过预测下一个字的方式产生知识，而人们只要通过和GPT对话就可以获得知识，而不仅仅是信息。

首先来看获取的内容上，就是有区别的。互联网那个时代获得的是信息，Information，而AI时代获取的是知识，Knowledge。虽然这两个概念在日常使用中经常交替使用，但在学术和实践上它们有着不同的含义。信息通常被视为是数据的加工和组织形式。数据是原始的、未经加工的事实和数字，而信息是将这些数据加工、整理和解释后的结果信息。信息本身是客观存在的，不依赖于个人的理解或经验。而知识是通过人的理解、经验、技能和教育获得的信息，它是信息经过个人内化和理解后的形式。知识不仅仅是事实或信息，还包括对这些信息的应用、解释和批判性思考的能力。知识通常与个人的上下文和经验紧密相关，它是主观的，并且随着个人经验的增长而发展。相比信息，知识更难以量化和传递，因为它依赖于人们的理解和认知框架。所以信息可以被看作是原始数据的有意义表述，而知识则是人对这些信息的理解、应用和内化。而现在的AI具有类似人的能力，可以帮助实现知识的生成和传播。所以我们才会谈到AI的伦理道德和人类对齐的问题。

其次，再看看获得内容的方式上的区别。搜索引擎提供的是，用户按照关键字的单次查询，用户再根据需要浏览搜索结果；而ChatGPT提供更像人类对话的交互体验，可以在多轮对话中细化和扩展信息。搜索引擎专注于提供互联网上已存在的信息和资源，而ChatGPT能够创造性地生成文本等内容，如撰写文章、画图等多模态内容。搜索引擎基于同样的关键字，为用户返回的内容是一致的，而ChatGPT却可以根据用户提示词的特定要求，返回个性化的结果。

商业模式探索

当前AI领域正在探索各种商业模式，这与早期互联网公司探索盈利模式的过程有些相似。搜索引擎诞生了类似Google这样的垄断性的巨头公司，而ChatGPT的母公司OpenAI也貌似会变成类似的商业巨头。另外，90年代的传统行业都开始寻求互联网化，主要是采用传统业务+互联网方式改进原来的商业模式，例如《纽约时报》和《华尔街日报》出现了在线订阅服务，传统银行从传统的柜面业务，开始提供网上银行服务，允许客户通过互联网进行转账、支付账单和管理账户。这与今天AI的发展类似，例如微软和谷歌的搜索引擎融入了AI技术，Office推出了AI辅助的Copilot，更多公司在原来的功能新增了AI能力。还有，早期在互联网应用的盈利模式上还不明确，这和今天大模型应用盈利模式不清晰也是类似的。从用户角度看，早期的互联网用户也是只能随意的浏览网站、聊天交流，并不会因为互联网影响到自己的工作和生活，这和今天人们使用ChatGPT的方式也很类似，只会觉得AI很厉害，但是具体对自己的工作和生活有什么影响，大家也是不清楚的。

即使我们再回顾一下互联网历史的第一个阶段和第二阶段，它也和AI之前的发展历程是类似的，主要体现为思想起源、行业规范和算力基础三个方面。

思想起源

互联网的思想起源来自万尼瓦尔·布什，他是二战时期的美国科学家和政府科技顾问。他在《大西洋月刊》上发表的一篇文章，提出了一种名为“Memex”的理论装置，可以用于存储和检索大量信息。”Memex” 这个名字是由两个词 “memory”（记忆）和 “index”（索引）合并而成的Memex被认为是个人计算机和超文本互联网的先驱，预示了后来互联网中信息检索的概念。而人工智能的概念起源于1956年的达特茅斯会议，在这次会议上，科学家们讨论了机器智能的可能性，并提出了“人工智能”这一术语。然后，基于军方和冷战的时代特征，建立了阿帕网，但在当时，各个学校和研究机构也都有各自的网络和底层协议。这和人工智能的早期发展很类似，符号主义、联结主义、行为主义三大学派一直争执不断，并且在算力和数据不具备的情况下，经过了几起几落。

行业规范

在互联网的第二阶段，形成了统一的TCP/IP协议，从而让互联网的发展走上了快车道。就如同人工智能再2000年以后，逐步把发展方向转移到了机器学习、深度学习、以及今天多层神经网络的Transformer大模型上，貌似在学术争端上，各方已经选择了一致的方向。

算力基础

对比一下基础算力上也可以找到类似的情况。1971年，英特尔推出了世界上第一个商用微处理器4004，标志着现代CPU的诞生。1999年，英伟达推出了GeForce 256，被认为是世界上第一个GPU。英特尔的CPU和英伟达的GPU分别对互联网和人工智能（AI）领域做出了显著的贡献。例如英特尔CPU提供了强大的计算能力，支持了复杂的网络应用和大数据处理，这是互联网基础设施的核心部分。英特尔的CPU推动了个人电脑的普及，从而使得更多人能够接入互联网。英伟达的GPU不仅限于传统的图像处理，还扩展到了语音识别、自然语言处理等AI领域，极大地加速了大模型的训练过程，这是现代AI发展的关键。英伟达使得广大研究人员和开发者能够更容易地利用GPU进行AI研究和应用开发。

截至2023年，人工智能的发展状态可以类比于互联网在1995年左右的发展阶段。在时间节点上，主要基于以下几个方面的相似性：

二者都处于技术成熟与商业化初期

1995年是互联网从学术和研究领域向广泛商业应用过渡的关键时期。同样，AI目前正在从实验室研究和早期应用走向更广泛的商业和工业应用。

二者都处于公众意识开始增强的阶段

伴随着市场的宣传，公众意识和认知逐步增强，虽然真正的使用者还不多。1995年左右，互联网开始进入公众视野，例如网景公司Netscape和雅虎公司的IPO上市，被看作是互联网经济开始蓬勃发展的标志。类似地，AI也在2023年成功破圈，成为公众广泛讨论的热门话题。在与用户交互层有重大的技术突破和应用扩散，正如1995年左右，网页浏览器开始让用户能够接触到互联网，大家在互联网上传的内容也随之大量产生，同理，2023年ChatGPT的诞生，让普通用户可以容易的使用AI，由此通过AIGC产生的内容也大量出现。微软在1995年推出了Windows 95操作系统，这个版本的操作系统首次内置了Internet Explorer浏览器，极大地促进了互联网的普及和使用。微软在2023年在Office和Windows中开始集成GPT，构建了属于自己的Copilot。

二者都让大众对未来产生了更高的预期

在1995年，对互联网的未来潜力存在广泛的乐观预期。网景IPO当天，其股票价格从原定的每股$28飙升至最高$75，市值一度超过20亿美元。这一显著的市场表现突显了投资者对互联网商业潜力的巨大信心。类似地，目前对AI的未来应用和影响也有着高度的期待和预测。OpenAI获得了有收益上限的，微软的100亿美元投资。预计OpenAI估值达到900亿美元。

但是从技术发展速率上来看，今天的AI发展是远远快于当初的互联网的。一是由于技术进步的加速，现代的技术创新速度普遍快于20世纪90年代，这部分得益于互联网的知识传播、更丰富的数据和更先进的计算资源。二是由于全球化的进程和资金投入，当前全球化的程度和资本市场的规模远超过互联网早期，这加速了对于AI这项新技术的研发和推广。三是由于社会接受度和适应速度，现代社会的人们对新技术的接受和适应速度通常更快，因为在过去几十年里，技术变革已成为常态，技术变革也让很多人变得富有。但是由于人性、人们的使用习惯、社会机制、法律法规等多方面的制约，也会拉低当前技术的发展速度。综合考虑这些因素，粗略估计，当前AI技术发展的一年，可能相当于1990年代互联网行业发展5-10年左右的发展时间。我们可以简单的采用1:5的换算关系，这和和多行业专家的感知也是一致的。

05 互联网的1996-2005

首先让我们看看互联网行业在1996年到2005年期间，从宏观来看主要出现了以下情况：一是技术不断成熟和商业化的深入；二是出现了互联网泡沫，之前许多的创业公司出现了倒闭，行业经历了调整，但是活下来的公司大多后面都取得了成功。三是互联网技术与有线宽带、无线网络、个人PC等新技术的不断融合。四是互联网上出现了大规模的个性化服务，例如个性化新闻、电子商务等。五是互联网带来了网络安全、数据和个人隐私泄露的问题。六是随着互联网的普及，各国政府出现了更多相关法律和规章制度。七是互联网加深了对社会和经济的影响，互联网对工作、娱乐、社交等方面的影响在此期间显著增强。那时的互联网，被一些人称为是“Web 1.0”。在那个时期，典型的互联网大事件包括：

1996年的美国电信法案，该法案放宽了对电信公司的管制，使更多的公司能够进入市场，加速互联网的成长。
1998年，谷歌成立，很快就在全球成为最主要的搜索引擎。在线支付公司PayPal成立，也形成了后来美国硅谷著名的PayPal黑手党。
1998年，Netscape将Navigator开源后，推出了Mozilla浏览器，微软将IE浏览器与 Windows捆绑销售，引发了微软公司的反垄断诉讼，形成了当年的浏览器大战。
2000年前后，出现了互联网泡沫。
2000年1月，美国在线和时代华纳合并，是迄今为止规模最大的公司合并。
2000年3月10日，纳斯达克指数达到5048.62的历史最高点，标志着泡沫的顶峰。2000年4月开始到10月份，纳斯达克指数急剧下跌，市值共下跌了78%。先前估值过高的互联网公司开始迅速贬值，也倒闭了很多公司。例如在线购物公司，如Pets.com、Webvan 和 Boo.com，以及一些通信公司，例如 Worldcom、NorthPoint 和 Global Crossing。
2000年以后，随着科技行业的增长趋于稳定，公司进行了整合；亚马逊、eBay 和谷歌等一些公司获得了市场份额，并开始在各自领域占据主导地位。现在最有价值的上市公司一般都在科技行业。
在基础设施上，宽带替代拨号上网，为个多人接触互联网的服务铺平了道路。
2000 年代初期，各种互联网所使用的技术不断出现，例如PHP、JavaScript 和 Java，AJAX、HTML 4等技术，以及各种软件框架，这些技术简化了 Web 开发的速度，这也导致了大量互联网应用的出现。
2000年以后，社交网络也得到了初步发展，2003年出现了MySpace，Facebook也就是现在Meta公司建立于2004年。

抽象总结一下那段互联网的发展历史过程，就是首先出现了3-4年的蓬勃发展，政策也给力，一些典型的互联网应用在那个时候就已经出现了，但是当时市场上出现了很多创业公司，市场竞争加剧，在当时是无法察觉哪些公司会胜出的。然后是浏览器之争，以及当时的门户之争，都代表着对早期互联网用户入口的争夺。到了2000年，整个行业乐极生悲，导致了互联网泡沫，大量初创公司倒闭。但存活下来的公司说明也是找到了真正商业模式，获得了市场的认可。但同时，从网络到PC等基础设施的完善，为2000年后的互联网拓展奠定了基础。各种开发语言和开发技术的出现，也为互联网应用的大量出现做好了准备。后来随着用户规模的增大，才出现了社交网络，代表了互联网用户已经达到了一定规模所产生的，产生了更大的网络效用。

06 预测2024年的AI领域

类比互联网行业这个阶段web1.0阶段，我们按照不同的7个维度来预测2024年AI领域，可能会发生哪些大事件？

第一个维度是基础技术发展。当时在互联网行业发生的是，宽带替代拨号上网，个人PC的普及，代表了背后英特尔芯片的生产能力。如果深入分析发现，这两项技术变革都发生在用户端，并非若干年后的云计算为互联网后端服务带来的改变。以此类比，在2024年，第一，类似于CPU的成熟，英伟达的GPU算力生产将会能够满足社会的需求，不再出现供不应求的情况。第二，AI可能会在用户端的基础技术上会出现改变，推测出可能是关于实现大模型的边缘计算能力，通过将大模型推理运算从中心下沉到用户的设备边缘，例如web，手机、汽车、智能家居等设备中，以实现更低的带宽成本和更快的响应速度。所以第一个可能的事件是“GPU算力的生产将会能够满足社会的需求，不再出现供不应求的情况”。

第二个维度是技术融合。当时在互联网行业发生的是，PHP、JavaScript、Java、AJAX、HTML 4等技术的发展和融合推动了Web开发的快速进步。以此类比，在2024年，AI技术融合更容易出现在开发端，例如传统的前端开发技术与AI快速融合，一些开发语言与AI融合，也会带来一些开发语言和开发方式消失。所以可能发生的事件是“在行业内，可以实现AI大模型在用户设备的边缘计算和推理能力”。另外一个可能是“AI技术可以与某个开发语言或开发技术充分融合，替代了原有的开发模式“。

第三个维度是行业应用维度。当时互联网行业出现的是一些行业互联网应用的早期萌芽，以及后期社交网络这种互联网原生应用出现。以此类比，在2024年，第一，垂直行业的AI应用将会出现，但仍处于十分的早期，并不为大多数普通用户所知。第二，对于媒体和内容创作行业的AI应用趋于成熟，达到普通用户可以直接上手使用的程度。第三，AI的原生应用，例如AI游戏或AI社交等，可能会在2024年的晚些时候出现。所以可能发生的事情，一个是“垂直行业的AI应用和商业模型已经出现，但是仍然非常早期，并不为大众所知”，另一个是”在媒体和内容创作行业的AI应用趋于成熟，已达到普通用户可以直接使用的级别“，还有一个是”某个类别的AI原生应用会初现端倪“。

第四个维度是社会影响。当时互联网行业出现的更多是普及和民众大范围接受的情况。以此类比，在2024年，肯定AI应用会获得人们更大范围的认知和使用，但对于政府来说，并不会有大的政策突破，但是对于教育领域，可能某些政府会明确出台支持和鼓励AI直接用于学生教育的政策，不再让学生使用AI成为灰色地带，学生和教师也更加熟练的使用AI工具用于知识获取和内容产生。所以可能发生的事情是“某些政府会明确出台支持和鼓励AI直接用于学生教育的政策“，改变原来那种拉扯博弈的状态。

第五个维度是AI隐私、安全、伦理和公平性。当时互联网行业发生的微软的反垄断官司，而并非对互联网行业实质的安全和制度措施。以此类推，在2024年，各国政府、组织以及研究机构，不会对这个领域做出大的行动举措和实质改变。所以我们不认为这个领域会有什么大的事件发生。

第六个维度是国际竞争和合作。当时互联网形成了以美国为首的垄断，以及全球化推广的事态。而今天的AI行业也有类似的特征，以此类推，在2024年，以美国为首的几家AI头部公司会成立AI的行业组织。所以可能发生的事情是“AI的行业组织成立，以解决全球化推广中的资源分配和标准设定问题”。

第七个维度是投资和市场，当时互联网行业在高速发展后产生了泡沫，考虑到目前全球的经济形势也并不乐观，以此类比，在2024年，第一，AI创投行业会出现大衰退，一些创业公司快速倒闭，AI投资变得更加谨慎，投资人对一些AI商业模式不再抱有希望，但是能够坚持过寒冬的AI公司将获得新生。第二，考虑到大衰退前，必然会有大高潮，那么AI行业可能会出现一项巨额的公司收购或并购，这笔交易金额远超它的实际价值。所以可能发生的事情，一是“AI行业可能会出现一项巨额的公司收购或并购案，交易金额远超实际价值”，随后可能会发生“AI创投行业会出现大衰退，一些创业公司快速倒闭，AI投资变得更加谨慎”。

汇总下来，我们预测的2024年全球AI行业十大事件是：