对话海国图智陈定定：闯入AI世界的文科教授

添加书签

AIGC开放社区
2023-08-09

随着人工智能技术的飞速发展，AIGC作为一种新兴的应用领域，正在引发广泛的关注。

“从去年12月到现在，感觉已经过了好几年，变化超出我们所有人的想象。”陈定定表示，“作为一个文科生，我觉得有很多想象空间被打开了。”

近期，AIGC开放社区联合科技慢半拍播客栏目专访了这位在AI领域创业，来自暨南大学国际关系学院的教授。陈定定表示从国际关系、政治研究中跨界到AI领域，“是从实用这个角度去理解科技，”“我希望科技能够为我们的工作赋能。”

陈定定是海国图智研究院创始人兼院长，同时也是暨南大学国际关系学院教授，博士研究生导师，主要研究领域包括国际关系理论、中美关系、中国外交和国际公众舆论等。

海国图智研究院（Intellisia Institute）在2015年由陈定定教授成立于深圳，属中国第一批新型社会智库之一。海国图智成立于2018年，是脱胎于海国图智研究院的信息科技企业，其核心业务是构建基于AIGC技术的智能服务平台。今年5月，海国图智宣布获得千万元天使轮融资。

在陈定定看来，ChatGPT出来以后，文本写作已经得到质的飞跃。“我们发现其实G端、B端、C端都有客户，因为它打破了界限。”

大模型落地，应该关注实用价值。海国图智的产品以RWKV技术为主，结合开源的GLM，实现了国产化的需求。同时，RWKV基于RNN路径，可以一次性写出1~2万字的内容，完全满足政务领域算力消耗小，超长文本写作的需求。

他认为，企业的DNA决定了企业的赛道，也形成竞争的壁垒。海国图智不是用技术找赛道，而是用技术来赋能业务。海国图智在政务领域拥有丰富经验，基因决定了公司的产品，同时也决定了其他公司无法跨界到这个赛道。

展望AIGC未来，谈及下一步规划，他认为在商业与应用层面考虑，重复造轮子没有意义，“对于一个创业公司来说，这个阶段技术不重要，商业模式才重要。商业布局，渠道建设，先期的准备，就是领先的法宝。”

AIGC打开了更多想象空间

您之前的履历和经验是国际关系和政治研究，是什么促使你选择人工智能这个领域？

研究国际问题首要困难是语言。通常大多数研究者只懂一门外国语言，但是研究国际问题需要了解多个国家的资讯，这就需要借助工具。2018年，谷歌突破神经网络翻译方法，看各个国家本地的报道或文献就没有什么困难了。也是从那个时候，我开始关注机器翻译。

机器翻译另一个关联是自动写作，我在高校做老师，主要工作是写作，所以一直渴望有一款软件或者程序能够帮助我写文献，做摘要，甚至是写长文章。过去有自动写作的产品，但是直到去年12月OpenAI ChatGPT出来，自动写作的问题才得以更好地解决。

在逐渐加入AI的过程中，您是怎么看待AI技术发展的？

AI技术发展不是线性的，整个过程带有高低潮的节奏感，大概四到五年就会有一个领域突然迎来爆发。去年，文本、图像、视频等领域一下子集中爆发了，让大家有很多期待。作为一个文科生，我也觉得有很多想象空间被打开了。

与其他行业比较，政务AIGC产品对技术是否会产生新的要求？

AIGC在技术上没有区别，但是在应用上会划分不同的赛道，有娱乐、游戏，也有严肃内容。海国图智的基因是写材料、写报告和学术，这个基因决定了公司现在的产品，同时也决定了娱乐或游戏公司没办法跨界到这个赛道。

同时，海国图智并不是一个典型的创业公司或科技公司，更像是一家科技应用公司，用科技赋能行业，提升效率。很多公司用技术找赛道，先把锤子做出来再到处找钉子，海国图智则是在政务领域做了多年，发现有更好的工具可以提高效率，于是用新技术来赋能。

当然，技术也是必不可少的。海国图智拥有众多算法工程师，专门做技术。传统的基因是咨询学术，现在增加了新的基因，未来形成基因突变也有可能。

目前产品主要是服务于哪些人群，是否有一些案例？

文本生成拥有广泛的含义，在G端、B端、C端均能发挥效用。首先，政府部门有很多的材料报告要写，比如领导发言稿，高频但是通常要求不高，机器助手可以提供一些思路或者直接文本生成。其次，B端和C端都有回邮件，写通知，做方案等高频场景，难度高一点的市场分析、咨询报告、财务分析、投资顾问等，只要是围绕着文本生成，机器助手都可以提供帮助。

海国图智AIGC产品矩阵

有人担心AIGC会造成大量失业，您怎么看？

在政务领域，最理想状态是提高政府为人民服务的效率。如果一个部门配置是三个人，写通知，发邮件占用一个人，那就只有两个人去为群众服务。但是，如果这部分重复性工作让人工智能来完成，节约的人手就可以去服务群众了。所以，AIGC本质是解放劳动力，让大家关注更有价值的工作。

这些套路性的，重复性的、没有想法的文本，对于政府行业的价值究竟有多大，或者我们可以做些什么，来扭转这个局面？

这是一个非常重要的问题。可行的方案是通过外挂知识库、本地知识库，让大模型的回答更加精准，经过测试精确度可以提高到90%。此外，目前的产品还是1.0版本，按照AI技术发展的规律，到了2.0、3.0甚至更高版本，这些问题会逐步解决。

在政务领域，我们是如何做到思想意识或者政治修养对齐？

一是人工监督，AIGC生成内容通过邀请专家来审核，形成政治对齐。二是机器监督，让机器模型作为裁判来评判其他模型的答案。当然，作为裁判的模型经过提前训练，与人类价值观对齐。

目前产品在政务领域落地，有没有遇到什么阻碍？

一方面，政府或企业有迫切的需求，希望提高效率，减少重复工作的频率和强度。虽然不是所有工作场景都希望机器做，但是需求是肯定的。另一方面，这是一个慢慢渗透的过程。决策层还需要考虑伦理、潜在不可知的社会影响。整体来看，这是一个矛盾，既希望提高效率，又担心渗透过快，产生未知影响。

落地需要关注实用价值

在您看来，国外的大模型和国内的大模型呈现出怎样的格局？

首先，全球化时代，任何突破性的技术不可能单纯由一个国家的科学家做出来。国外大模型的创始成员有很多成员都是中国人，或者从中国出去的学生，所以不能用单个国家来区分大模型。

其次，开源正在成为一种趋势。开源加速了知识流动性，将会让更多人获得知识的成果，这也是知识生产者的最大理想。我们不否认存在一些竞争，但是全球化和开源传递了一个积极信号，人类是作为一个整体在不停进步和发展。

您能介绍一下RWKV，和 Transformer，LLaMa，GPT这些模型有什么区别？

海国图智的产品以RWKV技术为主，结合了开源的GLM，是完全国产化的产品。RWKV基于RNN路径，通过吸收Transformer的一些优点，可以一次性写出1~2万字的内容，完全满足政务领域算力消耗小，超长文本写作的需求。

独立部署，具体是怎样的支持？

目前支持单机单卡、消费级GPU，部分游戏卡。未来算力需求还会进一步下降，CPU甚至手机端也可以。单机单卡目前可以支持3-5人同时使用。

海国图智AIGC产品类型

本地部署之后，如何获取最新的一些资讯、知识？

一种是知识库更新，严格按照断网保密使用的设备，可以通过蓝光Combo光驱加载最新的知识。一种是系统更新，半年为一个周期，通过更换固态硬盘实现知识库和模型的整体升级。

需要指出，对于应用者来说，怎么平衡隐私保护、安全性跟便捷性，没有完美答案，只有一个满足需求的均衡点。对于中小微企业来说，如果没有太多商业保密的需求，完全可以联网使用，RWKV也支持联网。

很多数据来自企业内部，其中也包含一些非结构化数据，所以在这个过程中，我们会怎么采集数据训练模型？

一是入场训练，如果客户保密要求比较高，可以外派工程师入驻帮助训练，进出不带数据实现保密要求。二是分类分级后训练，数据虽然不能公开，但通过清洗，分类分级可以场外处理。最后就是利用公开的数据进行训练。

“用”技术与“等”技术

谈一下AIGC未来的发展，或者您下一步的计划？

AIGC发展迅猛，变化超出所有人的想象。不考虑国家层面，从商业以及应用层面来看，首先，重复造轮子没有任何意义，一是大模型需要强大的财力、算力支持，二是已经落后很多，做出来也会被降维打击。其次，技术将会迎来新的关键点，年底或者明年六月是关键时间节点。

对于创业公司而言，在新技术迭代之前，这个阶段商业模式很重要，商业布局，渠道建设，先期准备，是企业领先的法宝。第一应用为王，第二提前部署，第三想清楚谁会为产品买单，提前让客户用上一个有效率的产品，在用的同时同步迭代最新的技术，这是一个比较好的商业策略。

希望收听完整音频对话内容的朋友，请移步【科技慢半拍】播客节目：

END

对话海国图智陈定定：闯入AI世界的文科教授