对话海国图智陈定定:闯入AI世界的文科教授

添加书签

随着人智能技术的飞速发展,AIGC作为一种新兴的应用领域,正在引发广泛的关注。

“从去年12月到现在,感觉已经过了好几年,变化超出我们所有人的想象。”陈定定表示,“作为一个文科生,我觉得有很多想象空间被打开了。”

近期,AIGC开放社区联合科技慢半拍播客栏目专访了这位在AI领域创业,来自暨南大学国际关系学院的教授。陈定定表示从国际关系、政治研究中跨界到AI领域,“是从实用这个角度去理解科技,”“我希望科技能够为我们的工作赋能。”

陈定定是海国图智研究院创始人兼院长,同时也是暨南大学国际关系学院教授,博士研究生导师,主要研究领域包括国际关系理论、中美关系、中国外交和国际公众舆论等。

海国图智研究院(Intellisia Institute)在2015年由陈定定教授成立于深圳,属中国第一批新型社会智库之一。海国图智成立于2018年,是脱胎于海国图智研究院的信息科技企业,其核心业务是构建基于AIGC技术的智能服务平台。今年5月,海国图智宣布获得千万元天使轮融资。

在陈定定看来,ChatGPT出来以后,文本写作已经得到质的飞跃。“我们发现其实G端、B端、C端都有客户,因为它打破了界限。”

大模型落地,应该关注实用价值。海国图智的产品以RWKV技术为主,结合开源的GLM,实现了国产化的需求。同时,RWKV基于RNN路径,可以一次性写出1~2万字的内容,完全满足政务领域算力消耗小,超长文本写作的需求。

他认为,企业的DNA决定了企业的赛道,也形成竞争的壁垒。海国图智不是用技术找赛道,而是用技术来赋能业务。海国图智在政务领域拥有丰富经验,基因决定了公司的产品,同时也决定了其他公司无法跨界到这个赛道。

展望AIGC未来,谈及下一步规划,他认为在商业与应用层面考虑,重复造轮子没有意义,“对于一个创业公司来说,这个阶段技术不重要,商业模式才重要。商业布局,渠道建设,先期的准备,就是领先的法宝。”

01

AIGC打开了更多想象空间


您之前的履历和经验是国际关系和政治研究,是什么促使你选择人工智能这个领域?

研究国际问题首要困难是语言。通常大多数研究者只懂一门外国语言,但是研究国际问题需要了解多个国家的资讯,这就需要借助工具。2018年,谷歌突破神经网络翻译方法,看各个国家本地的报道或文献就没有什么困难了。也是从那个时候,我开始关注机器翻译。

机器翻译另一个关联是自动写作,我在高校做老师,主要工作是写作,所以一直渴望有一款软件或者程序能够帮助我写文献,做摘要,甚至是写长文章。过去有自动写作的产品,但是直到去年12月OpenAI ChatGPT出来,自动写作的问题才得以更好地解决。

在逐渐加入AI的过程中,您是怎么看待AI技术发展的?

AI技术发展不是线性的,整个过程带有高低潮的节奏感,大概四到五年就会有一个领域突然迎来爆发。去年,文本、图像、视频等领域一下子集中爆发了,让大家有很多期待。作为一个文科生,我也觉得有很多想象空间被打开了。

与其他行业比较,政务AIGC产品对技术是否会产生新的要求?

AIGC在技术上没有区别,但是在应用上会划分不同的赛道,有娱乐、游戏,也有严肃内容。海国图智的基因是写材料、写报告和学术,这个基因决定了公司现在的产品,同时也决定了娱乐或游戏公司没办法跨界到这个赛道。

同时,海国图智并不是一个典型的创业公司或科技公司,更像是一家科技应用公司,用科技赋能行业,提升效率。很多公司用技术找赛道,先把锤子做出来再到处找钉子,海国图智则是在政务领域做了多年,发现有更好的工具可以提高效率,于是用新技术来赋能。

当然,技术也是必不可少的。海国图智拥有众多算法工程师,专门做技术。传统的基因是咨询学术,现在增加了新的基因,未来形成基因突变也有可能。

目前产品主要是服务于哪些人群,是否有一些案例?

文本生成拥有广泛的含义,在G端、B端、C端均能发挥效用。首先,政府部门有很多的材料报告要写,比如领导发言稿,高频但是通常要求不高,机器助手可以提供一些思路或者直接文本生成。其次,B端和C端都有回邮件,写通知,做方案等高频场景,难度高一点的市场分析、咨询报告、财务分析、投资顾问等,只要是围绕着文本生成,机器助手都可以提供帮助。

海国图智AIGC产品矩阵

有人担心AIGC会造成大量失业,您怎么看?

在政务领域,最理想状态是提高政府为人民服务的效率。如果一个部门配置是三个人,写通知,发邮件占用一个人,那就只有两个人去为群众服务。但是,如果这部分重复性工作让人工智能来完成,节约的人手就可以去服务群众了。所以,AIGC本质是解放劳动力,让大家关注更有价值的工作。

这些套路性的,重复性的、没有想法的文本,对于政府行业的价值究竟有多大,或者我们可以做些什么,来扭转这个局面?

这是一个非常重要的问题。可行的方案是通过外挂知识库、本地知识库,让大模型的回答更加精准,经过测试精确度可以提高到90%。此外,目前的产品还是1.0版本,按照AI技术发展的规律,到了2.0、3.0甚至更高版本,这些问题会逐步解决。

在政务领域,我们是如何做到思想意识或者政治修养对齐?

一是人工监督,AIGC生成内容通过邀请专家来审核,形成政治对齐。二是机器监督,让机器模型作为裁判来评判其他模型的答案。当然,作为裁判的模型经过提前训练,与人类价值观对齐。

目前产品在政务领域落地,有没有遇到什么阻碍?

一方面,政府或企业有迫切的需求,希望提高效率,减少重复工作的频率和强度。虽然不是所有工作场景都希望机器做,但是需求是肯定的。另一方面,这是一个慢慢渗透的过程。决策层还需要考虑伦理、潜在不可知的社会影响。整体来看,这是一个矛盾,既希望提高效率,又担心渗透过快,产生未知影响。

02

落地需要关注实用价值


在您看来,国外的大模型和国内的大模型呈现出怎样的格局?

首先,全球化时代,任何突破性的技术不可能单纯由一个国家的科学家做出来。国外大模型的创始成员有很多成员都是中国人,或者从中国出去的学生,所以不能用单个国家来区分大模型。

其次,开源正在成为一种趋势。开源加速了知识流动性,将会让更多人获得知识的成果,这也是知识生产者的最大理想。我们不否认存在一些竞争,但是全球化和开源传递了一个积极信号,人类是作为一个整体在不停进步和发展。

您能介绍一下RWKV,和 Transformer,LLaMa,GPT这些模型有什么区别?

海国图智的产品以RWKV技术为主,结合了开源的GLM,是完全国产化的产品。RWKV基于RNN路径,通过吸收Transformer的一些优点,可以一次性写出1~2万字的内容,完全满足政务领域算力消耗小,超长文本写作的需求。

独立部署,具体是怎样的支持?

目前支持单机单卡、消费级GPU,部分游戏卡。未来算力需求还会进一步下降,CPU甚至手机端也可以。单机单卡目前可以支持3-5人同时使用。

海国图智AIGC产品类型

本地部署之后,如何获取最新的一些资讯、知识?

一种是知识库更新,严格按照断网保密使用的设备,可以通过蓝光Combo光驱加载最新的知识。一种是系统更新,半年为一个周期,通过更换固态硬盘实现知识库和模型的整体升级。

需要指出,对于应用者来说,怎么平衡隐私保护、安全性跟便捷性,没有完美答案,只有一个满足需求的均衡点。对于中小微企业来说,如果没有太多商业保密的需求,完全可以联网使用,RWKV也支持联网。

很多数据来自企业内部,其中也包含一些非结构化数据,所以在这个过程中,我们会怎么采集数据训练模型?

一是入场训练,如果客户保密要求比较高,可以外派工程师入驻帮助训练,进出不带数据实现保密要求。二是分类分级后训练,数据虽然不能公开,但通过清洗,分类分级可以场外处理。最后就是利用公开的数据进行训练。

03

“用”技术与“等”技术


谈一下AIGC未来的发展,或者您下一步的计划?

AIGC发展迅猛,变化超出所有人的想象。不考虑国家层面,从商业以及应用层面来看,首先,重复造轮子没有任何意义,一是大模型需要强大的财力、算力支持,二是已经落后很多,做出来也会被降维打击。其次,技术将会迎来新的关键点,年底或者明年六月是关键时间节点。

对于创业公司而言,在新技术迭代之前,这个阶段商业模式很重要,商业布局,渠道建设,先期准备,是企业领先的法宝。第一应用为王,第二提前部署,第三想清楚谁会为产品买单,提前让客户用上一个有效率的产品,在用的同时同步迭代最新的技术,这是一个比较好的商业策略。

希望收听完整音频对话内容的朋友,请移步【科技慢半拍】播客节目:

END