AIGC每周盘点 |百度发布文心一言;Open AI发布GPT-4;微软将“ChatGPT”内置在Office中

添加书签

专注AIGC领域的专业社区,关注GPT-3、百度文心一言等大语言模型(LLM)的发展和应用落地,以及国内LLM的发展和市场研究,欢迎关注!

资讯

百度正式发布文心一言,中国版“ChatGPT”来了!

北京时间3月16日下午2点,百度在北京总部召开新闻发布会,正式发布了生成式AI产品——文心一言。(API申请地址:https://cloud.baidu.com/survey_summit/wenxin.html?track=C109067&track=4016a6e2daa72dd8f416b6eba17830b31f1db02567e779da)

百度创始人、董事长兼首席执行官李彦宏,百度首席技术官王海峰出席了发布会,并对「文心一言」的产品功能、技术框架、产品优势、应用场景、产业发展等多个维度进行了深度解读。(大会视频:https://pan.quark.cn/s/1f50f95a6fe2#/list/share

从现场的演示Demo来看,「文心一言」对文本的理解能力、推理能力、回答准确度、逻辑性、多模态等方面反应迅速且准确,丝毫不输ChatGPT。但李彦宏也坦言,由于「文心一言」刚推出功能方面还有很多完善和进步的空间,需要企业、用户等多方资源共同努力,才能让「文心一言」变得更好、更聪明。

Open AI正式发布GPT-4,史上最强ChatGPT来了!

3月15日凌晨2点,Open AI宣布正式发布GPT-4。这将是Open AI最先进的系统,可用于生成更安全、更拥有的交互响应。

Open AI花了6个月的研发时间,使得GPT-4在生成内容方面更安全、一致。与 GPT-3.5相比,GPT-4响应不允许内容请求的可能性低82%,产生事实响应的可能性高40%,高级推理能力也超越了ChatGPT。

目前,Open AI在ChatGPT Plus上提供GPT-4服务,开发人员可通过API构建应用程序和服务。(GPT-4 API申请地址:https://openai.com/waitlist/gpt-4-api)

清华系公司「智谱AI」开源 ChatGLM-6B 大模型,性能不输GPT-3

由清华技术成果转化的公司智谱 AI 宣布开源了 GLM 系列模型的新成员 ——中英双语对话模型 ChatGLM-6B,支持在单张消费级显卡上进行推理使用。这是继此前开源GLM-130B 千亿基座模型之后,智谱 AI 再次推出大模型方向的研究成果。(开源地址:https://github.com/THUDM/ChatGLM-6B)

此外,基于千亿基座的 ChatGLM 线上模型目前也在 chatglm.cn 进行邀请制内测,用户需要使用邀请码进行注册,也可以填写基本信息申请内测。

根据介绍,ChatGLM-6B 是一个开源的、支持中英双语问答的对话语言模型,并针对中文进行了优化。该模型基于 General Language Model (GLM)架构,具有 62 亿参数。结合模型量化技术,用户可以在消费级的显卡上进行本地部署(INT4 量化级别下最低只需 6GB 显存)。

微软将“ChatGPT”集成在Word、Excel、PPT等产品中,全民自动化办公时代降临!

北美时间3月16日,微软召开了“The Future of Work With AI”大会。微软董事长兼首席执行官Satya Nadella、微软高级副总裁Jared Spataro等高管出席了本次大会。如何通过生成式AI产品,加速日常办公效率成为大会的重点主题之一。

在产品介绍环节,微软推出了Microsoft 365 Copilot,这是一种基于大语言模型开发的AI产品,功能类似ChatGPT,并将其集成在Microsoft 365(Word、Excel、PPT、Outlook等)和Microsoft Graph中。

早在3月6日,微软推出了Dynamics 365 Copilot,成为全球首家为ERP、CRM提供ChatGPT的厂商。现在,微软将Copilot集成在Office等产品矩阵中,可根据简单描述自动生成PPT,自动生成Excel数据等,这标志着一个崭新的“全民自动化办公时代”已经来临。

Midjourney V5正式公测:2分钟自动生成专业画师级图片

3月16日,著名AI自动生成图片平台Midjourney宣布V5版本正式公测。(测试地址:https://discord.com/channels/662267976984297473/@home)

用户通过简单的命令在Midjourney平台,2分钟便能快速生成媲美专业画师级的图片,涵盖漫画、油画、赛博、3D、素描、写实、朋克、水墨等所有主流画作类型。并且还可以根据需求对生成的图画进行二次修改,极大节省了创作时间。

2秒钟无限扩展图片设计、联想,Stability AI发布Stable Diffusion Reimagine

著名开源AI自动生成图片平台Stability AI在官网宣布,推出了Stable Diffusion Reimagine。这是一种全新的图片扩展、联想工具,用户只需要上传一张图片,该平台会自动生成3张联想图片,并且支持更细致化的编辑。(体验地址:https://clipdrop.co/stable-diffusion-reimagine?ref=producthunt

例如,你上传了一张卧室装修的图片,Reimagine自动生成了3张风格、位置各不相同的图片,用户还可以点击图片的重置按钮,2秒钟就能完成图片的再次生成。

简单来说,这是一款可以让图片扩展、充满联想的产品,只要你愿意可以无限重置下去。

性能比肩GPT-3.5,大幅度降低训练费用,斯坦福开源Alpaca模型

3月14日,斯坦福大学研究中心宣布开源了,类Open AI的GPT-3.5大语言模型Alpaca。(开源地址:https://github.com/tatsu-lab/stanford_alpaca

Alpaca是从Meta的LLaMA模型70亿参数中微调而成。Alpaca的行为类似于OpenAI 的GPT-3.5(text-davinci-003),并且在运行环境和训练费用方面更低。(在线体验地址:https://alpaca-ai-custom4.ngrok.io/)

将ChatGPT集成在产品中,著名聊天社区Discord推出3款智能聊天机器人

近日,全球著名游戏聊天社区Discord宣布将Open AI的ChatGPT集成在产品中,以增强人工智能生成内容体验。这三款产品分别是Clyde、AutoMod AI和Conversation Summaries。同时开源了头像混合产品Avatar Remix(地址:https://github.com/discord/avatar-remix-bot/)

其中,Clyde可以进行回答问题、扩展话题等;AutoModAI用于监督聊天机器人的行为,当发现虚假、违规信息时会及时阻止;Conversation Summaries,可自动生成对话摘要,帮助用户掌握最新聊天动态。

值得一提的是,知名AI自动绘画平台Midjourney使用的服务器便是由Discord提供。目前,超过1300万用户使用了其服务并自动创造了超过10亿张图片。

加速ChatGPT等研发进程,微软Azure推出ND H100 v5 VM

据悉,微软Azure的NDH100 v5 VM,支持从8到数千个NVIDIA H100 GPU,并通过NVIDIA Quantum-2 InfiniBand网络功能实现互连。性能方面比微软上一代使用的ND A100 v4 VM有显著的提升,这也是Azure最强大、可大规模扩展的AI虚拟机系列。

Open AI总裁兼联合创始人Greg Brockman表示,与 Azure共同设计超级计算机对于满足AI苛刻的训练需求至关重要。这使得Open AI能够在 ChatGPT 等产品上开展研究和调整工作。

国内首创房产营销AIGC产品“原境空间”发布,商汤科技携手中原地产加速AI布局

3月17日,由中原地产联合国内领先的AI科技公司商汤科技举办的“数智时代,原动未来——AIGC下的地产数智化之路”高峰论坛活动在深圳举办,国内首创的房产营销AIGC产品“原境空间”正式发布。

原境空间作为AIGC首个落地的产物,究竟如何打破时间和空间的限制?深圳中原二级市场战略发展中心总经理钱蛟为大家进行了深入解读。原境空间是中原地产和商汤科技联合打造的房产营销AIGC解决方案,产品通过商汤科技AI+MR领域领先的数字化技术,为地产行业开创线上与线下一体、虚拟与现实融合的全新营销模式。将助力整个营销流程和客户服务链路的数字化升级,推进房地产营销全流程更加智慧化。

将ChatGPT集成在RPA产品中,Compass UOL 增强超级自动化能力

近日,全球知名专注数字化转型厂商Compass UOL宣布将ChatGPT集成在RPA产品中,以提升超级自动化能力和客户自动化体验。

Compass UOL表示,通过集成将实现技术上的互补充分发挥各自的技术特点,ChatGPT将主要用于内容搜集、生成等,而RPA可将搜集的数据执行自动化操作,例如,上传、录入等,从而打造功能更强大的超级自动化解决方案。

Compass UOL还可以根据组织的实际自动化需求,将 ChatGPT集成在客服、咨询、财务等业务场景中,提供个性化产品定制服务。

对话式AI自动化平台Uniphore收购Red Box,以增强AIGC能力

著名对话式AI自动化平台Uniphore宣布收购,拥有35年历史的语音识别厂商Red Box,以增强AIGC(人工智能生成内容)能力。

通过此次收购,Uniphore将增强实时通话后的数据捕获和转化,同时保证每一个语音通话和屏幕的数据安全。将业内领先的对话式智能自动化与领先的语音识别相结合,可以从语音客服的对话中提取更高的商业价值。

融资

提供类“ChatGPT”功能,自动生成ESG报告等,SESAMm获得3500万欧元B2轮融资

NLP(人工智能语言处理)领导者SESAMm宣布获得3500万欧元B2轮融资,本次由法国巴黎银行的风投部门Opera Tech 和Elaia领投,Unigestion、RBI、AFG Partners等跟投。

SESAMm通过对200亿篇100种语言,涵盖全球500万家企业信息的ESG(文章结尾介绍了该概念)数据湖,预训练了类似“ChatGPT”的大语言模型(已经开放了API)。并根据不同ESG业务场景进行了微调,提供自动分析投资策略、企业负面新闻追踪、供应商监控、自动生成风险评估报告等智能服务。

简单来说,可以把SESAMm看成是一个聚焦在ESG领域具有ChatGPT 功能的“搜索引擎”。同时提供了深度数据分析功能并生成ESG数据报告,通过邮件等方式自动发送到用户手中,以实时了解一家企业、机构的最新动态、发展趋势。

END

加入AIGC开放社区交流群

添加微信:13331022201 ,备注“职位信息&名字”

管理员审核后加入讨论群