时间在变,空间随着时间也在变,不变的唯有真知灼见。
2025年01月03日  星期五
首页
财经
观察
参考
ESG
公告
市场
研究
IPO
周报
动态
推荐
首页 > 公司

百度发布“文心一言”,掌握中文和多模态生成的最新生成型人工智能

来源:真灼传媒 时间:2023-03-16 14:39:04

字号

北京2023年3月16日 /美通社/ -- 拥有强大互联网基础的领先人工智能公司百度公司(纳斯达克股票代码:BIDU,港交所股票代码:9888)("百度 "或 "公司")今天推出了新一代大型语言模型(LLM)和生成型人工智能产品文心一言。文心一言在一系列领域表现出色,包括理解中国语言和文化,生成文学和商业写作,进行复杂的数学计算,以及制作多模式内容。该人工智能产品可以理解人类的意图,并提供接近人类水平的准确、合乎逻辑和流畅的反应。

 

从2023年3月16日开始,文心一言将向最初的一批拥有邀请码的用户开放,并将很快向更多用户开放。百度还通过百度人工智能云提供对文心一言 API的访问,使企业客户能够申请和利用该平台的先进语言能力。自2月以来,已有超过650家企业加入了文心一言的生态系统。

 

大型语言模型和生成性人工智能代表了一种新的技术范式,带来了任何全球企业都不能错过的机会。文心一言被定位为一个基础的人工智能赋能平台,旨在促进金融、能源、媒体和公共事务等各行业的智能转型。百度联合创始人、董事长兼首席执行官李彦宏说。"百度设想的未来是,我们与所有人联手推动人工智能的发展,使每个人都能获得最先进的生产力工具,并确保所有人都能分享这些进步带来的好处。"


Robin Li, Co-founder, Chairman and CEO of Baidu delivers speech and presents demos at the ERNIE Bot press conference.

百度公司联合创始人、董事长兼首席执行官李彦宏在文心一言新闻发布会上发表演讲并展示演示。

 

改变生产力的工具

在北京举行的文心一言揭幕新闻发布会上,李彦宏展示了它在五个场景中的表现:文学创作、商业写作、数学计算、中文理解和多模式生成。

  • 文学创作。文心一言总结了中国流行科幻小说《三体问题》的基本内容。它根据对话查询,为故事的潜在扩展提出了五个角度,显示了它在对话、分析和内容生成方面的全面专业知识,以及它的事实性和由内在知识图谱支持的推理。

  • 商业写作。文心一言能够作为一个多功能的商业文案,展示了其从零开始构建品牌的能力,包括为公司设计一个名称,制作一个吸引人的品牌口号,以及起草新闻稿等任务。这种高水平的创造能力是可能的,因为文心一言是在数以万亿计的网页、数以百亿计的搜索和图像数据、数以千亿计的日常语音数据以及由5500亿个事实组成的知识图谱上训练出来的。

  • 数学计算。文心一言还拥有一定程度的认知能力,使其能够掌握相对复杂的任务,如数学推导和逻辑推理。在面对诸如 "鸡兔同笼 "等考验人类逻辑思维的经典难题时,文心一言可以理解问题的含义,制定正确的解决问题的方法,并按照正确的步骤得出正确的答案。

  • 中文理解。文心一言展示了无与伦比的中文自然语言处理(NLP)能力,这体现在它对中文和文化细微差别的理解上。在一个演示中,文心一言解释了成语 "洛阳纸贵 "背后的含义,这暗指由于诗歌的流行而对纸张的高需求。文心一言阐述了支撑这个成语的经济理论--供求法则--并创作了一首诗,将成语的四个汉字作为每行的第一个字。 

  • 多模式生成。文心一言可以在文本提示下生成文本、图像、音频和视频,甚至能够用几种当地方言(如四川方言)发声。文心一言的视频生成功能由于其相对较高的成本,尚未向所有用户提供。

"多模式是生成式人工智能不可否认的未来趋势"李彦宏说。"未来,随着我们继续完善百度统一的多模态大模型,文心一言的多模态生成能力将得到推进。"

ERNIE Bot demonstrates multi-modal generation ability, able to produce text, images, audio and video given a text prompt.

文心一言展示了多模式生成能力,能够在文本提示下生成文本、图像、音频和视频。

 

尽管文心一言的能力,这种类型的LLM仍然远远不够完美。基于现实世界的用户反馈的持续改进仍然至关重要。

"一旦我们将文心一言投入使用,"李说,"我们将建立一个机制,让真实世界的用户反馈、开发人员的呼叫和模型的迭代协同工作,以更有效和高效地增强模型。"

 

文心一言的技术基础

百度首席技术官王海峰说,文心一言是百度多年研究和行业实践的结晶。这个新一代的知识增强型LLM是建立在百度内部模型ERNIE(知识整合的增强表示)和PLATO(预训练的对话生成模型)之上。自2019年发布以来,ERNIE已经从一个自然语言理解模型发展成为一个具有跨语言、跨模式、跨行业和跨任务能力的模型平台。

百度使用监督微调、从人类反馈中强化学习、提示学习、知识增强、检索增强和对话增强来训练ERNIE机器人。

李彦宏在新闻发布会上发言,强调了百度作为全球少数几家提供完整人工智能栈的公司之一的独特地位。这包括人工智能芯片Kunlun、深度学习框架PaddlePaddle、预训练模型ERNIE,以及各种应用,如搜索、人工智能云、自动驾驶和小度智能设备。

李彦宏强调,百度的全人工智能栈的优势在于它能够实现端到端的优化,大幅提升效率。框架和模型之间的协同作用降低了成本,简化了模型开发。百度的PaddlePaddle框架已被用于开发4D混合并行技术,这大大提升了超大规模模型的训练和推理效率。百度的全人工智能栈将促进一个闭环系统,每一层都可以提供反馈,帮助文心一言继续迭代和改进。

 

新兴的商业机会

李彦宏预测,LLMs将为三个新兴的商业机会铺平道路:提供模型即服务解决方案的云计算公司,专注于微调特定行业模型的公司,以及创建基于LLMs的应用程序的企业。

李彦宏说,百度人工智能云将很快推出基于文心一言的云服务和应用产品,包括公共云和私有化部署。

"文心一言不是中美技术对抗的工具。它是几代百度技术人员追求技术改变世界的梦想的产物。它是一个全新的平台,使我们能够服务于数以亿计的用户,并为成千上万的行业赋能,也是创新驱动发展的有力例证,"李彦宏在会议上说。"我们相信,人工智能(AI)将彻底改变我们今天所知的每个行业。人工智能的巨大长期价值及其对生活各方面的变革性影响仅处于起步阶段。未来会有无数突破性的应用和产品,以及更多里程碑式的事件"。

 

关于百度

百度成立于2000年,其使命是通过技术使复杂的世界变得更简单。百度是一家具有强大互联网基础的领先人工智能公司,在纳斯达克以 "BIDU "和港交所以 "9888 "交易。一张百度ADS代表8股A类普通股。 

 

微信扫码 > 右上角点击 > 分享