自然语言处理或 NLP 是一种基于人工智能 (AI) 的技术,它使机器学习对业务应用程序有用。
根据麦肯锡 2021 年的一项调查,超过一半的企业将 AI 用于至少一个流程,其中一些企业处于 AI 实施的高级阶段。
NLP 简化了人与机器之间的信息交换,使 AI 算法能够以新的方式接收数据。该技术还对元宇宙产生了影响,因为它可以让虚拟世界中的数字人类变得更加逼真。
什么是自然语言处理?
自然语言处理 (NLP) 是语言学、计算机科学和人工智能的跨学科研究,旨在构建能够理解人类输入并做出相应响应的数字系统。
从本质上讲,它允许只理解二进制语言(0 和 1)的机器处理人类语言。
NLP 有两个核心子集,自然语言理解 (NLU) 和自然语言生成 (NLG)。前者将人类语言转换为机器可读的格式以进行 AI 分析。分析完成后,NLG 会生成适当的响应,并以相同的语言将其发送回人类用户。
NLP 是如何工作的?
NLP 可以应用于文本和语音。对于文本,它使用光学字符识别 (OCR) 将英文或任何其他语言的文本转换为计算机可以理解的数据块。
它采用非结构化文本(如 PDF 表单或社交媒体)并将其转换为机器处理。就语音而言,它使用语音识别技术将音频分解为称为音素或不同声音单元的语言结构,然后将其与其文本等价物匹配以进行机器处理。
一旦文本或语音被转换,NLP 引擎会将其传递给 AI 算法,该算法可以使用此输入来执行各种任务,例如使用常见问题解答数据库解决查询或生成转录。
分析输入数据后,将通过 NLG 层将算法的响应转换为文本或音频格式以供人类用户理解。
数字应用程序中的常见 NLP 任务
NLP 技术嵌入到应用程序和软件系统中,以执行各种任务。这些包括:
语音转文本——将语音输入转换为文本输出,以解决实时字幕和会议转录等用例。用于语音到文本的 NLP 也有助于实现可访问性目的。
语义消歧——一种先进的 NLP 技术,允许机器理解单词的上下文用法。
情绪分析——这是 NLP 最常见的应用之一。它将人类陈述转换为机器可读的格式,以检测表示情绪的特定单词和短语。以这种方式使用的 NLP 允许社交媒体算法了解哪些帖子是快乐的,哪些是悲伤的,等等。
语法标记——在这里,NLP 有助于根据上下文识别特定单词的词性。它对于生成准确的会议记录和摘要很有用。
命名实体识别——NLP 引擎可以识别和分类文本和语音对象。
这些应用程序出现在不同类型的软件中,包括虚拟现实 (VR) 应用程序。
NLP 在元宇宙中意味着什么?
元宇宙(或任何其他虚拟环境)中的 NLP 将为 VR 用户提供另一种提供输入的方法。它还将为 VR 环境提供一种响应用户输入的替代方式。
通常,VR 中的导航是通过手持控制器、手势或眼球追踪进行的。用户可以按下几个按钮、移动操纵杆、向上/向下滚动等,使用 VR 控制器来导航像元宇宙这样的沉浸式空间。NLP 为这种体验添加了基于语音的控件。
例如,当玩家对着麦克风说话时,VR 游戏中的门就会打开。由于元宇宙试图以极高的真实度复制现实世界的体验,语音命令将发挥重要作用。
同样,元宇宙内部的数字元素也可以使用 NLP 进行“回话”。游戏中的非游戏角色 (NPC) 或数字人通常使用语音气泡来回应 VR 用户。
NLP 会将这些交互提升到一个全新的水平,从而可以生成带有语言细微差别和语音调制的音频响应。它甚至可以自动将回复翻译成多种语言,以覆盖更广泛的受众。
这就是为什么像 Meta Platforms Inc. 这样的元宇宙公司正在为开发人员推出 NLP 辅助工具。2021 年 11 月,Meta推出了语音 SDK,允许 VR 开发人员使用语音命令和多语言支持创建虚拟环境。
为什么自然语言处理对 XR 很重要?
NLP 在扩展现实 (XR) 中发挥着至关重要的作用,因为它:
允许用户即使在他们的手被占用时也能执行命令。这对使用 XR 辅助技术的现场服务人员有重大影响。
简化 VR 中的网页浏览和搜索体验,提供虚拟键盘的替代方案。
让驾驶和其他免提导航体验在 VR 中更加无缝。这主要对游戏玩法很重要。
通过自动翻译和转录。
支持更逼真的虚拟助手,可以实时处理用户输入。组织可以使用该技术在元界中提供支持服务。
应该记住,NLP 仍然是一项不断发展的技术,在处理输入时其准确度水平低于 100%。
虽然它在未来具有巨大潜力,但组织必须在实验阶段投资开发 NLP,在各种数据上训练 NLP 模型,并确保对捕获的语音和文本数据进行正常的使用。