浅谈自然语言处理技术的应用领域

2021-01-30 15:28| 发布者: |

  一种流行文本分类应用是情感分析(),其中的常用类别标签表示源文本的情绪色调,例如“积极”或“消极”。

  此外,还可以按需要给文本分配多个类别标签(即所谓的多标签分类)。 例如为tweet分配多个主题标签。

  语言建模真的是一个很有趣的自然语言问题的子任务,特别是在其他一些任务的基础上调节语言模型。

  “问题是预测出给定单词的下一个单词。 该任务是语音或光学字符识别的基础,也用于拼写校正,手写识别和统计学的机器翻译。”

  除了关于学术研究的兴趣,语言模型还是许多应用深度学习的自然语言处理架构的关键组成部分。

  语言模型可以学习词与词之间的概率关系,然后生成与源文本统计上一致的词汇新序列。

  “语音识别的任务是将包含口语在内的自然语言的声学信号转换成符合说话者预期的相应的单词序列。”

  给定依据文本生成的音频数据,模型必须能生成人类可读的文本。鉴于过程的自动性,这个任务也可称为自动语音识别(Automatic Speech Recognition, ASR)。

  说明生成是解决如何描述图像内容的问题,依照诸如照片等的数字图像生成和图像内容相关的文本描述。

  “机器翻译,从一种语言到另一种语言的文本或语音的自动翻译,是NLP最重要的应用之一。”

  鉴于加入了深层神经网络,该任务现在也被称为神经机器翻译(neural machine translation)。

  “在机器翻译任务中,输入是由某种语言的符号序列组成,而计算机程序必须将输入转换成其他语言的符号序列。 机器翻译经常应用于自然语言,例如从英语翻译成法语。 近来,深度学习开始对该任务产生重要影响。”

  文档总结是指根据文本创建对应简短描述的任务。其语言模型用来输出基于完整文档的总结。

  “问答系统,它通过返回相应的短语(例如位置,人物或日期)来尝试回答以问题形式提出的用户查询。 例如,问题为什么杀死肯尼迪总统? 可能得到名词短语奥斯瓦尔德作答案”

  大约90年代开始,自然语言处理技术领域发生了巨大的变化。这种变化的两个明显的特征是:

  (1)对系统输入,要求研制的自然语言处理系统能处理大规模的真实文本,而不是如以前的研究性系统那样,只能处理很少的词条和典型句子。只有这样,研制的系统才有线)对系统的输出,鉴于真实地理解自然语言是十分困难的,对系统并不要求能对自然语言文本进行深层的理解,但要能从中抽取有用的信息。例如,对自然语言文本进行自动地提取索引词,过滤,检索,自动提取重要信息,进行自动摘要等等。

  同时,由于强调了“大规模”,强调了“真实文本”,下面两方面的基础性工作也得到了重视和加强。

  (1)大规模真实语料库的研制。大规模的经过不同深度加工的真实文本的语料库,是研究自然语言统计性质的基础。没有它们,统计方法只能是无源之水。

  (2)大规模、信息丰富的词典的编制工作。规模为几万,十几万,甚至几十万词,含有丰富的信息(如包含词的搭配信息)的计算机可用词典对自然语言处理的重要性是很明显的。

<
>
关于我们
AB模版网成立于2014年,我们是一家专注用户体验设计开发与互联网品牌建设的设计公司,创立至今为2000多位客户提供了创新与专业的设计方案。设计服务范围包括:交互原型设计、产品视觉设计、网站设计与开发建设、移动及软件产品界面设计、图标设计、品牌及平面设计等。

联系我们

服务时间:9:00-18:00)

官方微信官方微信

部门热线

前   台:
业务部:
客服部:
技术部:
人事部:

咨询电话 返回顶部
返回顶部