欢迎光临112期刊网!

论自然语言处理

日期:2023-01-24 阅读量:0 所属栏目:计算机应用


摘 要:自然语言处理是人工智能的一个重要应用领域。它的主要目的是克服人机对话中的各种限制,使用户能用自己的语言与计算机对话。本文介绍了自然语言处理的概念、发展历史和应用技术。

关键词:自然语言;自然语言处理
  自然语言是指人们日常使用的语言,如汉语、英语、日语、法语等,它是人类学习环境和互相通讯的工具。在人类历史上以语言文字形式记载和流传的知识占到知识总量的80%以上。就计算机的应用而言,据统计用于数学计算的仅占10%,用于过程控制的不到5%,其余85%左右都是用于语言文字的信息处理。所谓语言信息处理,是指用计算机对自然语言的形、音、义等信息进行处理,即对字、词、句、篇章的输入、输出、识别、分析、理解、生成等的操作和加工。根据可计算性理论,任一计算机的运算都是按一定程序,分步骤相继作用在离散对象之上所完成的,而这些对象又都以线性序列相邻接地排列组合所构成。而自然语言具有的离散性、序列性和邻接性三个特征其具备了“可计算性”,为自然语言处理奠定了物质基础。
1.自然语言处理概述
  所谓自然语言处理,就是利用计算机技术研究和处理语言的一门学科,即把计算机作为语言研究的强大工具,在计算机的支持下对语言信息进行定量化的研究,并提供可供人与计算机之间能共同使用的语言描写。自然语言处理通常又叫自然语言理解,因为处理自然语言的关键是要让计算机“理解”自然语言。但什么是“理解”呢?对于这个术语也存在着各式各样的认识。如心理学家认为,理解是“紧张的思维活动的结果”,哲学家认为,理解是“认识或揭露事物中本质的东西”,而逻辑学家则认为理解是“把新的知识、经验纳入已有的认识结构而产生的”。这样,自然语言的理解过程,实质上是把一种表达转换为另一种表达的过程,这种转换也可视为映射。建立自然语言理解系统就是寻求映射的算法,使机器能够得到同人在理解上相当的输出。判断机器是否理解语言的最直观的方法,当然是依据机器对你所提出问题的回答,来判定机器是否理解了你的问话。
2.自然语言处理的发展历史
  自然语言处理的研究大体上经历了三个时期,即60年代以关键词匹配为主流的早期,70年代以句法-语义分析为主流的中期, 和80年代开始走向实用化和工程化的近期。
2.1以关键词匹配为主流的早期历史
  当通用计算机问世时,人们想到的第一件事就是用计算机把一种语言翻译成另一种语言。在开始的15年(1950-1965年),机器翻译几乎成了所有自然语言处理系统的中心课题。当时人们相信好的译文可以通过分别处理查词典和重新排列词序两步操作来得到。于是那时的学者们普遍认为机器翻译包括两个基本过程,即查词典和语法分析。即首先通过查词典,将源语文章的每个词的对应的目标词查找出来,然后再进行第二步,即语法分析——调整词序、词尾和形式等等。
2.2以句法-语义分析为主流的中期历史
  进入70年代以后,一批采用句法-语义分析技术的自然语言理解系统脱颖而出。这个时期的代表作是LUNAR,SHRDLU和MARGIE系统。这些系统的主要特点是在句法,语义的分析中采用了所需要的知识表达形式和处理模型,尽管它还是局限在某个领域内,但在语言分析的深度和难度方面都比早期系统有了长足的进步,能够更好地理解自然语言,标志着自然语言处理进入了一个新的阶段。下面以LUNAR系统作为例子。
2.3走向实用化和工程化为特征的近期历史
  自然语言的最大特点就是充满了歧义。句法分析达不到令人满意的效果,是由于其不能很好地解决自然语言中的各种歧义现象。因此语义分析就成了自然语言理解的研究主题。其目的是根据上下文辨识一个多义词在指定句子中的确切意义,然后根据该句子的句法结构和各词的词义推导出这个句子的句义,并用形式化的方式表达出来,从而使计算机能够根据这一表示进行推理。到80年代一批新的语法理论脱颖而出,具有代表性的有词汇功能语法(LFG)、功能合一语法(FUG)和广义短语结构语法(GPSG)等。
  基于语料库的方法主要存在两个问题:首先,由于只是根据概率统计值来进行自然语言处理,因此缺乏对语言内部的深入理解,导致正确率受到极大的限制;其次,模型要求大规模语料库和人工标注工作量过大之间存在矛盾。可以通过以下的方法来解决上述的问题:首先,是引入部分规则机制来弥补对语言理解的不足,也就是规则和统计相结合的汉语自动分词;其次,通过引入开放学习机制,不断修正统计数据,弥补语料统计数据的局限性。
3.自然语言处理的应用
  当前在计算机普及应用中,为了让计算机更方便地为人类服务,人们迫切希望用自然语言同计算机进行通讯的时代早日到来,这正是计算机科学家,语言学家,心理学家等寻求的目标。自然语言处理研究的历史虽不很长,但就目前已有的成果足以显示它的重要性和应用前景。在美、英、日、法等发达国家,自然语言处理如今不仅作为人工智能的核心课题来研究,而且也作为新一代计算机的核心课题来研究。从知识产业的角度来看,自然语言处理的软件也占重要地位,专家系统,数据库、知识库,计算机辅助设计系统、计算机辅助教学系统、计算机辅助决策系统,办公室自动化管理系统、智能机器人等,无一不需要用自然语言做人-机界面。从长远看,具有篇章理解能力的自然语言理解系统可用于机器自动翻译、情报检索、自动标引,自动文摘,自动写故事小说等领域,具有广阔的应用领域和令人鼓舞的应用前景。

参考文献:
[1] 孙艳峰,王建荣,冯志勇. Ontology技术在自然语言理解中的应用.青海师范大学学报(自然科学版),2003(3)
[2]辛日华. 计算机自然语言处理. 呼伦贝尔学院学报,2003(2)
[3] 邱君瑞.自然语言处理与信息检索系统.情报杂志,2002(3)
[4] 隋然.自然语言与逻辑语言:人脑与电脑.外语与外语教学,2003(1)
[5]姚佳梅.基于自然语言理解技术的网络搜索.图书馆工作与研究,2003(2) 本文链接:http://www.qk112.com/lwfw/jsjlw/jisuanjiyingyong/241544.html

论文中心更多

发表指导
期刊知识
职称指导
论文百科
写作指导
论文指导
论文格式 论文题目 论文开题 参考文献 论文致谢 论文前言
教育论文
美术教育 小学教育 学前教育 高等教育 职业教育 体育教育 英语教育 数学教育 初等教育 音乐教育 幼儿园教育 中教教育 教育理论 教育管理 中等教育 教育教学 成人教育 艺术教育 影视教育 特殊教育 心理学教育 师范教育 语文教育 研究生论文 化学教育 图书馆论文 文教资料 其他教育
医学论文
医学护理 医学检验 药学论文 畜牧兽医 中医学 临床医学 外科学 内科学 生物制药 基础医学 预防卫生 肿瘤论文 儿科学论文 妇产科 遗传学 其他医学
经济论文
国际贸易 市场营销 财政金融 农业经济 工业经济 财务审计 产业经济 交通运输 房地产经济 微观经济学 政治经济学 宏观经济学 西方经济学 其他经济 发展战略论文 国际经济 行业经济 证券投资论文 保险经济论文
法学论文
民法 国际法 刑法 行政法 经济法 宪法 司法制度 法学理论 其他法学
计算机论文
计算机网络 软件技术 计算机应用 信息安全 信息管理 智能科技 应用电子技术 通讯论文
会计论文
预算会计 财务会计 成本会计 会计电算化 管理会计 国际会计 会计理论 会计控制 审计会计
文学论文
中国哲学 艺术理论 心理学 伦理学 新闻 美学 逻辑学 音乐舞蹈 喜剧表演 广告学 电视电影 哲学理论 世界哲学 文史论文 美术论文
管理论文
行政管理论文 工商管理论文 市场营销论文 企业管理论文 成本管理论文 人力资源论文 项目管理论文 旅游管理论文 电子商务管理论文 公共管理论文 质量管理论文 物流管理论文 经济管理论文 财务管理论文 管理学论文 秘书文秘 档案管理
社科论文
三农问题 环境保护 伦理道德 城镇建设 人口生育 资本主义 科技论文 社会论文 工程论文 环境科学