日期:2023-01-12 阅读量:0次 所属栏目:审计会计
引言
随着网络信息的日益丰富,很多的不良内容在网络上出现已经成为亟待解决的社会问题,用什么样的手段来保证网络信息的合法性与健康性已经成为了网络研究领域中的最新热点,而随之而来的是越来越高的关注度。本文试图对内容审计所涉及的关键性技术进行论述,并且从中挖掘当今网络情况的研究热点与难点,为以后内容审计技术研究奠定相关基础。
一、审计关键技术
(一)模式匹配算法
审计系统需要通过多种模式精确的匹配以及多种模式匹配算法搜索数据包中是不是存在敏感模式串,并且从中统计出其频率,以便于支持文本内容的分析。
内容审计中的多种模式匹配有很多的特点:首先是在网络环境处于中英文混合的情况下,由于其编码的原因,导致其数据包中会有相关的部分通常是英文字符,而与内容相关的则是中文字符,并且两者会参杂其中。而就中文而言,因为汉字的简繁体导致文中会包含两种或两种以上的编码字符。其次是发布不良信息的人会在信息中刻意加入干扰字符。除此之外,因为中英文存在着较大的明显差异,例如英文的字母表小,字符较长,而中文则是大字符集语言,且字母表的数量也较为庞大,这些存在在其中的差异就造成了中英文混合环境下内容审计的模式匹配算法也会发生变化。
如果涉及到中文的多种模式相似匹配就会变得愈发的复杂。已存在的多种模式相似匹配算法允许在其模式串中随意的加入字符,但是如果一个中文字符就不允许插入任何字符了,在包含了n个中文字符的字符串中只存在n个禁止插入的位置,所以在中英文混合的网络环境中,多种模式相似匹配算法就会导致错误的匹配结果。一种适合于中英文混合环境的多种模式相似匹配算法就应该把所有的模式串转换成很多个有限的自动机并且能够利用模式串构建新状态的驱动器,从而可以用待匹配的字符来驱动状态驱动器,再由驱动器转到每一个有限自动机。
(二)文本内容分析技术
本文的内容分析在审计过程中被用作深度识别的可质疑文本,与此同时也会发现当前的信息流中存在的热点信息。本文的内容分析技术基本上以词语为最初元素,构建了基础表示模型,并且分析文本相似度分类等方式来确定其中的部分属性。
而对于中文的词语之间是不存在明确的隔断标志的,所以就需要做出分词的处理。当前最常见的中文分词的方法就是机械分词方法以及知识分词方法。前者是要求跟字典相匹配的,从而利用语法的规则来进行词语的校正。而本文则会用机械分词方法的形式来具体的描述模型,而模型就可以描述机械分词法所能够采取的算法策略。而后者不仅仅要通过字典的匹配,并且要利用多方面的知识,同时还要通过人工智能技术的分析推理来进行校正。
二、审计结果评估与处理
审计过程会根据审计结果对一定时间内的内容进行评估和预测,在特定时候则需要同网络安全防火墙进行联动合作,实施在线拦截等多项防护措施,并且要向网络管理者提交需要制定的内容的安全审计的报告。
(一)内容安全态势评估与预测
通过分析得出一定周期内的分析审计结果,对于目前的网络信息内容的安全的情况进行仔细评估,并且对于未来的情况作出预测,得以实现对于不良信息内容的大范围扩散的有利控制,一方面可以根据其严重程度来制定相应的应对措施以达到遏制其发展的目的;另一方面可以估算已有措施的有效程度,以方便以后的措施实施。
而从其本质上讲,网络内容的安全问题也是用户对于社会上的热点信息关注程度的体现。针对这样的情况,研究者首先要根据传染病模型和流言模型来建立关注热点的不良信息关注规模与趋势的预测模型;其次要根据用户关注热点不良信息的行为情况来研究相应的预测模型。
(二)在线处理与阻断
如果出现违反安全策略的信息,审计系统可以根据其情况采取相应的在线处理措施,有一部分的措施是在审计系统的内部就能够完成;另一部分就要与安全防火墙联动合作完成。
而在审计系统中在线拦截技术是最具有难度实现的。首先,对于数据包的准确性判定具有很大的难度,满足什么样的条件才能被称为是恶意数据包,这个标准很难界定。其次是在线拦截对于网络的流量的依赖是相当大的,因此会出现网络数据传输效率下降的现象出现,从而严重的影响了正常流量的使用。所以一般情况下,只有网络安全情况及其糟糕的时候才会采取在线拦截的手段。
三、审计研究的优势与劣势
(一)流媒体视频内容审计
流传的网络视频的特点是其内容丰富,给人以感观上的强烈冲击,这也将成为不良信息在网络上传播的方式之一。怎样做到准确且及时地识别出此类视频且能够在第一时间做出有效的管理措施就成为了目前亟待解决的问题。现存的识别方法大部分是要提取完整的视频帧图像,继而采取有效的识别方式来对其进行检测。这样的方法无论是从哪个角度都不能满足内容审计的现状需求。
(二)动态信息流的特征分析
不良信息在网络中的传播表面上看是没有任何的规律可循,但是仔细研究就可以摸索到它的传播是具有一定的规律性的,尤其是相对热门的信息。在具体研究的过程中,从核心内容及其传播途径入手,通过对热点信息的开始、传播到扩散整个过程的研究,从中找寻其表现出来的特有的关键点,从而挖掘隐藏在其中的信息流。
(三)关键词列表动态更新
在现存的内容审计模式中,大部分都是要人工建立其关键词表,从而将数据包中的内容与关键词相匹配,以此来查找可疑的数据包。一个全面的、客观的并且可以及时更新的关键词表是很难建立起来的,这也会导致传统的处理方式其局限性加大。尤其是在当今社会知识爆炸的大背景下,网络上出现的新兴的词汇会越来越多,而且这些热点的词汇也会关联相当多的具有舆论价值的网络内容。所以,一定要通过特有的技术手段来跟踪这些网络词汇的出现以及其发展动态。
(四)主动式内容传播检测
现在使用的内容审计的常见模式就只是被动地接受检测,无法进行整体的跟踪监控,对于网络上传播的不良信息缺乏有力地控制手段。因此,实现主动地不良信息的检测就成为了首要解决的问题。首先可以假装成不良信息的获取者或者传播者,继而了解其相关的特征属性,进而追根溯源发展发布不良信息的网站并且进入到其下载任务当中,从中获取其网络用户的规模以及其IP地址的大致分布,就可以实现对于不良信息传播与扩散的全程的跟踪与监控。
四、总结
互联网网络已经逐渐地成为信息交流过程中不可或缺的重要平台,而控制网络上不良信息的发布及传播已经成为了具有重要现实意义的研究课题。而网络信息的内容的审计也将运用多种技术在网络的热点处收集齐数据包,对于其所扩散出来的内容进行检测审计与分析,从而实现对于网络信息内容的全局控制。
本文链接:http://www.qk112.com/lwfw/huijilunwen/shenjihuiji/147539.html上一篇:加强中学财务会计内部审计几项措施