当今时代是互联网时代,互联网作为这个时代的主题使得这个时代具有资源共享性和信息传播性的特点,给人们的生活带来了便利。网络在为人们认识世界带来便利的同时也为有害信息的广泛传播提供了便捷且广泛的途径。人们在享受互联网带来的便利的同时,也常常会受到一些非法信息的滋扰。因此信息安全问题对于维护网络环境的健康有着十分重要的意义。 目前网络的过滤技术主要有三种,它们是基于URL过滤方式、基于文本的过滤方式和基于图像内容的过滤方式。这几种过滤技术各有优劣,有的实现比较简单,有的具有更广泛的适应性,有的效率高实时性更强。单一采用某一技术的准确性不高,而考虑到图片和图片附近的文字一般具有相同的类别,它们有相互补充说明的特性,所以综合考虑图片和文本的分类特点是主要的过滤方式。 主要以过滤敏感信息为主要目的,基于内容的文本过滤技术和图像过滤技术是针对文本过滤的特征提取和图像过滤中的肤色检测方面的技术,并根据敏感图像的特点,提出一种连通域探测算法,实验中该算法表现出更好的可靠性和更少的时间开销。 LJKeyScanner过滤系统就是一款由灵玖软件研发的敏感信息过滤系统,它将各环节的特征提取和优化算法及分类等算法应用于文本和图像过滤模块,并对网络敏感信息过滤系统的实验结果进行分析,取得了较好的效果。 LJKeyScanner关键词敏感扫描系统主要完成对待检测网页的敏感关键词检测,并对检测出的敏感关键词,标出其在源文件中的位置,将检测结果与检测时间等信息写入敏感关键词检测结果表中。系统在敏感词检测期间需要驻留内存,通过加载敏感关键词知识库来做敏感关键词的检测。同时,还可以准确的检测出待检测文本中的敏感关键词,敏感词位置及上下文摘要等具体信息,并在实际的页面中将检测出的敏感关键词进行了标注,管理员可以通过检测出的敏感词进行判定,并反馈给系统,及时更新词库。以防止网页不良信息的蔓延和给社会和人们带来重大损失。