摘 要 :随着网络技术的迅速发展和互联网络规模的不断扩大,人们能够获得的新闻信息资源也日益丰富.应用搜索引擎进行检索,经常会得到内容相同或相近的新闻网页,它们不但浪费了存储资源,而且加重了用户检索和阅读的负担.网页去重处理是提高搜索引擎的关键技术之一,因此,发现并去除重复网页信息的研究工作具有重要意义.文中提出了一种基于版权信息的新闻网页去重算法,其主要思想是:应用
有关论文范文主题研究: | 关于网络技术的论文例文 | 大学生适用: | 在职研究生论文、电大论文 |
---|---|---|---|
相关参考文献下载数量: | 67 | 写作解决问题: | 毕业论文怎么写 |
毕业论文开题报告: | 标准论文格式、论文摘要 | 职称论文适用: | 技师论文、初级职称 |
所属大学生专业类别: | 毕业论文怎么写 | 论文题目推荐度: | 最新题目 |