基于版权信息的新闻网页去重策略

点赞:13939 浏览:59278 近期更新时间:2024-04-06 作者:网友分享原创网站原创

摘 要 :随着网络技术的迅速发展和互联网络规模的不断扩大,人们能够获得的新闻信息资源也日益丰富.应用搜索引擎进行检索,经常会得到内容相同或相近的新闻网页,它们不但浪费了存储资源,而且加重了用户检索和阅读的负担.网页去重处理是提高搜索引擎的关键技术之一,因此,发现并去除重复网页信息的研究工作具有重要意义.文中提出了一种基于版权信息的新闻网页去重算法,其主要思想是:应用

基于版权信息的新闻网页去重策略参考属性评定
有关论文范文主题研究: 关于网络技术的论文例文 大学生适用: 在职研究生论文、电大论文
相关参考文献下载数量: 67 写作解决问题: 毕业论文怎么写
毕业论文开题报告: 标准论文格式、论文摘要 职称论文适用: 技师论文、初级职称
所属大学生专业类别: 毕业论文怎么写 论文题目推荐度: 最新题目