排序方式: 共有2条查询结果,搜索用时 46 毫秒
1
1.
会话识别是web日志挖掘数据预处理的关键步骤,其质量对日志挖掘结果有重要影响。文章介绍了现有的会话识别方法,提出了利用数据清洗中废弃的图片等日志数据和web图结构,改进会话识别中的页面分组规则和路径补全算法,并通过实验证实方法对改善会话识别质量是有效的。 相似文献
2.
网络水军是网络组织的主要形式,主要从事话题炒作等干扰舆情正常传播的行为,因此有必要对其特征和行为开展深入探讨.本文以特定网络论坛数据为分析对象,抽取论坛上特定板块的帖文、回复和账户信息,分析了信息发布的时间分布特点;人工分析了水军帖、水军账户在该论坛的总体分布情况;并进一步利用由账户及其间关系构成的复杂网络,分析了论坛上社区和网络组织的统计特征和典型结构;多方面确认了水军不但在论坛上大量存在,而且具有典型的组织结构特征. 相似文献
1