Perfil de 树杰追梦不息FotosBlogListasMás ![]() | Ayuda |
追梦不息我的梦想之路 |
|||||||
|
11 abril 微软雅虎重启谈判 美国消息人士10日说,美国微软公司和雅虎公司继去年收购计划告吹后,近日重启谈判,讨论搜索引擎和广告投放合作事宜,以对抗搜索引擎巨头谷歌公司。眼下谈判处于初级阶段,双方已提出多种合作方案。两家公司均拒绝就此事发表评论。 欢迎访问我的独立博客 10 abril GAE开始支持Java了4月7日,Google宣布其Google App Engine支持Java语言。此次升级支持原有的所有GAE API,且与Java Servlet API, JDO and JPA, javax.cache, and javax.mail兼容。与此同时,Google还提供了GAE的Eclipse插件。 此前Google App Engine只支持Python。 详情可见这里:Seriously this time, the new language on App Engine: Java
欢迎访问我的独立博客:大树底下 几种用户相似度计算方法及其优缺点注:我毕设要做一个垂直搜索引擎中的用户推荐项目,这些是我摘录的一些资料和相关分析。 进行用户协同过滤时,一个关键问题是如何计算用户之间的相似性。比较常见的计算用户相似度的算法有余弦相似性、皮尔森系数、调整余弦相似性三种。 这三种相似性都是基于一个称为用户-项目矩阵的数据结构来进行计算的。该数据结构如下: 余弦相似性:把用户评分看作是n维项目空间上的向量,通过计算两个向量之间的夹角余弦来度量两个用户之间的相似性。 在垂直搜索引擎中,用户数据具有相当的稀疏性。所以需要通过一定的手段来消除这种稀疏性。我的思路:
欢迎访问我的独立博客:大树底下。 01 abril 推荐系统目标:设计一个推荐系统;该系统用于bijiala垂直搜索引擎中;能够针对用户给出合适的推荐;推荐内容包括用户可能感兴趣的产品,某款产品用户可能感兴趣的价格区间、品牌等元数据,关联的关键字;能够根据用户是否接受推荐进行再学习。 原则:尽量高的准确率;尽量好的效率,良好的扩展性。 基元数据:页面、关键字、元数据。 思路:基于内容和协同过滤的结合方法。 1.如何表示一个用户及其兴趣? 做法: 1.用户的表示:ip,会话,cookies(可能); 架构: 矩阵式的推荐系统。结合多个推荐算法。 25 marzo 垂直搜索用户推荐两个维度的分析:用户自身的纵向对比,用户之间的横向对比 两者之间的权重动态调整(根据用户反馈) 多个维度的推荐: 过程:用户建模-->项目匹配-->推荐输出
设计目标是什么?建立怎么样的系统?有哪些考评该系统的依据?关键功能点是什么? 最终要推荐什么:产品(电子产品、机票、酒店)、关键字、下一步要做什么?是进行有状态的推荐还是无状态的推荐? 如何将用户与这些东西关联:向量?关键字如何识别并与某类产品关联? 如何进行权重分配?用户之间相似度的权重,用户直接关键字搜索的权重,用户点击的权重,用户采纳建议后如何计算权重并并入现有体系? 长期跟踪的推荐还是短期的推荐?能够从web日志中提取出cookies信息?
定义用户的元操作:关键字搜索、点击链接访问了概要信息页面、最终进入了外部网站 是否区分关键字搜索和直接的分类点击? 对于群体公用ip的如何处理?如学校 如何解决冷开始问题? 是否会存在性能瓶颈?
思路:用户推荐在其他地方有何应用?是否有可以借鉴的地方?有没有一些简单但有效的方法?别人的思想有没有可以借鉴的? 在目前比较流行的方法当中,有没有可以结合起来应用的方法? 有没有一些比较冷门但是合适的方法?
相关链接: 推荐系统:协同过滤 之 User-based Collaborative Filteringhttp://www.guwendong.cn/post/2006/user_based_collaborative_filtering.html 推荐系统:协同过滤 之 Item-based Collaborative Filteringhttp://www.guwendong.cn/post/2006/item_based_collaborative_filtering.html
|
||||||
|
|