Trekerz

求知若饥 虚心若愚

推荐系统冷启动问题

【笔记】浅谈冷启动

一、 简介冷启动问题分类: ​ a. 用户冷启动 ​ b. 物品冷启动 ​ c. 系统冷启动 解决方案: ​ a. 先提供非个性化推荐 ​ b. 利用用户注册时提供的信息 ​ c. 利用用户的社交网络账号登陆(需要用户授权..


推荐系统架构基础

【笔记】浅谈推荐系统架构

一、 外围架构 ​ 开发者要通过UI展示的过程向用户推广网站并通过记录用户行为日志获得用户的反应,这就涉及到推荐系统和用户行为数据的存储。 ​ 在用户数据的收集和存储中,能否实时获取数据用以推荐系统非常重要,所以,在收集数据时,就要把需要实时存取的数据和不需要实时存取的..


浅谈Google文本计算API

【笔记】文档相似度、提取匹配

一、 概述​ Google+ API以及发送API的请求 ​ 词频-逆文档频率(TF-IDF),这一分析文档中单词的基本技术 ​ 如何将NLTK(自然语言工具箱)应用到人类语言中 ​ 如何将余弦相似度应用到按关键字查询文档等常见问题中 ​ 如何通过检测搭配模式从人..


Django基础2

【笔记】Django框架基础知识——第2部分

四、 Django视图层视图层主要工作:衔接HTTP请求、Python程序、HTTP模板等。 1. URL映射通过URL dispatcher可以指定用户的每一个访问的后台Python处理函数是什么。 (1) 普通URL映射django.conf.urls.url 通过urlpatt..


用户行为数据的利用4

【笔记】隐语义模型

六、 基于图的模型​ 用户行为很容易用二分图表示。基于邻域的模型可以看做基于图的模型的简单形式,因此很多研究人员把基于邻域的模型也成为基于图的模型。 1. 用户行为数据的二分图表示​ 令G(V,E)表示用户物品二分图,其中V = VU∪VI由用户顶点集合VU和物..


用户行为数据的利用3

【笔记】隐语义模型

五、 隐语义模型LFM(latent factor model),最早在文本挖掘领域被提出,用于找到文本的隐含语义。相关的名词有LSI、pLSA、LDA、Topic Model。 1. 基础算法核心思想:通过隐含特征(latent factor)联系用户兴趣和物品。 (1) 一个新的推..


Django基础

【笔记】Django框架基础知识

一、 Django综述1. Django的特点及结构​ a. 完善的文档 ​ b. 集成数据访问组件(Model层自带数据库ORM组件) ​ c. 强大的URL映射技术(用正则表达式管理) ​ d. 后台管理系统自动生成 ​ e. ..


用户行为数据的利用2

【笔记】UserCF和ItemCF

四、 基于邻域的算法分为两类:基于用户的协同过滤算法UserCF、基于物品的协同过滤算法ItemCF。 1. 基于用户的协同过滤算法主要两个步骤: ​ a. 找到和目标用户兴趣相似的用户集合 ​ b. 找到这个集合中的用户喜欢的,且目标用户没有听说过的物品推荐给目..