Trekerz

求知若饥 虚心若愚

分类、推荐算法笔记

【笔记】算法概念

问题背景: 对于提出的问题,根据问题分类找到相似问题 ​ 根据问题分类算法获得问题分类或者问题概要(是问题按照内容来聚类,不是大类),从数据库中找到并推荐相似度前N的问答。 对于缺乏相似问答的问题(从第1步中得出相似度低于哪个值时推荐就不准确,超出这个值,就进入第2步),推荐..


4月22日推荐算法适用性分析

【笔记】算法适用性分析

基于内容的推荐内涵:​ 计算物品的内容相似度。 所含部件:​ 1. 内容分析器(提取物品内容信息,作为属性学习期和过滤部件的输入) ​ 2. 文件学习器(收集、泛化代表用户偏好的数据,生成用户概要信息) ​ 3. 过滤部件(通过学习用户概要信息,去..


深度学习笔记4

【笔记】限制玻尔兹曼机(RBM)和深信度网络

一、 限制玻尔兹曼机(RBM)1. 概念​ 假设有一个二部图,每一层的节点之间没有链接,一层是可视层,即输入数据层(v),一层是隐藏层(h),如果假设所有的节点都是随机二值变量节点(只能取0或者1值),同时假设全概率分布p(v,h)满足Boltzmann 分布,我们称这个模..


挖掘网页:自然语言处理

【笔记】NLP

一、 概述获取网页并从中提取人类语言数据; 利用NLTK完成自然语言处理中的基本问题; 在NLP中使用上下文驱动的方法进行分析; 使用NLP来解决分析性问题,比如生成文档摘要; 度量涉及预测分析领域质量的准则。 二、 抓取、解析、爬取网页(次重点)一个网页抓取的出色工具:基于Java的boi..


深度学习笔记3

【笔记】稀疏编码

1. 概念如果把“输出必须和输入相等”的限制放松,同时利用基的概念,即O=a1*Φ1+a2*Φ2+…+an*Φn,Φi是基,ai是系数,我们就可以得到这样一个优化问题:Min|I-O|,其中I表示输入,O表示输出。 通过求解这个最优化式子,可以求得系数和基,这些系数和基就是输入I的另一种近..


利用用户标签数据推荐2

【笔记】用户标签

三、 基于标签的推荐系统​ 一个用户标签行为的数据集一般由一个三元组的集合表示,其中记录(u, i, b) 表示用户u给物品i打上了标签b。当然,用户的真实标签行为数据远远比三元组表示的要复杂。 1. 实验设置数据集:Delicious和CiteULike的两个数据..


深度学习笔记2

【笔记】DL基础

五、 深度学习(DL)基本思想​ 假设有一个n层的系统,S1、S2、…、Sn,它的输入式I,输出是O,形象地表示为I=>S1=>S2=>…=>Sn=>O。根据信息处理不等式,信息在经过处理之后不可能没有损失,所以I≠O。 ​ 假设有一堆I,..


利用用户标签数据推荐

【笔记】用户标签

推荐系统的目的:联系用户兴趣和物品。 联系用户兴趣和物品的三个办法: ​ a. 利用用户喜欢过的物品 ​ b. 利用与用户兴趣相似的用户 ​ c. 通过一些特征联系用户和物品(属性集合、隐语义向量、标签) 标签:一种无层次化结构的、用来描述信息的关键词,可以用..