求知若饥 虚心若愚
2017-04-24
问题背景: 对于提出的问题,根据问题分类找到相似问题 根据问题分类算法获得问题分类或者问题概要(是问题按照内容来聚类,不是大类),从数据库中找到并推荐相似度前N的问答。 对于缺乏相似问答的问题(从第1步中得出相似度低于哪个值时推荐就不准确,超出这个值,就进入第2步),推荐..
2017-04-22
基于内容的推荐内涵: 计算物品的内容相似度。 所含部件: 1. 内容分析器(提取物品内容信息,作为属性学习期和过滤部件的输入) 2. 文件学习器(收集、泛化代表用户偏好的数据,生成用户概要信息) 3. 过滤部件(通过学习用户概要信息,去..
2017-03-26
一、 限制玻尔兹曼机(RBM)1. 概念 假设有一个二部图,每一层的节点之间没有链接,一层是可视层,即输入数据层(v),一层是隐藏层(h),如果假设所有的节点都是随机二值变量节点(只能取0或者1值),同时假设全概率分布p(v,h)满足Boltzmann 分布,我们称这个模..
2017-03-25
一、 概述获取网页并从中提取人类语言数据; 利用NLTK完成自然语言处理中的基本问题; 在NLP中使用上下文驱动的方法进行分析; 使用NLP来解决分析性问题,比如生成文档摘要; 度量涉及预测分析领域质量的准则。 二、 抓取、解析、爬取网页(次重点)一个网页抓取的出色工具:基于Java的boi..
2017-03-24
1. 概念如果把“输出必须和输入相等”的限制放松,同时利用基的概念,即O=a1*Φ1+a2*Φ2+…+an*Φn,Φi是基,ai是系数,我们就可以得到这样一个优化问题:Min|I-O|,其中I表示输入,O表示输出。 通过求解这个最优化式子,可以求得系数和基,这些系数和基就是输入I的另一种近..
2017-03-23
三、 基于标签的推荐系统 一个用户标签行为的数据集一般由一个三元组的集合表示,其中记录(u, i, b) 表示用户u给物品i打上了标签b。当然,用户的真实标签行为数据远远比三元组表示的要复杂。 1. 实验设置数据集:Delicious和CiteULike的两个数据..
2017-03-22
五、 深度学习(DL)基本思想 假设有一个n层的系统,S1、S2、…、Sn,它的输入式I,输出是O,形象地表示为I=>S1=>S2=>…=>Sn=>O。根据信息处理不等式,信息在经过处理之后不可能没有损失,所以I≠O。 假设有一堆I,..
2017-03-21
推荐系统的目的:联系用户兴趣和物品。 联系用户兴趣和物品的三个办法: a. 利用用户喜欢过的物品 b. 利用与用户兴趣相似的用户 c. 通过一些特征联系用户和物品(属性集合、隐语义向量、标签) 标签:一种无层次化结构的、用来描述信息的关键词,可以用..