我想尝试构建一个推荐系统,我的意思是一种算法,可以查看用户发布的偏好和/或评论,然后为他们提出建议,类似于 netflix 或亚马逊使用的算法。
什么是学习如何编写这样的东西的好资源?我应该从哪里开始?
请您参考如下方法:
查看 Netflix Prize 上的维基百科页面和它的 discussion forum .还有,有点相关的2009 GitHub Contest是许多不同推荐引擎上完整源代码的良好来源。显然还有 Wikipedia page on the topic itself ,其中有一些不错的链接。
如果您开始自己编写,您将需要使用语料库。我实际上建议使用 Netflix Prize's data set .只需将数据集分成两部分。在第一块上训练并在第二块上为您的算法评分。
附录:这类事情的一个有点相关和可怕的应用程序是 predicting demographic information :用户的性别、年龄、家庭收入、智商、性取向等。您可能可以使用 Netflix Prize 数据集以相当高的准确度完成这些属性中的大部分。幸好 everyone in that dataset is just a number .