推荐系统和消费行为

在 2017-11-06 发布于 播客 分类

本期嘉宾:万梦婷(UCSD 博士学生)
话题:推荐系统

推荐系统已经是互联网产品的标准组件。 精准的广告推荐是 Google 和 Facebook 的营收支柱。 Amazon 首页最显著的位置的商品全部由推荐系统选择。 今天这期节目,我们和万梦婷一起讨论了流行的推荐系统实现: 从基本的基于记忆的协同过滤,说到了越来越复杂的基于模型的推荐系统。

推荐系统也是一个跨越多学科的研究方向。 我们聊到相关研究的进展在帮助人们设计更加精准的推荐系统的同时 …


阅读全文

数据科学中的隐私保护

在 2017-10-30 发布于 播客 分类

本期嘉宾:宋爽(UCSD 博士候选人)
话题:差分隐私

在网购一个物件,豆瓣网上打一个分数的同时,我们也无条件地把自己的大量隐私信息交给了不同的网站、商家,因为我们知道自己的信息会相对安全,即使公布也会做匿名化处理。 然而我们拱手交给互联网的信息真的那么安全吗?2006年,Netflix 举办的机器学习竞赛所用的数据集中的隐私泄露 让我们意识到隐私保护远远比简单的匿名化复杂的多。 尽管 Netflix 把数据集中的用户ID和识别码等的识别用户的信息都抹去了 …


阅读全文

生成对抗网络:两个神经网络的对弈

在 2017-10-23 发布于 播客 分类

本期嘉宾:刘爽(UCSD 博士学生)
话题:深度学习

从大家广泛运用电子邮件的那天起,很多研究者和程序员就开始了和垃圾邮件分类的斗争。垃圾邮件分类的算法越来越精进, 就意味着更加逼真的垃圾邮件也可以成功的被筛选出来。站在垃圾邮件生成者的角度考虑,为了能够传播他们的邮件,他们就需要把垃圾邮件设计的和普通邮件更相似,更难以区分。

基于类似的思路,本期节目我们和大家聊一聊 2014年Ian Goodfellow提出的生成对抗网络模型(Generative Adversarial …


阅读全文

图像语义分析和显著性检测

在 2017-10-16 发布于 播客 分类

本期嘉宾:秦瑶(UCSD 博士学生)
话题:计算机视觉

今天这期节目,UCSD 的博士学生秦瑶和我们介绍了计算机视觉方向的研究问题。 秦瑶主要在图像分割 (Image Segmentation) 和显著性检测 (Saliency Detection) 方向开展她的研究。

这一期节目中,我们主要聊了语义分析和显著性检测这两类计算机视觉的研究问题。 我们了解了这些问题是如何定义的,介绍了常用的解决方法 …


阅读全文

漫谈 Boosting 算法

在 2017-10-09 发布于 播客 分类

本期嘉宾:张家鹏(UCSD 博士候选人)
话题:集成算法

直觉上来讲,我们会觉得一个机器学习模型的准确率要很高才有用。 如果有一个模型声称它能保证对于数据的任何分布,它都能保证达到 51% 的正确率, 我会觉得它弱爆了,并不会想用它来解决问题(除非我在考试,题目是选择题,并且只有两个选项)。

我们今天的节目就和这类听起来很“弱”的模型有关 …


阅读全文