主动学习的几种策略
在 2017-09-11 发布于 播客 分类
本期嘉宾:张驰丞
话题:主动学习
现实生活中的绝大部分数据都是没有标签的。在收集整理了数据后,如果人工对每一条数据一一标注,时间成本和经济成本都会非常高。在本期节目中,张驰丞介绍了这个问题的一种解决方法:主动学习,由算法主动索要某一些数据标签的机器学习方法。我们将深入讨论不同的方法是如何判断哪些样本格外“困难”,需要手工标注。
收听节目
提到的一些内容
- 张驰丞个人主页
- 驰丞提到的一类主动学习方法,争议型准则的相关文章: Beyond Disagreement-based Agnostic Active Learning
- 在讲到agnostic的设定下,我们提到了 PAC Learning
- 节目开始时提到的可以用来标识数据的众包平台 Amazon Mechanical Turk
关注德塔赛
谢谢收听!