主动学习的几种策略

在 2017-09-11 发布于 播客 分类

本期嘉宾:张驰丞
话题:主动学习

现实生活中的绝大部分数据都是没有标签的。在收集整理了数据后,如果人工对每一条数据一一标注,时间成本和经济成本都会非常高。在本期节目中,张驰丞介绍了这个问题的一种解决方法:主动学习,由算法主动索要某一些数据标签的机器学习方法。我们将深入讨论不同的方法是如何判断哪些样本格外“困难”,需要手工标注。

收听节目

提到的一些内容


阅读全文

收集数据的故事

在 2017-09-10 发布于 播客 分类

德塔赛的第一期节目从数据科学的第一步──收集数据开始。数据科学依赖于大量数据,当现有的基准数据集不能满足实验要求的时候,我们如何利用人人都可以获得的互联网上的数据来建立我们自己的数据集?主播阿拉法特和主播舒晏分别介绍了有关社交网络上的文字数据收集和大规模图像数据收集的故事。

收听节目

提到的一些内容

关注德塔赛

谢谢收听!