用机器学习近似 NP 困难问题

在 2017-10-02 发布于 播客 分类

本期嘉宾:戴涵俊
话题:用机器学习解决一类NP困难问题

计算机领域有一类困扰了科学家很久的问题,叫做NP困难问题。NP困难问题在生活中很常见,例如物流、城市规划等等都可以找到NP困难问题的原型。但这类问题至今都没有有效的、多项式时间内的解。计算机理论领域的研究者从搜索、构造等角度给出过很多种近似解法。人工智能在这类问题中会有怎样的应用呢?机器学习算法如何从多个小问题中找规律来解决这一大类问题呢?AlphaGo背后的强化学习算法又是怎么和这个问题联系起来的呢?我们以NP困难中的最小点覆盖问题为例,介绍机器学习算法在NP困难的组合优化问题上的应用。

收听节目

提到的一些内容 …


阅读全文

在线教育带来新的数据契机

在 2017-09-25 发布于 播客 分类

本期嘉宾:翟真
话题:教育领域里的数据

网易公开课等网络课程,降低了越来越多人获得新知识的门槛;相较于传统的作业本和试卷,在线的作业、考试也使整个教学过程更高效便捷。更重要的是,这些线上的教育平台提供了一种系统地获得、整理、分析学生在学习过程中每一步的相关数据。例如,哪一段教学视频是学生重复看了很多次才看懂的,做作业时学生在做出了哪些错误的尝试之后得出了正确答案…… 通过分析这些数据,老师可以更有针对性地利用课堂时间;在学生做作业时,在线作业系统可以给出更有针对性的提示 …


阅读全文

给神经网络做减法

在 2017-09-18 发布于 播客 分类

本期嘉宾:林政豪
话题:深度学习

在过去的几年中,深度神经网络给很多机器学习任务带来了很大的突破。从图像识别到机器翻译,在深度学习的帮助下,很多任务已经实现了超过人类平均水平的精度。然而精度的提升背后的代价是数以百万计的参数,和长达几天甚至几周的显卡上的运算需求。大量的功耗和庞大的模型,限制了深度学习模型在手表手机等小型电子设备上的应用。那么我们该如何在不损失太多精度的同时,给深度网络做减法,让深度学习可以更好的应用在嵌入式系统中呢?本期节目我们从硬件的角度讨论深度学习的优化。

收听节目

提到的一些内容


阅读全文

主动学习的几种策略

在 2017-09-11 发布于 播客 分类

本期嘉宾:张驰丞
话题:主动学习

现实生活中的绝大部分数据都是没有标签的。在收集整理了数据后,如果人工对每一条数据一一标注,时间成本和经济成本都会非常高。在本期节目中,张驰丞介绍了这个问题的一种解决方法:主动学习,由算法主动索要某一些数据标签的机器学习方法。我们将深入讨论不同的方法是如何判断哪些样本格外“困难”,需要手工标注。

收听节目

提到的一些内容


阅读全文

收集数据的故事

在 2017-09-10 发布于 播客 分类

德塔赛的第一期节目从数据科学的第一步──收集数据开始。数据科学依赖于大量数据,当现有的基准数据集不能满足实验要求的时候,我们如何利用人人都可以获得的互联网上的数据来建立我们自己的数据集?主播阿拉法特和主播舒晏分别介绍了有关社交网络上的文字数据收集和大规模图像数据收集的故事。

收听节目

提到的一些内容

关注德塔赛

谢谢收听!


阅读全文