高成本云服务?TiDB 帮你省钱
762
2023-04-25
机器学习已成为大数据的基石
机器学习几乎无处不在,即便我们没有专程调用它们,它们也经常出现在大数据应用之中。我曾经在博客中描述了一些典型的大数据使用案例。换句话说,这些应用都能够在“极端情况下”提供***的结果。在结尾部分,我还提到了拍字节级数据容量、实时数据速度和/或多结构数据多样性的结合。
当时我还列出了一个应用列表,在收集过程中刻意避开了“机器学习分析”。主要原因是,尽管在这些使用案例中机器学习即便不是主要的,也是一个常用的工具,但是它们自身并不是一个使用案例。换句话说,它们不是一个凭借自身力量而形成的特殊应用域。出于同样的原因,我也没有像大数据使用案例那样列出模式设计、元数据管理或数据整合。但与机器学习一样,它们也都为实现大数据分析应用的价值做出了自己的贡献。
机器学习对大数据应用投资回报的贡献主要体现在两个方面:一是促进数据科学家们的多产性;二是发现一些被忽视的方案,有些方案甚至遭到了***的数据科学家们的忽视。这些价值来自于机器学习的核心功能:即让分析算法无需人类干预和显式程序即可对***数据进行学习。解决方案允许数据科学家们根据典型数据集创建一个模型,然后利用算法自动概括和学习这些范例和新的数据源。
为了在这些素材当中找到线索,“深入学习”(deep learning)成为了大数据科学家的机器学习指令系统中的一个重要工具。正如van Rijmenam所说的那样,利用神经网络开展的深入学习有助于从这些数据流中提取感知能力,因为这些数据流可能涉及组成对象之间语义关系的层次结构安排。“深入学习能够打破数据中具有不同特点的组成成分之间的隔阂,利用这些特点从中找出不同的特征组合,从而搞清楚它们看到了什么或者是正在做什么。”van Rijmenam说。
显然,对于创建能够感知和处理动态分布式方案的环境来说,机器学习一个基础性工具。人类对实时威胁和恐怖主义活动、自然灾难、飓风等其他威胁的侦测与应对能力,取决于对海量数据中的信息进行自动筛选、分类和关联。如果没有这种能力,那么人类就有被“淹死”在大数据海洋之中的危险。
36大数据知识图谱:关于机器学习
机器学习(Machine Learning, ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。
它是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域,它主要使用归纳、综合而不是演绎。
版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。