所有内容 第737页
-
试看大数据在航空业的广阔前景
旅客搭乘美国联合航空公司(United Airlines,简称“美联航”)的班机时,通常还会涉及一连串潜在的附加服务,比如升舱、是否有权进入贵宾室等等。 美联航电子商务与经营副总裁斯科特•威尔森介绍说...
-
自动分析工具:数据科学家职业的终结者?
数据科学家的工作的一部分就是把他们的工作自动化。 比如说通过一些预测性的API工具来实现工作的自动化。 然而, 这些API已经在某些领域开始取代数据科学家的工作了。这对这个职业来说可不是什么好事。 我...
-
机器学习中的数学(2)-线性回归,偏差、方差权衡
线性回归定义: 在上一个主题中,也是一个与回归相关的,不过上一节更侧重于梯度这个概念,这一节更侧重于回归本身与偏差和方差的概念。 回归最简单的定义是,给出一个点集D,用一个函数去拟合这个点集,并且使得...
-
众说纷纭 机器学习究竟是什么?
所谓数据科学家,是指那些能够利用最合适的工具与方法完成自身工作的专业人士。最出色的数据科学家能够将自己完整的知识集与模式发现方案充分利用于统计分析工作当中。 我们应该如何对科学技术数据的积累总和进行查...
-
数据分析要避免辛普森悖论
辛普森悖论在数据集方面看上去广泛,而且没有被分解成有意义的片段。辛普森悖论是研究中被忽略的“混淆变量”结果。混淆变量本质上是一个与核心研究无关的变量,它随着自变量的改变而改变。 假设相同的货币化(也就...
-
如何识别虚假数据?
决策本身就够困难的了,更不要说是根据一些糟糕的数据做出决策了。 好的决策应该是“数据驱动”的,但是如果数据有效性不好,就不可能据此做出好的决定。我的整个职业生涯几乎都在做市场调研和调查数据分析方面的工...
-
数据挖掘中易犯的10大错误
按照Elder博士的总结,这10大易犯错误包括: 0. 缺乏数据(Lack Data) 1. 太关注训练(Focus on Training) 2. 只依赖一项技术(Rely on One Techn...
-
数据可视化:纽约地铁的数字地图
如果你是一个痴迷于研究地图、都市化和数据可视化这类东西的纽约人,那么这款名为“地铁视野”的新手机应用在你看来一定美妙如诗;如果你对这些东西都不感兴趣,这款应用也能在你等地铁无聊的时候给你带来一点乐趣。...