10 条创业者需要避免的数据圈套

  1. 假设数据没有噪声:分析前要检查数据是否有效、实用
  2. 忘记归一化:例如要考虑基础概率的影响
  3. 排除异常点:需要先讨论
  4. 包括异常点:异常点可能不适合用于普世模型中
  5. 忽视季节性:考虑变化背后的周期变化
  6. 抛开基数奢谈增长
  7. 数据呕吐:找到重要数据
  8. 谎报军情的指标:数据指标预警不可过于敏感
  9. 「不是在这收集的」综合症:参考不同数据源可能会带来独到的见解
  10. 关注噪音:人类容易从噪音中无中生有出模式

Ref:数据科学家 Monica Rogati