小的知识点整理
- 目前常见的数据采集方案有什么。
- 埋点、可视化埋点、无埋点
- (无埋点并不是字面意思不埋点,其实也是一种埋点,只是让开发人员完全无感知,直接嵌入sdk,然后每个元素都能查看他们的情况,后续开发中也不需要开发者再做什么开发。总结就是嵌入之后,开销即用,不用开发。)
- 数据采集常常使用埋点的方式,请问它的弊端是什么?
- 工程量大、周期长、容易发生错埋、漏埋
- 关于T检验描述:
- T检验是对样本均值差别显著性进行的检验
- 配对T检验其本质就是单样本的T检验
- 再进行两独立样本T检验之前,需要先检查方差是否齐性
- T检验的前提是其检验对象的总体大体服从正态分布,而不是一定服从正态分布。
- 数据结构用于描述数据对象及数据元素间的关系,而数据类型描述了数据对象、数据元素间的关系及数据的基本处理办法。
- DAU(Daily Active User)日活跃用户数,简称日活。
- MAU(Monthly Active User)月活跃用户数,简称月活。
- MNU(Monthly New User)月新增用户数,简称月新增。
- ARPU(Average Revenue Per User)指的是每个用户的平均收入
- ROI(Return on investment) 投资回报率
- 一个新的产品在推广中最关注的推广数据指标是 注册量。(推广初期——获取用户、)
- 一个活动页面被浏览了是 6000 次,其中去重后的 ip 数是 600 个,那么该页面的 pv 是多少?( PV = Page Views 是页面浏览量,算的是次数;UV = Unique Views,算的是人数,就是去重之后的数)
- 视频网站去广告功能需要付费才能使用,假如有 10000 人免费试用了一次去广告功能,试用后点击支付的人有 500 人,最终支付成功的有 30 人,请问试用的转化率是多少?( 每个环节一个漏斗,最终付费成功是转化成功 )
- 某航运公司年初用120万元购进一艘运输船。投入运输后,每一年的总收入为72万元,需要支出的各种费用为40万元。若该船运输满15年要报废,报废时旧船卖出可收回20万元,则这15年的平均盈利额约为多少万元。(计算32-120/15+20/15)
- 同比,是指在相邻时段中的某一相同时间点进行比较;
- 环比,则相对更简单,就是相邻时间段的对比,不像同比那样,是在相邻时间段内部的某个相同时间点的对比;
- 同比发展速度,一般是指本期发展水平与上年同期发展水平对比,而达到的相对发展速度。
- 环比发展速度,一般是指报告期水平与前一时期水平之比,表明现象逐期的发展速度。
- 一件商品相继两次分别按折扣率10%和20%进行折扣,已知折扣后的售价为540元,那么折扣前的售价为?(原价*0.9*0.8 = 540,原价为750)
- 假设一个APP今天获得了10000个新用户,如果明天有2000个用户继续使用APP,并且每个用户打开2次APP,那么这个APP的次日留存是:(日留存只与用户数有关,与打开次数无关。每个人打开两次APP,并不影响用户量。2000/10000=0.2)
- 漏斗分析法一般用于分析用户增长、用户转化。
- 杜邦分析法一般用于分析财务上的盈利分析。
- 常见的数据分析方法有什么?杜邦分析法、漏斗分析法、矩阵/四象限分析法。
- 金字塔原理,应是属于一种解决问题的思维逻辑方法,有结构的,有层次的。
- UV、DAU、销售金额、转化率都是可以用来衡量具体的运营结果。
渠道运营的关注重点:ROI(投资回报率)、新增用户数。
- 渠道运营只关注拉新数量,不关注转化数,所以应该是注册转化率,不是推荐转化率。
- 用户留存对与APP至关重要,以下关于APP留存指标的说法正确的是:
- 理论上,每一款APP都有 “ 留存数据 ” 。
- “ 次日留存 ”是一个非常重要的留存指标 。
- 对于陌陌等交友类产品,以下哪些数据是核心数据?
- 每DAU的打开频率
- 每DAU的消息发送量
- 用户的个人信息完善程度
- 平均每个用户的好友数量
- 对于这种陌生人交友产品,最重要的是用户的活跃度与黏性指标。活跃度有DAU打开数与发送量,黏性的话主要是关系用户会继续使用的可能性,因此它的好友数量决定了产品对他的价值,资料的完善程度决定了用户对产品投入的精力与关注,而价值越大,投入越多,自然也越不容易舍弃,因此也需要重视。
- SWOT分析法又称态势分析法,是把组织内外环境所形成的机会(Opportunities),风险(Threats),优势(Strengths),劣势(Weaknesses)四个方面的情况,结合起来进行分析,以寻找制定适合组织实际情况的经营战略和策略的方法。字母T代表的是Threates(风险)
- PV是一定时间内某个页面的浏览次数,被打开50次,应为50。UV是一定时间内某个页面的访问人数,应为5。
- 在众多的客户管理模型的分析模式中,RFM模型是被广泛提到的,RFM模型是衡量客户价值和客户创造利益能力的重要工具和手段,RFM通常是指哪三个指标?
RFM是Rencency(最近一次消费),Frequency(消费频率)、Monetary(消费金额),三个指标首字母组合。
小贴士:
R值:最近一次消费,指的是客户在店铺消费最近一次和上一次的时间间隔,理论上R值越小的客户是价值越高的客户。
F值:消费频率,是指是客户在固定时间内的购买次数(一般是1年)。有时候会根据商品特性做调整,店铺在运营RFM模型时,会把F值的时间范围去掉,替换成累计购买次数。
M值:消费金额,是所有数据库报告的支柱,显示出排名靠前的顾客所花费的金额,从而做出针对性活动。
- 推广付费指标中,CPC是指__?
CPC(Cost Per Click),按点击次数付费广告;CPD(Cost Per Download),按APP的下载数付费;CPS(Cost Per Sales),按完成购买的用户数;CPA(Cost Per Action),按投放的实际效果付费。
- 广告投放付费模式: CPC按点击次数付费 CPD按APP的下载数付费 CPS按完成购买的用户数 CPA按投放的实际效果付费
- 从传统零售的“货”为主到电商的“人-货-场”立体维度,管理者需要自上而下的系统性的规划监控不同指标,其中下列哪个指标不属于运营指标中效率指标?
售罄率为库存指标,(实际销售货品成本/总进货成本或者or实际销售货品价/总进货零售价)。
效率指标包括:客单价、件单价(按多件计)、连带率(销售总件数与订单(销售小票)的比值)、动销率(动销品种数 /仓库总品种数,提醒我们对某些商品重视)。
- 客单价(per customer transaction)=销售额÷成交顾客数
商品动销率=(商品累计销售SKU数量 ÷商品库存SKU数量)*100%
连带率=销售总数量÷销售小票数量,指销售的件数和交易的次数相除后的数值,反映的是顾客平均单次消费的产品件数。
售罄率 = 累计销售 ÷ 总进货
- 数据报告最主要作用是为决策者提供决策思考。展示分析水平、分析结果、分析质量主要是评估数据分析报告是否合格。
- 编写数据报告的一般流程顺序应该是:明确数据报告的需求及目的、拆解指标发现问题、拆解问题、拓展维度探究指标差异、撰写报告及美化。
编写数据报告是整个业务分析过程的成果,基本流程是首先明确数据报告的需求及目的,其次拆解指标发现问题,在确定问题后,就需要找到能够数值化衡量这些问题的指标,以及它们的计算方式,再以计算公式结果为指标,拓展维度(比如地区、时间)来探究不同维度下的指标差异,最终得出结论撰写报告并优化。
- 分类算法是数据分析常用的方法,K近邻、决策树、支持向量机都是分类算法,
- DBSCAN算法是基于密度的聚类算法,不属于分类算法。
- 通过波士顿矩阵对公司业务进行分析,企业良性发展的业务发展方向应该是幼童→明星→金牛。业务发展的方向是幼童→明星→金牛,即把幼童培养成为明星,在明星的业务增长率下降时,要使它变为金牛。企业现金流向应为金牛→明星→幼童, 即金牛业务应为明星业务、幼童业务的发展提供资金。
- 一个好的指标体系的作用可以监控业务情况,通过拆解指标寻找并解决问题,评估业务改进情况。
- 有一种经营分析理论是市场占有率、业务增长情况和相对竞争地位,把业务分为四种类型或者阶段:“幼童”、“金牛”、“明星”、“瘦狗”。
“金牛”业务即市场占有率高,但增长率低,相对竞争地位高的业务;
“明星”业务即市场增长率和竞争地位都较高的业务;
“幼童”业务即市场增长率高但是市场占有率低的业务;
“瘦狗”业务即市场增长率和市场占有率都低的业务。
- 分布式存储:通过网络使用企业中的每台机器上的磁盘空间,数据分散的存储在企业的各个角落
- 数据库的概念:按照数据结构来组织、存储和管理数据的仓库
- 云存储:通过网络技术、分布式文件系统、服务器虚拟化、集群应用等技术讲网络中的海量的异构存储设备构成可弹性扩张、低成本、低能耗的共享存储资源池,共同对外提供数据存储和业务访问功能的一个系统。
- 数据清洗是指对数据集中的不完整、不合理或不准确的数据进行修补、去重、纠错、修补或删除。数据变换指的是将原始数据变换成符合目标算法要求的数据。数据集成是指对来自不同的数据源的数据进行集成处理。数据清理、数据变换、数据集成均属于数据预处理。
- 全数据思维是:通过丰富、全面、多源、互补、互证的大数据,来构建研究对象的全面信息,探索对象之间客观联系的思维模型。
- 准确性思维是:缩小数据研究范围,不接受数据的混杂型、保证数据的准确性。
- 相关性思维是:量化和研究两个或多个数据值之间存在的数理关系。
- 容错性思维是:容许大数据中存在噪音、杂质、脏数据、混杂数据和错误数据
- 数据监控指标正常波动范围的确定可以参考环比数据、同比数据、当天数据极值、每个环节的转换等数据维度来确认。市场容量只能研究目标产品整体规模,不能较准确的评估指标是否正常。