代立冬的数据之路

专注数据架构 外功修行,内功修神

承载每天10万级任务的数据调度系统的架构是如何设计的

EasyScheduler大数据调度系统架构分享 导语 EasyScheduler是易观平台自主研发的大数据分布式调度系统。主要解决数据研发ETL 错综复杂的依赖关系,而不能直观监控任务健康状态等问题。EasyScheduler以DAG流式的方式将Task组装起来,可实时监控任务的运行状态,同时支...

2018-12-13 20:01:57

阅读数 28959

评论数 12

数据分析方法论之常用分析思路

对于一款App来讲,市场渠道人员比较关注渠道的获客质量,经常会用到渠道分析;运营人员比较关注用户在产品内的行为信息,通常会用到用户分群,进行针对性运营;产品人员则关注产品功能的使用情况以及核心流程的转化情况。那么如何实现所有业务人员的数据需求。 我们以有帐号体系产品的注册为核心流程为例,一般产品的...

2019-06-01 23:03:44

阅读数 256

评论数 1

留存分析为何要做, 如何做

导读 留存,是指用户在 App、网站等应用上使用过,并一段时间后仍有使用。留存分析模型是一种衡量用户健康度/参与度的方法,超越下载量、DAU 等这样的虚荣指标,深入了解用户的留存和流失状况,发现影响产品可持续增长的关键因素,指导市场决策、产品改进、提升用户价值等等。 ▌留存分析能解决哪些问...

2019-03-16 20:51:53

阅读数 282

评论数 0

大数据分析的下一代架构--IOTA架构[上]

IOTA是什么?你是否为下一代大数据架构做好准备?   经过这么多年的发展,已经从大数据1.0的BI/Datawarehouse时代,经过大数据2.0的Web/APP过渡,进入到了IOT的大数据3.0时代,而随之而来的是数据架构的变化。 ▌Lambda架构 在过去Lambda数据架构成为每...

2018-04-22 07:37:51

阅读数 4494

评论数 0

如何建立数据思维

数据思维是新手和老手的分界线(之一) 作为数据PM,不管是初入行还是处于打怪中间态,都需要建立数据思维,从实战经验来看,数据思维也是区分一般数据PM和高阶数据PM的分界线之一。我刚入行时,做广告商业产品,遇到一个case让我见识到了产品老大的数据思维。对于广告部门而言,收入是KPI,每天的广告收入...

2019-01-02 22:33:55

阅读数 688

评论数 0

如何定义数据指标

数据指标的定义,是培养数据思维要闯的第一道关。比如常见的以下指标定义: 1、激活,如何定义一个激活? 下载、安装并打开APP的用户数?我们暂且这么定义。根据定义,下载没安装或者安装没打开的用户,都不计入激活。只有完成所有步骤的用户才算。但是问题来了,一个用户下载、安装并打开APP时,根本没登录,他...

2019-01-02 22:20:30

阅读数 532

评论数 1

数据分析指标名词解释

数据分析指标名词解释 名词解释 维度 指人们分析事物的角度。比如,分析活跃用户,可以从时间的维度,也可以从地域的维度去看,也可以时间、地域两个维度组合去分析。 有层次关系的维度,就可以根据分析需求改变维的层次,变换分析的粒度钻取,比如分析活跃用户,从地域这个维度类型上,可以细分到省份、城市、...

2018-12-21 22:23:07

阅读数 938

评论数 1

运营干货 | 如何高效引导,使产品达成自传播增长模式

作为增长部门的一员,观察产品运营数据时发现,持续十来天用户日均增量不超过50? 半月前新版上线跟某平台合作进行宣传推广,在复盘过程中却发现该渠道过来的用户7日留存率不足5%? 作为一款社交软件,产品目前处于探索实施阶段,只能通过举办活动来获客,非活动期间几乎没有新增用户? ...

2018-08-13 10:50:47

阅读数 323

评论数 0

APP埋点方式大汇总

埋点方式大汇总图如下:   代码埋点 无码埋点 全/无埋点 按业务需求自定义埋点 √ √   支持事件参数 ...

2018-07-26 10:34:11

阅读数 2817

评论数 0

一篇推文到底能带来多少流量?UTM参数玩转流量识别与追踪

APP运营工作中的每一步都会讲求ROI(投资回报率),我们进行各种形式的推广,每种推广带来的流量效果如何呢?这就是本文探讨的内容——使用UTM参数进行流量识别。以下为本文的文章结构图: ▌令无数小编垂泪的流量迷思业务场景1:运营同学A每天都会发至少一篇文章到微信公众号,在阅读原文处加上跳转链接,方...

2018-07-04 18:33:02

阅读数 698

评论数 0

ClickHouse中文社区成立了,Clickhouse中国第一次线下Meetup于2018年1月27在北京举行

当我们还在讨论如何用Hadoop、Spark这些巨无霸组件来分析大数据的时候,俄罗斯开源了一个极具战斗力的数据仓库:ClickHouse。值得一提的是在易观主办的有40多个国内超强团队参与的OLAP大赛中,获得开源组第一名的伙伴就使用了速度惊人的ClickHouse。ClickHouse是一个面向...

2017-12-23 23:26:40

阅读数 8143

评论数 0

App统计指标定义

活跃用户 新增用户 累计用户 DAU/MAU 启动次数 日均启动次数 人均启动次数 单次使用时长(min) 人均使用时长(min) 留存用户 N日留存率(%) 访问人数 访问人数占比(%) 访问次数 访问次数占比(%) 单次访问时长(min) 人均访问时长(min) 跳出率(%) 平均安装的应用 ...

2017-06-08 23:56:31

阅读数 2238

评论数 0

网站统计指标定义

(一)流量统计 1. 独立用户数:在当前计算周期内,访问统计对象的不重复用户数。万瑞数据系统通过对用户所使用的浏览器赋予唯一标识来识别用户的身份。同一浏览器在当前计算周期内多次访问同一统计对象时,该浏览器被计算为一个独立用户。 2. 页面浏览量:在当前计算周期内,统计对象的页面被访总和。当带有万瑞...

2017-11-09 14:51:16

阅读数 679

评论数 0

统计中纬度与指标的区别

在统计分析系统中, 维度:是分析的角度。 如流量来源(广告、搜索引擎等),上网方式等 。 指标:是用数值来量化分析维度。是衡量数据的  指标是指可以按总数或比值衡量的具体维度元素。例如,维度“城市”可以计算指标“人口”,其值为具体城市的居民总数。又例如,衡量某个渠道来源的流量所浏览的网页数(浏览量...

2015-12-28 00:01:51

阅读数 3401

评论数 0

决策统计---指标六要素

决策统计---指标六要素

2016-06-29 11:12:37

阅读数 3900

评论数 0

电商数据分析基础指标体系

电商数据分析基础指标体系 傅志华 信息流、物流和资金流三大平台是电子商务的三个最为重要的平台。而电子商务信息系统最核心的能力是大数据能力,包括大数据处理、数据分析和数据挖掘能力。无论是电商平台(如淘宝)还是在电商平台上销售产品的卖家,都需要掌握大数据分析的能力。越成熟的电商平台,越需要以...

2016-03-15 18:26:07

阅读数 4178

评论数 0

数据分析侠A的成长故事

数据分析侠A的成长故事面包君 同学A:22岁,男,大四准备实习,计算机专业,迷茫期作为一个很普通的即将迈入职场的他来说,看到周边的同学都找了技术开发的岗位,顿觉自己很迷茫,因为自己不是那么喜欢钻研写代码,而自己又没太多的经验。那年他实习,选择了一家国内一线梯队的电商公司,HR问道想选择什么岗位,而...

2016-03-09 10:46:40

阅读数 33600

评论数 3

提示
确定要删除当前文章?
取消 删除