【数仓项目】暴风雨前的宁静-术语介绍&ods层构建&一次磁盘崩溃

术语介绍

1. 用户

用户以设备为判断标准,在移动统计中,每个独立设备认为是一个独立用户。Android系统根据IMEI号,IOS系统根据OpenUDID来标识一个独立用户,每部手机一个用户。

2. 新增用户

首次联网使用应用的用户。如果一个用户首次打开某APP,那这个用户定义为新增用户;卸载再安装的设备,不会被算作一次新增。新增用户包括日新增用户、周新增用户、月新增用户。

3. 活跃用户

打开应用的用户即为活跃用户,不考虑用户的使用情况。每天一台设备打开多次会被计为一个活跃用户。

【数仓项目】数据采集阶段-生成(造)数据

写在前面

巧妇难为无米之炊,所以今天我们来造数据2333(别问我为什么要造,不然我一个普通大三在校生去哪搞大数据hhhh,淘宝买的数据格式参差不齐用不了,唉~


基本原理

运用java脚本bean,生成项目中可能会需要的各项数据

运用阿里的开源json处理框架fastjson将相应数据转为json,分为启动日志和事件日志
其中启动日志不带时间戳为纯json,事件日志加了时间戳格式为时间戳|json,打印到控制台

【做题杂记】sql中的连接

外连接(out join)

外连接分为外左连接(left outer join)和外右连接(right outer join)

注释:left outer join 与 left join 等价, 一般写成left join
right outer join 与 right join等价,一般写成right join

左连接,取左边的表的全部,右边的表按条件,符合的显示,不符合则显示null

举例:

1
select <select list> from A left join B on A.id=B.id

菜鸡教程-群发不同邮件脚本编写

写在前面

由于近期在协会举办了一场比赛,赛后需要将200份不同成绩单分别发给参赛者,为了方便,用python实现了该功能,并利用博客进行记录分享学习。
还是那句话,菜鸡菜笔,如有不正,还请大佬们不吝惜赐教!

,