博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
用户日志生成策略,哪个方案好?
阅读量:3593 次
发布时间:2019-05-20

本文共 489 字,大约阅读时间需要 1 分钟。

      假定我们有1亿用户的访问日志数据,每个用户在每天的日志中都可能有浏览信息,也可能没有;每天的日志是按时间顺序生成的,每个用户浏览的时间确可能跨度很大,例如一个用户的浏览行为在日志的第1,100,10000行上进行了记录。现在我们需要将该日志转化为一个以用户ID为关键码,用户在该天的浏览历史做值的这样一个日志,并且要求当输入用户ID和指定时间段(最多为3个月),那么该用户日志该如何生成?这里给三个方案:

      A:单表策略,<user,data>为主关键字,<url list>为值,任何搜索都只需对表做一次操作。

      B:多表策略,<user>为主关键字,<url list>为值,每个表是1天的全部数据,搜索需要多表进行操作,如果查询用户90天的数据,需要读90张表。

      C:综合策略,<user,data>为主关键字,<url list>为值,每自然周数据做一个表。

      D:您的方案

 

      注:以上每个表均为提供随机查询的数据结构,且物理上都是一个完整的文件,或者是一个完整的整体(裸盘的话)。

   

      大家认为哪一种方案更好,或者提出自己认为更好的方案。

   

     

      本周五公布我的观点,欢迎探讨,共同交流。

转载地址:http://qoewn.baihongyu.com/

你可能感兴趣的文章
配置maven本地仓库路径
查看>>
idea生成mybatis实体的方法
查看>>
idea逆向工程mybatis
查看>>
oracle纯url连接字符串
查看>>
oracle自动提交事务以及手动
查看>>
几分钟学会密码学(一)——维吉尼亚密码
查看>>
vulhub环境搭建+靶场使用
查看>>
Nginx 配置错误导致漏洞
查看>>
Webmin 远程命令执行漏洞
查看>>
Nginx越界读取缓存漏洞(CVE-2017-7529)
查看>>
DNS域传送漏洞——vulhub漏洞复现 007
查看>>
利用21端口的思路
查看>>
木马工作原理——病毒木马 002
查看>>
DHT11使用详解
查看>>
android
查看>>
Android——广播
查看>>
Android——内容提供者
查看>>
Android——网络编程
查看>>
Android——服务
查看>>
HarmonyOS工作原理解析
查看>>