阅读量:1
任务描述
本关任务:分析同一种搜索词,哪个网站域名被用户访问最多,并根据访问次数降序取前十。
编程要求
在右侧编辑器补充代码,分析同一种搜索词,哪个网站域名被用户访问最多,并根据访问次数降序取前十。
创建数据库:mydb
创建原始表:db_search
字段名 | 类型 | 注释 |
---|---|---|
id | string | 用户编号 |
key | string | 搜索关键词 |
ranking | int | 该URL 在返回结果中的排名 |
or_der | int | 点击顺序 |
url | string | 域名 |
time | string | 时间 |
部分数据如下:
数据切分方式:空格
数据所在位置:/root/data.txt
测试说明
平台会对你编写的代码进行测试:
预期输出:
[陋俗] www.qihoo.com 5529
[周恩来] bbs.phoenixtv.com 2050
[女艺人] bbs.union.daqi.com 1662
[北京的GAY吧] love.86gay.com 1217
[张玉凤] bbs.union.daqi.com 1171
[百度] www.baidu.com 1076
[林彪] bbs.phoenixtv.com 885
[明星] club.yule.sohu.com 864
[《十景缎》] book.haahoo.com 638
[富婆] bbs.enet.com.cn 591
开始你的任务吧,祝你成功!
代码如下:
---------- 禁止修改 ---------- drop database if exists mydb cascade; ---------- 禁止修改 ---------- ---------- begin ---------- ---创建mydb数据库 create database if not exists mydb; ---使用mydb数据库 use mydb; ---创建表db_search create table if not exists db_search( id string comment '用户id', key string comment '搜索关键词', ranking int comment 'url在返回结果中的排名', or_der int comment '点击顺序', url string comment '网站域名', time string comment '日期') row format delimited fields terminated by ' ' lines terminated by '\n' stored as textfile; ---导入数据:/root/data.txt load data local inpath '/root/data.txt' into table db_search; --分析同一种搜索词,哪个网站域名被用户访问最多,并根据访问次数降序取前十。 select t.key,t.url,t.cnt from( select key,url,count(*) cnt,row_number() over (partition by key order by count(*) desc) rk from db_search group by key,url) t where t.rk<=1 order by t.cnt desc limit 10; ---------- end ----------