SQL进阶技巧:如何分析可能好有问题?

avatar
作者
筋斗云
阅读量:0

目录

0 问题描述

1 数据准备

2 数据分析

3 小结


0 问题描述

给定每个用户的好友列表,好友关系是互相对称的,返回每个用户的可能好友。如果两个用户不是好友关系,并且两者拥有至少一个(或者两个)共同好友,则两者互相是可能好友。

1 数据准备

--建表语句 create table maybe_friend(id string, friends string) row format delimited fields terminated by ' '; load data local inpath '/temp/sql.txt' into table maybe_friend;  --数据:用户id、好友id列表 A B,C,D B A,C,E C A,B,D,E,F D A,C,F E B,C F C,D

2 数据分析

--sql语句 --创建临时表,将好友关系分解为最细粒度 with friend as ( select id, friend from common_friend lateral view explode(split(friends, ',')) temp as friend)  --将具有至少两个共同好友的临时表与好友关系表进行连接,如果临时表的两个用户是好友关系,则在好友关系表中存在对应记录,否则不存在对应记录, --表示两者是可能好友 select t2.id1, t2.id2 from 

广告一刻

为您即时展示最新活动产品广告消息,让您随时掌握产品活动新动态!