阅读量:0
目录
0 问题描述
给定每个用户的好友列表,好友关系是互相对称的,返回每个用户的可能好友。如果两个用户不是好友关系,并且两者拥有至少一个(或者两个)共同好友,则两者互相是可能好友。
1 数据准备
--建表语句 create table maybe_friend(id string, friends string) row format delimited fields terminated by ' '; load data local inpath '/temp/sql.txt' into table maybe_friend; --数据:用户id、好友id列表 A B,C,D B A,C,E C A,B,D,E,F D A,C,F E B,C F C,D
2 数据分析
--sql语句 --创建临时表,将好友关系分解为最细粒度 with friend as ( select id, friend from common_friend lateral view explode(split(friends, ',')) temp as friend) --将具有至少两个共同好友的临时表与好友关系表进行连接,如果临时表的两个用户是好友关系,则在好友关系表中存在对应记录,否则不存在对应记录, --表示两者是可能好友 select t2.id1, t2.id2 from