问答题
计算题
一个数据库有5个事务,如表所示。设min_sup=60%,min_conf=80%。
(a)分别用Apriori算法和FP-growth算法找出所有频繁项集。比较两种挖掘方法的效率。
(b)比较穷举法和Apriori算法生成的候选项集的数量。
(c)利用(1)所找出的频繁项集,生成所有的强关联规则和对应的支持度和置信度。
【参考答案】
(a)频繁1-项集:M,O,K,E,Y
频繁2-项集:{M,K},{O,K},{O,E},{K,Y},{K,E......
(↓↓↓ 点击下方‘点击查看答案’看完整答案 ↓↓↓)
点击查看答案
相关考题
-
问答题
考虑如下的频繁3-项集:{1,2,3},{1,2,4},{1,2,5},{1,3,4},{1,3,5},{2,3,4},{2,3,5},{3,4,5}。 (a)根据Apriori算法的候选项集生成方法,写出利用频繁3-项集生成的所有候选4-项集。 (b)写出经过剪枝后的所有候选4-项集。 -
问答题
数据集如下表所示: (a)把每一个事务作为一个购物篮,计算项集{e},{b,d}和{b,d,e}的支持度。 (b)利用(a)中结果计算关联规则{b,d}→{e}和{e}→{b,d}的置信度。置信度是一个对称的度量吗? (c)把每一个用户购买的所有商品作为一个购物篮,计算项集{e},{b,d}和{b,d,e}的支持度。 (d)利用(b)中结果计算关联规则{b,d}→{e}和 {e}→{b,d}的置信度。置信度是一个对称的度量吗? -
问答题
列举关联规则在不同领域中应用的实例。
