欢迎来到在线考试题库网 在线考试题库官网
logo
全部科目 > 商业经济行业技能考试 > 数据挖掘工程师

问答题

计算题

一个数据库有5个事务,如表所示。设min_sup=60%,min_conf=80%。

(a)分别用Apriori算法和FP-growth算法找出所有频繁项集。比较两种挖掘方法的效率。
(b)比较穷举法和Apriori算法生成的候选项集的数量。
(c)利用(1)所找出的频繁项集,生成所有的强关联规则和对应的支持度和置信度。

    【参考答案】

    (a)频繁1-项集:M,O,K,E,Y
    频繁2-项集:{M,K},{O,K},{O,E},{K,Y},{K,E......

    (↓↓↓ 点击下方‘点击查看答案’看完整答案 ↓↓↓)

    点击查看答案
    微信小程序免费搜题
    微信扫一扫,加关注免费搜题

    微信扫一扫,加关注免费搜题