撰文/施誉楷
啤酒和尿布出现在同一个购物篮里面,这是有名的购物篮分析,「大数据分析与应用」课程以此为例带入关联式分析之学习,用有趣的方式了解数据与数据之间的关联性。
110年度教育部「智慧创新跨域人才培育联盟计画」—「大数据行销」计画主持人、任课教师徐明珠表示,关联规则是用来探索购买商品之间的关联性,可以作为行销人员在搭配行销或促销商品组合时的参考,因此将它列入课程内容中。11月23日课程中,邀请了林汉洲老师协同,带领同学再探讨另一项商业行为背后的大数据行销与算法如何运作。
本周的课程从购物篮分析导入,林老师用啤酒和尿布两种看似没有关联但却常常一起被购买的行销案例来介绍购物篮分析,在大量的消费纪录里找出哪些商品会一起被购买?或是买了某样商品的人通常会同时再买哪些商品?而能够算出这些高频关联性商品组合的方法就是关联式分析算法,它是一种找出资料彼此之间的关联的方法,寻找所有满足最低支持度门槛的项目集,并从中萃取出具高度信赖度的规则,运用的方法有穷举法、Aprioir算法以及FD-Growth。而林老师今天是介绍Aprioir算法,一开始先寻找项目,再产生项目集,最后进行比对找出频繁项目集,过程中会不断的删除没达到支持度的项目,透过这种随时删除的机制来加快运算的速度。
在学会了基本概念后,林老师带着同学们练习撰写关联式算法的程式,或许是因为Aprioir算法是一个完整的运算模式,包含了大量的规则与步骤,同学需要更完整的逻辑思考以及记忆更多的英文专有名词才有办法正确执行程式,很幸运的是林老师与徐老师会一步一步的看着同学输入;一位一位的说明无法顺利执行是因为什么环节出错了,有如此的教学方式,同学们会愿意在日渐复杂的课程里持续学习;在同学们的课堂回馈可以发现,觉得有挑战的占了大多数,同时也出现了认为需要回去复习才不会忘记的想法,开始有更积极再学习的想法。
在徐老师与林老师双师跨域教学下,面对越走越深的课程内容,依然有办法让学生最后跑出正确的结果;依然有办法提升学生的学习意愿。在未来的课程里,还有让同学考大数据分析证照的规划,由此可见徐主任对于传播系同学学习大数据分析与应用的企图心。
本周的课程为关联式分析算法
徐老师会一步一步的带着同学完成步骤
徐老师和林老师双师共授,细心指导着每位同学
课程变难了,但同学们都持续提升学习热力