“时至今日,推荐系统已然成了一门显学,个性化推荐成了互联网产品的标配。为此,我知道,好学的你肯定在收藏着朋友圈里流传的相关文章,转发着微博上的相关讨论话题,甚至还会不断奔走在各种大小行业会议之间,听着大厂职工们讲那些干货。推荐系统从搜索引擎借鉴了不少技术和思想,比如内容推荐有不少技术就来自搜索引擎, 由 Amazon 发扬光大的,基于用户( User-based )和基于物品( Item-based )的协同过滤将推荐系统技术从内容延伸到协同关系,超越了内容本身。”
这段话是摘抄自刑无刀的《推荐三十六式》,从这一段文字中你就能看出,推荐有很多技术是门外汉不了解,甚至没听说过的,如果你是一个程序员,你知道什么是"协同过滤"吗?你知道推荐引擎分为几部分吗?现在很多沙龙,大小会议着重讨论的也是推荐系统中各种复杂算法或者整个系统架构,这对于刚刚入门的我们学习起来门槛着实太高了(小红我就是一个中年油腻程序员大叔,做了10年coding,你们看到这一定会吐槽,你一个中年油腻大叔叫他妈的什么小红,实话告诉你们哥们也是比较无奈的,因为另一个小鲜肉博主叫了“小熊”,哥们我支能叫小红了,这些是题外话),小红博主都是从程序开发转行到做数据挖据的,所以完全可以理解明白,现在那些有危机感的,亦或者想转行做数据挖掘的你们的迷惑和迷茫,这也正是我们要开这个博客的原因。
现在机器学习培训,深度学习培训虽然没有像JAVA,前端技术那样多,但也已经比较普遍。小红我也通过各种渠道了解和学习了其中几家知名培训机构的课程,课程讲的都挺好的,可以说干货满满(像那种打着“数据挖掘”,“深度学习”这样名头教python的这样的机构不在咱们讨论的范围内啊),下面是一个培训组织的课程安排
课程安排合理,从基础的微积分开始讲,由浅入深。相信您努力学习后一定会有收获,但是也存在一定的问题。
问题1:如果你想做数据挖掘相关的工作,比如想以后往推荐,搜索,广告方向发展的话,我就问一个问题,你学习的这些,“熵”,“聚类”这些算法如何在你的系统中使用?
问题2:机构培训都教算法,理论,是否有机构讲广告,推荐架构么,据我所知,好像没有(如果有请下面留言,谢谢)
问题3:你的系统,已经过了基于内容推荐的话,以后如何搭建,下面往哪个方向走,想了解业内比较前沿的技术和架构吗?
问题4:现在公司面试理论面试已经不是最重要的了,以阿里2018年春季面试举例,他们会问,
你们系统LR带入的特征是多少维的?带入的是几天的特征?特征数据规模是多少G或多少T?训练时间多长?。
这些都是在培训机构中无法学习到的,如果你没有做过相关工作瞎编你都编不出来。
本博客的面向人群:
1、在校学生,以后想从事数据挖掘相关行业,特别是推荐,广告,搜索行业;
2、有着一颗不甘于平凡躁动心的程序员(典型就像小红一样的老程序员),带你入门让你少走弯路。
博客以后保持一周一更,如果小红和小熊一段时间比较忙的话,也尽量两周一更。
PS.
小熊博主提醒我,他是根正苗红的数学专业出身,从事数据挖掘工作相关工作,现在在某一线大厂,不是半路出家。
转载请注明——redbear博客