4008-889335
数据分析
深度好文 顶级咨询公司数据分析的十大底层逻辑
发布时间:2020-01-12    信息来源:未知    浏览次数:

  虽然没真正在顶级管理咨询公司麦肯锡里工作过,但由于我打交道的人大多都有些咨询背景——如,大老板是前

  麦肯锡的人一般自带光环。因为能在麦肯锡工作的人,大多都是世界名校的高材生,或某企业高管等等。他们给人留下的印象就是特别聪明,仿佛什么难题到了他们手上都可以迎刃而解。

  但这种“聪明”,更多是因为他们比普通人更熟练地运用几种高价值的「思维方式」。经过长期的咨询训练,分析框架已经成为他们的一种大脑本能。

  其实,这些思维方式一点也不神秘,不管是不是做数据分析,都很实用也很容易理解。

  在市场营销中,有一个非常重要的概念,叫Customer segmentation(顾客分层)。这其实就是分类思想。

  由于年龄、收入与性别等因素的不同,人与人之间存在着不一样的生理需求与心理需求。而需求不一样的消费者组成了不同的细分市场。针对不同的细分市场,产品会有不同的定位。

  其中有一个核心概念,叫作“人生角色”。指的是,每个人每时每刻在扮演着多个人生角色,如儿子、父亲、朋友、丈夫、社团领袖、企业高管等等。

  为了成为尽职尽责的人,在制定周计划时就需要考虑每个角色的任务,缺一不可。唯有如此,在生活与工作之间才能取得平衡。

  作为集团战略部门,每天面对的任务有很多,但哪个才是值得我们花时间去解决的呢?这个问题就显得非常迫在眉睫了。但是不怕,因为有矩阵思维。

  首先,我们对每个项目的“可行性”与“商业价值”进行一次评分。然后,把这两个维度分别设为X轴和Y轴。最好,所有项目就会自动地分布在了四个象限之中。

  显而易见,你的重点就应该放在第一象限的项目中,尤其是颜色最深的右上方的那个项目,因为它的可行性最高,同时商业价值最大。

  除了个人管理,还可以用来做市场分析。其中,最著名的莫过于波士顿管理咨询的产品矩阵模型了(BCG matrix):

  所以,当你发现存在两个可量化的关键指标时,就可以试试做成一个矩阵,说不定你会有意外新发现哦。

  最近,国内很流行一个来自硅谷的名词,叫“增长黑客”。这群人混迹各大互联网公司,是一个由来自产品、技术、设计等不同部门的人所组成的神秘兮兮的战略部门。

  他们的主要任务,就是帮助公司业绩成倍地增长。在一些公司里,增长黑客是直接汇报给CEO的。可见他们的价值是非常巨大的。

  增长黑客那本书中非常核心的一个概念,叫AARRR模型。其实就是一个漏斗模型。

  漏斗的每一层,都有一定的容量。漏斗越往下,容量越小。而层与层之间的比例,就是传说中的转化率。到了最底层,就是收入。

  所以,要提高最终的收入,原理很简单,就是把每一层的容量都扩大,或者,把下钻的转化率给提高。作为增长黑客的你,首先要学会去用数据去判断,哪个地方的容量太小,或转化率太低,然后再去制定方案进行针对性提高。

  几年前,“大数据”一下子火了。这要归功于一本无比畅销的通俗读物《大数据时代》

  书中提出了几个(当时)挺新颖的观点。其中有一个说大数据关注的不是因果关系,而是相关关系

  这个表述虽然不准确,但至少反映了相关性是很重要的,尤其在数据种类与数理都非常丰富的情况下。

  我们在媒体里常常看到这样的报道,“百分之多少的人会更倾向于做某件事”。举个例子,有专家发现,在经济低迷的时候,89%的女性更倾向于买口红。

  (d)非线性相关:某一范围内,X数量越多,Y数量越多;超过某一个拐点后,X数量越多,Y数量越少。

  打比方,现在你是你们公司的市场部经理,为了提高明年的销售业绩,你最近进行一次分析,哪个媒体广告需要减少投资,哪个媒体广告需要增加投资?

  关于预算分配的问题,永远都让市场部头的人头疼。这种决策在过去是(现在很多时候也是)老板们拍脑袋想出来的。那有没有更加科学一点的办法呢?

  试试用相关思维来翻译这个问题,那就是:销售额与哪个媒体广告的投放量存在正相关呢?

  这个问题一下子就具体很多了,因为X与Y都是可以被很好量化的指标。只需要把过去几个月甚至几年的数据拉出来,Excel一算就可以知道了。

  假设将横坐标的看作是产品销量(口红、粉底液、气垫、防晒霜等等),纵坐标看成是媒体投放渠道金额(微信、微博、爱奇艺、杂志等等)。那么,它们的两两之间的相关系数就会形成一张系数表。

  蓝色表示两者相关关系比较强,红色表示比较弱。那么,哪个产品更应该加大哪个投放渠道的投放量就一目了然了。

  当然,这只是一个打比方。一个严谨的投资决策肯定不能仅靠看一个维度或一张表就能解决的。但它给出了一个很不错的视角。

  当你手头上拥有很多数据时,不妨来一次这样的数据探索(Data exploresure),说不定会有什么新奇发现哦。

  决策树(Decision tree),相信这个概念对于所有学过机器学习的人都并不陌生,因为这是一种入门级的算法。几乎每个初学者第一个接触的机器学习算法都是决策树。

  它既可以当做一个体系化的分类思维,也可以当做一个流程图甚至是一个检查清单来使用。但不管你怎么用,决策树的框架都是不变的。

  从顶端一点开始,它一层一层往下展开。每一层都有若干个支点,而每个支点会分解成多条支线。就像下图一样。

  假如有一天,你去参加非诚勿扰的相亲大会,由于你读过猫爷这篇文章,所以你打算在相亲节目中使用决策树。

  如果对方年龄太大,你立马可以排除;在年龄合适的人里,你再看他长得怎么样,颜值爆表、每天看着他的脸都可以不用吃饭的,那就别问下去了,马上就在一起。如果长得还行,那就继续看看他的收入,以此类推。

  由于决策树越接近顶端的因素,重要性越高。所以你对相亲对象的要求,按重要性来排序就是年龄颜值收入性格。当然,这只是一个半开玩笑的举例,以便你理解。

  如果你现在是银行的信用卡主管,你会给一个申请者多少信用卡额度呢?这本身就是一个决策树模型能解决的问题。你要做的,就是找出决策树中重要的支点与支线,譬如是否高学历、是否高收入、是否在500强、是否有负债、是否已婚、是否有房产等等。当一个申请者落在好的分支里,那就获得高额度;落在差的分支里,就得到低额度。

  为了找出市场中高价值的潜在消费者,并对他们投放广告,我们用决策树等模型去提高媒体投放的转化率,效果相当理想,比传统投放的ROI要提高了好几倍。

  PDCA循环的起源,要追溯到20世纪20年代,有一位叫沃特的统计学家所发明,由戴明所改良与普及的,最终演变成了科学管理的一个非常重要的工具,帮助企业或组织持续性地改进质量,被广泛应用于新产品开发、供应商管理、人力资源管理以及各种项目管理之中。

  Do是最基础的。哪怕一个从不动脑子的人,他也知道去做,就像富士康里的车间工人一样。

  聪明一点的人,他就会做Plan。在行动之前,先分析目标是什么,用什么方式去实现最有效率,识别潜在的问题、障碍与风险等等。能做好这一步的人,已经超过了80%的朋友了。

  还有没有更聪明的人呢?有,那就是会做Check的人。他们会去追踪与评估自己的行动是否已经达到了目标,有哪些差距,有哪些改进空间。他们有总结与反思的习惯。阶段性就会复盘一次,可能是每天,可能是每周,也可能是每个月,总结出成功的经验与失败的教训。如此勤奋思考的人,已经超过了95%的朋友。

  那么,还有没有更加聪明的人呢?还真的有。那就是会做好Action的人。他们能够把经验教训都标准化成为下一次行动方案,让成功继续成功,让踩过的坑不再去踩。这就是最难的知行合一。

  你们应该知道,如果去国外的商学院读研究生或者MBA,那么一定会经历一场考试,它的名字叫GMAT。

  当说一下当时我备考的情景:从零基础开始,自学2个月,换库首日裸考出700分。

  700分是什么概念呢?700分,就是分水岭。能考出700分的人,才有申请全球顶尖商学院的资格(GMAT的全球平均分是558分,考过700分,意味着你的成绩打败了全世界90%的考生,当然也包括了母语为英语的英美考生)

  为什么我能够这么短时间内考出高分?完全不是因为英语水平有多好,恰好相反,我英语特别差,雅思只能勉强拿6.5。

  说起来很简单,因为我在复习过程中有个重大发现——GMAT这门考试的本质就是逻辑。

  逻辑,不仅仅是GMAT的本质,也是很多商业项目与社会现象的本质。唯有抓住了这条命脉,才容易以最快的时间达到最好的效果。

  所以在讲逻辑链之前,先让我们回顾两个逻辑概念:归纳与演绎。因为并不是很多人都理解它们的意思。

  假设你看到猫爷在床上看书,在车站看书,甚至在厕所也在看书,那么你可能会得出结论:猫爷可能是一个爱看书的人,在哪里都会在看书。

  再假设,你有天晚上打算跟猫爷去西餐厅约会,但已经听朋友说过了这人老爱迟到,所以你在约会前就开始猜测,这一次猫爷大概率也会迟到。

  归纳与演绎,是两个互相联系的好朋友:归纳,特殊性是因,一般性是果;演绎,一般性是因,特殊性是果。

  他们通过一次又一次的控制变量的可重复试验,来归纳出一条又一条的普遍性规律。

  在朋友圈里的文章,除了新闻资讯类的不说,剩下大多数都是发表观点类的论述文,从房地产分析到国际局势判断,从社会热点到电影影评,内容方方面面。但本质上看,都逃不出逻辑链。

  你很可能会发现一个事实,大多文章都只是一味地给出结论,并没有同时给出明确充分的理由或证据,或者假设是有错误的。粗心的读者可能就会囫囵吞枣地接受了这类文章中那些经不起推敲的结论。这就是读死书的问题根源。

  是不是那种,他一说话,你就会有种茅塞顿开的感慨,甚至忍不住发出“Aha”的惊叹。

  假设你明天回到公司,你向老板做工作汇报,说:老板,这个季度的总销售业绩环比下降了。

  你支支吾吾答不出,于是跑回去看数据表,然后又跑回来跟老板说:老板,虽然老客的销售额在略微上升,但是新客的销售额最近半年一直在下跌。

  你挠挠头,又跑回去工位,翻出过去半年的资料。过了半天你又跑回去找老板,说:老板,最近半年我们在市场推广上的重心从视频广告转换到了社交媒体上了,而社交媒体中的用户,好像对我们的产品不感兴趣,使得新客人数下降了很多。

  你老板开始有点微笑,饶有兴趣地抬起头,问:为什么他们对我们的产品不感兴趣呢?

  这时候你早有准备,把用户画像和产品定位等等材料都拿出来,给出了一个完整的答案。你的老板满意地点了点头,说:很好,你总算摸到了问题根源了。

  实际上,你完全可以不需要老板的反复提醒,而是通过多次自问“为什么”来拓宽逻辑链的前端,直达问题的根源。

  时间序列其实也是机器学习算法的一种,所以可以讲得很浅显,也可以讲得很艰深。但实在没必要把它想得太复杂。

  时间序列思维的本质,就是站在时间之上,俯视万事万物的变化,洞察其中不变的规律。

  去年罗辑思维在跨年大会上就带红了“小趋势”一词,最近又有本书叫《大趋势》卖得很畅销。

  自己成了一名股票交易员,日常工作就是在股票交易市场中通过低买高卖来套利赚钱。

  假如你今天上班,一如既往地打开交易软件,不幸的是,你发现自己重仓买入的股票是如此的画面:

  正当你焦头烂额地一顿操作,旁边跟你一样重仓买入这支股票的同事却一脸气定神闲。于是你便问:喂兄弟,干嘛还不逃呀?

  “啊”你一脸惊喜——刚刚以为的大跌,原来不过是上涨过程中的正常回调罢了。

  尽管站在了一个相同的价位,但你前后的感受和决策是迥乎不同的,甚至可能是截然相反。

  原因很简单,唯有在时间维度放大之后,你才能看到一张更接近“事实”本来面貌的全景图。换句话说,你必须站在一个时间跨度足够大的位置,才能判断出所谓的趋势。

  与之相对的,短期和双向的走势,都只是波动,无穷无尽的波动,毫无规律的波动,干扰你做出正确决策的波动。

  唯有志存高远的人,目光放到未来十年甚至一百年的人,他们才用足够大的胸怀与眼界去目睹人类社会中浩浩荡荡的趋势,从而顺势而为,最后成为一个“时势造英雄”的故事。

  前段时间与秦小明交流过(他是2018年福布斯30位30岁以下杰出年青人之一,他通过期货交易而积累了数十亿的财富)。我问他,期货交易的秘密。

  再譬如,看一年的电商销量,必定是在每年6月和11月都迎来高峰(因为有618和双十一)

  这也是我想提醒的:真实世界中大多数时间序列,都是复合型的——同时包含两个或以上的特性。在这张图,就是趋势+季节性。

  另外,还值得注意的是,当你在一个有明显季节性的时间序列里的时候,环比就是没有多大意义的,而是应该去看同比。(环比是指这个月跟上个月比较,同比是指今年这个月跟去年这个月的比较)

  但有周期意识的人,他们相信趋势是有终点的;在众人的欢呼声中,他们时刻保持着警惕,耐心等待拐点来临的信号。一旦发现周期出现,他们会立马采取行动,全身而退,明哲保身。

  周期这把大屠刀,是难以伤害到这种人的。但周期分分钟就会收割一大波韭菜。就像巴菲特所说的,潮水退了才会看到谁在裸泳

  善于运用时间序列思维的人,他们更容易识别出事物的变化规律。换言之,他们更容易感知到事物下一步变化的走向。

  如果你准确预判那支股票有潜力、哪个房地产会升值,那你就是下一个巴菲特和李嘉诚了。

  如果你能预判到未来业务的发展,消费者的喜好变化趋势,那你还愁卖不出商品吗

  如果你在运营一家互联网公司,每天有无数个指标涌进来:用户增长率、点击率、购买率、转发率、绑定率……浩如烟海。你怎么知道哪个指标有问题呢?

  一旦曲线的走势突破了安全区域的上边界或下边界,就会自动地警报提醒你,让你及时地做出反应。

  图中蓝色区域就是时间序列的“安全区域”;它有个更正式的学术名称,叫置信区间

  如果你发现一个研究对象是随着时间而发生变化时,不妨画出它的时间序列,尝试去做三件事:

  譬如,你打算去斯里兰卡旅行,翻看了地图册,根据地理位置你大概能知道它的夏天会有多热,尽管你还没真正地在那儿待过。

  这句话是可以被证伪的。因为只需要把猫爷的身高和吴亦凡的身高拿出来做个对比就行了

  是否可被证伪,就是成为科学的一种重要依据。简单说,科学真理就是可被证伪,但未被证伪的知识。

  你开了一家水果店,但不知道卖什么水果比较好,于是你决定采取AB test的方法去寻找答案。单数日卖红苹果,双数日卖青苹果。

  一个月之后,你再对比下红苹果和青苹果的销量,发现大家都喜欢买红苹果,不喜欢买青苹果。

  之所以说“近似”,是因为真正的(或者说最理想的)AB test是只能在互联网环境中才能实现的。因为互联网允许通过分流的方式来实现两个甚至多个方案的同时进行。

  众多手机用户会被分配到不同的待定方案中,然后通过用户行为或者用户反馈来检验哪个方案是最成功或最受欢迎的。

  AB test之所以重要,是因为你有时候不能先验地去认定用户喜欢什么,不喜欢什么。别说产品经理不知道了,有时候连用户自己也说不清自己究竟喜欢什么,或不喜欢什么。

  原理上,你可以对每个小更改的地方都做过多次AB test,不停地对产品进行优化。

  试验思维除了以AB test的方式来帮助产品改良之外,它也是一种公司策略。

  亚马逊创始人杰夫-贝佐斯,曾经说过:“亚马逊之所以取得今天的成功,就是因为我们坚持每年每月、每日每夜地不断测试的结果。”

  我有一个学姐,她就是在美国亚马逊里工作的。听她的分享,亚马逊内部是同时有非常多的创新项目在同时进行(这有点类似腾讯的赛马机制),最后哪个项目做出成绩,就会倾斜更多资源在它身上,慢慢培养出一个优秀的项目成果。

  每个创新项目都是企业的一场试验。而每个创新项目中,也都不停地进行AB test。

  Facebook的年轻创始人马克-扎克伯格也说过类似的话:“我最自豪的一件事,就是我们的测试框架——在任何时间点之上,都不只有一个版本的Facebook在运作,或许有上万个版本——这就是我们能够取得成功的秘诀”

  还记得我在之前有提到过的漏斗思维吗,其实完整的黑客增长是:AARRR漏斗模型+AB test—— AARRR漏斗模型从高到低有好几层,每一层都有转化率,而AB test就是提高每一层转化率的方法。

  回到国内互联网,头条系大佬张一鸣也说过:“头条系每发布一个新APP,名字都必须打包无数个放到应用商店中进行AB test,最后才决定用哪个名字。哪怕你有99.9%的把握认为手上的是最好的一个名字,那测一下又有什么关系呢?”

  展开这一节之前,容我先吐槽下“一万小时理论”。大多数人对这个理论或多或少也有所耳闻。作者在《异类》这本书里指出,一个人要从平凡变成超凡,10000小时的努力训练是必要条件。

  这本书的作者也推翻了谬误的一万个小时理论,他认为,真正能有效提升能力的是一套原则,例如,在舒适圈边缘练习、收集有效的反馈、精神高度集中等等。

  之后他就开始不断地试错,不断地寻找自己的新定位和新方向。是的,是不断地试错。

  他的短视频内容,从美妆知识,到不同国家的英文口音,再到各地旅游景区的典故,再到不同餐厅的美食打卡。通过非常多次的试错,test & learn,他现在慢慢清楚自己粉丝的口味,以及适合自己的内容。

  历史上有一个地位重要的人,曾经以自己一己之力,把试验精神发扬光大的。没错,那就是小学作文就被大家写烂的人:爱迪生。

  爱迪生的发明工厂,通过无数次的失败试验,硬生生地创造了被广泛商用的电灯、电影、留声机。他是真正地把试验、创新、发明当作企业去运作的第一人。

  之所以把这个思维放在最后来讲,并不是因为它不重要,恰好相反,正是因为它太重要了,所以我不得不拿它来作为压轴收尾。

  一次是在给下一届管理培训生做培训时,一次是在一次校招直播时,还有一次是在商学院分享会上。

  人们对数字化的关注度比较高,很大一部分原因是目前许多传统行业都面临着数字化战略的组织转型这个大挑战。

  结合我对业务的理解,我曾经给出过一个比较通俗的答案方便大家理解:数字化等于四个层级。

  管理学大师曾经说过一句万世真理:No measurement, no improvement。翻译过来就是,没有数据,就无法优化。

  你一定有接触过一些理财知识,那通常这些理财书籍或理财教程的第一课都会强调什么?没错,就是让你要养成记账的生活习惯。

  记账为什么对于理财小白而言很重要?因为你在一开始,对钱根本是无感的——钱都花到什么地方去了呢?对于金钱流向,你几乎毫无概念。

  唯有通过记账,你才会惊讶地发现跟朋友聚会吃喝玩乐花了35%的收入,或者发现你在各种杂七杂八的网站上花了小几百块钱开通不怎么用的VIP,或者发现化妆品的支出比你预计的还要多。

  没有数字,你就没有客观事实依据,有的只是主观印象,而且印象往往都是错误的。

  同理,你要做时间管理,第一步就是学会观察和记录自己每一天是如何分配时间的。

  如果你要做项目管理时,你面对更加复杂的资源与形势,但原理都是一样的,第一步还是学会观察和记录人力、时间、金钱等等资源是如何被分配和使用的。

  从产品流通角度看,从研发、生产、包装、运输、储存、分销到送到消费者手上,每一个环节都要做好数字化。

  从业务部门角度看,从财务、人力资源、市场、供应链、公关等部门,也是要落实数字化的第一步。

  数字化第一步只是让你拥有了数字。但是,至于哪些数字重要哪些不重要,哪些数字能反映什么业务问题或增长机遇,只能通过数字化第二步来实现,那就是建立指标体系。

  相信大家平时都喜欢看抖音、小红书或微博上面的网红发的视频或者帖子,在这些帖子里,有时候会植入金主爸爸的产品广告。

  对于企业而言,网红的商业价值就体现在这:以原创的作品,向信任度很高的粉丝进行种草。

  但是,在行业内有个公开的秘密,网红的粉丝数和互动数都掺杂了很多水分。所以对于企业而言,这种社交媒体广告投放的效果究竟如何,确实有点黑盒子,大家都不清楚。

  首先,收集过去一年内,他们投放出去的成千上万条的社交链接,爬取每条社交链接的用户评论数以及转发数,以及网红的粉丝数和价格。

  一个好的指标体系,必然是能够清楚地反映出我们在一个领域上是否表现得足够好。这种比较一般有三个分析维度:

  跟大盘比。整个市场是否在上升或者下降,我在市场趋势的上方还是下方。譬如,整个市场都在下跌,但只要我的下跌速度比市场均值较慢,也不是一件坏事。

  第二步,你通过购买量和浏览量的比值,建立了转化率这个指标;并且通过对比分析,你发现最近一个月的转化率是偏低的。

  在这个过程,可以应用之前提及的“逻辑链思维”帮你拓宽思路,找到真正的问题所在。

  实现前三个步骤的半自动化或全自动化,极大提高工作效率,把人的劳动力解放出来。

  实际上,一些数字化战略很领先的企业,已经部分实现了上述的自动化功能,而且,这也是大势所趋。传统部门中重复劳作的工作将最终被机器全面代替。

  内容介绍:本书的写作初衷是为了帮助更多功能测试人员转型自动化测试方向。在转型过程中,主流自动化测试技术和应用场景的结合是非常重要的一环。本书从自动化测试理论入手,全面地阐述自动化测试的意义及实施过程。全文以Python语言驱动,结合真实案例分别对主流自动化测试工具Selenium、RobotFramework、Postman、Python Requests、Appium等进行系统讲解。通过学习本书,读者可以快速掌握主流自动化测试技术,并帮助读者丰富测试思维,提高Python编码能力。

  1、65 页 PPT,看看人家埃森哲是如何系统化做好数据分析的(附下载链接)

  4、541页的《利用Python进行数据分析》第二版(附电子书和源码下载)

  从2017年开始,人工智能便波澜不断,无论是从BAT高调布局AI,还是从年薪50万招聘AI应届生,炽手可热形容AI工程师一点都不过分。百度推出“少帅计划”,针对30岁以下......博文来自:Python大本营的博客

  数据分析通过谈论数据来像他们的公司传递价值,用数据来回答问题,交流结果来帮助做商业决策。数据分析师的一般工作包括数据清洗,执行分析和数据可视化。取决于行业,数据分析师可能有不同的头衔(比如:商业分析师...博文来自:数智集的博客

  简介:本文来自AgeClub举办的中国老年产业商业创新大会上禹闳资本方巍的分享,方总在早期阶段成功投资医养连锁机构浙江绿康与老年文娱平台乐退族,AgeClub与禹闳资本保持长期合作;第一部分 对老年产...博文来自:AgeClub的博客

  阿里妹导读:在刚刚结束的乌镇世界互联网大会上,阿里云自主研发的POLARDB云原生数据库当选世界互联网领先科技成果,凭实力站上C位。这个”包管“了北京市每天800万人次的......博文来自:阿里技术

  对比线性回归逻辑回归不能再使用误差平方和代价函数,要是用交叉熵代价函数,要使用sigmoid激活函数部分数据集展示手写底层import tensorflow as tfimport numpy as ...博文来自:门前大橋下丶

  现在像深度学习,人工智能这样的词非常的火热,说先要说的是无论是深度学习还是人工智能,都是非常实验性的领域,我们在书上,在学术论文上看到的理论,都可能被推翻,所以今天分享的都是现在这个阶段人类的共识。我...博文来自:jacky_zhuyuanlu的博客

  1、第一阶段(一般岗位叫数据专员)基本学会excel(VBA最好学会;会做透视表;熟练用筛选、排序、公式),做好PPT。这样很多传统公司的数据专员已经可以做了2、第二阶段(数据专员~数据分析师)这一阶...博文来自:u010199413的专栏

  在整个数据分析流程中,数据采集是最重要的一个环节。只有采集好数据源,才是数据分析的根基,否则“巧妇难为无米之炊”。在数据采集中,我们经常使用埋点的方法采集数据。什么是埋点......博文来自:lovenankai的专栏

  前言上次分享,我们利用pandas和sklearn完成了泰坦尼克号数据的预处理,包括下面的步骤,具体可看深度学习泰坦尼克号生还数据处理选取建模字段缺失值处理性别处理登陆船舱的处理划分数据集数据的标准...博文来自:罗罗攀

  什么是人工智能、机器学习、深度学习、数据挖掘以及数据分析,本文尝试给出自己的理解和认知。...博文来自:木小鱼的笔记

  这里旨在分享一些我在学习的过程中所收集使用到的一些书籍和资料,其中包括 数据挖掘 、算法、数据分析、机器学习、深度学习、深度学习框架、和一些大牛的笔记以及老师们的讲义供大家学习。...博文来自:丿回到火星去

  关于这本‘工具书‘:不论是数据科学,传统机器学习还是深度学习,相关的理论讲解和代码资源已经十分丰富,但是当我们实际想要使用代码实现这些理论的时候,却总觉得机器学习或者数据科学的任务流程会有点复杂:繁琐...博文来自:weixin_44563688的博客

  可用于深度学习的源代码漏洞数据分析介绍海量的数据是应用人工智能的基石,深入了解数据有利于进一步开展相关研究。这批可用于深度学习的源代码漏洞数据来源于NDSS’18的VulDeePecker[1]提供的...博文来自:smallyoki的博客

  男怕入错行,女怕嫁错郎。同样是IT行业,既有6000块月薪横扫一片的外包人形代码机器,也有刚毕业就年薪30万都招不到的互联网算法工程师。  那顶级数据工程师在面对一堆数据的思考方式是什么样的呢?本...博文来自:小小何先生的学习之旅

  深度解析数据分析对排名的决定作用通过网站数据,更加放便我们了解网站的健康度,看出网站与用户之间的黏度,准确定位网站问题,及时的进行调整定制新的优化计划,让关键词排名更加稳定。...博文来自:Websites

  &:十进制:2、4转换为二进制:010、100,&位运算符规则:两个位分别相与,同时为1才得1,只要一个为0就为0,得出二进制后,可转10进制百分位0、1相与,为0十分位1、0相与,为...博文来自:Yaro的博客

  爬虫福利一:27报网MM批量下载 点击看了本文,相信大家对爬虫一定会产生强烈的兴趣,激励自己去学习爬虫,在这里提前祝:大家学有所成!目标网站:妹子图网环境:Python3.x相关第三方模块:requ...博文来自:Nick.Peng 的博客

  三四月份投了字节跳动的实习(图形图像岗位),然后hr打电话过来问了一下会不会opengl,c++,shador,当时只会一点c++,其他两个都不会,也就直接被拒了。七月初内推了字节跳动的提前批,因为内...博文来自:ljh_shuai的博客

  福利来了,给大家带来一个福利。最近想了解一下有关Spring Boot的开源项目,看了很多开源的框架,大多是一些demo或者是一个未成形的项目,基本功能都不完整,尤其是用户权限和菜单方面几乎没有完整的...博文

  在博主认为,对于入门级学习java的最佳学习方法莫过于视频+博客+书籍+总结,前三者博主将淋漓尽致地挥毫于这篇博客文章中,至于总结在于个人,实际上越到后面你会发现学习的最好方式就是阅读参考官方文档其次...博文来自:程序员宜春的博客

  前后端分离后,维护接口文档基本上是必不可少的工作。一个理想的状态是设计好后,接口文档发给前端和后端,大伙按照既定的规则各自开发,开发好了对接上了就可以上线了。当然这是一种非常理想的状态,实际开发中却很...博文来自:江南一点雨的专栏

  如果觉得我写的还行,请关注我的博客并且点个赞哟。本文主要介绍JAVA 中最常使用字符串常量String相关知识。1.String简介2.创建字符串对象两种方式的区别3.String常用的方法4.Str...博文来自:穿越清华

  首先跟大家说明一点,我们做 IT 类的外包开发,是非标品开发,所以很有可能在开发过程中会有这样那样的需求修改,而这种需求修改很容易造成扯皮,进而影响到费用支付,甚至出现做完了项目收不到钱的情况。那么,...博文来自:DavidGoGo_的博客

  Python 是一种代表简单思想的语言,其语法相对简单,很容易上手。不过,如果就此小视 Python 语法的精妙和深邃,那就大错特错了。本文精心筛选了最能展现 Python 语法之精妙的十个知识点,并...博文来自:Python作业辅导员 - 天元浪子【许向武】

  以实际SQL入手,带你一步一步走上SQL优化之路!博文来自:飘渺Jam的博客

  2019年11月2日,我统计了某招聘网站,获得有效程序员招聘数据9万条。针对招聘信息,提取编程语言关键字,并统计如下:编程语言比例rankpl_percentage1java33.62%2cpp16....博文来自:juwikuang的专栏

  餐盘在灯光的照耀下格外晶莹洁白,女朋友拿起红酒杯轻轻地抿了一小口,对我说:“经常听你说线程池,到底线程池到底是个什么原理?”...博文来自:万猫学社

  杨辉三角 是经典算法,这篇博客对它的算法思想进行了讲解,并有完整的代码实现。...博文来自:扬帆向海的博客

  昨天,有网友私信我,说去阿里面试,彻底的被打击到了。问了为什么网上大量使用ThreadLocal的源码都会加上private static?他被难住了,因为他从来都没有考虑过这个问题。无独有偶,今天笔...博文来自:粉丝交流群:864965495

  刷课一时爽,一直刷课一直爽!终于让我找到了这个黑客代码了,教程开始:只限谷歌浏览器和火狐浏览器使用,如果第一次失败,请重新试一下次将下面代码复制后,进入浏览器按F12键,先点击console 然后Ct...博文来自:HNUCM-杨超逸技术博客

  关于SQL和ORM的争论,永远都不会终止,我也一直在思考这个问题。昨天又跟群里的小伙伴进行了一番讨论,感触还是有一些,于是就有了今天这篇文。声明:本文不会下关于Mybatis和JPA两个持久层框架哪个...博文来自:十步杀一人-千里不留行

  欢迎来到“Python进阶”专栏!来到这里的每一位同学,应该大致上学习了很多 Python 的基础知识,正在努力成长的过程中。在此期间,一定遇到了很多的困惑,对未来的学习方向感到迷茫。我非常理解你们所...博文来自:Python作业辅导员 - 天元浪子【许向武】

  一、垃圾文字生成器介绍最近在浏览GitHub的时候,发现了这样一个骨骼清奇的雷人项目,而且热度还特别高。项目中文名:狗屁不通文章生成器 项目英文名:BullshitGenerator根据作者的介绍,他...博文来自:十步杀一人-千里不留行

  IT界知名的程序员曾说:对于那些月薪三万以下,自称IT工程师的码农们,其实我们从来没有把他们归为我们IT工程师的队伍。他们虽然总是以IT工程师自居,但只是他们一厢情愿罢了。 此话一出,不知激起了多少(...博文

  二哥,我今年大二,看你分享的《阿里巴巴 Java 开发手册》上有一段内容说:“循环体内,拼接字符串最好使用 StringBuilder 的 append 方法,而不是 + 号操作符。”到底为什么啊,我...博文

  不带钱不带卡,只带手机出门就能畅行无阻,这已是生活的常态。益普索发布的《2019第一季度第三方移动支付用户研究》报告显示,移动支付在手机网民中的渗透率高达95.1%,截至今年1月,支付宝全球用户数已经...博文

  你知道的越多,你不知道的越多 点赞再看,养成习惯GitHub上已经开源,有一线大厂面试点脑图,欢迎Star和完善 前言 这一期不算...博文

  第一幕:缘起 听说阎王爷要做个生死簿后台管理系统,我们派去了一个程序员…… 996程序员做的梦: 第一场:团队招募 为了应对地府管理危机,阎王打算找“人”开发一套地府后台管理系统,于是...博文

  网易云音乐是音乐爱好者的集聚地,云音乐推荐系统致力于通过 AI 算法的落地,实现用户千人千面的个性化推荐,为用户带来不一样的听歌体验。 本次分享重点介绍 AI 算法在音乐推荐中的应用实践,以及在算法...博文

  作者  胡书敏 责编 刘静 出品 CSDN(ID:CSDNnews) 本人目前在一家知名外企担任架构师,而且最近八年来,在多家外企和互联网公司担任Java技术面试官...博文

  今天周末,和大家聊聊学习这件事情。 在如今这个社会,我们的时间被各类 APP 撕的粉碎。 刷知乎、刷微博、刷朋友圈; 看论坛、看博客、看公号; 等等形形色色的信息和知识获取方式一个都不错过。 貌似学...博文

  前几天,GitHub 有个开源项目特别火,只要输入标题就可以生成一篇长长的文章。 背后实现代码一定很复杂吧,里面一定有很多高深莫测的机器学习等复杂算法 不过,当我看了源代码之后...博文

  知乎高赞:中国有什么拿得出手的开源软件产品? 在知乎上,有个问题问“中国有什么拿得出手的开源软件产品(在 GitHub 等社区受欢迎度较好的)?” 事实上,还不少呢~ 本人于2019.7.6进行...博文

  &和&&都可作逻辑与的运算符,表示逻辑与(and),&是位运算符,你还需要知道这5个位运算符,基础很重要,云运算其实很骚!...博文

  一、数据库简介 数据库(Database,DB)是按照数据结构来组织,存储和管理数据的仓库。 典型特征:数据的结构化、数据间的共享、减少数据的冗余度,数据的独立性。 关系型数据库:使用关系模型把数据...博文

  有一次面试的时候,被问到进程之间有哪些通信方式,不过由于之前没深入思考且整理过,说的并不好。想必大家也都知道进程有哪些通信方式,可是我猜很多人都是靠着”背“来记忆的,所以今天的这篇文章,讲给大家详细着...博文

  引言 王者荣耀大家都玩过吧,没玩过的也应该听说过,作为时下最火的手机MOBA游戏,咳咳,好像跑题了。我们今天的重点是爬取王者荣耀所有英雄的所有皮肤,而且仅仅使用20行Python代码即可完成。 准备工...博文

  张小龙生于湖南邵东魏家桥镇, 家庭主要特点:穷。 不仅自己穷,亲戚也都很穷,可以说穷以类聚。爷爷做过铜匠,总的来说,标准的劳动阶级出身。 家有兄弟两人, 一个小龙,一个小虎。 小虎好动,与邻...博文

  双十一大概会产生多大的数据量呢,可能大家没概念,举个例子央视拍了这么多年电视新闻节目,几十年下来他存了大概80P的数据。而今年双11一天,阿里要处理970P的数据,做为一个IT人,笔者认为今年”双十一...博文

  2019年互联网寒冬,大批企业开始裁员,下图是网上流传的一张截图: 裁员不可避免,那如何才能做到不管大环境如何变化,自身不受影响呢? 我们先来看一个有意思的故事,如果西游记取经团队需要裁员一名,会裁...博文

  开源的 Android 和闭源的 iOS,作为用户的你,更偏向哪一个呢? 整理 屠敏 出品 CSDN(ID:CSDNnews) 毋庸置疑,当前移动设备操作系统市场中,Android ...博文

  我清晰的记得,刚买的macbook pro回到家,开机后第一件事情,就是上了淘宝网,花了500元钱,找了一个上门维修电脑的师傅,上门给我装了一个windows系统。。。。。。 表砍我。。。 当时买ma...博文

  二哥,你好,我想知道一般程序猿都如何接私活,我也想接,能告诉我一些方法吗? 上面是一个读者“烦不烦”问我的一个问题。其实不止是“烦不烦”,还有很多读者问过我类似这样的问题。 我接的私活不算多,挣到的...博文

  今年正式步入了大四,离毕业也只剩半年多的时间,回想一下大学四年,感觉自己走了不少弯路,今天就来分享一下自己大学的学习经历,也希望其他人能不要走我走错的路。 (一)初进校园 刚进入大学的时候自己完全...博文

  迅速发展的前端开发,在每⼀年,都为开发者带来了新的关键词。2019 年已步⼊尾声,2020 年前端发展的关键词⼜将有哪些呢?发展的方向又会是什么呢?参考2019年大前端的发展,不出意外,前端依旧会围绕...博文

  知乎高赞:文中列举了互联网一线大厂程序员都在用的工具集合,涉及面非常广,小白和老手都可以进来看看,或许有新收获。...博文

  裁员,也是一门学问,可谓博大精深!以下,是互联网公司的裁员的多种方法:-正文开始-135岁+不予续签的理由:千禧一代网感更强。95后不予通过试用期的理由:已婚已育员工更有责任心。2通知接下来要过苦日子...博文

  在阿里,40岁的奋斗姿势 在阿里,什么样的年纪可以称为老呢?35岁? 在云网络,有这样一群人,他们的平均年龄接近40,却刚刚开辟职业生涯的第二战场。 他们的奋斗姿势是什么样的呢? 洛神赋 “翩若...博文

  其实从去年已经隐隐约约感觉到数据库的有变化,只是没有想到变得这么快。今年的一些事情实实在在地给了某些数据库重击,如果以前去某数据库还是喊喊,然后该用还用,今年从传统领域刮起的去某数据库的风,已经开始了...博文

  大家好,我是 Rocky0429,一个最近老在 GitHub 上闲逛的蒟蒻… 特别惭愧的是,虽然我很早就知道 GitHub,但是学会逛 GitHub 的时间特别晚。当时一方面是因为菜,看着这种全是英...博文

  最近一直忙于面试,人事推给了我一份简历,职位是算法工程师,年龄是 46 岁,我揉了揉眼镜后再看看,确实是 46 岁。抱着忐忑的心,我电话面试一番后,还是不觉得他和我们的团队很适合。 人都会有同理心,...博文

  介绍几个可以下载编程电子书籍的网站。 1.Github Github上编程书资源很多,你可以根据类型和语言去搜索。推荐几个热门的: free-programming-books-zh_CN:58K 星...博文

  楼主身处昆明,一个新晋的一线城市,这个地方的互联网环境真的很差。从毕业开始,就想着找一家做自己产品的互联网公司,锻造能力的同时,说不定还能搞点股份(现在想想,尼玛,当时真是太天真,股份没拿到,尼玛五险...博文

  源码 告别枯燥,60秒学会一个小例子,系统学习Python,从入门到大师。Python之路已有190个...博文

  python版飞机大战 用python几百行代码搞定飞机大站游戏。 我们利用pygame包进行飞机大战的游戏开发,所有大家首先得安装好pygame包,本游戏一共封装了8个类, 定义玩家飞机精灵类 ...博文

  相信大家时不时听到程序员猝死的消息,但是基本上听不到产品经理猝死的消息,这是为什么呢? 我们先百度搜一下:程序员猝死,出现将近700多万条搜索结果: 搜索一下:产品经理猝死,只有400万条的搜...博文

  **爬虫三连:获取网页,解析网页,保存目标** 刚到公司还没坐下,我旁边的IOS同学就悄悄告诉我项目出了BUG,并给我投来了一个神秘的微笑。。。 在我吃完早餐,喝完开水,上完厕所之后,手终...博文

  全文共4124字,预计学习时长12分钟 来源:Pexels 由于我们所处生态系统的快速发展,我们更倾向于花时间尝试最新的发明并在互联网上进行讨论。IT业得到经久不息的发展热情,其中前端开...博文

  :我也是转行,没有项目经验,每次被问到很深入的问题就没法回答,又不能乱说

分享到:
您使用的浏览器版本过低,不仅存在较多的安全漏洞,也无法完美支持最新的web技术和标准,请更新高版本浏览器!!