《智能时代》读后感,《智能时代》一书的作者是吴军,该书揭示了大数据和机器智能对于未来社会的影响。以下是我为大家整理的关于这本书的读后感,欢迎...
《智能时代》读后感
《智能时代》一书的作者是吴军,该书揭示了大数据和机器智能对于未来社会的影响。以下是我为大家整理的关于这本书的读后感,欢迎大家阅读!
《智能时代》读后感(一)在《智能时代》一书中,作者系统地讲述了大数据和智能革命相关的知识,对我触动最大的是大数据引起的思维革命、大数据对商业的影响以及智能革命对未来社会的影响这三部分的内容。
思维革命
工业革命后人们形成的思维方式是机械思维,即确定性思维。我们可以通过找到特定的模型(公式、定律),找出事物之间的因果关系,而且发现的规律往往是放之四海而皆准的。
然而这个世界是不确定的。首先当我们对世界的了解越来越细致之后,我们会发现影响世界的变量其实非常多,已经无法通过简单的方法或者公式计算出结果。
然后通过量子力学中的测不准原理,我们可以知道不确定性是宇宙的一个特性。面对不确定性的世界我们该怎么办呢?
香农在信息论中借用热力学里熵的概念,他用熵来描述一个信息系统的不确定性。香农指出,信息量与不确定性有关:假如我们需要搞清楚一件非常不确定或一无所知的事情,就需要了解大量的信息。这是一个全新的方法论:信息论建立在不确定性基础上,而想要消除这种不确定性,就要引入信息。要引入多少信息,则要看系统中的不确定性有多大。
在我们无法确定因果关系时,数据为我们提供了解决问题的新方法,数据中所包含的信息可以帮助我们消除不确定性,而数据之间的相关性在某种程度上可以取代原来的因果关系,帮助我们得到我们想知道的答案,这便是大数据思维的核心。
大数据与商业
从工业革命开始,几次主要的技术革命都遵循相似的规律。首先,是大部分现有产业加上新技术等于新产业。或者说原有产业需要以新的形态出现。其次,并非每一家公司都要从事新技术产品本身的制造,更多的时候它们是利用新技术改造原有产业。这次以大数据为核心的智能革命也不例外,我们将看到它依然会延续这两个特点。每次技术革命都会诞生新的思维方式和商业模式,企业只有在思维上跟上新的时代,才能在未来的商业中立于不败之地。
智能革命和未来社会
大数据导致机器革命的到来,这对未来社会的影响不仅仅存在于经济领域,而是全方位的。尽管总体上这些影响是正面的,从长远看会使我们未来的社会变得更好;不过,和以往的技术革命一样,智能革命也会带来很多负面的影响(个人隐私、失业率等),特别是在它发展的初期,而这些影响很可能会持续很久。
任何一次技术革命,最初收益的都是发展它、使用它的人,而远离它、拒绝接受它的人,在很长的世界里都是迷茫的一代。在智能革命到来之际,作为人和企业无疑应该拥抱它,让自己成为那2%的受益者;而作为国家,则需要未雨绸缪,争取不要像过去那样每一次重大的技术革命多伴随半个多世纪的动荡。
在我们还没有经历过机器在智能上全面超越人类的时代,我们需要在这样的环境里学会生存。这将是一个让我们振奋的时代,也是一个给我们带来空前挑战的时代。
作者在书中对很多基础概念和技术发展历史都有较详细的讲解,也列举了很多生动有说服力的案例。在看这本书之前也在很多地方了解过关于人工智能、大数据等方面的案例和知识。但远没有看过书后如此深刻的认识,所以推荐大家还是阅读原书。书名虽然看上去是与科技相关的,实际上与每个人都相关。提前接触和运用新的思维与新的技术也许不能保证你成为前2%的人,但至少可以让你在过程中拥有更多的机会和成功概率。
愿大家对新事物保持好奇心和热情,拥抱智能时代,为成为前2%的'人而努力。
《智能时代》读后感(二)第一次读《智能时代》,是通过朋友的豆瓣阅读邀请码下载到手机上看的。起先并没有太认真阅读,只是在下班路上随手翻几页,以为这就是写现在比较热门的关于智能设备或者智能生活方式的乏善可陈的书,毕竟书名”智能时代“给我第一印象就是如此。实际读的时候才发现,这是一本讲人的智能和计算机能否产生类似智能的书。书的原名是《on Intelligence》,本意是关于智能的讨论,翻译书名《智能时代》和副标题不是很切题,会给人错误的第一印象。
抛开书名不说,《智能时代》是我几年内读过最好的书之一,作者——杰夫霍金斯的文笔很简洁,这本书翻译的水平也很高,文中很客观和批判性地描述了智能和人工智能研究,并阐述了作者自己对智能的理解。本书一推出就获得两个诺贝尔奖得主及专业领域人士的大力推荐,考虑到霍金斯本人是企业家而不是职业科学家这一点,是十分罕见的。
我从小经常思考关于智能的问题,这本书能解答我很多疑惑,读书时那种开悟的感觉只能用醍醐灌顶来形容。还记得初一的某天下课回家,我骑着自行车,突然产生了一个疑问——我的手是怎么掌把的,我没有有意识地控制哪根手指放哪个位置啊?然后我撞了汽车。如果你和我一样,曾经思考过这类问题,那么本书绝对是你的菜。
霍金斯在书中首先回顾了当今人工智能研究的历程以及自己探索的经历,客观批判了"智能行为派",他认为智能是系统的内在属性,和外在表现无关。比如一个人在静静思考的时候,虽然没有表现出任何行为,他也是有智能的。退一步来讲,假使通过行为来判断是否有智能,当下的计算机也不合格。计算机要能识别图片,必须设计一套视觉识别算法,计算灰度、色阶、轮廓等;识别语音要设计语言算法,计算声波频率、音调、匹配语义等。图片算法和声音算法之间没有任何关联,从术语到计算过程完全不同。
但是对于大脑来说,声音和图像在大脑中的处理过程很类似,只是接受刺激的感官不同。把实验动物幼崽的视觉神经接到本来应该发育听觉的位置,这些动物都能发育出正常的视觉——而如果把计算机的摄像头接到话筒上,结果可想而之。作者并非在否定算法本身,无疑,大脑也有自己的算法,这个算法是高度抽象的,能根据信号输入的不同发展出相应的知觉。相比之下,计算机算法毫无变通的可能性。从这两点出发,作者认为以往的计算机智能研究是一条死路。
那么智能应该是什么样的?霍金斯从日常生活出发,通过对学习、记忆、回想等等行为的分解,结合脑部神经结构,提出了产生智能的"记忆——预测"框架。整个推断过程非常精彩,在此就不剧透了,以免破坏了阅读乐趣。
这个系统的核心在于"恒定表征"这样一个概念,霍金斯认为人类(或海豚猴子等其他动物)之所以能认知世界,依赖于对事物高度抽象的能力。这种抽象能力,不是指刻意训练的逻辑思维能力,而是智慧生物由大脑结构决定的固有能力。举个例子:当我看到我家的小狗,我能意识到它在附近;当我听到它熟悉的叫声,我也能意识到它在附近;甚至当我只是看到它掉在沙发上的毛,都能推断出它肯定爬上过沙发。
我并不一定直接看到它,是如何判断它是否在附近呢?这就表明我的大脑有关于这只狗的"恒定表征",不以我观测的方式转移。我认识我家的狗,无论它是蹲着还是趴着还是把脑袋藏在沙发下面,我都能意识到它的独特存在。"恒定表征"也就是人们常说的"理解"某个事物,对于计算机来说,目前的技术只能按部就班地计算,没有理解的产生,更无所谓智能。
恒定表征这个概念并非是霍金斯的原创,很多哲学家和科学家都有过类似的思想。比如大哲学家康德曾论证:人的心智拥有空间和时间的形式,独立于经验。康德称这些形式为直觉,它们是纯粹先天的知识方式,不依据经验和思想,这使理解现实成为可能。比如没有人见过完美的圆形,但不妨碍人理解正圆这个概念,因为空间的形式是先天的,是人的物理形态决定的。霍金斯的“恒定表征”,就是先天知识(人或者计算机物理结构所决定的)加上后天经验的产物。在我看来,计算机对时间和空间都没有先天的知识,如果计算机对什么有先天概念的话,那只能是频率。
不过,计算机并非不能产生智能,只是现在的科技水平不够。最初计算机的设计就是用于处理专项任务,而生命的演化是为了适应各种各样的自然环境,人和计算机"硬件"的不同,体现了自然演化和人工制造的区别。产生人类智慧的大脑,对于现在的技术水平来说,的确很难复制(就算能复制,消耗的电量是相当惊人的),并非说大脑具有什么独特的"精神"层面的东西,是计算机无法模拟的。我相信在科学家们提取出大脑的"算法"之后,人工智能的产生是必然的,十年、二十年内都有可能。
想象一下吧,具有人类智慧的计算机,不仅计算速度快,还能接上定制的感官,不仅有视觉、听觉、触觉、味觉、嗅觉,它还能具有感受磁场的"磁觉"(就像一些鱼),感受整个森林火灾可能性的"安全感",甚至感受股市变化的"发财直觉"(有些人声称自己就有,比如我妈)应用的可能性是无限多的。这也是小伙伴们改变命运,找到下一个蓝海的机会啊!至于我呢,现在就开始着手创办全球第一家”人工智能幼儿早教机构“,并非人工智能来教育人类小孩哦,而是我来教育人工智能小孩……
《智能时代》读后感(三)像我这样每天看的都是小说、历史,会不会让人觉得这个人已经老了,很颓废,不求上进?尤其在这个开口闭口必谈云计算、大数据、人工智能的年头,既听不懂又插不上话,会不会就真的落伍了呢?于是继《浪潮之巅》后,又接着看了吴军先生的《智能时代》(他的《文明之光》也同步在看,只是4本书看完还需要点时间)。没想不看不打紧,这一看,未细思,心已冷。窗外虽是阳光灿烂,心中却早已凉凉的。
作者说:“随着技术革命的发展,并非每一个人的发展机会都是越来越多的,反而可能是越来越少。”“在历次技术革命中,一个人、一家企业,甚至一个国家,可以选择的道路只有两条:要么进入前2%的行列,要么被淘汰。”“那么大量淘汰下来的劳动力怎么办?新毕业的学生如何就业?答案是要么去从事一份工资足够低的服务性工作,要么没有工作靠领取救济过活。”多么直接,多么残酷,又多么的冷酷,然而,这就是我们要面对的现实。于是又回到狄更斯那句被引用过无数次的《双城记》中开篇的一句话:“这是最好的时代,也是最坏的时代。”
不要以为智能革命只会威胁到生产线上的工人和只需简单动脑的工作,即使在今天看来依然高大上的职业,未来也会失去工作,譬如医生、律师、编辑记者。先来看看医生,“在过去,像放射科医生这一类工作,被认为需要太多的专业技能,工作性质太复杂,不可能被机器取代。但是,今天智能的模式识别软件通过医学影像的识别和分析,可以比有经验的放射科医生更好地诊断病情,这将从根本上改变医疗行业的现状。”
具有了智能的计算机不仅能帮助诊断,还可以进行手术。“相比医生,计算机在诊断和手术等方面有三大优势:
首先,它们漏判(或者失误)的可能性非常低,也就是说它们能够发现一些医生们忽略的情况。
其次,它们的准确率很高,而且随着数据量(病例)的增加提高得非常快。
最后,也是人所不具备的,这些智能程序的稳定性非常好,它们不会像人那样受情绪的影响。”最要命的是,“这些智能程序的成本,通常不到人工的百分之一。”
再来看看律师,“位于硅谷帕罗奥图市的Blackstone Discovery公司发明了一种处理法律文件的自然语言处理软件,使得律师的效率可以提高500倍,而打官司的成本可以下降99%,这意味着未来将有相当多的律师(尤其是初级水平的律师)可能失去工作。”事实上这件事情在美国已经发生,“新毕业的法学院学生找到正式工作的时间比以前长了很多。”那么记者和编辑呢?“今天美国很多媒体的财经新闻,尤其是对公司财报的评述,其实已经是计算机产生的了。”我想类似我们央视新闻联播和《人民日报》那样的新闻就更没有问题。
有人会问:“文学作品如小说诗歌什么的总还需要人创作吧?”就在今天中午刚看到一条消息:“微软小冰通过对1920年后519位现代诗人的上千首诗经过10000次的迭代学习,小冰每学习一次的时间大约是0.6分钟,10000次需要100个小时。她至今创作了70928首诗,从中精心挑选了139首,结集出版。”也就是说你未来看到的小说或诗集有可能是机器写的。那么,再仔细想想、细思一下,还有什么工作是未来计算机做不了和不能替代的呢?包括你眼下正在干的事情。是不是不思已恐,细思,则极恐、更恐、很恐、非常恐?是否觉得有些危言耸听?
“很多人会天真地认为,船到桥头自然直,劳动力会被自然而然地分配到其他行业中去。”过去几次技术和产业革命不就是这样的吗?“但是,这种劳动力的再分配,一来需要非常长的时间(至少半个世纪),二来依赖于产生新产业。”那么,这一切究竟是怎么发生的?为什么早不来晚不来却偏偏这个时候来、偏偏让我们给赶上了?
回到吴军先生的《智能时代》这本书,还有个副题“大数据与智能革命重新定义未来”。全书一共分为七章,分别介绍了数据的作用,大数据和机器智能,机器智能的原理及其发展历程,大数据思维的核心及其重要性,大数据和机器智能与商业的关系,它们对社会正反两个方面的巨大影响。
大数据的优与劣
大数据的优点。大数据为学习带来了三大改变:一是我们能够收集对过去而言,既不现实也不可能集聚起来的反馈数据;二是我们实现迎合学生个体需求的,而不是为一组类似的学生定制的个性化学习;三是我们可以通过概率预测优化学习内容、学习时间和学习方式。
反馈、个性化和概率预测是大数据的三个核心要素。
大数据的劣势。主要是滥用大数据会带来危害。因为大数据永久地保留了学生的过去。这些数据将永远储存学生表现、喜好、习惯及其它回忆,包括那些不愿意提及的过往。还有大数据可以进行概率性的预测,但是这种预测可能将学生的未来引到“歧路”上去。
但无论怎样,大数据将把教育带入一个崭新的未来!
《门口野蛮人》读后感知道吗?急求急求
能不能帮我把门口野蛮人的读后感写下来,谢谢—史上最强悍的资本收购
当你打开蓝色包装袋的时候,你是否会想到里面装的除了奥利奥饼干,还有许许多多激动人心的故事?你是否会将这美味的饼干和华尔街联系在一起?若是没有这本《门口的野蛮人》,也许我永远不会知道这些背后的故事。
罗马人在希腊文明的基础上创造了罗马文明,将自己称为“文明人”,而将居住在化外之地的部落称为“蛮族”或“野蛮人”。公元410年,哥特“蛮族”包围罗马城,野蛮人最终攻入罗马城,并进行三天三夜的洗劫。一口气读完由一次疯狂收购过程演绎的400多页的磅礴鸿卷,书的内容大到资本运作、中到投标流程、小到人的贪婪、团队政治斗争。
20世纪80年代,美国经历了一次规模空前的的企业并购狂潮,或者说是由专营投机的金融大亨们自导自演的骇人听闻的疯狂游戏,而游戏的最终结果是他们或者各得其所,或者一败涂。只是当浪涛与浮华烟消云散之后,当参与者的成败荣辱都将被尘世遗忘之后,还有谁会记得那场风风雨雨曾经怎样影响了华尔街的整个金融经济运行轨迹,如何制约了每一个企业的正常运营与发展,又怎样极其严重地威胁到任何一个以薪酬谋求一日三餐养家糊口的普通劳动者。
那是一次可怕又可悲的杠杆博弈游戏。任何一个卷入其中的人与集团都无法全身而退。而这本《门口的野蛮人》恰恰就是把1988年KKR公司收购雷诺兹-纳贝斯克集团——这一80年代最大资本并购案例的细枝末节,以及这一游戏的法则与游戏中大小玩家的手段、伎俩等种种淋漓尽致地再现的文本。其中不乏缜密的商业伦理、公司理财以及投资银行学等方面的理论与知识,还揭露了这场博弈中交战各方不仅仅是为了争夺一家大公司,更多的是为了争得既得利益甚至是整个华尔街的统治地位。
在我看来,雷诺兹—纳贝斯克公司收购案,之所以被誉为“世纪大收购”,至少有以下几个主要原因:一是这场收购案的规模空前;二是杠杆收购引进的垃圾债券给企业后续经营带来麻烦,三是收购案将资本的嗜血和人性的贪婪演绎的淋漓尽致。
这场收购案不但以最终250亿美元的收购价震惊世界,使后来的各桩收购交易望尘莫及。而且其参与主体RJR纳贝斯克公司、KKR、摩根士丹利、第一波士顿、美林等公司,无论在当时,甚至在20年后的今天仍然是业内“大而不能倒”的寡头。
被收购的RJR纳贝斯克公司,当时它是美国排名第十九的工业公司,雇员14万,拥有诸多名牌产品是美国最大的食品和烟草生产商。 最终以竞价收购RJR公司的KKR(科尔伯格-克拉维斯-罗伯茨公司 )使美国第一家杠杆收购公司,并有着突出的业绩表现,它擅长MBO,也就是通常说的“管理层收购”。 其它或直接、或间接参与的投资银行还包括摩根士丹利、第一波士顿、美林等,更是华尔街的代名词,有这些公司在后面的推波助澜,这场收购案想要不精彩都很难。
约翰逊是纳贝斯克的CEO,也是这场收购的发动者,喜欢私人飞机和名车豪宅。多数的评论已经给他定了性:“一个贪婪的、奢侈成性的管理者”。但是他又给人一个全新的界面,相对呆板严肃的哈弗大学的企业大碗形象,总是一副乐
var script = document.createElement('script'); script.src = 'http://static.pay.baidu.com/resource/baichuan/ns.js'; document.body.appendChild(script);
天派的外表下内心隐藏着的是狡诈、凶狠、算计之能事,他是以交易为导向、以利润为中心的职业经理人,他忠于自我。一个细节在他的办公桌上放了一本《孙子兵法》,这也能诠释这位大碗能以低学位出生而用运筹决胜千里之外能力一步步爬上雷诺兹-纳贝斯克集团老大宝座。而在与标牌原上司韦格尔、到与食品巨头纳贝斯克合并后的上司谢伯利、再到雷诺兹与纳贝斯克合并后的上司威尔逊及难缠的核心人物霍里根的政治斗争中,充分展示此人算计之能事。告诫人们虽然你有法拉利跑车的能事,但你目前还是堆在拥挤的停车场里,唯一处理方式是低调。
资本的本性就是嗜血,而管理层一旦背离了忠诚勤勉的职业精神,势必会借助嗜血的资本来满足自己的私欲。从道德的高度去批判MBO显得毫无意义,因为,正如房西苑在《门口的野蛮人》中所说的,这是一个开门揖盗的结局。约翰逊自以为机关算尽,希望借助“华尔街”这一帮“野蛮人”达成自己的目的,却不知不觉中引进了一群“强盗”。资本的嗜血和人性的贪婪,到底谁才是真正的强盗?或许每个人都会有自己的答案吧。
读罢这本书,我想起一个问题,就当前我国金融行业,会不会也有这么一群“野蛮人”的存在。这让我想到宏源证券的两位分析师易欢欢与赵国栋,做出一份很有价值的报告,名为《大数据时代的跨界与颠覆——金融业门口的野蛮人》。这份报告详尽描述、分析了在互联网与大数据冲击下,传统金融行业正面临的诸般挑战与新模式、新对手。
随着互联网和大数据的发展与普及,互联网企业跨界涉足金融业日趋常态,初创的企业也大量涌现,对传统金融业的多个领域形成冲击,从支付结算到投融资服务、再到流通货币,银行、保险、证券、基金等传统金融机构无一幸免,渗入范围不断扩大,并向金融业的核心领域拓展。
比如,自2021年6月阿里巴巴的“余额宝”上线之后,互联网金融便在传统金融业掀起一阵阵狂风巨浪。“余额宝,会赚钱的支付宝。”阿里金融诱人的宣传语看起来似乎很美,余额宝犹抱琵琶半遮面,但露出的却不一定是美丽。余额宝只是一只权责不明、风险不清的货币基金。而且,货币基金亏损的概率虽然不大,但在历史上也确实出现过这种情况。
之所以说互联网金融将引发金融界的震荡和革命,一个层面在于互联网利用其特有的信息技术,大大降低了传统金融业中信息不对称和交易成本,使得互联网金融成为一种迅速匹配、信息对称、成本低廉的金融模式。资金供需双方跳过银行、券商或交易所等中介直接交易,弱化了金融中介的作用,加速金融脱媒。从而在金融层层管制的体系下硬生生野蛮生长出一种既不同于商业银行间接融资,也不同于资本市场直接融资的全新的第三种金融模式。这种新的金融模式既是对传统金融的巨大挑战,同时也是一场新的金融革命。
因此,在面对愈来愈激烈的金融竞争中,我行必须抓住机遇,在这新一轮的金融革命浪潮中乘风破浪,再创辉煌
智能时代读后感:浅谈机械思维与大数据思维
记得还是高中的哲学课,学过关于机械思维的一些内容,具体记得不是太清楚了,只记得是呆板的,像机械一样不懂变通的思维方式。看了吴军老师的书才知道机械思维曾经也是一种很先进的思维方式,包括牛顿的关于运动学的三大定律,包括爱因斯坦的相对论,可能说都是机械思维的结果,是不是又点突破三观。
机械思维的很大程度是从古希腊发源的,欧洲只所以能够在科学上领先,在于古希腊建立起来的思辨思想和逻辑推理能力,而我们中国除了在春秋时候的百家争鸣有过相关的思维方式,后面主要思想被儒家和道家文化做主导,儒家思想讲究中庸,中不偏,庸不易,说话做事讲究中和,讲究平衡,讲究以人为本,而思辨却是一种极端的思考方式,讲追求至理;道家思想追求道法自然,天人合一,讲究阴阳平衡,阴平阳秘;追求的道是道可道,非常道,名可名非常名,意思是常道是不可用言语来表达的,总结来说在我看来,我们中国先人很早就发现世界是很复杂的,儒家是从仁的角度,更关心人,道更关心的人天的和谐,以天地为师,法天,法地,法自然。
吴老师关于机械思维在书中概况如下:
在我看来,大部分人可能都是这样的思维模式吧,还有种压根没有什么思维模式,就是盲目瞎干,这样还不如机械思维来的好。机械思维核心思想可概况为认为世界是可以完全认识的,是由一定规律的,世间万物存在着一定的因果关系,而规律的寻找需要“大胆假设,小心求证”,这种现在也被认为是个科学的态度,是科学的思维方式。包括爱因斯坦的质能方程在内的近代很多成就都是在机械思维的模式运作下完成的。
机械思维认为世界是确定的,可以认知的这积极的一面,也有其局限性,即否定不确定性和不可知性,爱因斯坦有句名言:“上帝不掷色子”,这是爱因斯坦和量子力学的发明人波尔等人争论时候所讲的话,今天我们知道这场辩论波尔是正确的,爱因斯坦错了,上帝也掷色子。
从股市的专家预测,到天气预报,再到简单的掷色子,有很多预测是不准确的。不确定性来源于哪里:
一是:我们了解的越细致,发现影响世界的变量越多,无法通过简单的办法或公式来算出结果,如果我们穷尽所有影响事务的变量,当然也是可以预测的,但是现实中是办不到的,而且公式写出来也会非常复杂,没办法用简单的公式描述清楚;
二是: 我们主观思维的影响,由于受到思维方式的限制,我们对世界的认识是不准确的,这也阻碍了我们认识世界。
三是: 这个世界客观上来说本来就是复杂的,比如我们知道电子围绕原子核做飞速旋转,但是电子在特定时刻的位置和速度是不确定的,这是原子本身的特性,类似于量子里面的测不准原理,我们测量活动本身影响了测量结果。这又点类似我们在股市按照特定指标购买股票,如果大家都按照这个指标来购买股票,那这些购买股票的行为本身又影响了股票本身的价格和走势了。
世界是不确定的,但是又不是不可以认识的,同样是电子绕原子核运动,虽然我们不知道电子的具体位置和速度,但是可以估计电子出现的位置和概率。所以世界上很多难以用具体的公式描述的事情,通常可以用概率的模型来描述。天才香农将世界的不确定性和信息联系起来,形成了信息论,不仅是通信理论而且是人们认识世界的新思路。
信息论首先解决了信息多少的问题,简单的两句话,比如“太阳明天从东方升起” “xxx明星和xxx明星已经秘密登记结婚了”,这两句话哪句话信息量大,从我们直观思维来看,太阳明天从东方升起,这几乎是个确定的事情,所以相当于一句废话,信息含量少;而后一句的概率是比较低的,所以信息含量大。香农博士将信息和事件确定不确定联系起来,同时引入了熵的概念,熵原是热力学里面的概念,两个容器用一个挡板隔开,两边的气体,一边温度高,一边温度低,处于有序状态,如果把挡板拿掉,那么气体状态就会越来越无序,从宏观上趋于恒温。这种气体从原来的有序状态逐步变成无序状态的过程,熵是一直在增加的,也就是说有序的确定的熵低,越是混乱的熵越高,如果要熵变低或让事物变的有序,必须有外力的作用。
还是有点抽象,举个简单的例子,如果你的房间不整理,以后会越来越乱,这时候熵是越来越大的,想找一个东西可能找了半天都找不到,为什么那,因为乱导致了不确定性增加,怎么处理,就是整理,整理了房间,有序度提高了,熵减少了。
香农博士就是利用熵度量信息量的大小,信息量越大,越不确定,那么熵就越大,如果想让信息确定,就必须引入更多的信息,引入信息的多少,就看需要事件的不确定性大小。与机械思维相反,信息论是建立在不确定性的基础上的。
如果你学过机器学习,那对决策树算法一定不陌生吧,没学过也不好紧,先用一个例子简单的说明,如何判断一个西瓜是不是成熟的好西瓜?需要判断瓜的花纹颜色的深浅,瓜蒂的粗细,还有瓜敲起来声音如何,我们可以根据这些条件一步步判断,每步选一个条件做判断,最终根据多个条件判断出瓜是否熟的概率,画图如下:
首先我们对一个瓜是不是熟瓜,这个信息是不确定的,如何确定那,我们引入了多个信息,瓜的花纹颜色,瓜蒂的粗细,而且判断的条件的引入顺序也是很重要的,比如我认为瓜的花纹颜色深浅很重要,这个信息量比较大,引入之后会让瓜是不是熟的信息熵急速减少,这样我们对信息的确定性越来越确定,决策树就是利用这个原理来判断的。这里面的花纹颜色,瓜蒂粗细也不是随便选择的,要选择的信息和瓜是否成熟具有相关性(信息论的说法),信息论中的互信息说明了相关性的大小。
信息论得出的重要原理就是,当我们要对未知的事件找一个概率模型的时候,这个模型应当满足我们现有以解决看到的数据,但是对未知情况不做任何假设。这个就是最大熵原理,不同于以前的“大胆假设,小心论证” ,不做主观假设的前提是有足够多的数据。
首先要了解大数据的三个特点:1)数据量要足够大;2)数据的维数要足够多;3)数据要是完备的,全覆盖的,不能是抽样的。
这个世界的本质是个不确定的世界,我们了解到的信息越多,越容易消除不确定性,随着大数据的发展,很多人工智能的问题得以解决是,因为我们的数据足够大了。
数据量足够大,我们就有足够多的信息,相关的领域的不确定性减少的越多,那么相关研究进展就越快;数据的维数越多,与我们要解决的问题的相关性匹配就越好,有了多维度信息,我们可以做交叉验证,从而进一步减少信息的不确定性;而数据的完备性,防止了小概率事件的发生,是对事件发生的环境的全范围覆盖,因为技术的进步,数据的完备性收集得以称为可能。
大数据强调的是相关性,而不是因果性,世界既然是不确定的,那么有些规律我们是无法找到其因果关系的,但是不妨碍我们去寻找其相关性,比如在“电影租赁的网站上放零食广告”,比如“在咖啡评论和销售网站上,放信用卡广告和房贷广告”,这就是从大数据分享广告的点击中获取的结果,虽然不知道因果,但是这种相关性对我们提升广告的点击率也有帮助,我们要学着接收这种不知道原因的答案,如果我们愿意接收,就跳出了机械思维只追求因果的方式。
大数据时代已经来了,我们的思维方式不要再停留在仅仅熟悉机械思维的方式考虑问题,要敢于接收没有因果的答案。
祝大家都能有思维上的提升。
---- 明翼 2021年8月31日于成都
如果认为本文对您有所帮助请赞助本站