一起源码网

  • www.171739.xyz
  • 全球最大的互联网技术和资源下载平台
搜索
一起源码网 门户 科技前沿 查看主题

『星尘』CPH视角下的数据挖掘

发布者: 云文章 | 发布时间: 2020-1-23 20:30| 查看数: 3950| 评论数: 1|帖子模式

 文章可授权转载,欢迎投稿,稿件根据质量会支付一定金额报酬。联系人:金融监管研究院副院长刘诚燃,联系加微信:18956351980

线下培训课程

上海

1.27-28日

上海

1.27-28日

『星尘』CPH视角下的数据挖掘

(本文写于2018年1月2日凌晨,系金融数据挖掘系列笔记第37篇)

2017年7月20日我国发布《新一代人工智能发展规划》,王革指出,世界正发生深刻变化,正从原来物理空间和人类社会空间组成的“二元空间”(PH空间)进入多了一个信息空间的三元空间(CPH空间)。

二元空间中,信息及知识的获取均均直接来自人类,并由人脑加以应用,改变物理世界。而在CPH三元空间中,许多信息直接来源于物理世界——数以万计的卫星一刻不停地向地面传达信息,数以亿计的摄像头通过屏幕传达信息,大量的传感器形成传感器网,成为新的信息源。并因此持续不断产生着大数据。

《星际穿越》中,库珀在奇点,以时间维度的可视化为基,向墨菲传递了关键信息,从而认识了规律,挽救了人类。现今,大数据科学家凭借信息空间中生生不息的“活数据”,不用身临其境,亦可自宏观至微观,细致全面地了解物理世界与人类社会的结构与运行规律。

如果说,过去分析师通过设计指标体系、抽样调查、实地观察、人与人语言交流,仅能管中窥豹地分析二元空间的各自结构与运行规律。现在,凭借源源不断、详尽无遗的电子数据,分析师就可以构造出物理世界与人类社会的信息映射,就如:因为文字(这是一种数据,一种信息处理工具)记录了语言、思维与行动,所以一个人就可能自省过去的言行,发现其中不当之处,并指导自己当下的行为。

这种“信息映射”,就是我曾提出的“数据痕迹”,数据分析师依靠电子信息技术,更加高效地处理数据,获取知识,积累、掌握与运用规律,影响人类行为和物理世界。基于海量数据的、非平凡的知识!发现,就是数据挖掘。在金融这一领域,因其高风险,“蝴蝶效应”普遍存在,为降低数据财务成本、时间成本,提升管理精细化水平与决策质效,大数据分析尤其有现实意义!

数据是有生命周期的,数据定义、采集、传输、存储、检索、分析、展示的全过程,均需人机协同和能量的持续投入,因之获取的知识如运用得宜,也会产生远大于各种投入的使用价值与经济价值,如此周流循环,生生不息,这可称为数据资产的再生产过程。

与其它产品与服务一样,如果短期投入巨大,短期产出却不明显,那么人们基于有限理性,往往会选择在数据挖掘技能与知识获取上不投入时间或精力,尤其是不投入资金(对个体而言,钱总是相对稀缺的!)因数据生产的全生命周期循环不畅,迄今为止大数据分析与现实的经营或监管活动未能无缝对接、有机协作的重要原因。(短期投入大,短期产出少,激励行为短期化,理性人大概率选择不做,或应付一下)

记得1994-1998年时,PC机刚开始应用于日常办公,身边同事原来是处于手写文稿、由办公室打字员用四通打字机謄写,发回撰稿人手工修改,再由打字员謄写,最后油印发文的信息处理方式之下,效率低。逐渐的,每个处室、每个人开始配发PC机、笔记本,建立了计算机网络与电邮、OA,打字与上网成为办公基本技能,有勤学苦练的老同志,也有人以学不会为理由,依然是自己手写别人打,信息处理效率上不去,于是乎就开始了自然选择。

此理于今依然。

如果说年岁已长的同事还有理由的话(心想反正又不会改革到自己身上,最多不进步,混几年就能退休了。)年轻人自不必说,40上下的中年人,至少还要工作20年,如仍抱这一心态,是准备温水煮青蛙一般静待自然选择吗?

学习从来是件艰苦的事情,知识与技能习得与保鲜需要持续投入,其价值并不会因为年岁的增长而自然增值。免费其实是最贵的,碎片化的数据,没有自己的抉择,总归仍是垃圾。

海量数据迅猛积累,赛博(Cyber)空间茁壮成长,物理世界与人类行为皆开始信息化、数字化,因而也就可通过数据挖掘来理解世界,掌握知识,发现规律……至于是否会增长智慧,就个体来看,依然离不开自身不懈地努力思考与积极实践,离不开人与人、人与物、人与信息的多维互动,人机工程+团体协作,应是数据飞船启航的必备条件!

延伸阅读

人工智能正在换代的动因

文章摘自:中国科学报

《新一代人工智能发展规划》发布的缘起

在1956年的美国达特茅斯会议上,包括麦卡锡、明斯基等在内的4位图灵奖获得者与多名学者共同确立了“人工智能”的概念,就是希望机器能像人那样认知、思考和学习,即用计算机模拟人的智能。此后,出现了基于人工智能的应用。

自20世纪70年代以来,人工智能涌现出的应用包括机器定理证明、机器翻译、专家系统、博弈、模式识别、学习、机器人和智能控制,这些都是在模仿人的智能。在这一过程中形成了很多学派,如今最著名的就是“连接学派”中的“深度融合网络”。

中国工程院对人工智能尤其在应用领域研究以后,发现人工智能正在大变,这些大变化出现了很多新的关键理论与技术,比较典型的有大数据智能、群体智能、跨媒体智能、人机混合增强智能、自主智能系统。

大数据智能即现在的大数据支持下的人工智能;互联网将人与计算机、人与人连接在一起,形成群体智能;跨媒体处理的认知方式越来越引起人工智能界的重视,这种“多媒体+传感器”产生的跨媒体感知计算可称为跨媒体智能;把机器跟人结合在一起形成更强大的智能系统称之为人机混合增强智能;从机器人的概念解放出来,各种各样的智能系统逐渐发展成自主的智能系统。

另外人工智能的应用也出现了许多变化,如智能制造、智能城市、智慧医疗等。

这些变化是如何产生的?我们需要研究它的根源。在此基础上,中国工程院将其当做一个重大课题进行研究。该课题所提出的观点为国家所接受,这促成了7月20日我国发布《新一代人工智能发展规划》。

人工智能正在换代的动因

为什么说人工智能正在换代?我们认为原因是,当今世界正在发生巨大变化:正从原来由物理空间和人类社会空间组成的“二元空间”(PH空间)进入多了一个信息空间的三元空间(CPH空间)。

三元空间是如何壮大的?50年前世界还只是二元空间,所有信息的流转、传播均来自于人类。就算后来有了互联网、移动通信、搜索工具,仍旧是二元空间,因为信息源仍然是人。然而今天,许多信息直接来源于物理世界——数以万计的卫星一刻不停地向地面传达信息,数以亿计的摄像头通过屏幕传达信息,大量的传感器形成传感器网,成为新的信息源。

在二元空间,人类通过自然科学和工程技术认识和改造世界;而在多了一个信息空间的三元空间,人类可以人机交互、大数据、自主装备的自动化间接改造物理世界,而且这种能力越来越强大。

空间的变化,不仅出现了大数据,还出现了新的通道。这些新的通道会带来新的计算、新的社会能力。这不仅会给计算机学科、智能学科提供研究的新途径和新方法,还会形成很多新的学科。举例来说,城市规划师很难一次性将一座城市的空间、产业、环境统一规划好,但从空间的层面理解城市,通过大数据的渠道,今后一定可以更清晰地了解城市如何良性运转。

同样的,复杂的环境生态系统、仍有许多未知的医疗和健康系统等,都是“科学问题+工程问题+社会问题”的复杂系统,靠传统的认知、观测很难了解它们,需要将传统的方式与新的认知方式结合在一起,才能对它们进行新的改造,这就是人工智能迈向新一轮发展的基本动因。

以动因而论,信息环境发生巨变,人工智能怎能不变?在新的信息环境下的人工智能一定是新的人工智能。以需求而论,人类的需求也发生巨变,人们需要用数据方法研究智能城市,去发展智能医疗、智能交通、智能游戏、无人驾驶、智能制造,需要人工智能从模拟人到模拟系统。以目标而论,从过去追求计算机模拟人的智能到追求人机融合,追求“互联网-人-机”更加融合的群体智能,这就是提出人工智能2.0的由来。相信随着信息技术的扩展,一定还会有新的人工智能技术出现。

需要提出的是,人工智能从1.0走向2.0,实际是人类的生存空间从PH空间到CPH空间演变的深化,前方还有许多理论和实践的挑战等待着我们。

AI 2.0时代初露端倪的技术

尽管人工智能2.0还只是刚开始,但已经出现了很多新的技术特征。

从大数据智能来看,现在深度学习技术很强大,但不止于此。AlphaGo能够引起举世震动,不仅因其机器学习能力,还在于其运用了“自我博弈进化”等新技术,这是一种新理念。可见,大数据智能除了深度学习以外还会产生很多新技术。

一些新的应用也很有启发。一个很好的例子是,谷歌的DeepMind团队已能为谷歌“挣钱”——DeepMind用它的软件控制着谷歌数据中心的风扇、制冷系统等120个变量,软件将这120个变量进行推理优化,使得谷歌数据中心的用电效率提升了15%,几年内已为谷歌节约电费数亿美元。2015年我国数据中心耗电1000亿度(据ICT Research统计),相当于整个三峡水电站一年发电量,这对我们很有启发。

用计算机替代人来进行组织工作也已出现巨大苗头。一个人或一组人不易完成的事,群智可以完成。美国普林斯顿大学一个项目组开发了一款名为“EyeWire”的游戏软件,目标是通过电子显微镜把人的视网膜与人脑的联系进行涂色显示。然而,这种对神经元的标记并不是几个人能完成的——神经是如此之多而每个科学家只知道其中一小部分。该项目组通过互联网号召全世界的眼神经专家共同来标记,最终有145个国家的16.5万名科学家参与了这个项目,人类也史无前例地知晓了视神经的工作机制,这就是群智的力量。

人机一体化技术导向的混合智能也潜力巨大。可穿戴设备、半自动驾驶、人机协同手术等技术已大面积涌现,这将成为一个新的领域,也会有大量的新产品出现。

同时,跨媒体推理已经兴起。近两年虚拟/增强现实(VR/AR)这种跨媒体技术十分引人注目。谷歌眼镜可以“所见即所知”,将所见物品的产地、价格等信息即时呈现;微软的智能软件可利用照片生成油画、国画,这都表明跨媒体技术发展非常快,相信在今后20年,跨媒体技术将大大提高机器和人的智能水平。

此外,无人系统迅速发展。过去60多年间,人工智能大力发展机器人,但发展最快的反而是机械手/臂、无人机、无人船等。许多城市、企业提出机器换人,但最核心的部分不是换掉人,而是让机器更智能、更加自主化。因此,自主智能系统仍需投入大量研究。

人工智能2.0的发展顺应信息化“数字化—网络化—智能化”的发展方向。中国很多省市和企业都纷纷在国家规划的指导下,制定本区域、本单位的新一代AI发展规划,准备大干一番。有理由相信,中国的人工智能技术与产业的快速发展期正在不可阻挡地大踏步到来。

为什么说人工智能正在换代?我们认为原因是,当今世界正在发生巨大变化:正从原来由物理空间和人类社会空间组成的“二元空间”(PH空间)进入多了一个信息空间的三元空间(CPH空间)。

三元空间是如何壮大的?50年前世界还只是二元空间,所有信息的流转、传播均来自于人类。就算后来有了互联网、移动通信、搜索工具,仍旧是二元空间,因为信息源仍然是人。然而今天,许多信息直接来源于物理世界——数以万计的卫星一刻不停地向地面传达信息,数以亿计的摄像头通过屏幕传达信息,大量的传感器形成传感器网,成为新的信息源。

在二元空间,人类通过自然科学和工程技术认识和改造世界;而在多了一个信息空间的三元空间,人类可以人机交互、大数据、自主装备的自动化间接改造物理世界,而且这种能力越来越强大。

空间的变化,不仅出现了大数据,还出现了新的通道。这些新的通道会带来新的计算、新的社会能力。这不仅会给计算机学科、智能学科提供研究的新途径和新方法,还会形成很多新的学科。举例来说,城市规划师很难一次性将一座城市的空间、产业、环境统一规划好,但从空间的层面理解城市,通过大数据的渠道,今后一定可以更清晰地了解城市如何良性运转。

线下培训课程

上海

流动性管理、报表统计与FTP

1.27-28日

上海

票交所时代票据业务新展望

1.27-28日

最新评论

yy890816 发表于 2022-7-30 22:49
html免费模板源代码

一起源码让程序更轻更快

www.171739.xyz

工作时间 周一至周六 8:00-17:30

侵权处理

客服QQ点击咨询

关注抖音号

定期抽VIP

Copyright © 2016-2021 https://www.171739.xyz/ 滇ICP备13200218号

快速回复 返回顶部 返回列表