下面是小编为大家整理的互联网金融论文-大数据时代,供大家参考。
大数据时代
摘要:
随着网络信息的普及, 互联网的疆界和领域被大大的拓展, 数据在爆炸性的增长, 庞大的数据资源使得各个领域开始了量化进程, 无论学术界、 商界还是政府, 所有领域都将开始这种进程, 大数据时代的到来跟我们带来了新的机遇与挑战。
关键词:
大数据
云计算 发展 安全
一、 何为大数据 大数据(Big data) , 或称巨量资料, 指的是所涉及的资料量规模巨大到无法通过目前主流软件工具, 在合理时间内达到撷取、 管理、 处理、 并整理成为帮助企业经营决策更积极目的的资讯。
(一)
大数据的特点
大数据分析相比于传统的数据仓库应用, 具有数据量大、 查询分析复杂等特点。《计算机学报》 刊登的“架构大数据: 挑战、 现状与展望” 一文列举了大数据分析平台需要具备的几个重要特性, 对当前的主流实现平台———并行数据库、 MapReduce 及基于两者的混合架构进行了分析归纳, 指出了各自的优势及不足, 同时也对各个方向的研究现状及作者在大数据分析方面的努力进行了介绍, 对未来研究做了展望。
大数据的 4 个“V”, 或者说特点有四个层面:
第一, 数据体量巨大。
从 TB 级别, 跃升到 PB 级别; 第二, 数据类型繁多。
前文提到的网络日志、 视频、 图片、 地理位置信息等等。第三, 价值密度低, 商业价值高。
以视频为例, 连续不间断监控过程中, 可能有用的数据仅仅有一两秒。
第四, 处理速度快。
1 秒定律。
最后这一点也是和传统的数据挖掘技术有着本质的不同。
业界将其归纳为 4 个“V” ——Volume(大量)、 Velocity(高速)、 Variety(多样)、 Value(价值)
从某种程度上说, 大数据是数据分析的前沿技术。
简言之, 从各种各样类型的数据中,快速获得有价值信息的能力, 就是大数据技术。
明白这一点至关重要, 也正是这一点促使该
技术具备走向众多企业的潜力。
(二)
大数据的结构 大数据就是互联网发展到现今阶段的一种表象或特征而已, 没有必要神话它或对它保持敬畏之心, 在以云计算为代表的技术创新大幕的衬托下, 这些原本很难收集和使用的数据开始容易被利用起来了, 通过各行各业的不断创新, 大数据会逐步为人类创造更多的价值。
其次, 想要系统的认知大数据, 必须要全面而细致的分解它, 我着手从三个层面来展开:第一层面是理论, 理论是认知的必经途径, 也是被广泛认同和传播的基线。
我会从大数据的特征定义理解行业对大数据的整体描绘和定性; 从对大数据价值的探讨来深入解析大数据的珍贵所在; 洞悉大数据的发展趋势; 从大数据隐私这个特别而重要的视角审视人和数据之间的长久博弈。
第二层面是技术, 技术是大数据价值体现的手段和前进的基石。
我将分别从云计算、 分布式处理技术、 存储技术和感知技术的发展来说明大数据从采集、 处理、 存储到形成结果的整个过程。
第三层面是实践, 实践是大数据的最终价值体现。
我将分别从互联网的大数据, 政府的大数据, 企业的大数据和个人的大数据四个方面来描绘大数据已经展现的美好景象及即将实现的蓝图。
二、 大数据时代的产生 进入 2012 年, 大数据(Big data)
一词越来越多地被提及, 人们用它来描述和定义信息爆炸时代产生的海量数据, 并命名与之相关的技术发展与创新。
它已经上过《纽约时报》《华尔街日报》 的专栏封面, 进入美国白宫官网的新闻, 现身在国内一些互联网主题的讲座沙龙中, 甚至被嗅觉灵敏的国金证券、 国泰君安、 银河证券等写进了投资推荐报告。
数据正在迅速膨胀并变大, 它决定着企业的未来发展, 虽然很多企业可能并没有意识到数据爆炸性增长带来问题的隐患, 但是随着时间的推移, 人们将越来越多的意识到数据对企业的重要性。
正如《纽约时报》 2012 年 2 月的一篇专栏中所称, “大数据” 时代已经降临, 在商业、经济及其他领域中, 决策将日益基于数据和分析而作出, 而并非基于经验和直觉。
哈佛大学社会学教授加里· 金说:
“这是一场革命, 庞大的数据资源使得各个领域开始了量化进程, 无论学术界、 商界还是政府, 所有领域都将开始这种进程。”
三、 大数据的用途 大数据可分成大数据技术、 大数据工程、 大数据科学和大数据应用等领域。
目前人们谈论最多的是大数据技术和大数据应用。
工程和科学问题尚未被重视。
大数据工程指大数据的规划建设运营管理的系统工程; 大数据科学关注大数据网络发展和运营过程中发现和验证大数据的规律及其与自然和社会活动之间的关系。
物联网, 云计算, 移动互联网, 车联网, 手机, 平板电脑, PC 以及遍布地球各个角落的各种各样的传感器, 无一不是数据来源或者承载的方式。
有些例子包括网络日志, RFID, 传感器网络, 社会网络, 社会数据(由于数据革命的社会), 互联网文本和文件; 互联网搜索索引; 呼叫详细记录, 天文学, 大气科学, 基因组学,生物地球化学, 生物, 和其他复杂和/或跨学科的科研, 军事侦察, 医疗记录;摄影档案馆视频档案; 和大规模的电子商务 。
四、 大数据时代的安全机遇与挑战 大数据在成为竞争新焦点的同时, 不仅带来了更多安全风险, 同时也带来了新机遇。
一是大数据成为网络攻击的显著目标。
在网络空间, 大数据是更容易被“发现” 的大目标。
一方面, 大数据意味着海量的数据, 也意味着更复杂、 更敏感的数据, 这些数据会吸引更多的潜在攻击者。
另一方面, 数据的大量汇集, 使得黑客成功攻击一次就能获得更多数据, 无形中降低了黑客的进攻成本, 增加了“收益率”。
二是大数据加大隐私泄露风险。
大量数据的汇集不可避免地加大了 用户隐私泄露的风险。
一方面, 数据集中存储增加了泄露风险; 而这些数据不被滥用, 也成为人身安全的一部分; 另一方面, 一些敏感数据的所有权和使用权并没有明确界定, 很多基于大数据的分析都未考虑到其中涉及的个体隐私问题。
三是大数据威胁现有的存储和安防措施。
大数据存储带来新的安全问题。
数据大集中的后果是复杂多样的数据存储在一起, 很可能会出现将某些生产数据放在经营数据存储位置的情况, 致使企业安全管理不合规。
大数据的大小也影响到安全控制措施能否正确运行。
安全防护手段的更新升级速度无法跟上数据量非线性增长的步伐, 就会暴露大数据安全防护的漏洞。
四是大数据技术成为黑客的攻击手段。
在企业用数据挖掘和数据分析等大数据技术获取商业价值的同时, 黑客也在利用这些大数据技术向企业发起攻击。
黑客会最大限度地收集更多有用信息, 比如社交网络、 邮件、 微博、 电子商务、 电话和家庭住址等信息, 大数据分析使黑客的攻击更加精准。
此外, 大数据也为黑客发起攻击提供了更多机会。
黑客利用大数据发起僵尸网络攻击, 可能会同时控制上百万台傀儡机并发起攻击。
五是大数据成为高级可持续攻击的载体。
传统的检测是基于单个时间点进行的基于威胁特征的实时匹配检测, 而高级可持续攻击(APT)
是一个实施过程, 无法被实时检测。
此外, 大数据的价值低密度性, 使得安全分析工具很难聚焦在价值点上, 黑客可以将攻击隐藏在大数据中, 给安全服务提供商的分析制造很大困难。
黑客设置的任何一个会误导安全厂商目标信息提取和检索的攻击, 都会导致安全监测偏离应有方向。
六是大数据技术为信息安全提供新支撑。
当然, 大数据也为信息安全的发展提供了新机遇。
大数据正在为安全分析提供新的可能性, 对于海量数据的分析有助于信息安全服务提供商更好地刻画网络异常行为, 从而找出数据中的风险点。
对实时安全和商务数据结合在一起的数据进行预防性分析, 可识别钓鱼攻击, 防止诈骗和阻止黑客入侵。
网络攻击行为总会留下蛛丝马迹, 这些痕迹都以数据的形式隐藏在大数据中, 利用大数据技术整合计算和处理资源有助于更有针对性地应对信息安全威胁, 有助于找到攻击的源头。
五、 大数据时代下的处理和分析工具 用于分析大数据的工具主要有开源与商用两个生态圈。
(一)
开源大数据生态圈:
1、 Hadoop HDFS、 HadoopMapReduce,
HBase、 Hive 渐次诞生, 早期 Hadoop 生态圈逐步形成。
2、 .
Hypertable 是另类。
它存在于 Hadoop 生态圈之外, 但也曾经有一些用户。
3、 NoSQL, membase、 MongoDb (二)
商用大数据生态圈:
1、 一体机数据库/数据仓库:
IBM PureData(Netezza) ,
OracleExadata,
SAP Hana 等等。
2、 数据仓库:
TeradataAsterData,
EMC GreenPlum,
HPVertica 等等。
3、 数据集市:
QlikView、
Tableau 、
以及国内的 Yonghong Data Mart 。
六、 大数据时代的发展趋势 虽然大数据目前在国内还处于初级阶段, 但是商业价值已经显现出来。
未来, 数据可能成为最大的交易商品。
但数据量大并不能算是大数据, 大数据的特征是数据量大、 数据种类多、 非标准化数据的价值最大化。
因此, 大数据的价值是通过数据共享、交叉复用后获取最大的数据价值。
在他看来, 未来大数据将会如基础设施一样, 有数据提供方、 管理者、 监管者, 数据的交叉复用将大数据变成一大产业。
大数据的整体态势和发展趋势, 主要体现在几个方面:
大数据与学术、 大数据与人类的活动, 大数据的安全隐私、 关键应用、 系统处理和整个产业的影响。
大数据整体态势上, 数据的规模将变得更大, 数据资源化、 数据的价值凸显、 数据私有化出现和联盟共享。
大数据的发展会催生许多新兴新职业, 会产生数据分析师、 数据科学家、 数据工程师,有非常丰富的数据经验的人才会成为稀缺人才。
随着大数据的发展, 数据共享联盟将逐渐壮大成为产业的核心一环。
随着大数据的共享越来越大, 隐私问题也随之而来, 比如说每天手机产生的通话、 位置等等。
但这给带来了便利的同时也给带来了个人隐私的问题。
数据资源化, 大数据在国家和企业和社会层面成为重要的战略资源, 成为新的战略制高点和抢购的新焦点。
随着社会的不断发展, 大数据对 IT 技术架构的挑战, 大数据的生态环境问题, 大数据的应用及产业链将日益突出。
参考文献 【1】
大数据时代. 豆瓣. 2012 【2】
维克托· 迈尔· 舍尔维恩、 肯尼斯· 库克耶· 《大数据时代》
:
浙江人民出版社· 2013 【3】
李建义·《数据库原理及开发》:
中国水利水电出版社· 2005
【4】“大数据时代” 来临· 北京晚报网· 2012
【5】
大数据时代· 百度百科· 2014
姓名__________
专业____________
指导老师____________
日期_____________
推荐访问:互联网金融论文-大数据时代 互联网 金融 时代