-
大数据时代下如何打造“智慧交通”
所属栏目:[设计教程] 日期:2019-10-20 热度:198
【大咖·来了 第7期】10月24日晚8点观看《智能导购对话机器人实践》 图片来自Unsplash 当今时代,数据已经渗透到每一个行业和业务职能领域,对于海量数据的挖掘和运用,因为近年来,互联网和信息行业的发展而进一步引发关注。仅从交通管理角度出发,探索在[详细]
-
面试问:Kafka为什么速度那么快?该怎么回答
所属栏目:[设计教程] 日期:2019-10-20 热度:169
【大咖·来了 第7期】10月24日晚8点观看《智能导购对话机器人实践》 Kafka的消息是保存或缓存在磁盘上的,一般认为在磁盘上读写数据是会降低性能的,因为寻址会比较消耗时间,但是实际上,Kafka的特性之一就是高吞吐率。即使是普通的服务器,Kafka也可以轻[详细]
-
谷歌首席科学家:搞研究的痛苦,搞工程的人不懂
所属栏目:[设计教程] 日期:2019-10-20 热度:98
【大咖·来了 第7期】10月24日晚8点观看《智能导购对话机器人实践》 谷歌首席科学家、谷歌大脑技术负责人Vincent Vanhoucke(万努克)最近发出的一篇劝退文,引发海外科研学者的热议。 在这博客中,万努克直言以研究为业,固然令人羡慕,但会面临着各种各样的[详细]
-
Python爬虫44万条数据揭秘:如何成为网易音乐评论区的网红段子手
所属栏目:[设计教程] 日期:2019-10-20 热度:146
【大咖·来了 第7期】10月24日晚8点观看《智能导购对话机器人实践》 获取数据 其实逻辑并不复杂: 爬取歌单列表里的所有歌单url。 进入每篇歌单爬取所有歌曲url,去重。 进入每首歌曲首页爬取热评,汇总。 歌单列表是这样的: 翻页并观察它的url变化,注意[详细]
-
小型企业将如何从5G中受益
所属栏目:[设计教程] 日期:2019-10-20 热度:58
【大咖·来了 第7期】10月24日晚8点观看《智能导购对话机器人实践》 在足够多的新设备进入主流市场之前,5G已经在许多领域引起了越来越多的关注。从IT、零售、交通和制造业到医疗、娱乐、教育和农业,几乎每个行业都将在某种程度上受到5G的影响。 越来越多[详细]
-
对PB级非结构化数据的要求
所属栏目:[设计教程] 日期:2019-10-20 热度:167
【大咖·来了 第7期】10月24日晚8点观看《智能导购对话机器人实践》 众所周知,非结构化数据很难管理。但是,当组织的非结构化数据资产超过PB阈值时,控制数据集将带来一系列全新的挑战。 大多数传统的网络附加存储(NAS)系统都难以管理100 TB的非结构化数据[详细]
-
大数据之什么是Hash表
所属栏目:[设计教程] 日期:2019-10-16 热度:142
大数据之什么是Hash表,Hash,一般翻译做散列,也有直接音译为哈希的,它是基于快速存取的角度设计的,也是一种典型的空间换时间的做法。顾名思义,该数据结构可以理解为一个线性表,但是其中的元素不是紧密排列的,而是可能存在空隙。 1.散列表(Hash tabl[详细]
-
Apache Spark Delta Lake写数据使用及实现原理代码解析
所属栏目:[设计教程] 日期:2019-10-16 热度:159
Delta Lake 写数据是其最基本的功能,而且其使用和现有的 Spark 写 Parquet 文件基本一致,在介绍 Delta Lake 实现原理之前先来看看如何使用它,具体使用如下: df.write.format(delta).save(/data/yangping.wyp/delta/test/) //数据按照dt分区 df.write.f[详细]
-
Linux TCP/IP协议栈,数据发送接收流程,TCP协议特点
所属栏目:[设计教程] 日期:2019-10-14 热度:72
可以毫不夸张的说现如今的互联网是基于TCP/IP构建起来的网络。弄懂协议栈的原理,无论对调试网络IO性能还是解决网络问题都是有很大帮助的。本片文章就带领大家来看看内核是如何控制网络数据流的。 TCP特点 我们都非常清楚TCP协议设计的初衷,就是保证数据[详细]
-
苹果野心获支持 无人驾驶获路测许可
所属栏目:[设计教程] 日期:2019-10-14 热度:107
【51CTO.com原创稿件】Business Insider带来了***的消息:苹果公司今日获得加州车辆管理部门DMV的许可证,这意味着苹果可以在加州公路上测试无人驾驶汽车。苹果这次要测试的是2015款雷克萨斯RX450h,同时,有6名驾驶员获得此次智能驾驶测试操作资格。 苹果[详细]
-
大数据无处不在,安全性也需要如此
所属栏目:[设计教程] 日期:2019-10-14 热度:90
从大数据分析中获得的见解对于企业来说是非常有价值的。但是,每个新数据流都会创建一个新的潜在攻击向量,从而使传统的外围防御措施变得过时,并使组织容易受到攻击。在以往,数据安全主管和数据科学家不得不在分析和安全之间做出选择,但是现在别无选择[详细]
-
5G网络真的无敌?第六代Wi-Fi表示不服
所属栏目:[设计教程] 日期:2019-10-14 热度:157
随着第五代移动通信技术(5G)正式商用,同属第五代的Wi-Fi技术(802.11ac)的处境就非常尴尬了,除了不存流量费用外,无论是网速、设备连接数还是网络延迟,5G都拥有秒杀802.11ac的资质。那么,当5G网络和5G手机普及后,Wi-Fi又该如何应对? 第六代Wi-Fi技术出[详细]
-
一个简单的算法,分布式系统的性能瞬间被提升10倍以上
所属栏目:[设计教程] 日期:2019-10-14 热度:198
一、概要 这篇文章,给大家聊聊分布式文件系统HDFS在大量客户端并发写数据时,如何进行性能优化? 二、背景引入 先引入一个小的背景,假如多个客户端同时要并发的写Hadoop HDFS上的一个文件,这个事儿能成吗? 明显不可以接受啊,因为HDFS上的文件是不允许并[详细]
-
大数据分析师学习入门,10个数据可视化技巧
所属栏目:[设计教程] 日期:2019-10-13 热度:122
我必须对你说实话:当我学习数据科学时,我完全低估了绘图的重要性。没错,那时一切都一团糟:我从头开始学习 python、熟悉了所有可能的算法、理解了所有东西背后的数学原理,但是我的绘图技巧很糟糕。 为什么会这样?我们总是在做同样的事情。你知道的:pa[详细]
-
低功耗广域网技术比较一:成功实施的十大标准
所属栏目:[设计教程] 日期:2019-10-11 热度:144
低功耗广域网(LPWAN)是发展最快的物联网通信技术,也是全球物联网连接的主要驱动因素。随着各种低功耗广域网解决方案和供应商的出现,为物联网项目选择合适的技术方案并非易事。为了帮助您选择正确的解决方案,我们正在制作一个由两部分组成的帮助文章系列[详细]
-
大多数企业网络无法处理大数据负载
所属栏目:[设计教程] 日期:2019-10-11 热度:184
调查发现,企业IT无法跟上不断增长的数据过载。这次问题围绕网络带宽和整体性能。埃森哲(Accenture)对300位IT专业人员进行的调查发现,大多数人认为他们的企业网络无法完成处理大数据和物联网(IoT)部署的任务。在接受调查的公司中,只有43%的公司表示其网[详细]
-
文旅部将出台规定 在线旅游“大数据杀熟”或被处罚
所属栏目:[设计教程] 日期:2019-10-11 热度:137
据文化和旅游部网站消息,近日,文化和旅游部在官网发布《在线旅游经营服务管理暂行规定(征求意见稿)》(以下简称《暂行规定》),向社会公开征求意见。《暂行规定》对虚假预定、不合理低价游、价格歧视(大数据杀熟)、信用监管等问题都做出了具体规定[详细]
-
数据分析常用的18个概念,终于有人讲明白了!
所属栏目:[设计教程] 日期:2019-10-11 热度:118
[ 导读 ]大多数情况下,数据分析的过程必须包括数据探索的过程。数据探索可以有两个层面的理解: 一是仅利用一些工具,对数据的特征进行查看; 二是根据数据特征,感知数据价值,以决定是否需要对别的字段进行探索,或者决定如何加工这些字段以发挥数据分[详细]
-
智能数据降低业务成本的7种方法
所属栏目:[设计教程] 日期:2019-10-11 热度:167
智能数据可以通过许多有用且功能强大的方式降低企业的运营成本。 智能化设备和产品如今构成了现代生活的大部分。人们拥有智能手机、智能扬声器、智能汽车以及无处不在的物联网设备,旨在使人们的工作和生活更轻松、更直观。 当商业智能实践发挥作用时,甚[详细]
-
企业选择数据湖架构的5大理由
所属栏目:[设计教程] 日期:2019-10-11 热度:123
随着大数据的重要性和接受度的提高,人们也越来越需要考虑如何组织和托管大数据。答案之一是数据湖,在数据准备和组织方面最广泛的数据体系结构系统。 简单地说,它允许企业首先存储数据,然后在需要时检索数据。就像一个存储单元,你只是把你的东西存储,[详细]
-
大数据分享:60多个有用的数据可视化图形库
所属栏目:[设计教程] 日期:2019-10-11 热度:88
在开源世界中,某些库为数据可视化提供了许多可能性,包括图形或网络表示。其他库仅专注于网络图表示。通常,这些库比通用库提供更多的功能。您还将找到商业图形可视化库。商业图书馆的优势在于可以保证持续的技术支持和先进的性能。 宇宙网数据集的图形可[详细]
-
实例:大型监控网络系统如何规划ip地址?
所属栏目:[设计教程] 日期:2019-10-11 热度:76
对于监控项目来说,很多故障的原因都是跟ip地址设置不当有关,如ip冲突,或者有几路监控图像没有显示等,都是跟ip有一定关联,合理的分配ip地址十分重要。 一、为什么要合理分配IP? 对于小型监控项目来说,ip地址的设置比较简单,大部分的人都不会出错,对[详细]
-
一文详细解读 Dubbo 中的 Http 协议
所属栏目:[设计教程] 日期:2019-10-11 热度:58
太阳红彤彤,花儿五颜六色,各位读者朋友好,又来到了分享 Dubbo 知识点的时候了。说到 Dubbo 框架支持的协议,你的第一反应是什么?大概会有 Dubbo 默认支持的 dubbo 协议,以及老生常谈的由当当贡献给 Dubbo 的 rest 协议,或者是今天的主角 http。截止到[详细]
-
大数据世界中7种灾难性的网络安全错误
所属栏目:[设计教程] 日期:2019-10-11 热度:93
在人们生活的这个大数据世界中,需要防范一些网络安全错误。 如今,大数据正在以多种方式改变世界。企业依靠数据来提供高效的服务,但也必须担心网络安全风险。 行业媒体Towards Data Science提供了关于机器学习与黑客相关性的一份非常详细的指南,指出如[详细]
-
带你认识HDFS和如何创建3个节点HDFS集群
所属栏目:[设计教程] 日期:2019-10-03 热度:157
在本文中,大数据专家将为您介绍如何使用HDFS以及如何利用HDFS创建HDFS集群节点。 我们将从HDFS、Zookeeper、Hbase和OpenTSDB上的系列博客开始,了解如何利用这些服务设置OpenTSDB集群。在本文中,我们将探究HDFS。 HDFS Hadoop分布式文件系统(HDFS)是一种[详细]
