-
TF-IDF与余弦相似性的应用(二):自动摘要
所属栏目:[大数据] 日期:2021-03-16 热度:159
作者: 阮一峰 日期: 2013年3月26日 有时候,很简单的数学方法,就可以完成很复杂的任务。 这个系列的前两部分就是很好的例子。仅仅依靠统计词频,就能找出关键词和相似文章。虽然它们算不上效果最好的方法,但肯定是最简便易行的方法。 今天,依然继续这个[详细]
-
【原创】薛存金:面向海洋异常变化的时空关联挖掘模型
所属栏目:[大数据] 日期:2021-03-16 热度:148
此内容为数据派独家内容, 数据派 是清华大数据产业联合会官方微信公众账号,定期发布清华大数据系列讲座信息,分享讲座实录,欢迎个人转发、收藏 。 其他机构或媒体如需转载,请联系 yafei.xue@tsingdata.com 申请授权。 【在 “数据派” 回复 “清华大数据[详细]
-
HDOJ/HDU 1250 Hat#39;s Fibonacci(大数~斐波拉契)
所属栏目:[大数据] 日期:2021-03-16 热度:182
Problem Description A Fibonacci sequence is calculated by adding the previous two members the sequence,with the first two members being both 1. F(1) = 1,F(2) = 1,F(3) = 1,F(4) = 1,F(n4) = F(n - 1) + F(n-2) + F(n-3) + F(n-4) Your task is to[详细]
-
HDOJ/HDU 1133 Buy the Ticket(数论~卡特兰数~大数~)
所属栏目:[大数据] 日期:2021-03-16 热度:87
Problem Description The “Harry Potter and the Goblet of Fire” will be on show in the next few days. As a crazy fan of Harry Potter,you will go to the cinema and have the first sight,won’t you? Suppose the cinema only has one ticket-offi[详细]
-
行业专家采用大数据预测寿命
所属栏目:[大数据] 日期:2021-03-16 热度:70
点击上方蓝色字体关注。 您还可以搜索公众号“ D1net ”选择关注D1net旗下的各领域(云计算,数据中心,大数据,CIO,企业协作,网络数通,信息安全,企业移动应用,系统集成,服务器,存储,呼叫中心,视频会议,视频监控等)的子公众号。 ======= 日前,英[详细]
-
2016#34;百度之星#34; - 资格赛(Astar Round1)Problem B(大
所属栏目:[大数据] 日期:2021-03-15 热度:58
Problem B ?Time Limit: 2000/1000 MS (Java/Others) ? ?Memory Limit: 65536/65536 K (Java/Others) Problem Description 度熊面前有一个全是由1构成的字符串,被称为全1序列。你可以合并任意相邻的两个1,从而形成一个新的序列。对于给定的一个全1序列,请[详细]
-
在数据分析、挖掘方面,好书推荐
所属栏目:[大数据] 日期:2021-03-14 热度:185
入门读物: 深入浅出数据分析 (豆瓣)?这书挺简单的,基本的内容都涉及了,说得也比较清楚,最后谈到了R是大加分。难易程度:非常易。 啤酒与尿布 (豆瓣)?通过案例来说事情,而且是最经典的例子。难易程度:非常易。 数据之美 (豆瓣)?一本介绍性的书籍,每章[详细]
-
数据标准化与PCA白化原理探索
所属栏目:[大数据] 日期:2021-03-14 热度:66
PCA是实验中很常用的工具,一般用来做降维,它的实现有很多很多种,其中牵涉相当多的细节,笔者在实现PCA时常常有困惑,为什么查到的各种代码总有一些不同的trick,有时候对样本提前归一化?有时候又要减均值?这些操作对于PCA降维效果到底有什么影响?这篇[详细]
-
R语言绘制文字云
所属栏目:[大数据] 日期:2021-03-14 热度:74
差不多一年没有怎么认真写过博客了,最近要做毕业设计,记录一下有关实验。参考实验楼上一个实验。主要学习使用分词包 Rwordseg 对莎士比亚的名著《仲夏夜之梦》中的内容进行单词频数统计,提取关键词,并进行数据清洗,最后使用包 wordcloud 根据关键词出现[详细]
-
K 大数查询
所属栏目:[大数据] 日期:2021-03-14 热度:199
题目大意 有N个集合,初始为空。有M个操作, 修改操作:编号范围在l~r的集合都加入一个数值为a的数, 询问操作:编号范围在l~r的集合数值为第k大的数。 n,m=50000,|a|=n,k 树套树 当然可行,但我不会 考虑离线——整体二分 L,R表示数值的区间,mid=(L+R)/2[详细]
-
大数 Astar-Round1 Problem B
所属栏目:[大数据] 日期:2021-03-14 热度:82
题目 2016"百度之星" - 资格赛(Astar Round1) http://bestcoder.hdu.edu.cn/contests/contest_showproblem.php?cid=690pid=1002 Problem Description 度熊面前有一个全是由1构成的字符串,被称为全1序列。你可以合并任意相邻的两个1,从而形成一个新的序列[详细]
-
R语言数据处理——tidyr包
所属栏目:[大数据] 日期:2021-03-14 热度:86
????在实际进行数据分析的过程中,我们常需要对数据进行一些相应的整理, “ tidyr 包 ”中的 gather( 宽数据转为长数据 )、 spread( 长数据转为宽数据 )、 unit( 多列合并为一列 )、 separate( 将一列分离为多列 ) 这四个 函数为我们的数据整理提供[详细]
-
R文本挖掘 | 如何在用户词库中添加搜狗词典?
所属栏目:[大数据] 日期:2021-03-14 热度:167
写 在前面 亲爱的小伙伴们!阔别大家将近10天,是不是等得有些着急了呢?本期大猫课堂将继续《R文本挖掘》系列,上节课中已经教大家 如何用jiebaR分词包进行分词 ,本期将教大家一个更加进阶的分词功能: 把搜狗专业词库添加进自己的用户自定义词典中。 稍微[详细]
-
lt;大数处理gt; 2016百度之星第二题
所属栏目:[大数据] 日期:2021-03-14 热度:57
链接:http://bestcoder.hdu.edu.cn/contests/contest_showproblem.php?cid=690pid=1002 Problem B ? ?Accepts: 2483 ? ?Submissions: 9088 ?Time Limit: 2000/1000 MS (Java/Others) ? ?Memory Limit: 65536/65536 K (Java/Others) Problem Description 度[详细]
-
2016#34;百(sha)度(bi)之星#34;-资格赛(Astar Round 1)题解
所属栏目:[大数据] 日期:2021-03-14 热度:127
昨天中午一年一坑人的百(sha)度(bi)之星又开赛了,当然正赛的话是下周开始,最先开始的是资格赛。资格赛嘛,过一题就算过了,所以也不管那么多了,就在比赛结束前把题解贴出来了。然后呢,果然不愧是刚刚被政府找去谈话的百度,秉承着坑死你们这帮acmer[详细]
-
HDOJ1002 大数相加
所属栏目:[大数据] 日期:2021-03-14 热度:161
pre name="code" class="java"import java.math.BigInteger;import java.util.Scanner;public class Main{ public static void main(String[] args) { Scanner cin = new Scanner(System.in); BigInteger a,i,t; int kase=0; int ts; ts=cin.nextInt(); int[详细]
-
简单大数相加
所属栏目:[大数据] 日期:2021-03-13 热度:148
#include iostream#include cstdio#include cstringusing namespace std;#define N 1000char s1[N];char s2[N];int main(){ int k,i,j; int l1,l2; int a[N]={0}; int b[N]={0}; gets(s1); //getchar() //不用这个玩意,有的话会吞掉下一个字符串的第一个字[详细]
-
[sicily] 1020. Big Integer
所属栏目:[大数据] 日期:2021-03-13 热度:88
1020. Big IntegerConstraintsTime Limit: 1 secs ,Memory Limit: 32 MBDescriptionLong long ago,there was a super computer that could deal with VeryLongIntegers(no VeryLongInteger will be negative). Do you know how this computer stores the Ver[详细]
-
如何利用BI搭建电商数据分析平台
所属栏目:[大数据] 日期:2021-03-13 热度:138
? ? ? ? 某电商是某大型服装集团下的重要销售平台。2015 年,该集团品牌价值达数百亿元,产品质量、市场占有率、出口创汇、销售收入连年居全国绒纺行业第一,在中国有终端店3000多家,零售额80 亿。其羊绒制品年产销能力1000万件以上的规模,占有中国的40%和[详细]
-
[案例分享] 大数据分析的威力:HPE Vertica 帮助Guess 网上商店
所属栏目:[大数据] 日期:2021-03-13 热度:167
在今天这个颠覆式创新的时代,消费者行为正在发生着巨大的变迁,他们相互之间的联系越来越紧密,他们与自己心仪的品牌之间也有着与以往不同的互动行为,此时,零售行业必须适时作出改变,通过大数据分析,实现更加精准的营销。 通过将大量数据从各种数据源转[详细]
-
干货丨初学者必看的大数据分析实用贴士
所属栏目:[大数据] 日期:2021-03-13 热度:139
选自:DZone 编译:数据观-赵杏 来源:数据观(公众号:cbdioreview) 作者:Marleen Anderson,是提供IT支持服务和IT培训的澳大利亚公司Saxons中团队的成员,是一名伟大的对企业家精神有极大兴趣的技术痴迷者。 数据分析是目前市场中的一个主要力量,理解消[详细]
-
新一代大数据处理引擎 Apache Flink
所属栏目:[大数据] 日期:2021-03-13 热度:191
大数据计算引擎的发展 这几年大数据的飞速发展,出现了很多热门的开源社区,其中著名的有 Hadoop、Storm,以及后来的 Spark,他们都有着各自专注的应用场景。Spark 掀开了内存计算的先河,也以内存为赌注,赢得了内存计算的飞速发展。Spark 的火热或多或少的[详细]
-
HDU 1042 N! (大数阶乘,紫书上的方法超时!!还是Java大法好!!)
所属栏目:[大数据] 日期:2021-03-13 热度:152
N! Time Limit: 10000/5000 MS (Java/Others)????Memory Limit: 262144/262144 K (Java/Others) Total Submission(s): 73270????Accepted Submission(s): 21210 Problem Description Given an integer N(0 ≤ N ≤ 10000),your task is to calculate N! ? In[详细]
-
Bi-shoe and Phi-shoe(欧拉函数变形)
所属栏目:[大数据] 日期:2021-03-13 热度:80
Bi-shoe and Phi-shoe Time Limit: 2000 MS????? Memory Limit: 32768 KB????? 64bit IO Format: %lld %llu Submit? Status? Practice? LightOJ 1370 Description Bamboo Pole-vault is a massively popular sport in Xzhiland. And Master Phi-shoe is a ve[详细]
-
【邀请函】2016永洪科技大数据分析沙龙——济南站
所属栏目:[大数据] 日期:2021-03-13 热度:140
报道大数据企业: 大数据产品、大数据方案、 ? 大数据人物 分享大数据干货: 大数据书籍、大数据报告、 大数据视频 本文由永洪BI投稿。欢迎更多优质原创文章投稿给大数据人:289585305@qq.com 前言: 大数据人 作为此次大数据分析沙龙活动协办方,将对此处活[详细]