订阅

算法

基于用户投票的排名算法:Stack Overflow
基于用户投票的排名算法:Stack Overflow
上一篇文章,我介绍了Reddit 的排名算法。 它的特点是,用户可以投赞成票,也可以投反对票。也就是说,除了时间因素以外,只要考虑两个变量就够了。 但是,还有一些特定用途的网站,必须考虑更多的因素。世界排名第一 ...
基于用户投票的排名算法:Reddit
基于用户投票的排名算法:Reddit
在上一篇介绍了Hacker News的排名算法。它的特点是用户只能投赞成票,但是很多网站还允许用户投反对票。就是说,除了好评以外,你还可以给某篇文章差评。 Reddit是美国最大的网上社区,它的每个帖子前面都有向上和向 ...
基于用户投票的排名算法:Delicious和Hacker News
基于用户投票的排名算法:Delicious和Hacker News
互联网的出现,意味着”信息大爆炸”。 用户担心的,不再是信息太少,而是信息太多。如何从大量信息之中,快速有效地找出最重要的内容,成了互联网的一大核心问题。 各种各样的排名算法,是目前过滤信息的主要手段之 ...
数据挖掘十大经典算法
数据挖掘十大经典算法
机器学习中,决策树是一个预测模型;他代表的是对象属性与对象值之间的一种映射关系。树中每个节点表示某个对象,而每个分叉路径则代表的某个可能的属性值,而每个叶结点则对应从根节点到该叶节点所经历的路径所表示 ...
HMM学习最佳范例六:维特比算法
HMM学习最佳范例六:维特比算法
六、维特比算法(Viterbi Algorithm) 寻找最可能的隐藏状态序列(Finding most probable sequence of hidden states)   对于一个特殊的隐马尔科夫模型(HMM)及一个相应的观察序列,我们常常希望能找到生成此序列最 ...
稳定婚姻问题和Gale-Shapley算法
稳定婚姻问题和Gale-Shapley算法
什么是算法?每当有人问作者这样的问题时,他总会引用这个例子:假如你是一个媒人,有若干个单身男子登门求助,还有同样多的单身女子也前来征婚。如果你已经知道这些女孩儿在每个男孩儿心目中的排名,以及男孩儿们在 ...
浅析PageRank算法
浅析PageRank算法
很早就对Google的PageRank算法很感兴趣,但一直没有深究,只有个轮廓性的概念。前几天趁团队outing的机会,在动车上看了一些相关的资料(PS:在动车上看看书真是一种享受),趁热打铁,将所看的东西整理成此文。 本文 ...
霍夫曼编码压缩算法
霍夫曼编码压缩算法
前两天发布那个rsync算法后,想看看数据压缩的算法,知道一个经典的压缩算法Huffman算法。相信大家应该听说过 David Huffman 和他的压缩算法—— Huffman Code,一种通过字符出现频率,Priority Queue,和二叉树来进 ...
用户投票的排名算法介绍(1)
用户投票的排名算法介绍(1)
互联网的出现,意味着"信息大爆炸"。 用户担心的,不再是信息太少,而是信息太多。如何从大量信息之中,快速有效地找出最重要的内容,成了互联网的一大核心问题。 中国统计网 中国统计网 各种各样的排名算法 ...
用户投票的排名算法介绍(2)
用户投票的排名算法介绍(2)
它的特点是用户只能投赞成票,但是很多网站还允许用户投反对票。就是说,除了好评以外,你还可以给某篇文章差评。 Reddit是美国最大的网上社区,它的每个帖子前面都有向上和向下的箭头,分别表示"赞成"和"反 ...
用户投票的排名算法介绍(3)
用户投票的排名算法介绍(3)
Reddit的排名算法。 它的特点是,用户可以投赞成票,也可以投反对票。也就是说,除了时间因素以外,只要考虑两个变量就够了。 但是,还有一些特定用途的网站,必须考虑更多的因素。世界排名第一的程序员问答社区Stac ...
用户投票的排名算法介绍(4)
用户投票的排名算法介绍(4)
你可能会觉得,这是一个全新的课题,伴随着互联网而产生,需要全新的方法来解决。但是,实际上不是。我们可以把"热文排名"想象成一个"自然冷却"的过程: (1)任一时刻,网站中所有的文章,都有一个"当前 ...
主成分分析 PCA算法
主成分分析 PCA算法
对同一个体进行多项观察时,必定涉及多个随机变量X1,X2,…,Xp,它们都是的相关性, 一时难以综合。这时就需要借助主成分分析 (principal component analysis)来概括诸多信息的主要方面。我们希望有一个或几个较好的 ...
Floyd最短路径算法
Floyd最短路径算法
在图论中经常会遇到这样的问题,在一个有向图里,求出任意两个节点之间的最短距离。当节点之间的权值是正值的时候,我们可以采用Dijkstra算法,用贪心策略加于解决。但当节点之间的权值有负数的时候,Dijkstra就行不 ...
MapReduce工作原理图文详解
MapReduce工作原理图文详解
将运行作业所需要的资源文件复制到HDFS上,包括MapReduce程序打包的JAR文件、配置文件和客户端计算所得的输入划分信息。这些文件都存放在JobTracker专门为该作业创建的文件夹中。文件夹名为该作业的Job ID。

热门频道

  • 大数据
  • 商业智能
  • 量化投资
  • 科学探索
  • 创业

即将开课

社区热帖

     

    GMT+8, 2020-7-9 11:58 , Processed in 0.139312 second(s), 16 queries .