Git 协作纪要

一、常用开发模式

先看一张图
这里写图片描述

注意:
1、少用pull或不用pull;
2、本地的多个分支,如果不是用命令行的话,对文件修改是对所有分支内容修改。

git clone -> 修改 ->

Read More

Comments

通过欢迎度对网页排名

声明:由于此次第一次使用动态加载的表达式,hexo对LaTex支持可能不太好,因此这里有些公式显示奇奇怪怪,排版比较好一点的参考csdn:博客链接,下次就直接上图片算了。免得这边不兼容。

一、欢迎度历史

1998年 Jon Kleinberg致力于HITS的万维网搜索引擎项目,其中的算法使用了万维网的超链接结构来改进搜索引擎所得的结果。

同时,在离他很近的斯坦福大学里,两名博士生正在从事一项名为PageRank的类似项目,分别是Sergey Brin和Larry Page。

Read More

Comments

网络搜索引擎简介

一、传统信息检索回顾

传统信息检索文档集的搜索有三种基本的计算机辅助技术:布尔模型、向量空间模型和概率模型。这些模型发展与20世纪60年代,直到2000年6月,便存在3500种不同的搜索引擎技术,并且大多数搜索引擎仍然依赖于以上三种基本模型的一种或数种。下图摘自《搜索引擎-原理技术与系统》,显示了搜索的主干流程。
这里写图片描述

Read More

Comments

export CSDN blog to Markdown

#一、综述

最开始的博客用的是oschina, 自我感觉小清新,支持比较多风格的编辑器,容易编辑程度比csdn的要好。后来因为csdn人气的关系,又转到csdn,不过csdn编辑确实比较虐心,再后来就在服务器上搭一个WordPress的博客,不过用起来不是很爽。几个月前支持Markdown编辑,这无疑给用github pages的用户一个福音,因为可以直接上传到自己的github博客上。

Read More

Comments

Album

You just say something I don’t know.

Comments

HPC集群平台搭建概念

  在本文之前,我建议先看完这篇文章:Linux高性能计算集群 – Beowulf集群  

#一、搭建集群中可能会遇到的问题

1.集群设计/布局的一大难点就是网络,各家有各家的策略,一般围绕Beowulf变型。
2.软件的部署缺乏实操调试,也不能断定这样部署是否成功以及是否优越。
3.操作系统的选型以及安装系统、所需软件(包括集群管理工具、驱动软件、能耗监控软件等)的整个流程的手动/自动化部署。

Read More

Comments

HPC性能测试

#一、介绍

  说到高性能计算,一般都是利用搭建集群配合加速卡做并行计算实现。但用相同的硬件实现更快的方法,那就是做测试了。比较有名的就是Linpack测试了,Linpack现在在国际上已经成为最流行的用于测试高性能计算机系统浮点性能的benchmark,在高性能领域,就是利用其中的HPL测试进行测试。下面摘一段百科上的解释:

Read More

Comments

学习感悟

社会篇

走过2014,看得很多是互联网如何在颠覆各个行业。以下说的都是感悟,可能有些无序,多多包含。

无论是做科研也好,投入社会工作也罢,在做以互联网技术为核心的技术学习时,都要有一个目标,做出为社会认可的有价值的“产品”,并间接体现为金钱财富。

Read More

Comments

【machine learning】KNN算法

适逢学习机器学习基础知识,就将书中内容读读记记,本博文代码参考书本Machine Learning in Action(《机器学习实战》)。

一、概述

kNN算法又称为k近邻分类(k-nearest neighbor classification)算法。

kNN算法则是从训练集中找到和新数据最接近的k条记录,然后根据他们的主要分类来决定新数据的类别。该算法涉及3个主要因素:训练集、距离或相似的衡量、k的大小。

Read More

Comments

网络爬虫框架scrapy介绍及应用——抓取新浪新闻的标题内容评论

一、综述

开始这篇博文之前,调研了相关的爬虫方法,简单罗列冰山一角。

综述:

http://www.crifan.com/summary_about_flow_process_of_fetch_webpage_simulate_login_website_and_some_notice/

Read More

Comments