Git简介

Git

Git简介

首先:我为什么要写这篇文章呢?因为今天我写conditional random field的代码的时候,把其中一个函数直接覆盖掉了,然后想改回来,没办法,保存过了,修改不回来了。其实,Git我使用过,只不过很少使用,一是因为我总觉得git命令太难记得了,因为一段时间按不用就会忘记。所以,我今天写下这篇使用指南,防止我以后记不住,看看自己的博客就行了。
Git,世界上最先进的、流行的分布式版本控制系统。

NumPy

numpy中的一些方法汇总

numpy.asarray

numpy.asarray(a, dtype=None, order=None)将输入转换成一个数组

  • 参数:
    • a:类似于数组的输入数据,list,tuple…
    • dtype:数据类型,可选参数,默认情况下,数据类型继承于输入数据  
    • order:{‘C’,’F’},可选参数,确定使用以行为主(C)或者以列为主(F)的内存表示方式,默认以行为主
  • 输出:ndarray

Markdown初会

简介

Markdown是一种轻量级标记语言,能将文本转换成XHTML(或者HTML)文档,它的目标是实现易读易写,成为一种适用于网络的书写语言。
用途:Github的Readme.md

Python多线程

Python多线程

线程or进程

多线程和多进程最大的不同在于,多进程中,同一个变量,各自有一份拷贝存在于每个进程中,互不影响,而多线程中,所有变量都由所有线程共享,所以,任何一个变量都可以被任何一个线程修改,因此,线程之间共享数据最大的危险在于多个线程同时改一个变量,把内容给改乱了。

neural-network-tag-all-data

概述

因为要使用所有的数据进行神经网络词性标注工作,正好也是新的一年的开始,以前的东西难免有一点遗忘,所以我现在就乘这个机会重新开始工作,做好数据的记录,方便以后查找。

语料库的处理

Corpus.conll转换成word2vec所需要的格式文件

我们将train.conll加在大数据量的conll数据后面,形成我们所需要的语料库Corpus.conll,使用process-corpus.py进行处理,生成word2vec所需要的文件Corpus.txt。
process-corpus.py处理结果

tips

简要

本篇博客主要记录一些比较杂的小知识,主要解决在工作中遇到的一些问题(要学会使用Google,Google大法好)

shell

shell中常用的命令总结

tee

tee:在将终端上的信息重定向到文件中的同时能在终端上看到输出信息
例子:

1
ls | tee ls.txt

Python刷新显示

Python刷新显示的示例代码

1
2
3
4
5
6
7
8
9
#!/usr/bin/python
import sys
from time import sleep
for i in range(0, 5):
print "\rhello kiro ", i,
sys.stdout.flush()
sleep(1)
<% if (theme.google_analytics){ %> <% } %>