《Python自然语言处理》学习笔记索引
关于Python自然语言处理
关于该书的简介:
《Python自然语言处理》提供了非常易学的自然语言处理入门介绍,该领域涵盖从文本和电子邮件预测过滤,到自动总结和翻译等多种语言处理技术。在《Python自然语言处理(影印版)》 中,你将学会编写P
http://www.cyqdata.cn/cnblogs/article-detail-52799
python获取当前系统的桌面的路径的三种方法
原先以为获取这个应该不难,翻遍了手册呀文档呀,以为会像os.getcwd()一样简单。
结果百度呀谷歌呀,用中文搜英文搜,当然有搜到一个英文的不明白也不太喜欢,我放在第三个。
先讲我自己研究出来的两种方法。我是这样想的,桌面不是可以移到D盘之类吗?
然后我就搜索怎么修改桌面的保存位置,然后找到是在注册表里修改,
然后我
http://www.cyqdata.cn/cnblogs/article-detail-52330
Python 对象的实例化过程
我们知道,Python 的构造函数有两个,一个是我们最常用的 __init__ ,另一个是很少用到的 __new__。而从它们的函数定义 def __new__(cls, [...]) 和 def __init__(self, [...]) 可以知道,__init__ 被调用时实例已经被创建(就是 self 参数所引用
http://www.cyqdata.cn/cnblogs/article-detail-52254
[Dev Tools]使用Python解压,对比文件
Table of Contents 1 What is the problem? 2 Solution 1 What is the problem? 做为程序员,在日常的coding中
http://www.cyqdata.cn/cnblogs/article-detail-42384
Python和Node.js支持尾递归吗?
什么是尾递归?简单来说就是最后返回的只是一个函数的调用,而不用保存多余的局部变量。看一个简单的计算阶乘的例子(Lua代码):
function fact(n) return n==0 and 1 or n * fact(n-1)end
改成尾递归的方式就是:
function tail_fact(n,
http://www.cyqdata.cn/cnblogs/article-detail-42305
我也要学python-内置数据结构(一)
学完了C后,现在学python感觉好有效率的啊!PYTHON语言本身就内置了好多非常常用的数据结构,开发效率太高了,我在学python的时候一直在想,这个方法用C如何实现啊,然后自己再用C去实现,这样学感觉特有趣,也特有效率。都快忍不住要去悄悄PYTHON的源码啦!
关于python的学习笔记我是这样安排的:
内置数据结构(一 二) 模块与函数 字符串与正则表达式
http://www.cyqdata.cn/cnblogs/article-detail-41954
Python中的列表解析和生成表达式
优雅、清晰和务实都是python的核心价值观,如果想通过操作和处理一个序列(或其他的可迭代对象)来创建一个新的列表时可以使用列表解析(
List comprehensions)和生成表达式,通过这两个操作,我们可以看到这三个观点是如何在python中和谐统一起来的。
列表解析
在需要改变列表而不是需要新建某列表时,可以使用列表解析。列表解析表达式为:
[expr for it
http://www.cyqdata.cn/cnblogs/article-detail-40279
用 Python 编写干净、可测试、高质量的代码
简介
编写软件是人所承担的最复杂的任务之一。AWK 编程语言和 "K and R C" 的作者之一 Brian Kernigan 在 Software Tools 一书中总结了软件开发的真实性质,他说,“控制复杂性是软件开发的根本。” 真实软件开发的残酷现实是,软件常常具有有意或无意造成的复杂性,而且开发人员常常漠视可维护性、可测试性和质量。这种不幸局面的最终结果是软件
http://www.cyqdata.cn/cnblogs/article-detail-39791
布同:如何循序渐进学习Python语言
大家都知道Python语言是一种新兴的编程语言。1989年,Python就由Guido van Rossum发明。Python一直发展态势很好。
原因有几点:1、跨平台性好。Linux、Windows、MacOS、塞班……。2、快速易学。
http://www.cyqdata.cn/cnblogs/article-detail-39669
为什么说Ruby比Python容易阅读
这是一篇充满偏见的语言战争文章,是一场无意义的锤子和锤子的比拼。语言的复杂性可以通过选择语言回避,而问题本身的复杂性是选择哪个语言都无法回避的。
不屑语言战争的人可以轻松无视此文。
1、字符串格式化
Python
"%s=%s" % (k, v)
在阅读 Python 字符串格式化的时候,视线先看到字符串的 %s 字样,但是不知道这指的是什么,然后看后面的变量 k,再接着看第二
http://www.cyqdata.cn/cnblogs/article-detail-38840
python threading获取线程函数返回值
最近需要用python写一个环境搭建工具,多线程并行对环境各个部分执行一些操作,并最终知道这些并行执行的操作是否都执行成功了,也就是判断这些操作函数的返回值是否为0。但是threading并没有显式的提供获取各个线程函数返回值的方法,只好自己动手,下面就介绍一下自己的实现方式。
一开始考虑到执行的操作可能有很多,而且后续会不断补充,因此先写了一个通用的多线程执行类,封装线程操作的基本方法,如下:
http://www.cyqdata.cn/cnblogs/article-detail-38384
IronPython <零点一> IronPython与C#交互<简单小例>
目标: 在WinForm程序中,让IronPython 与C#进行交互。 说明: 本例中在WinForm中嵌入了Ipy脚本,在WinForm执行与输出Ipy脚本运行结果,在WinForm运行时修改窗体属性与控件属性 测试环境: Window:VS2010+IronPython 2.7 参考: Iron
http://www.cyqdata.cn/cnblogs/article-detail-37958
IronPython <零> 前言
作者语: 我是一名.net开发人员,热爱C#.net,在专注第一语言的同时拓展第二主语言。同样出于热爱,选择了Python,而又不想纯粹的去学习Py,从而学习起来“杂交品种”。就杂交伦而言是有其一定的优势的。 IronPython 简 介 IronPython 是一种在 .NET 及 Mono上的 P
http://www.cyqdata.cn/cnblogs/article-detail-37731
python基础教程-第2章节 分支,循环,还有条件
一:回顾与思考
唉!刚才看了个恐怖片,暂时睡不着,现在继续学习会了!
上一章节,我学习了两种数据类型,1种是数字,1种是字符串。数字可以做数学运算,字符串呢可以处理文本信息。其中数字又分为,整数,浮点数。字符串当然就是字符串了。整数,浮点数就是描述数字的数据类型。然后呢,要做一些有意义的事情的话,就需要把这些组合起来进行一些处理了(就是表达式了)。还要注意,python解释器在做解释之前做
http://www.cyqdata.cn/cnblogs/article-detail-37666
开源Python数据挖掘平台-PyMining第2版发布
项目首页: http://code.google.com/p/python-data-mining-platform/ (可能需翻墙) 目前已经在该googlecode中加入了Tutorial等内容,可以在wiki中查看 项目介绍(复制自项目首页的说明): 这是一个能够根据源数据(比如说用csv格式表示的矩阵,或者中文文档)使用多种多样的算法去得到结果的一个平台。 算法能够通过xm
http://www.cyqdata.cn/cnblogs/article-detail-37409
python中的生成器(generator)
生成器是python中一个非常酷的特性,python
2.2中引入后在2.3变成了标准的一部分。它能够让你在许多情况下以一种优雅而又更低内存消耗的方式简化控制流(simplify
control flow)。
生成器是可以当做iterator使用的特殊函数,它功能的实现依赖于关键字yield,下面是它如何运作一个简单的演示:
>>> def spam(): yield
http://www.cyqdata.cn/cnblogs/article-detail-35266
测量Python代码运行的时间
Python 社区有句俗语: “python自己带着电池” ,别自己写计时框架。 Python 2.3 具备一个叫做 timeit 的完美计时工具可以测量python代码的运行时间。
timeit 模块
timeit 模块定义了接受两个参数的 Timer 类。两个参数都是字符串。
http://www.cyqdata.cn/cnblogs/article-detail-35137
布同:Python函数帮助查询工具
Python的自带文档功能很不错,给与我耳目一新的感觉。如果在CMD中进行“行式编程”编程的话,可以随时随地的查询函数的功能,非常方便。比如在学习list、tuple、dict、str、os、sys等模组的时候,利用Python的自带文档可以很快速的全面的学到那些处理的函数。所以这个自带文档功能能够给出学者带来很大的方便之处,进行简短的开发是再好不过的。
但是,当你离开
http://www.cyqdata.cn/cnblogs/article-detail-32402
蛙蛙推荐:利用IronPython做更灵活的网页爬虫
由于各种原因,我们经常需要去别的网站采集一些信息,.net下所有相关的技术都已经非常成熟,用Webrequest抓取页面,既支持自定义Reference头,又支持cookie,解析页面一般都是用正则,而且对方网站结构一变,还得重新改代码,重新编译,发布。
如果有了IronPython,可以把抓取和分析的逻辑做成Python脚本,如果对方页面结构变了,只需修改脚本就行了,不需重新编译软件,这样可
http://www.cyqdata.cn/cnblogs/article-detail-25414
python验证码识别——前处理
目前不少系统的验证码做得越来越复杂,人眼都难以识别,尤其是QQ之类的验证码,想要识别,太难了。
现在有这样一个验证码:
一般的验证码识别,都是先进行前处理,然后分割,在进行识别。这个验证码没有其他噪音,但存在一条横穿的曲线干扰,并且验证码中字体是粘连在一起的。
如果不将干扰曲线去除,那么整个识别将会受到一定的影响,为此,先要去掉这条曲线,首先通过的办法是将先获取曲线的头位置(x,y),这一部分很
http://www.cyqdata.cn/cnblogs/article-detail-21030