Python基础语法
python
python的基本数据类型
python一切皆为对象。
常见的基本数据类型
int
boolean
string
list---列表
tuple---元组
dict---字典
不可变类型:int,string,tuple
可变类型:list,dict
python默认的文件编码都是ASCII编码。
Python的字符串输出,用占位符:
print "my name is %s, Tome is %s ", % ("Tony","my good friend")
print my name is Tony , Tom is my good friend
上面是字符串的占位符,还有就是数字的占位符%d,用法同理。
join方法
>>> a = 'a'
>>> b = 'b'
>>> c = 'c'
>>> ','.join([a,b,c])
>>> 输出:a,b,c
>>>a = 'pyer'
>>>b = 'apple'
>>>c = 'my name is %s, i love %s ' % (a,b) //这种就是字典的形式
>>>d = 'my name is {0},i love {1}'.format(a,b) //format的形式
# 还有一种format的表达形式
>>> d = 'hello ,{who}, you are {gendar}'.format(who = 'kitty', gendar = 'femal')
# 还有一种字典的形式
>>> e = 'this is %(who)s , you are %(gendar)s' % {'who':'kitty','gendar':'female')
python的一对双引号和一对单引号和三个双引号的区别。
一对双引号和一对单引号在表达上没有本质区别,都是可以表示字符串,但是如果要出现多行表示的情况,这里用三个双引号比较方便。比如:
print """
我是第一行,
我是第二行,
。。。
"""
列表的几个特点
有序的集合
通过偏移来索引,从而读取数据
支持嵌套
可变的类型
内置list方法:返回一个列表。参数是可迭代对象。里面输出的容还是保持了可迭代对象 的元素和顺序。如果参数为空,则返回一个空的列表。
元组
有序的集合
通过偏移来取数据
属于不可变的对象,不能在原地修改内容,没有排序,修改等操作。
集合是没有顺序的概念。所以不能用切片和索引的方式进行操作。
创建集合。set():可变的; frozenset():不可变的;
添加操作。add()和update()方法不同,但都是添加;
删除 remove
成员关系:in, not in
交集,并集,差集 &,|,-
set去重,set集合中的元素不重复
字典:内部没有排序,通过键来读取内容,可嵌套,方便我们组织多种数据结构,并且可以原地修改里面的内容。属于可变类型。
组成字典的键必须是不可变的数据类型,比如,数字,字符串,元组等,列表等可变对象不能作为键。
创建字典哟两种方式,第一种{},里面直接写键,值;第二种通过dict()方法。比如:
Info = {'name':'laowang','age':18}
Info = dict(name = 'laowang',age = 18)
字典有很多方法。比如:
Info.pop('name')//返回该键对应的值
del Info['name']//删除这个元素
Info.get('name')//获取字典集合中某个键对应的值
Info.keys()
Info.values()
Info.has_key()//判断是否有某个键
Info.items()//生成一个字典的容器
定义函数
def是关键字,括号冒号永不忘,无缩进无真相;没有returned的函数,不是大丈夫--不是真函数;不写doc的函数,就像没有性别的人类。
** 和 *,猩猩是字典,星是元组。
爬虫:一段自动抓取互联网信息的程序。
爬虫调度端、URL管理器、网页下载器、网页解析器(从网页中提取出有价值的数据[beatifulsoup4])