zoukankan html css js c++ java

Python数据结构

1. list
2. tuple
3. set
4. dict
- 4.1. 多种方式构造字典对象
- 4.2. 字典排序
5. Queue
6. array
7. enum
8. collections

1. list

homepage

菜鸟教程

append()
extend()
index(item) -> int 获取某元素在列表中的index
pop(n_index)
clear()
remove(item)
reverse()
sort()
copy()
insert(i, x)

>>> list=['a','b','c']
>>> list.append(['d', 'e'])
['a', 'b', 'c',  ['d', 'e'] ]

>>> list.extend(['d','e','f'])
>>> list
['a', 'b', 'c', 'd', 'e', 'f']

2. tuple

3. set

官网

add()  # 常见结构仅set有add()方法
update()  # set.update(set2), 添加新的元素或集合到当前集合中
copy()
discard()
remove(item)
pop()  # 随机删除
clear()

difference()  # set1-set2
difference_update()  # 将差集更新至set1，而不是返回新集合

intersection()  # set1 & set2
intersection_update()
isdisjoint()  # 判断没有交集，返回True,否则,返回False

union()  # 注意没有union_update()

symmetric_difference()  # 差集
symmetric_difference_update()

issuperset()  # 父集
issubset()  # 子集

4. dict

homepage

d[key] = value
key not in d
del d[key]

get(key[, default])
items()  # return: dict_items([(key,value), (key2, value2)...])
keys()   # return: dict_keys([1,2,3])
values() # return: dict_values([value1, value2 ...])
pop(key[, default])  # 注意，不同于list的序数删除，也不同于set的随机删除
popitem()  # 随机删除某一项，用于逐一删除每个item
update([other])  # dict.update(dict2), 把字典dict2的键/值对更新到dict里

循环遍历

for key in self.dict_:
for key in self.dict_.keys():
for key, value in self.dict_.items():

4.1. 多种方式构造字典对象

可以通过成对的list/tuple来构造字典：

items=[('name','earth'),('port','80')]
dict2=dict(items)  # {'name': 'earth', 'port': '80'}

通过zip构造字典：

dict(zip(('a','b','c','d','e'),(1,2,3,4,5)))

from-keys构造字典：

{}.fromkeys(('x','y'),-1)  # {'x': -1, 'y': -1}
{}.fromkeys(('x','y'))  # {'x':None, 'y':None}

组合字典：

dictMerged2 = dict(dict1, **dict2)

等同于：

dictMerged=dict1.copy()
dictMerged.update(dict2)

以下字典组合方式可能失败，原因在于此方式要求keyword必须为str：

合并两个字典：

支持非str类型的主键：

即便主键重复也没关系：

4.2. 字典排序

def func_dict_sort(dict_, sort_type):
    """ return a list of sorted """
    if sort_type == "ascii":
        """
        list_keys = list(dict_.keys())
        list_keys.sort()
        return [(key, dict_[key]) for key in list_keys]
        """
        return [(key, dict_[key]) for key in sorted(dict_.keys())]

    elif sort_type == "value":
        """
        set_tuple = dict_.items()
        list_items_charge = [(tuple_[1], tuple_[0]) for tuple_ in set_tuple]
        list_items_charge.sort()
        print(list_items_charge)
        return [(key[1], key[0]) for key in list_items_charge]
        """
        list_items_charge = [(tuple_[1], tuple_[0]) for tuple_ in dict_.items()]
        return [(key[1], key[0]) for key in sorted(list_items_charge)]

用lambda表达式来排序，更灵活：

sorted(d.items(), lambda x, y: cmp(x[1], y[1]))
# 或反序
sorted(d.items(), lambda x, y: cmp(x[1], y[1]), reverse=True)

一种最为简练的方式：

# 按照key进行排序
print sorted(dict1.items(), key=lambda d: d[0])
# 按照value进行排序
print sorted(dict1.items(), key=lambda d: d[1])

5. Queue

5.1. queue.Queue

队列分类：

Queue() # 先进先出
LifoQueue() # 后进先出
PriorityQueue() # 优先级队列
deque() # 双向队列

方法列表：

q.put(): 用以插入数据到队列中

put方法还有两个可选参数：blocked和timeout。如果blocked为True（默认值），并且timeout为正值，该方法会阻塞timeout指定的时间，直到该队列有剩余的空间。如果超时，会抛出Queue.Full异常。如果blocked为False，但该Queue已满，会立即抛出Queue.Full异常。
q.get(): 可以从队列读取并且删除一个元素

get方法有两个可选参数：blocked和timeout。如果blocked为True（默认值），并且timeout为正值，那么在等待时间内没有取到任何元素，会抛出Queue.Empty异常。如果blocked为False，有两种情况存在，如果Queue有一个值可用，则立即返回该值，否则，如果队列为空，则立即抛出Queue.Empty异常.
q.get_nowait(): 同q.get(False)
q.put_nowait(): 同q.put(False)
q.empty(): 调用此方法时q为空则返回True

该结果不可靠，比如在返回True的过程中，如果队列中又加入了项目。
q.full(): 调用此方法时q已满则返回True

该结果不可靠，比如在返回True的过程中，如果队列中的项目被取走。
q.qsize(): 返回队列中目前项目的正确数量

结果也不可靠，理由同q.empty()和q.full()一样

5.2. multiprocessing.Queue

5.3. JoinableQueue

JoinableQueue与Queue一样也是multiprocessing模块中的一个类，也可以用于创建进程队列。

JoinableQueue创建可连接的共享进程队列，队列允许队列的消费者通知生产者，队列数据已被成功处理完成。通知过程是使用共享的信号和条件变量来实现的。

JoinableQueue除了与Queue相同的方法之外，还具有2个特有的方法：

q.task_done()

消费者使用此方法发出信号，表示q.get()返回的项目已经被处理完成。如果调用此方法的次数大于从队列中删除的项目数量，将引发ValueError异常。
q.join()

生产者使用此方法进行阻塞，直到队列中所有项目均被处理。阻塞将持续到为队列中的每个项目均调用q.task_done()方法为止。

from multiprocessing import Process,JoinableQueue
import time,random

def consumer(q):
    while True:
        time.sleep(random.randint(1,5))
        res=q.get()
        print('消费者拿到了 %s' %res)
        q.task_done()

def producer(seq,q):
    for item in seq:
        time.sleep(random.randrange(1,2))
        q.put(item)
        print('生产者做好了 %s' %item)
    q.join()  # 阻塞，直到队列为空（完全消费）

if __name__ == '__main__':
    q=JoinableQueue()
    seq=('包子%s' %i for i in range(10))
    p=Process(target=consumer,args=(q,))
    p.daemon=True #设置为守护进程，在主线程停止时p也停止，但是不用担心，producer内调用q.join保证了consumer已经处理完队列中的所有元素
    p.start()

    producer(seq, q)
    print('主进程结束')

6. array

homepage

更类似C语言的数组，要求每个元素的类型一致。

array.itemsize
array.typecode

array.array(typecode[, initializer])
array.frombytes(s)
array.fromlist(list)
array.fromstring()
array.fromunicode(s)

array.tobytes()
array.tolist()
array.tostring()
array.tounicode()

array.count(x)
array.append(x)
array.extend(iterable)
array.pop([i])
array.remove(x)

7. enum

homepage

from enum import Enum
>>> class Color(Enum):
...     RED = 1
...     GREEN = 2
...     BLUE = 3
>>> print(Color.RED)  # or Color['RED']

>>> from enum import Enum
>>> Month = Enum('Month',('Jan','Feb','Mar','Apr','May','Jun','Jul','Aug','Sep','Oct','Nov','Dec'))
>>> for name,member in Month.__members__.items():
        print(name,'=>',member,',',member.value)

('Jan', '=>', <Month.Jan: 1>, ',', 1)
('Feb', '=>', <Month.Feb: 2>, ',', 2)
...

8. collections

8.1. collections.namedtuple

homepage

当你使用 python 创建一个常规 tuple 时，其元素都是通用的，而且没有被命名。这使得你必须记住每个 tuple 元素的精确索引。 namedtuple 就可以解决这个问题。

Point = namedtuple('My_Point', ['x', 'y'])
>>> p = Point(11, y=22)     # p = My_Point(x=11, y=22)
>>> p[0] + p[1]             # indexable like the plain tuple (11, 22)
33
>>> p.x + p.y               # fields also accessible by name
33

因此，namedtuple 让 tuple 的使用更简单、更可读且更有组织性。

8.2. collections.deque

homepage

clear()
copy()
count(x)

append(x)
appendleft(x)
extend(iterable)
extendleft(iterable)
insert(i, x)
index(x[, start[, stop]])

pop()
popleft()
remove(value)
reverse()

8.3. collections.Counter

homepage

Counter本质上是dict的子类，接收一个类似list的迭代器，然后返回一个Counter-Dict。

>>> from collections import Counter
>>> c = Counter()
>>> for ch in 'programming':
...     c[ch] = c[ch] + 1
...
>>> c
Counter({'g': 2, 'm': 2, 'r': 2, 'a': 1, 'i': 1, 'o': 1, 'n': 1, 'p': 1})

elements()

获取elements就是将其中的key值乘以出现次数全部打印出来，当然需要通过list或者其他方式将其所有元素全部展示出来（负数不会被打印）。
```
>>> list(c.elements())
["cat", "cat", "cat", "dog", "dog"]
```
most_common([n])

频率最高的前n个字符，输出为 [(key,value), (k2,v2), ...]
subtract([iterable_or_mapping])
```
c.subtract(d)
```
dict-like
- c.values()
- sum(c.values())
- c.keys()
- c.clear()
- list(c)
- set(c)
- dict(c)
- c.items()

可以将负数和0的值对应的key项去掉（或 c += Counter() ）

>>> c = Counter(a=2, b=-4)
>>> +c
Counter({'a': 2})
>>> -c
Counter({'b': 4})

8.4. collections.defaultdict

defaultdict的作用是在于，当字典里的key不存在但被查找时，返回的不是keyError而是一个默认值。默认值由构造函数定义，例如int则默认值为0，list默认值为[]。

from collections import defaultdict

dict_int = defaultdict(int)
dict_int[2] = 'two'
dict_str = defaultdict(str)
dict_set = defaultdict(set)
dict_list = defaultdict(list)

print(dict_int[1])  # 0
print(dict_int[2])  # "two"
print(dict_int)     # defaultdict(<class 'int'>, {2: 'two', 1: 0})
print(dict_str[1])  # ""

print(dict_set[1])  # set()
print(dict_list[1]) # []
print(dict_list)    # defaultdict(<class 'list'>, {1: []})

from collections import defaultdict
test_0 = defaultdict(int, {
        0: 13,
        1: 14,
        2: 15,
    })

test_1 = defaultdict(int, {
        1: 23,
        2: 24,
        4: 77,
    })

output = test_0.copy()
for key, value in test_1.items():
    output[key] += value
print(output)

8.5. collections.OrderedDict

homepage

OrderedDict([('apple', 4), ('banana', 3), ('orange', 2), ('pear', 1)])
OrderedDict(sorted(dict_test.items(), key=lambda t: t[0]))

keys()
values()
items()

两个OrderedDict对象，如果其顺序不同那么Python也会把他们当做是两个不同的对象。

from collections import OrderedDict

d = OrderedDict()
d['foo'] = 1
d['bar'] = 2
d['spam'] = 3
d['grok'] = 4

# OrderedDict的使用与dict相同，这也是设计的初衷
for key in d.keys():
# for key in d:  # 同上
    print(key)

for value in d.values():
    print(value)

for key, value in d.items():
    print(key, value)

顺序字典的内存消耗大约为dict的两倍（且查询效率并不高），所以需要权衡使用。

查看全文

相关阅读:
高性能Javascript DOM编程学习笔记
 高性能Javascrip 改变作用域链
 高性能Javascript 加载和执行读书笔记
 javascript 在function 里return 重写function 而得到更多的作用域闭包
 HTML、css和javascript开发Android程序第五章节客户端存储学习笔记
 高性能Javascript HTML集合访问的学习笔记
 高性能Javascript 数据访问读书笔记
 博客
 高性能Javascript 缓存对象成员
 高性能Javascript 克隆节点学习笔记

原文地址：https://www.cnblogs.com/brt2/p/12966880.html