这套软件开发目的: 从始发站 到 目的地 能够自己的程序来给出一些参考线路 数据库设计: A. 车次信息 车次 经过的站点 //起点 终点 B. 数据库导入导出 去重 SQL delete from BusInfo where DataId not in ( select DataId from BusInfo as a where DataId = ( select top 1 DataId from BusInfo where BusId =a.BusId ) ) 泛型的用法; 1.派生类
前言
关于group by 与distinct 性能对比:网上结论如下,不走索引少量数据distinct性能更好,大数据量group by 性能好,走索引group by性能好。走索引时分组种类少distinct快。关于网上的结论做一次验证。
准备阶段屏蔽查询缓存
查看MySQL中是否设置了查询缓存。为了不影响测试结果,需要关闭查询缓存。
show variables like '%query_cache%';
查看是否开启查询缓存决定于query_cache_type和query_cach
总括
pandas的索引函数主要有三种:
loc 标签索引,行和列的名称
iloc 整型索引(绝对位置索引),绝对意义上的几行几列,起始索引为0
ix 是 iloc 和 loc的合体
at是loc的快捷方式
iat是iloc的快捷方式
建立测试数据集:
import pandas as pd
df = pd.DataFrame({'a': [1, 2, 3], 'b': ['a', 'b', 'c'],'c': [A,B,C]})
print(df)
a b c
0 1 a A
1 2 b