前两天参加公司组织的topcoder编程比赛。其中遇到从字符串中读取整型数字的问题。身边的同事有两个在这里卡了壳。因为时间紧张,我就简单的把自己的实现扔了过去。
/* query format: number1,number2 */
void ReadQuery(std::string& query, int64_t *userid, int16_t * cateid) {
char * endptr = NULL;
*userid = strtoll(query.c_str(), &endptr, 10);
*cateid = (int16_t) atoi(endptr + 1);
}
中间休息去卫生间的路上,想起来如果自己实现这个,有没有可能比使用函数库更快一些呢?自己实现也简单:
void ReadQuery(std::string& query, int64_t *userid, int16_t * cateid) {
int8_t k;
*userid = 0;
*cateid = 0;
const char * p = query.c_str();
while ((k = *p++) != ',') {
*userid = (*userid << 3) + (*userid << 1) + k - '0';
}
while ((k = *p++) != ' ') {
*cateid = (*cateid << 3) + (*cateid << 1) + k - '0';
}
}
还有一种方法,利用sscanf实现:
void ReadQuery(std::string& query, int64_t * userid, int16_t * cateid) {
return sscanf(p, "%lld,%d", a, b);
}
因为是比赛性能嘛,所以把自己能想到的各种奇淫技巧都用上了。事后想想,函数库的实现方式,估计也自己的实现差不多。先不看函数库实现,自己用一些数据测试了一下三者的耗时差异。
300000输入数据,三种方法各跑300遍,得到耗时数据后用Excel画了折线图:
图中去掉了一些规律的高峰值。不明白这些规律的高峰值是什么原因导致的。先记录在此,以后探究。
图中系列1是使用strtoll的实现,系列2是自己逐个字符解析的实现,系列3是利用sscanf的实现。看来strtoll和sscanf的实现性能相近,且比自己的实现要好。后续学习一下库函数是如何实现的。