getline函数是一个比较常见的函数。根据它的名字我们就可以知道这个函数是来完成读入一行数据的。现在对getline函数进行一个总结。
在标准C语言中,getline函数是不存在的。
下面是一个简单的实现方式:
下面是一个简单的测试程序:
但是这个实现是有问题的,就是遇到空行的时候也会停止的。
为了解决这个问题,我们需要重新考虑while循环的判断条件。
在上面的实现中,我们是遇到EOF和换行'\n'的时候都停止 ,然后通过判断所读到的字符串的长度是否大于0来判断是否结束。
为了能读入空行,我们需要判断一下是否读入的是结尾EOF,如果不是就继续读取就可以了。
还有一点,EOF是什么?
EOF是C语言中为了区分有效数据和输入结束符的。
C语言采用的解决办法是:在没有输入时getchar函数将返回一个特殊值,这个特殊值与任何实际字符都不同。这个值成为EOF(end of file ,文件结束)。我们在声明变量c 的时候,必须让它大到足以存放getchar函数返回的任何值。之所以不把c声明成char类型,是因为它必须足够大,除了能存储任何可能的字符外还要能存储文件结束符EOF。
EOF的输入由系统锁定。windows下是ctrl+z,linux/unix下是ctrl+d。
下面是给出的修改后的getline函数
如果是文件结尾(c==EOF&&i==0)的话,我们就返回-1,通过判断返回值是否为-1来决定是否继续入输入:
这样话就可以正确读入所有的输入了。
在gcc编译器中,对标准库进行了扩展,加入了一个getline函数。该函数的定义如下:
其中*lineptr指向一个动态分配的内存区域。*n是所分配内存的长度。如果*lineptr是NULL的话,getline函数会自动进行动态内存的分配(忽略*n的大小),所以使用这个函数非常注意的就使用要注意自己进行内存的释放。
如果*lineptr分配了内存,但在使用过程中发现所分配的内存不足的话,getline函数会调用realloc函数来重新进行内存的分配,同时更新*lineptr和*n。
注意*lineptr指向的是一个动态分配的内存,由malloc,calloc或realloc分配的,不能是静态分配的数组。
下面是使用这个函数情况,事先分配了动态内存。
下面是一个没有提前进行内存分配的情况:
同样最后要进行内存的释放。
这儿还要注意一个问题就是,getline函数读入的一行是包括最后的换行符的。之前我们写的函数是不包括这个的。下面我们进行修改一下,也读入换行符。
这样也读入了换行符。这样的话,这个getline函数就不错了。
在C++中为了使用的方便,C++在标准库中添加了getline函数。
其实在C++中对不同的输入流对象都定义了一个getline函数,即:
在头文件<iostream>中声明了getline函数:
下面是一个例子:
注意这儿的getline是要读入空白符。但是不包括最后的换行符。
C++中还定义了一个在std名字空间的全局函数,因为这个getline函数的参数使用了string字符串,所以声明在了<string>头文件中了。
声明如下:
注意此处也是不读入换行符的。
所以在C++中读取一行的函数是不读入换行符的,而GCC中getline函数是读入换行符的。可以理解为,一般情况下不读入,特别的是GCC的读入。
下面是一个简单的实现方式:
int getline_(char s[],int lim){
int c,i;
i=0;
while((c=getchar())!=EOF&&c!='\n'&&i<lim-1)
s[i++]=c;
s[i]='\0';
return i;
}
int c,i;
i=0;
while((c=getchar())!=EOF&&c!='\n'&&i<lim-1)
s[i++]=c;
s[i]='\0';
return i;
}
下面是一个简单的测试程序:
int test1(){
char s[100];
int len;
while((len=getline_(s,100))>0)
printf("%s\n",s);
return 0;
}
char s[100];
int len;
while((len=getline_(s,100))>0)
printf("%s\n",s);
return 0;
}
但是这个实现是有问题的,就是遇到空行的时候也会停止的。
为了解决这个问题,我们需要重新考虑while循环的判断条件。
在上面的实现中,我们是遇到EOF和换行'\n'的时候都停止 ,然后通过判断所读到的字符串的长度是否大于0来判断是否结束。
为了能读入空行,我们需要判断一下是否读入的是结尾EOF,如果不是就继续读取就可以了。
还有一点,EOF是什么?
EOF是C语言中为了区分有效数据和输入结束符的。
C语言采用的解决办法是:在没有输入时getchar函数将返回一个特殊值,这个特殊值与任何实际字符都不同。这个值成为EOF(end of file ,文件结束)。我们在声明变量c 的时候,必须让它大到足以存放getchar函数返回的任何值。之所以不把c声明成char类型,是因为它必须足够大,除了能存储任何可能的字符外还要能存储文件结束符EOF。
EOF的输入由系统锁定。windows下是ctrl+z,linux/unix下是ctrl+d。
下面是给出的修改后的getline函数
int getline2_(char s[],int lim){
int c,i;
i=0;
while((c=getchar())!=EOF&&c!='\n'&&i<lim-1)
s[i++]=c;
if(c==EOF&&i==0)
return -1;
s[i]='\0';
return i;
}
int c,i;
i=0;
while((c=getchar())!=EOF&&c!='\n'&&i<lim-1)
s[i++]=c;
if(c==EOF&&i==0)
return -1;
s[i]='\0';
return i;
}
如果是文件结尾(c==EOF&&i==0)的话,我们就返回-1,通过判断返回值是否为-1来决定是否继续入输入:
int test1(){
char s[100];
int len;
while((len=getline2_(s,100))!=-1)
printf("%s\n",s);
return 0;
}
char s[100];
int len;
while((len=getline2_(s,100))!=-1)
printf("%s\n",s);
return 0;
}
这样话就可以正确读入所有的输入了。
在gcc编译器中,对标准库进行了扩展,加入了一个getline函数。该函数的定义如下:
#include <stdio.h>
ssize_t getline(char **lineptr, size_t *n, FILE *stream);
ssize_t getline(char **lineptr, size_t *n, FILE *stream);
其中*lineptr指向一个动态分配的内存区域。*n是所分配内存的长度。如果*lineptr是NULL的话,getline函数会自动进行动态内存的分配(忽略*n的大小),所以使用这个函数非常注意的就使用要注意自己进行内存的释放。
如果*lineptr分配了内存,但在使用过程中发现所分配的内存不足的话,getline函数会调用realloc函数来重新进行内存的分配,同时更新*lineptr和*n。
注意*lineptr指向的是一个动态分配的内存,由malloc,calloc或realloc分配的,不能是静态分配的数组。
下面是使用这个函数情况,事先分配了动态内存。
void test2(){
int read;
int len=100;
char *line=NULL;
if((line=malloc((len+1)))==NULL){
printf("Can't get memory\n");
exit(-1);
}
while((read=getline(&line,&len,stdin))!=-1)
printf("%s\n",line);
free(line);
}
int read;
int len=100;
char *line=NULL;
if((line=malloc((len+1)))==NULL){
printf("Can't get memory\n");
exit(-1);
}
while((read=getline(&line,&len,stdin))!=-1)
printf("%s\n",line);
free(line);
}
下面是一个没有提前进行内存分配的情况:
void test3(){
int read;
int len=0;
char *line=NULL;
while((read=getline(&line,&len,stdin))!=-1)
printf("%s\n",line);
free(line);
}
int read;
int len=0;
char *line=NULL;
while((read=getline(&line,&len,stdin))!=-1)
printf("%s\n",line);
free(line);
}
同样最后要进行内存的释放。
这儿还要注意一个问题就是,getline函数读入的一行是包括最后的换行符的。之前我们写的函数是不包括这个的。下面我们进行修改一下,也读入换行符。
int getline3_(char s[],int lim){
int c,i;
i=0;
while((c=getchar())!=EOF&&c!='\n'&&i<lim-1)
s[i++]=c;
if(c==EOF&&i==0)
return -1;
if(c=='\n')
s[i++]=c;
s[i]='\0';
return i;
}
int c,i;
i=0;
while((c=getchar())!=EOF&&c!='\n'&&i<lim-1)
s[i++]=c;
if(c==EOF&&i==0)
return -1;
if(c=='\n')
s[i++]=c;
s[i]='\0';
return i;
}
这样也读入了换行符。这样的话,这个getline函数就不错了。
在C++中为了使用的方便,C++在标准库中添加了getline函数。
其实在C++中对不同的输入流对象都定义了一个getline函数,即:
std::fstream::getline这儿我们讨论标准输入对象的getline函数,其他的对象的情都是类似的。
std::istream::getline
std::ifstream::getline
std::iostream::getline
std::wfstream::getline
std::wistream::getline
std::wifstream::getline
std::wiostream::getline
std::stringstream::getline
std::basic_fstream::getline
std::basic_istream::getline
std::istringstream::getline
std::wstringstream::getline
std::basic_ifstream::getline
std::basic_iostream::getline
std::wistringstream::getline
std::basic_stringstream::getline
std::basic_istringstream::getline
在头文件<iostream>中声明了getline函数:
istream::getline函数是C类型的数组。因为C++中允许对函数进行重载,所以可以有多个同名函数。delim参数是指定分隔符。如果不指定的话,默认使用'\n'
istream& getline (char* s, streamsize n );
istream& getline (char* s, streamsize n, char delim );
下面是一个例子:
void test1(){
char line[100];
while(cin.getline(line,100))
cout<<line<<endl;
}
char line[100];
while(cin.getline(line,100))
cout<<line<<endl;
}
注意这儿的getline是要读入空白符。但是不包括最后的换行符。
C++中还定义了一个在std名字空间的全局函数,因为这个getline函数的参数使用了string字符串,所以声明在了<string>头文件中了。
声明如下:
istream& getline ( istream& is, string& str, char delim );简单的示例如下:
istream& getline ( istream& is, string& str );
void test2(){
string line;
while(getline(cin,line))
cout<<line<<endl;
}
string line;
while(getline(cin,line))
cout<<line<<endl;
}
注意此处也是不读入换行符的。
所以在C++中读取一行的函数是不读入换行符的,而GCC中getline函数是读入换行符的。可以理解为,一般情况下不读入,特别的是GCC的读入。