小伙伴们,对C语言编程有疑问的,可以加微信交流:poo_poo或者扫描我的头像,验证时请注明是“知友”
之前在 C Primer Plus(5版)第8章编程题1_重定向实现 - 知乎专栏 这篇文章中,我给出了C Primer Plus(5版)第8章编程题第一道题的解答,我使用了重定向技术来统计了一个文本文件中的字符数。重定向技术简单,直接调用了系统的能力,所以代码量也不多。
其实实现文件字符数统计,除了重定向技术外,还有两个方法也可以做到,一个是使用fseek、ftell函数,一个是使用getc函数。这两种方法都是使用了文件I/O函数。本文给出使用fseek、ftell函数的实现。
一、题目描述
本题是第8章编程题的第一道题,题目如下:
二、题目及思路分析
从题述来看,有如下几个关键点:
1. 有这么一个文本文件
2. 读入文件中的文本
3. 统计文件中字符数
4. 判断文件的结尾
下面再给出这4步的每一步的解决思路。
1. 有这么一个文本文件
这个好解决,事先建立好一个文本文件,里面准备一些字符。我事先准备好了一个文本文件,文件名是author.txt,里面的字符串是:
weibo: http://weibo.com/520JDH
zhihu: http://zhihu.com/people/520WX
CSDN: http://blog.csdn.net/kelehaier
2. 读入文件中的字符
这是要解决的第一个关键点。要读文件,必须得将文件作为程序的输入。使用文件I/O包中的fopen函数打开即可。
3. 统计文件中字符数
这是要解决的第二个关键点。文件中的字符在计算机中是用一个字节来表示的,因此要统计文件中的字符数,可以变换为统计文件中的字节数,一个字符就对应一个字节嘛。使用fseek函数将文件指针定位在文件的末尾,获取ftell函数的返回值即可。
ftell函数会返回当前文件指针的位置距离文件开始处相隔的字节数,也就获取了文件中的字符个数。
4. 判断文件的结尾
这是要解决的第三个关键点,即,如何判断读取操作已经到了文件末尾。
这里再提示下,在C中,针对不同的系统,统一以一个“EOF”来表示文件的末尾。这个“EOF”如果你头文件中查看其定义,会看到可能是一个整数值,比如“-1”。一些I/O函数,如getchar(),getc()等,遇到文件末尾后就会返回“EOF”。本程序采用了这个技术点。
三、代码
OS:Windows XP sp3
编译器:TDM-GCC 4.9.2 32-bit Release
根据上述分析,主要代码如下:
fseek(pFile, 0, SEEK_END);
count = ftell(pFile);
代码的fseek函数使用第三个参数SEEK_END将文件指针定位到文件末尾。当文件指针在文件末尾时,再使用ftell函数获取从文件指针的位置到文件开头所相隔的字节数。
为了说清楚这个相隔的字节数的意思,我画了一个示意图。举个例子,我有一个文本文件test.txt,文本内容在代码包中,可以查看下。这个文本文件中你看得到的只有两个字符,'a'和'b',你看不到的还有'\r'和'\n'。
刚打开文件的时候,文件位置指示器所处的位置如下图所示:
通过fseek函数,将文件位置指示器移到文件末尾,文件位置指示器所在位置如下图所示:
可以看出,文件位置指示器此时与文件开头相隔的字节数是4,因此ftell函数会返回值4.
完整的代码下载地址:
四、运行结果
下面是以二进制模式打开文件的统计结果:
下面是以文本模式打开文件的统计结果:
不管以何种模式打开文件,将文件指针移动到文件末尾后,ftell函数返回值99,文本中的字符个数包括你看见的和看不见的,一共是99个字符。
程序是在Win上运行,有兴趣的朋友可以在Linux下运行看看。
五、技术点
本文给出了一种统计文件字符数的方法,关键技术点是fseek函数和ftell函数。在其他项目中如果遇到需要获取字符数的需求,可以参考这种方法。
六、遗留问题
还有一种统计字符数的方法,是getc函数。如果使用getc函数来统计字符数的话,那么你会发现,以二进制模式打开此文件,统计到字符数是99;但是以文本模式打开此文件,统计到的字符数却是97.其中缘由,下篇文章再分析。