Home

cdeveloper

读书,写作

Linux 高级编程 - 必须掌握的 5 个底层 IO 函数


版权声明:本文为 cdeveloper 原创文章,可以随意转载,但必须在明确位置注明出处!

底层输入输出(Low-Level Input/Output)

这篇博客主要介绍 Linux 原生的 IO 操作(Low IO),你可能会想不是有跨平台的 ANSI C 可以使用么,为啥还要学习底层 IO ? 有以下 4 个原因:

  1. 用于读取大块的二进制文件
  2. 在解析之前将整个文件读入内核
  3. 执行数据传输以外的操作
  4. 将描述符传递给子进程

你需要知道这 4 个使用底层 IO 的原因,在以后遇到实际的情况时能够想到利用底层 IO 来解决。因为底层输入输出的函数也有很多,这篇博客主要介绍 5 个最常用,最基本的底层 IO 函数

  1. 打开文件:open
  2. 关闭文件:close
  3. 读取文件:read
  4. 写入文件:write
  5. 操作文件指针:lseek

如果你还有兴趣学习其他的底层 IO 函数,建议你查看 glibc 的官方底层 IO 的学习资料,那是最好,最权威的资料,下面就一起来看看这 5 个函数的用法。

open & close

我们操作 IO 首先要学会的就是打开和关闭文件,我们使用 openclose 这两个函数,他们的声明如下(man 2 open):

open

// open 需要 3 个头文件
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>

/*
 * filename: 要打开的文件名称
 * flags: 打开标记,例如:O_CREAT | ORDWR 表示文件不存在就创建,并且可读可写
 * mode: 打开权限
 * return: 成功,返回一个新的文件描述符 fd,失败返回 -1,并设置 errno
 */
int open (const char *filename, int flags, mode t mode);

打开文件也可以用 create,不过这个函数已经弃用了!

close

再来看看 close,关闭文件会有如下结果:

  1. 文件描述符被取消分配
  2. 文件上进程所拥有的任何记录锁都将被解锁
  3. 当与管道或 FIFO 相关联的所有文件描述符都已关闭时,任何未读数据被丢弃
#include <unistd.h>

/*
 * fd: 要关闭的文件的描述符
 * return: 成功返回 0,失败返回 -1,并设置 errno
 */
int close(int fd);

实例 1: open_close.c

我们来看一个简单的例子:

#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>

int main(int argc, char* argv[]) {
	if (argc < 2) {
		printf("please input filename:\n");
		exit(1);
	}

	// argv[1] = "1.txt", 打开的文件不存在就创建 | 可读可写,666(rw-rw-rw)
	int fd = open(argv[1], O_CREAT | O_RDWR, 666);

	if (fd < 0) {
		printf("file open fail.\n");
		exit(1);
	} else {
		printf("file open success.\n");
		// 必须关闭文件
		close(fd);
		printf("file closed.\n");
	}

	return 0;
}

编译:

gcc open_close.c -o open_close

运行,我们没有新建 1.txt 文件:

./open_close 1.txt
file open success.
file close success.

文件打开成功,并且当前目录下也有了一个 1.txt 文件了,说明我们指定的 O_CREAT 标记使得程序建立了这个文件。这两个函数基本用法就是这样,更多更详细的用法还需要你自己到 glibc 官网或者 man 2 open 去找。

read & write

我们在打开文件后肯定会做的就是读写文件了,不然你打开文件干嘛,我们来看看读文件的 API:

read

read 函数从文件描述符 filedes 指定的文件中读取 size 个字节,存储到 buffer 中。

#include <unistd.h>

/*
 * filedes: 要读取的文件描述符
 * buffer: 存储读取字节的缓冲区
 * size: 要读取的大小
 * return: 成功返回读取的字节数,失败返回 -1,并设置 errno
 */
ssize_t read (int filedes, void *buffer, size t size);

write

write 函数从 buffer 中取出 size 个字节的数据,写到 filedes 描述符表示的文件中。

#include <unistd.h>

/*
 * filedes: 写入的文件描述符
 * buffer: 存储待写入数据的缓存区
 * size: 要写入的字节数
 * return: 成功返回写入的字节数,失败返回 -1,并设置 errno
 */
ssize_t write (int filedes, const void *buffer, size t size);

实例 2: read_write.c

来看一个简单的读写文件的例子:读取 file1 的内容,写到 file2 中,相当于文件拷贝

#include <stdio.h>
#include <stdlib.h>
#include <fcntl.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <unistd.h>
#include <string.h>

int main(int argc, char* argv[]) {
	// 1. 打开两个文件
	int fd1 = open(argv[1], O_CREAT | O_RDWR, 0666);
	int fd2 = open(argv[2], O_CREAT | O_RDWR, 0666);

	if ((fd1 < 0) || (fd2 < 0)) {
		printf("file open fail.\n");
		exit(1);
	} else {
		printf("file1 open success: fd1 = %d\n", fd1);
		printf("file2 open success: fd2 = %d\n", fd2);

		char buf[1024];
		// clear
		memset(buf, 0, 1024);

		int read_length = 0;
		int write_length = 0;

		// 2. 将文件 1 的内容读取到 buf 中
		if ((read_length = read(fd1, buf, 1024)) != -1)  {
			// 3. 将 buf 的内容写入到文件 2 中
			if (read_length == write(fd2, buf, read_length)) 
				printf("write to fd2 success.\n");
			else 
				printf("write to fd2 falil.\n");
		} else {
			printf("read fd1 fail.\n");
		}
		
		// 必须关闭 2 个文件
		close(fd1);
		close(fd2);

		printf("file1 close success.\n");
		printf("file2 close success.\n");
	}

	return 0;
}

编译:

gcc read_write.c -o read_write

运行,1.txt 的内容是 hello world

./read_write 1.txt 2.txt

file1 open success: fd1 = 3
file2 open success: fd2 = 4
write to fd2 success.
file1 close success.
file2 close success.

写入成功,查看下 2.txt 的内容:

cat 2.txt

hello world

发现成功写入 hello world 到 2.txt 文件了,并且注意到 fd1 = 3, fd2 = 4,这也说明前面的 3 个文件描述符被系统使用了。

lseek

lseek 用来移动文件指针,什么是文件指针呢?你可以理解为当前读取或者写入的位置,我们移动这个指针可以控制读取或者写入数据的位置,声明如下:

#include <sys/types.h>
#include <unistd.h>

/*
 * filedes: 要操作的文件描述符
 * offset: 根据当前 whence 的偏移量
 * whence: 指定当前文件指针的位置
 * return: 成功返回设置后的文件位置,可以使用 `SEEK_CUR` 查看当前文件指针位置,
 *         失败返回 -1 并设置 errno
 */
off_t lseek (int filedes, off t offset, int whence);

其中 whence 参数需要特别注意,它有 3 种情况:

  1. SEEK_SET:设置文件指针指向文件开始并偏移 offset 字节处
  2. SEEK_CUR:设置文件指针只想当前位置偏移 offset 字节处
  3. SEEK_END:设置文件指针指向文件末尾偏移 offset 字节处

实例 3:file_length.c

我们可以使用 int file_length = lseek(fd, 0, SEEK_END)求文件的长度,这个操作经常被使用。

#include <stdio.h>
#include <stdlib.h>
#include <fcntl.h>
#include <sys/types.h>
#include <unistd.h>

int main(int argc, char* argv[]) {
	// 打开文件
	int fd = open(argv[1], O_CREAT | O_RDWR, 0666);

	if (fd < 0) {
		printf("file open fail.\n");
		exit(1);
	} else {
		printf("file1 open success: fd = %d\n", fd);

		// 得到文件长度
		int file_length = lseek(fd, 0, SEEK_END);
		
		// 输出文件长度
		printf("file_length = %d\n", file_length);

		// 关闭文件
		close(fd);
		printf("file1 close success.\n");
	}

	return 0;
}

编译:

gcc file_length.c -o file_length

运行,注意到 1.txt 中的 hello world 加上 ‘\0’ 一共 12 个字符

./file_length 1.txt
file1 open success: fd = 3
file_length = 12
file1 close success.

打印出 12,计算正确啦。

结语

到此,我们就学习了 6 个底层的 IO 函数,并实际练习了 3 个例子,把这 3 个例子搞清楚,基本的用法也就掌握的差不多了,更加详细的用法可以查看系统提供的 man 手册 man 2 open 等,或者查阅 glibc 官方文档,祝你学习愉快。

最后,感谢你的阅读,我们下次再见 :)

cdeveloper at 07/27/17