链接库以及编译过程

在Linux中,链接库有两种,静态链接库和动态链接库。静态链接库文件以.a作为后缀,动态链接库以.so作为文件名。

一个源文件编程一个可运行的程序,需要进过两个步骤,编译跟链接。编译就是编译器将源文件编译成目标文件,以.o作为文件名后缀,生成目标文件后,接下来就是链接器的工作了。
对于静态链接库,连接器将目标文件和所涉及到的库函数(引用的是静态链接库的函数)连接起来合成一个可执行的文件,此时的库函数数据是直接存在可运行文件里面,这样的可运行程序在在生成后,就可以脱离静态库函数而成功运行了。但是所生成的可执行文件会比较大。对于动态链接库,只是做一下符号标记,在程序运行需要用到库函数的时候,才会将动态库里面的函数加载在内存中,由于不是直接的将库函数代码拷贝到自己的空间,只是一个符号链接,所生成的可运行文件就会比较小。

静态链接库、动态链接库各自的特点

  1. 动态链接库有利于进程间资源共享
    什么概念呢?就是说,某个程序的在运行中要调用某个动态链接库函数的时候,操作系统首先会查看所有正在运行的程序,看在内存里是否已有此库函数的拷贝了。如果有,则让其共享那一个拷贝;只有没有时才链接载入。这样的模式虽然会带来一些“动态链接”额外的开销,却大大的节省了系统的内存资源。C的标准库就是动态链接库,也就是说系统中所有运行的程序共享着同一个C标准库的代码段。而静态链接库则不同,如果系统中多个程序都要调用某个静态链接库函数时,则每个程序都要将这个库函数拷贝到自己的代码段,显然将占有更大的内存资源。

  2. 将一些程序升级变得简单。用静态库,如果库发生变化,使用库的程序要重新编译。使用动态库,只要动态库提供给该程序的接口没变,只要重新用新生成的动态库替换原来就可以了。

  3. 甚至可以真正坐到链接载入完全由程序员在程序代码中控制。
    程序员在编写程序的时候,可以明确的指明什么时候或者什么情况下,链接载入哪个动态链接库函数。你可以有一个相当大的软件,但每次运行的时候,由于不同的操作需求,只有一小部分程序被载入内存。所有的函数本着“有需求才调入”的原则,于是大大节省了系统资源。比如现在的软件通常都能打开若干种不同类型的文件,这些读写操作通常都用动态链接库来实现。在一次运行当中,一般只有一种类型的文件将会被打开。所以直到程序知道文件的类型以后再载入相应的读写函数,而不是一开始就将所有的读写函数都载入,然后才发觉在整个程序中根本没有用到它们。

  4. 由于静态库在编译的时候,就将库函数装载到程序中去了,而动态库函数必须在运行的时候才装载,所以程序执行的时候,用静态库更快些。

源文件的编译过程

如果有一个源文件file.c需要编译,那么其编译过程如下图所示:

一般在执行命令 gcc -o file file.c ,会转化成以下几个步骤:

生成预处理后的文件:

1
gcc -E -o file.i  file.

预处理文件到汇编代码:

1
gcc -s file.s file.c

汇编代码到目标文件:

1
gcc -c file.s

生成可执行文件:

1
gcc -o file file.o

静态链接库创建

所有的库,不管是静态库还是动态库,都是有.o文件生成的,所以在创建库函数的时候,需要先生成.o文件。

1
2
3
gcc -c file.c //生成file.o

ar cr libfile.a file.o

动态链接库的创建

由于动态链接库函数的共享特性(故又叫共享库),它们不会被拷贝到可执行文件中。在编译的时候,编译器只会做一些函数名之类的检查。在程序运行的时候,被调用的动态链接库函数被安置在内存的某个地方,所有调用它的程序将指向这个代码段。因此,这些代码必须实用相对地址,而不是绝对地址。在编译的时候,我们需要告诉编译器,这些对象文件是用来做动态链接库的,所以要用地址不无关代码(Position Independent Code (PIC))。
对gcc编译器,只需添加上 -fPIC 标签,如:

1
2
3
gcc -fPIC -c file1.c
gcc -fPIC -c file2.c
gcc -shared libxxx.so file1.o file2.o

静态链接库和动态链接库的使用

由于是自己生成的链接库,所以在需要用到的时候,需要跟编译器说链接库放在那个位置:

1
2
3
4
5
6
gcc –o main main.o –L. –lxxxx

# -L 参数告诉编译器先到path目录下搜索libxxx.so文件,如果没有找到,继续搜索libxxx.a(静态库)。

如果想要直接的搜索静态的链接库,那么加上-static 就可以了
gcc –o main main.o -static –L. –lxxxx

对于动态链接库,如果想要让程序能可以顺利运行的话,那么可以通过下面的三种方法:

  1. 在程序运行期间,也需要告诉系统去哪里找你的动态链接库文件。在UNIX下是通过定义名为 LD_LIBRARY_PATH 的环境变量来实现的。只需将path赋值给此变量即可

    1
    export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:~/C_pram/practice
  2. 把库拷贝到/usr/lib和/lib目录下。

  3. 修改/etc/ld.so.conf文件,把库所在的路径加到文件末尾,并执行sudo ldconfig刷新(需要超级用户权限)。这样,加入的目录下的所有库文件都可见.

如果想要查看某个可执行文件依赖于那些库,可以使用ldd命令:

1
ldd executefilenam

查看静态库中的文件

1
2
3
4
5
6
7
8
9
10
11
12
13
  [root@node56 lib]# ar -t libhycu.a
  base64.c.o
  binbuf.c.o
  cache.c.o
  chunk.c.o
  codec_a.c.o
  …
  xort.c.o
  [root@node56 lib]#
  [root@node56 lib]# ar -tv libhycu.a
  rw-r--r-- 0/0 7220 Jul 29 19:18 2011 base64.c.o
  rw-r--r-- 0/0 2752 Jul 29 19:18 2011 binbuf.c.o
  rw-r--r-- 0/0 19768 Jul 29 19:18 2011 cache.c.o

查看动态库中的文件可以使用nm命令

1
nm -D file.so

下面是在网上找的生成动态链接库的例子,原文参考这里

1
2
3
4
5
6
7
8
9
10
11
/*mylib.h*/
void Print();

/*mylib.c*/
#include <stdio.h>
#include "mylib.h"

void Print()
{

printf("This is in mylib\n");
}

编译方法如下:

1
gcc -fpic -shared mylib.c -o mylib.so

此时将生成mylib.so动态链接库文件。

动态链接库在使用时,分为“隐式调用”和“显式调用”两种,如果是隐式调用,则与静态库的使用方法差不多,注意需要包含导出函数的头文件,即mylib.h:

1
2
3
4
5
6
7
#include <stdio.h>
#include "mylib.h"

int main()
{

Print();
}

编译方法:

1
gcc -o main main.c -L./ mylib.so

注意要加上动态链接库的搜索路径,否则编译器只会到系统路径中去寻找。

显式调用的方式,不必包含mylib.h,但是需要增加几个系统调用:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
#include <stdio.h>
#include <dlfcn.h> // 显式加载需要用到的头文件

int main()
{

void *pdlHandle = dlopen("./mylib.so", RTLD_LAZY); // RTLD_LAZY 延迟加载
char *pszErr = dlerror();
if( !pdlHandle || pszErr )
{
printf("Load mylib failed!\n")
return 1;
}

void (*Print)() = dlsym(pdlHandle, "Print"); // 定位动态链接库中的函数
if( !Print )
{
pszErr = dlerror();
printf("Find symbol failed!%s\n", pszErr);
dlclose(pdlHandle);
return 1;
}

Print(); // 调用动态链接库中的函数

dlclose(pdlHandle); // 系统动态链接库引用数减1

return 0;
}

可以看到,显式调用的代码看上去要复杂很多,但是却比隐式调用要灵活,我们不必在编译时就确定要加载哪个动态链接库,可以在运行时再确定,甚至重新加载。

看一下显式调用的编译方式:

gcc -ldl -o main main.c

注意要添加-ldl选项,以使用显式调用相关的函数调用。