Docker 基本操作

更簡單的,建議大家下載 .bashrc_docker,並將內容放到 .bashrc 中。

$ wget -P ~ https://github.com/yeasy/docker_practice/raw/master/_local/.bashrc_docker;
$ echo "[ -f ~/.bashrc_docker ] && . ~/.bashrc_docker" >> ~/.bashrc; source ~/.bashrc

這個檔案中定義了很多方便使用 Docker 的命令,例如 docker-pid 可以取得某個容器的 PID;而 docker-enter 可以進入容器或直接在容器內執行命令。

Docker Internal

Namespaces are a feature of the Linux kernel that partitions kernel resources such that one set of processes sees one set of resources while another set of processes sees a different set of resources.

jimmylin@ubuntu  ~  id
uid=1000(jimmylin) gid=1000(jimmylin) groups=1000(jimmylin),4(adm),24(cdrom),27(sudo),30(dip),46(plugdev),110(lxd)
 jimmylin@ubuntu  ~  unshare --user --pid --map-root-user --mount-proc --fork bash
 ⚡ root@ubuntu  ~  ps -ef
UID          PID    PPID  C STIME TTY          TIME CMD
root           1       0  0 05:23 pts/0    00:00:00 bash
root         103       1  0 05:23 pts/0    00:00:00 ps -ef
 ⚡ root@ubuntu  ~  id
uid=0(root) gid=0(root) groups=0(root),65534(nogroup)

If we don’t mount the /proc file system, we can see all processes.

 jimmylin@ubuntu  ~  unshare --user --pid --map-root-user --fork bash
 ⚡ root@ubuntu  ~  ps
    PID TTY          TIME CMD
   1016 pts/0    00:00:00 bash
   1789 pts/0    00:00:00 unshare
   1790 pts/0    00:00:00 bash
   1891 pts/0    00:00:00 ps
 ⚡ root@ubuntu  ~  ps -ef | head -5
UID          PID    PPID  C STIME TTY          TIME CMD
nobody         1       0  0 05:17 ?        00:00:00 /sbin/init
nobody         2       0  0 05:17 ?        00:00:00 [kthreadd]
nobody         3       2  0 05:17 ?        00:00:00 [rcu_gp]
nobody         4       2  0 05:17 ?        00:00:00 [rcu_par_gp]

The kernel assigns each process a symbolic link per namespace kind in /proc/<pid>/ns/. The inode number pointed to by this symlink is the same for each process in this namespace. This uniquely identifies each namespace by the inode number pointed to by one of its symlinks.

 jimmylin@ubuntu  ~  ls -la /proc/$$/ns/
total 0
dr-x--x--x 2 jimmylin jimmylin 0 Mar 19 05:27 .
dr-xr-xr-x 9 jimmylin jimmylin 0 Mar 19 05:27 ..
lrwxrwxrwx 1 jimmylin jimmylin 0 Mar 19 05:27 cgroup -> 'cgroup:[4026531835]'
lrwxrwxrwx 1 jimmylin jimmylin 0 Mar 19 05:27 ipc -> 'ipc:[4026531839]'
lrwxrwxrwx 1 jimmylin jimmylin 0 Mar 19 05:27 mnt -> 'mnt:[4026531841]'
lrwxrwxrwx 1 jimmylin jimmylin 0 Mar 19 05:27 net -> 'net:[4026531840]'
lrwxrwxrwx 1 jimmylin jimmylin 0 Mar 19 05:27 pid -> 'pid:[4026531836]'
lrwxrwxrwx 1 jimmylin jimmylin 0 Mar 19 05:37 pid_for_children -> 'pid:[4026531836]'
lrwxrwxrwx 1 jimmylin jimmylin 0 Mar 19 05:27 time -> 'time:[4026531834]'
lrwxrwxrwx 1 jimmylin jimmylin 0 Mar 19 05:37 time_for_children -> 'time:[4026531834]'
lrwxrwxrwx 1 jimmylin jimmylin 0 Mar 19 05:27 user -> 'user:[4026531837]'
lrwxrwxrwx 1 jimmylin jimmylin 0 Mar 19 05:27 uts -> 'uts:[4026531838]'

We can see there are symlinks

Reading the symlink via readlink returns a string containing the namespace kind name and the inode number of the namespace.

A control group (cgroup) is a Linux kernel feature that limits, accounts for, and isolates the resource usage (CPU, memory, disk I/O, network, and so on) of a collection of processes.

AUFS

AUFS (Advanced Multi-Layered Unification Filesystem) 和 Docker image 的關係主要在於分層儲存和寫時複製(Copy-on-Write)機制。

  1. Docker Image 分層結構:
Layer 4 (Container layer - 可寫)
Layer 3 (Read-only - 例如 apt install 某個套件)
Layer 2 (Read-only - 例如加入應用程式程式碼)
Layer 1 (Read-only - 例如基礎 Ubuntu 映像)
  1. AUFS 如何處理這些層:

所有層都被掛載到同一個掛載點 上層覆蓋下層的同名檔案 讀取檔案時,AUFS 從上往下尋找第一個匹配的檔案

當檔案發生變動時的處理流程:

當程式要修改 /etc/config.conf:
 
A. 如果檔案不存在:
   - 直接在最上層(Container layer)建立新檔案
 
B. 如果檔案存在於下層:
   1. AUFS 先把檔案從下層複製到最上層(Copy-up)
   2. 在最上層進行修改
   3. 下層的原始檔案保持不變

具體例子:

假設有個檔案 /etc/nginx/nginx.conf:
 
初始狀態:
Layer 4 (Container): []
Layer 3: []
Layer 2: nginx.conf (原始設定)
Layer 1: []
 
修改 nginx.conf 後:
Layer 4 (Container): nginx.conf (修改後的版本)
Layer 3: []
Layer 2: nginx.conf (原始設定,未變動)
Layer 1: []

刪除檔案的處理:

當刪除來自唯讀層的檔案時:
1. AUFS 在最上層建立一個 whiteout 檔案
2. 這個 whiteout 檔案會遮蔽下層的同名檔案
3. 對使用者來說,檔案看起來像是被刪除了

這種設計的優點:

節省空間:相同的基礎層可以被多個容器共用 快速部署:不需要完整複製整個檔案系統 隔離性:每個容器的修改都在自己的層中,不影響其他容器