shell编程跟java、php编程一样,只要有一个能编写代码的文本编辑器和一个能解释执行的脚本解释器就可以了。
当前主流的操作系统都支持shell编程,本文档所述的shell编程是指Linux下的shell,讲的基本都是POSIX标准下的功能,所以,也适用于Unix及BSD(如Mac OS)。
Linux默认安装就带了shell解释器。
Mac OS不仅带了sh、bash这两个最基础的解释器,还内置了ksh、csh、zsh等不常用的解释器。
windows出厂时没有内置shell解释器,需要自行安装,为了同时能用grep, awk, curl等工具,最好装一个cygwin或者mingw来模拟linux环境。
printenv - 打印部分或所有的环境变量
set - 设置 shell 选项
export — 导出环境变量,让随后执行的程序知道。
alias - 创建命令别名
shell 在环境中存储了两种基本类型的数据,虽然对于 bash 来说,很大程度上这些类型是不可 辨别的。它们是环境变量和 shell 变量。Shell 变量是由 bash 存放的少量数据,而剩下的基本上 都是环境变量。除了变量,shell 也存储了一些可编程的数据,命名为别名和 shell 函数。我们 已经在第六章讨论了别名,而 shell 函数(涉及到 shell 脚本)将会在第五部分叙述。
我们既可以用 bash 的内部命令 set,或者是 printenv 程序来查看什么存储在环境当中。set 命令可以 显示 shell 和环境变量两者,而 printenv 只是显示环境变量。因为环境变量内容列表相当长,所以最好 把每个命令的输出结果管道到 less 命令:
sulihuangdeMacBook-Pro:~ Tracy$ printenv | less
执行以上命令之后,我们应该能得到类似以下内容:
KDE_MULTIHEAD=false
SSH_AGENT_PID=6666
HOSTNAME=linuxbox
GPG_AGENT_INFO=/tmp/gpg-PdOt7g/S.gpg-agent:6689:1
SHELL=/bin/bash
TERM=xterm
XDG_MENU_PREFIX=kde-
HISTSIZE=1000
XDG_SESSION_COOKIE=6d7b05c65846c3eaf3101b0046bd2b00-1208521990.996705
-1177056199
GTK2_RC_FILES=/etc/gtk-2.0/gtkrc:/home/me/.gtkrc-2.0:/home/me/.kde/sh
are/config/gtkrc-2.0
GTK_RC_FILES=/etc/gtk/gtkrc:/home/me/.gtkrc:/home/me/.kde/share/confi
g/gtkrc
GS_LIB=/home/me/.fonts
WINDOWID=29360136
QTDIR=/usr/lib/qt-3.3
QTINC=/usr/lib/qt-3.3/include
KDE_FULL_SESSION=true
USER=me
LS_COLORS=no=00:fi=00:di=00;34:ln=00;36:pi=40;33:so=00;35:bd=40;33;01
:cd=40;33;01:or=01;05;37;41:mi=01;05;37;41:ex=00;32:\*.cmd=00;32:\*.exe:
我们所看到的是环境变量及其数值的列表。例如,我们看到一个叫做 USER 的变量,这个变量值是 "me"。printenv 命令也能够列出特定变量的数值:
sulihuangdeMacBook-Pro:~ Tracy$ printenv USER
me
当使用没有带选项和参数的 set 命令时,shell 和环境变量二者都会显示,同时也会显示定义的 shell 函数。不同于 printenv 命令,set 命令的输出结果很礼貌地按照字母顺序排列:
sulihuangdeMacBook-Pro:~ Tracy$ set | less
也可以通过 echo 命令来查看一个变量的内容,像这样:
sulihuangdeMacBook-Pro:~ Tracy$ echo $HOME
/home/me
如果 shell 环境中的一个成员既不可用 set 命令也不可用 printenv 命令显示,则这个变量是别名。 输入不带参数的 alias 命令来查看它们:
sulihuangdeMacBook-Pro:~ Tracy$ alias
alias l.='ls -d .* --color=tty'
alias ll='ls -l --color=tty'
alias ls='ls --color=tty'
alias vi='vim'
alias which='alias | /usr/bin/which --tty-only --read-alias --show-dot --show-tilde'
shell 环境中包含相当多的变量,虽然你的 shell 环境可能不同于这里展示的,但是你可能会看到 以下变量在你的 shell 环境中:
变量 | 内容 |
---|---|
DISPLAY | 如果你正在运行图形界面环境,那么这个变量就是你显示器的名字。通常,它是 ":0", 意思是由 X 产生的第一个显示器。 |
EDITOR | 文本编辑器的名字。 |
SHELL | shell 程序的名字。 |
HOME | 用户家目录。 |
LANG | 定义了字符集以及语言编码方式。 |
OLD_PWD | 先前的工作目录。 |
PAGER | 页输出程序的名字。这经常设置为/usr/bin/less。 |
PATH | 由冒号分开的目录列表,当你输入可执行程序名后,会搜索这个目录列表。 |
PS1 | Prompt String 1. 这个定义了你的 shell 提示符的内容。随后我们可以看到,这个变量 内容可以全面地定制。 |
PWD | 当前工作目录。 |
TERM | 终端类型名。类 Unix 的系统支持许多终端协议;这个变量设置你的终端仿真器所用的协议。 |
TZ | 指定你所在的时区。大多数类 Unix 的系统按照协调时间时 (UTC) 来维护计算机内部的时钟 ,然后应用一个由这个变量指定的偏差来显示本地时间。 |
USER | 你的用户名 |
如果缺失了一些变量,不要担心,这些变量会因发行版本的不同而不同。
当我们登录系统后,启动 bash 程序,并且会读取一系列称为启动文件的配置脚本, 这些文件定义了默认的可供所有用户共享的 shell 环境。然后是读取更多位于我们自己家目录中 的启动文件,这些启动文件定义了用户个人的 shell 环境。精确的启动顺序依赖于要运行的 shell 会话 类型。有两种 shell 会话类型:一个是登录 shell 会话,另一个是非登录 shell 会话。
登录 shell 会话会提示用户输入用户名和密码;例如,我们启动一个虚拟控制台会话。当我们在 GUI 模式下 运行终端会话时,非登录 shell 会话会出现。
登录 shell 会读取一个或多个启动文件,正如表12-2所示:
文件 | 内容 |
---|---|
/etc/profile | 应用于所有用户的全局配置脚本。 |
~/.bash_profile | 用户私人的启动文件。可以用来扩展或重写全局配置脚本中的设置。 |
~/.bash_login | 如果文件 ~/.bash_profile 没有找到,bash 会尝试读取这个脚本。 |
~/.profile | 如果文件 ~/.bash_profile 或文件 ~/.bash_login 都没有找到,bash 会试图读取这个文件。 这是基于 Debian 发行版的默认设置,比方说 Ubuntu。 |
非登录 shell 会话会读取以下启动文件:
表12-3: 非登录 shell 会话的启动文件 | 文件 | 内容 | | /etc/bash.bashrc | 应用于所有用户的全局配置文件。 | | ~/.bashrc | 用户私有的启动文件。可以用来扩展或重写全局配置脚本中的设置。 |
除了读取以上启动文件之外,非登录 shell 会话也会继承它们父进程的环境设置,通常是一个登录 shell。
浏览一下你的系统,看一看系统中有哪些启动文件。记住-因为上面列出的大多数文件名都以圆点开头 (意味着它们是隐藏文件),你需要使用带"-a"选项的 ls 命令。
在普通用户看来,文件 ~/.bashrc 可能是最重要的启动文件,因为它几乎总是被读取。非登录 shell 默认 会读取它,并且大多数登录 shell 的启动文件会以能读取 ~/.bashrc 文件的方式来书写。
如果我们看一下典型的 .bash_profile 文件(来自于 CentOS 4 系统),它看起来像这样:
# .bash_profile
# Get the aliases and functions
if [ -f ~/.bashrc ]; then
. ~/.bashrc
fi
# User specific environment and startup programs
PATH=$PATH:$HOME/bin
export PATH
以"#"开头的行是注释,shell 不会读取它们。它们在那里是为了方便人们阅读。第一件有趣的事情 发生在第四行,伴随着以下代码:
if [ -f ~/.bashrc ]; then
. ~/.bashrc
fi
这叫做一个 if 复合命令,我们将会在第五部分详细地介绍它,现在我们对它翻译一下:
If the file ~/.bashrc exists, then
read the ~/.bashrc file.
我们可以看到这一小段代码就是一个登录 shell 得到 .bashrc 文件内容的方式。在我们启动文件中, 下一件有趣的事与 PATH 变量有关系。
曾经是否感到迷惑 shell 是怎样知道到哪里找到我们在命令行中输入的命令的?例如,当我们输入 ls 后, shell 不会查找整个计算机系统,来找到 /bin/ls(ls 命令的绝对路径名),而是,它查找一个目录列表, 这些目录包含在 PATH 变量中。
PATH 变量经常(但不总是,依赖于发行版)在 /etc/profile 启动文件中设置,通过这些代码:
PATH=$PATH:$HOME/bin
修改 PATH 变量,添加目录 $HOME/bin 到目录列表的末尾。这是一个参数展开的实例, 参数展开我们在第八章中提到过。为了说明这是怎样工作的,试试下面的例子:
sulihuangdeMacBook-Pro:~ Tracy$ foo="This is some"
sulihuangdeMacBook-Pro:~ Tracy$ echo $foo
This is some
sulihuangdeMacBook-Pro:~ Tracy$ foo="$foo text."
sulihuangdeMacBook-Pro:~ Tracy$ echo $foo
This is some text.
使用这种技巧,我们可以把文本附加到一个变量值的末尾。通过添加字符串 $HOME/bin 到 PATH 变量值 的末尾,则目录 $HOME/bin 就添加到了命令搜索目录列表中。这意味着当我们想要在自己的家目录下, 创建一个目录来存储我们自己的私人程序时,shell 已经给我们准备好了。我们所要做的事就是 把创建的目录叫做 bin,赶快行动吧。
注意:很多发行版默认地提供了这个 PATH 设置。一些基于 Debian 的发行版,例如 Ubuntu,在登录 的时候,会检测目录 ~/bin 是否存在,若找到目录则把它动态地加到 PATH 变量中。
最后,有下面一行代码:
export PATH
这个 export 命令告诉 shell 让这个 shell 的子进程可以使用 PATH 变量的内容。
既然我们知道了启动文件所在的位置和它们所包含的内容,我们就可以修改它们来定制自己的 shell 环境。
按照通常的规则,添加目录到你的 PATH 变量或者是定义额外的环境变量,要把这些更改放置到 .bash_profile 文件中(或者其替代文件中,根据不同的发行版。例如,Ubuntu 使用 .profile 文件)。 对于其它的更改,要放到 .bashrc 文件中。除非你是系统管理员,需要为系统中的所有用户修改 默认设置,那么则限定你只能对自己家目录下的文件进行修改。当然,有可能会更改 /etc 目录中的 文件,比如说 profile 文件,而且在许多情况下,修改这些文件也是明智的,但是现在,我们要 安全起见。
为了编辑(例如,修改)shell 的启动文件,还有系统中大多数其它配置文件,我们使用一个叫做文本 编辑器的程序。文件编辑器是一个,在某些方面,类似于文字处理器的程序,比如说随着鼠标的移动, 它允许你在屏幕上编辑文字。只有一点,文本编辑器不同于文字处理器,就是它只能支持纯文本,并且 经常包含为便于写程序而设计的特性。文本编辑器是软件开发人员用来写代码,和系统管理原员用来管理 系统配置文件的重要工具。
Linux 系统有许多不同类型的文本编辑器可用;你的系统中可能已经安装了几个。为什么会有这么 多种呢?可能因为程序员喜欢编写它们,又因为程序员们会频繁地使用它们,所以程序员编写编辑器让 它们按照程序员自己的愿望工作。
文本编辑器分为两种基本类型:图形化的和基于文本的编辑器。GNOME 和 KDE 两者都包含一些流行的 图形编辑器。GNOME 自带了一个叫做 gedit 的编辑器,这个编辑器通常在 GNOME 菜单中称为"文本编辑器"。 KDE 通常自带了三种编辑器,分别是(按照复杂度递增的顺序排列)kedit,kwrite,kate。
有许多基于文本的编辑器。你将会遇到一些流行的编辑器,它们是 nano,vi,和 emacs。这个 nano 编辑器 是一个简单的,容易使用的编辑器,它是 pico 编辑器的替代物,pico 编辑器由 PINE 邮件套件提供。vi 编辑器 (在大多数 Linux 系统中被 vim 替代,vim 是 "Vi IMproved"的简写)是类 Unix 操作系统的传统编辑器。 vim 是我们下一章节的讨论对象。emacs 编辑器最初由 Richard Stallman 写成。emacs 是一个庞大的,多用途的, 可做任何事情的编程环境。虽然 emacs 很容易获取,但是大多数 Linux 系统很少默认安装它。
所有的文本编辑器都可以通过在命令行中输入编辑器的名字,加上你所想要编辑的文件来唤醒。如果所 输入的文件名不存在,编辑器则会假定你想要创建一个新文件。下面是一个使用 gedit 的例子:
sulihuangdeMacBook-Pro:~ Tracy$ gedit some_file
这条命令将会启动 gedit 文本编辑器,同时加载名为 "some_file" 的文件,如果这个文件存在的话。
所有的图形文本编辑器都相当不言自明的,所以我们在这里不会介绍它们。反之,我们将集中精力在 我们第一个基于文本的文本编辑器,nano。让我们启动 nano,并且编辑文件 .bashrc。但是在我们这样 做之前,先练习一些"安全计算"。当我们编辑一个重要的配置文件时,首先创建一个这个文件的备份 总是一个不错的主意。这样能避免我们在编辑文件时弄乱文件。创建文件 .bashrc 的备份文件,这样做:
sulihuangdeMacBook-Pro:~ Tracy$ cp .bashrc .bashrc.bak
备份文件的名字无关紧要,只要选择一个容易理解的文件名。扩展名 ".bak",".sav", ".old",和 ".orig" 都是用来指示备份文件的流行方法。哦,记住 cp 命令会默默地重写存在的文件。
现在我们有了一个备份文件,我们启动 nano 编辑器吧:
sulihuangdeMacBook-Pro:~ Tracy$ nano .bashrc
一旦 nano 编辑器启动后,我们将会得到一个像下面一样的屏幕:
GNU nano 2.0.3
....
注意:如果你的系统中没有安装 nano 编辑器,你可以用一个图形化的编辑器代替。
这个屏幕由上面的标头,中间正在编辑的文件文本和下面的命令菜单组成。因为设计 nano 是为了 代替由电子邮件客户端提供的编辑器的,所以它相当缺乏编辑特性。在任一款编辑器中,你应该 学习的第一个命令是怎样退出程序。以 nano 为例,你输入 Ctrl-x 来退出 nano。在屏幕底层的菜单中 说明了这个命令。"^X" 表示法意思是 Ctrl-x。这是控制字符的常见表示法,许多程序都使用它。
第二个我们需要知道的命令是怎样保存我们的劳动成果。对于 nano 来说是 Ctrl-o。尽然我们 已经获得了这些知识,接下来我们准备做些编辑工作。使用下箭头按键和 / 或下翻页按键,移动 鼠标到文件的最后一行,然后添加以下几行到文件 .bashrc 中:
umask 0002
export HISTCONTROL=ignoredups
export HISTSIZE=1000
alias l.='ls -d .* --color=auto'
alias ll='ls -l --color=auto'
注意:你的发行版可能已经包含其中的一些行,但是复制没有任何伤害。
下表是所添加行的意义:
文本行 | 含义 |
---|---|
umask 0002 | 设置掩码来解决共享目录的问题。 |
export HISTCONTROL=ignoredups | 使得 shell 的历史记录功能忽略一个命令,如果相同的命令已被记录。 |
export HISTSIZE=1000 | 增加命令历史的大小,从默认的 500 行扩大到 1000 行。 |
alias l.='ls -d .* --color=auto' | 创建一个新命令,叫做'l.',这个命令会显示所有以点开头的目录项。 |
alias ll='ls -l --color=auto' | 创建一个叫做'll'的命令,这个命令会显示长格式目录列表。 |
正如我们所看到的,我们的许多附加物意思直觉上并不是明显的,所以添加注释到我们的文件 .bashrc 中是 一个好主意,可以帮助人们理解。使用编辑器,更改我们的附加物,让它们看起来像这样:
# Change umask to make directory sharing easier
umask 0002
# Ignore duplicates in command history and increase
# history size to 1000 lines
export HISTCONTROL=ignoredups
export HISTSIZE=1000
# Add some helpful aliases
alias l.='ls -d .* --color=auto'
alias ll='ls -l --color=auto'
啊,看起来好多了! 当我们完成修改后,输入 Ctrl-o 来保存我们修改的 .bashrc 文件,输入 Ctrl-x 退出 nano。
>
为什么注释很重要?
不管什么时候你修改配置文件时,给你所做的更改加上注释都是一个好主意。的确,明天你会 记得你修改了的内容,但是六个月之后会怎样呢?帮自己一个忙,加上一些注释吧。当你意识 到这一点后,对你所做的修改做个日志是个不错的主意。
Shell 脚本和 bash 启动文件都使用 "#" 符号来开始注释。其它配置文件可能使用其它的符号。 大多数配置文件都有注释。把它们作为指南。
你会经常看到配置文件中的一些行被注释掉,以此防止它们被受影响的程序使用。这样做 是为了给读者在可能的配置选项方面一些建议,或者给出正确的配置语法实例。例如,Ubuntu 8.04 中的 .bashrc 文件包含这些行:
# some more ls aliases #alias ll='ls -l' #alias la='ls -A' #alias l='ls -CF'
最后三行是有效的被注释掉的别名定义。如果你删除这三行开头的 "#" 符号,此技术程称为 uncommenting (不注释),这样你就会激活这些别名。相反地,如果你在一行的开头加上 "#" 符号, 你可以注销掉这一行,但会保留它所包含的信息。
我们对于文件 .bashrc 的修改不会生效,直到我们关闭终端会话,再重新启动一个新的会话, 因为 .bashrc 文件只是在刚开始启动终端会话时读取。然而,我们可以强迫 bash 重新读取修改过的 .bashrc 文件,使用下面的命令:
sulihuangdeMacBook-Pro:~ Tracy$ source .bashrc
运行上面命令之后,我们就应该能够看到所做修改的效果了。试试其中一个新的别名:
sulihuangdeMacBook-Pro:~ Tracy$ ll
在这一章中,我们学到了用文本编辑器来编辑配置文件的必要技巧。随着继续学习,当我们 读到命令的手册页时,记录下命令所支持的环境变量。可能会有一个或两个宝贝。在随后的章节 里面,我们将会学习 shell 函数,一个很强大的特性,你可以把它包含在 bash 启动文件里面,以此 来添加你自定制的命令宝库。
bash 手册页的 INVOCATION 部分非常详细地讨论了 bash 启动文件。