Posted on

有效提高数学成绩的几个方法

学好数学,第一要点是要做足够的习题。只有足够的练习,才能准确、熟练地掌握所学的内容。

这一点,是所有数学老师都会强调,而且每个家长都清楚的一个道理。所以我不打算在这里过多强调这一点。

我们经常碰到有些学生,明明掌握了所学的知识点,但在考试中会出现这样那样的问题,例如,时间不够,简单的计算错误,对一些复杂的式子不知所措等等,这些都极大地影响了最后的学习成绩。

针对这些情况,我们讨论一些平时不太让人注意,但是却很能影响考试成绩的一些方法与技巧。

第一,先化简,再计算。每做一步,化简一步,再进行下一步计算。化简之后,计算会变得更简单,更不容易出错,可以更快并且更准确地得到答案。

例如,分式的乘法运算,要先化简,再做乘法(除法也是用乘法来算)

\[\frac{7}{8}\times\frac{4}{5}=\frac{7}{\cancel{8}2}\times\frac{\cancel{4}}{5}=\frac{7}{10}\]

但是事实上,很多同学是这样做的

\[\frac{7}{8}\times\frac{4}{5}=\frac{28}{40}=\frac{\cancel{4}\times 7}{\cancel{4}\times 10}=\frac{7}{10}\]

至少多了一步。更有甚者,

\begin{align*}\frac{7}{8}\times\frac{4}{5} &=\frac{28}{40}=\frac{\cancel{2}\times 14}{\cancel{2}\times 20}\\ &=\frac{14}{20}=\frac{\cancel{2}\times 7}{\cancel{2}\times 10}\\ &=\frac{7}{10}\end{align*}

这就多了好几步。如果数字再大一点,那就更不得了。当然,这除了不会先简化以外,还涉及到基本的计算能力的问题,这就是我们第二点要讲的方法,平时做题尽量不用计算器。

我们再来看一个化简的问题,解方程

\[\sqrt{x+19}+\sqrt{x-2}=7\]

这样的方程,两个根号,两边直接平方的话,左边会再出现一个根号,而且根号里面是一个二次多项式,然后再平方,计算量就大。那么我们先把其中一个根号放到右边去,

\[\sqrt{x+19}=7-\sqrt{x-2}\]

再平方,

\[x+19=49-14\sqrt{x-2}+x-2\]

合并同类项,将根号放到左边,其余的放到右边(也可以反过来,根号放右边,其余放左边,但这样的话,根号就是负的,多一个东西在那里,我个人是不喜欢的。)

\[14\sqrt{x-2}=49+x-2-x-19,\]

\[14\sqrt{x-2}=28\]

有些同学这里就直接两边平方了,不管是 \(14\) 还是 \(28\) 的平方都是不小的数啊!但事实上,只要两边除以 \(14\),就得到

\[\sqrt{x-2}=2\]再两边平方,多简单,

\[x-2=4,\quad x=6\]

再把答案代入方程,成立。所以方程的解是 \(x=6\)。

这里我们就是,每做一步,化简一步,这样计算量小,速度快,而且不容易出错。

第二,尽量不依赖计算器。北美的学生尤其依赖使用计算器,这使得他们的基本计算技巧特别弱。在碰到一些不准用计算器的考试中,在一些基本的计算上花费太多的时间,从而会造成时间不够或者不能够充分思考的情况下答题。我碰到一些学生,特别是北美本地长大的学生,甚至到了大学,基本的四则运算都不熟练。

第三,简化运算式。这跟之前化简不一样,化简是将一些数字、运算式约掉,但简化是通过一些运算,将复杂的式子变成相对简单的运算式,再对简化后的式子进行运算。

例如,我们对二次多项式进行因式分解

\[\frac{1}{3}x^2-\frac{1}{4}x-\frac{5}{24}\]

这样的二次多项式,即使你很熟悉因式分解,也是很难直接分解出来的。但是如果我们这样做

\[\frac{1}{3}x^2-\frac{1}{4}x-\frac{5}{24}=\frac{1}{24}(8x^2-6x-5)\]

然后对括号里的部分进行分解,就容易多了。利用交叉相乘的方法,很快就可以分解出来

\[\frac{1}{3}x^2-\frac{1}{4}x-\frac{5}{24}=\frac{1}{24}(2x+1)(4x-5)\]

第四,使用分数而不是小数进行运算,使用 \(\pi, e\) 等进行运算,而不是使用 \(3.14, 2.72\) 等进行运算。使用根式而不是用小数进行运算。

同样的一个数,小数的计算量要比分数的计算量大得多。我们看一个例子,这是我前几天跟几个同学讨论问题的碰到的。求二次函数 \[y=x^2+5x+19\] 的顶点。

标准的做法就是配方法,同学是这样做的

\begin{align*}y=x^2+5x+19=(x^2+5x)+19\\&=(x^2+5x+2.5^2)-2.5^2+19\\&=(x-2.5)^2-6.25+19\\ &=(x-2.5)^2+12.75\end{align*}

所以顶点为点 \((2.5,12.75)\)。我当时就说,能够用分数,就不要用小数。你们看,\(2.5\) 的平方,本质上就是 \(25\) 的平方,两位数的平方,但是如果是用 \(\frac{5}{2}\) 的平方,就是两个一位数的平方,是不是简单得多?\(2\) 和 \(5\) 的平方,即使是两个数的平方,也比一个两位数的平方容易计算得多!不信,如果我们换一个数字

\[y=x^2+9x+19\]

那就需要计算 \(4.5\) 的平方,这个数估计一般人心算不出来,得用竖式乘法来算。而 \(\frac{9}{2}\) 的平方,几乎每个人都可以在一秒内算出来 。

一句话,尽量避免小数的运算。能够用分数、根式、\(\pi, e\) 这些进行运算的,就不要使用小数。如果考试要求用小数表示出来,也是在最后一步化成小数。

第五,当解题方式有几种选择时,选取最快,最简便的解题方式。例如,解二次方程时,能够用因式分解就不要用二次根式解的公式。因式分解时,交叉相乘是最快的方式,而不是先将 \(a,c\) 相乘,再分解,再除以 \(a\) 的方式。

我们前面那个解方程的例题,

\[\sqrt{x+19}+\sqrt{x-2}=7\]

我们可以两边同时平方,然后再移项,简化,但是得到的式子却复杂多了,虽然也能解出来 ,但是效率却差了很多!

第六,记住所有重要的公式,而不依赖于公式纸。北美的考试中,大部分都有一张 cheat sheet,也就是公式表。我经常跟学生说,不要去看那张纸,如果依赖于那个公式表来答题,肯定不会有好成绩,因为你效率太低了呀。你有多少时间花在找公式的过程中去了。考试是有时间限制的,你花太多时间在找公式中,那么留给你答题的时间就少了呀。如果你记住了这些公式,你答题时,就不需要去花时间翻公式表。更糟糕的是,有时候你即使你看了公式表,你也不知道该用哪个公式!

当然,记住重要的公式,不是让学生去背这个公式表。这些公式都是通过不断的练习中记住的。我也经常跟学生说,做题时,也不应该去看着公式表来做题。只有当你需要确定你使用的公式是否正确的情况下,才去看公式表。这样记住的公式才记得牢,用得准,算得快。

Posted on

盘点数学中的“空间”

大学数学之后,会遇到各种各样的“空间”定义,例如,线性空间,拓扑空间,赋范空间,内积空间,希尔伯特空间,巴拿赫空间,索伯列夫空间……

那么什么是一个“空间”呢?其实没有哪个教材对“空间”这一个词有 一个明确的定义。

一般认为,“空间”就是带有某种结构的集合。

我们现在来看看有哪些常见的“空间”。

1,线性空间:线性空间就是在集合上定义了加法和数乘两个运算,并且集合对这两个运算封闭。其中加法满足交换律和结合律,数乘满足结合律与分配律。另外集合中存在零元和幺元。具体的定义可参考任何一本线性代数的书。

线性空间也许是进入大学以后接触到的第一个空间的定义。

2,拓扑空间:在一个集合上定义了一个拓扑结构,这个集合连同这个拓扑结构就被称之为一个拓扑空间。

一个集合上的拓扑是指它的一个子集的集合,满足:集合本身和空集在这个集合中;任何多个元素的并与有限个元素的交都在这个集合中。

这样的集合与它上面的给出的一个拓扑称之为拓扑空间。一个集合可以给出不同的拓扑结构,从而构成不同的拓扑空间。

3,距离空间(度量空间):在集合中定义一个距离或者度量,就构成了一个距离(度量)空间。

集合上的距离满足三个条件:非负性;对称性;三角不等式。

任何一本泛函分析的教材都有距离空间的定义。

4,欧氏空间:我们接触得最多的空间。就是在集合上定义了欧氏距离的距离空间。欧氏距离定义为\[d(x,y)=\sqrt{(x_1-y_1)^2+(x_2-y_2)^2+\cdots+(x_n-y_n)^2}\]

这个空间我们在中学就在用了,我们日常所处的空间就是三维欧氏空间。

5,赋范空间:在集合上定义一个范数,此集合连同上面定义的范数就成为一个赋范空间。由范数可以导出集合上的距离,所以赋范空间也是距离空间。

范数与距离的不同之处在于,我们可以对集合上的一个元素定义范数 \(\|x\|\),它大致上相当于向量的长度。但是对于距离空间,没有这样的定义 \(d(x)\)。距离是针对两个点来定义的,虽然我们也有 \(d(x,x)=0\) 这样的性质。

6,巴拿赫(Banach)空间:巴拿赫空间是完备的赋范空间,所以它本身肯定是一个赋范空间。

所谓完备的,意思就是说若 \(x_n\in X\),及 \(\lim_{n\to \infty}x_n=x\),那么一定有 \(x\in X\)。也就是说,一个巴拿赫空间的收敛点列,其极限也在这个空间中。

7,内积空间:在一个集合上定义一个双线性形式,就形成一个内积空间。所谓的双线性形式,就是对两个元素都是线性的(加法和数乘)。

\[<x+y,z>=<x,z>+<y,z>,\quad <x,y+z>=<x,y>+<x,z>\]

\[<ax,y>=a<x,y>=<x,ay>\]

由内积可以导出集合上的范数,所以内积空间也是赋范空间。

8,希尔伯特(Hilbert)空间:完备的内积空间称为希尔伯特空间。同样,完备的意思就是集合上收敛的点列,它的极限也在这个集合当中。

距离空间,赋范空间,巴拿赫空间,内积空间,希尔伯特空间,这几个空间是泛函数分析的基本研究对象。

9,仿射空间(affine space):仿射空间是一个几何概念。粗略的说法,仿射空间就是没有原点的欧氏空间。在它上面没有距离、长度和角度的概念。但是两点相减可以得到一个向量。

任何一个线性空间是仿射空间。

它的严格定义可以参考仿射几何的教材。

10,射影空间(projective spaces):射影空间是一个把”平行直线相交于无穷远处”的描述进行形式化定义的几何对象。在仿射空间中定义一个“无穷远”的点,就形成了射影空间。

或者另外一个直观的定义是:\(n+1\) 维中的所有一维线性子空间的集合,称为 \(n\) 维射影空间。

11,测度空间:在一个集合上定义一个测度,称形成一个测度空间。一个集合上的测度满足两个条件:空集的测度为 \(0\);不相交的集合的并的测度,等于各个集合的测度之和。

很多实变函数的教材的用的这个定义,但是也有很多教材是从勒贝格外测度开始引入可测和测度。但事实上,勒贝格测度也满足这两个条件。当然除了勒贝格测度以外,还有别的测度。

12,概率空间:现代概率论里,概率空间就是一个全空间测度为 \(1\) 的测度空间。

在概率空间里,任何多个概率空间族的积空间仍然是概率空间。这是与测度空间不同的地方。在测度空间里,只有有限个测度空间的积空间仍然是一个测度空间。

13,\(L^p\) 空间:这是在实变函数里就遇到的空间。若

\[\int_a^b|f(x)|^pdx<\infty\]

我们\([a,b]\) 上满足这个条件的所有可测函数的集合为 \(L^p\) 空间。

\(L^P\) 空间是一个函数空间,也是现代数学里最基本的一个函数空间。

在本科阶段,大致上就是这些空间的定义,有些空间可能有的同学都不会遇到。研究生阶段的空间的定义会更多。当然,还有更多的数学空间的定义,我们就不列出来了。例如,索伯列夫(Sobolev)空间,洛伦兹(Lorentz)空间,豪斯道夫(Hausdorff)空间,哈代(Hardy)空间,等等。这些空间都有自身的空间结构。我们不展开叙述了。

Posted on

盘点数学中的各种收敛:收敛、逐点收敛、一致收敛、条件收敛、绝对收敛、强收敛、弱收敛……

如今网络兴起各种各样的盘点,我也来赶一下时髦,盘点一下数学里的各种相关的概念。这一篇我们来盘点一下大学数学之后的各种收敛性的概念。当然我们主要侧重于大学阶段的内容,研究生阶段的概念我们不多涉及。

大学数学从微积分开始,就会遇到各种各样的收敛性概念,例如逐点收敛与一致收敛,条件收敛与绝对收敛,强收敛与弱收敛,还有依距离收敛,依范数收敛,依概率收敛,依测度收敛等等等等。我们来简单地叙述这些概念。

1,收敛,意思就是极限存在。函数极限的直观定义是:当 \(x\) 无限趋近于 \(a\) 时,函数 \(f(x)\) 无限接近于常数 \(A\),我们就说 \(A\) 是函数 \(f(x)\) 当 \(x\to a\) 时的极限。或者说当 \(x\) 趋近于 \(a\) 时,函数 \(f(x)\) 的极限是 \(A\) 或者函数 \(f(x)\) 收敛于 \(A\)。

自从柯西给出了极限的严格定义后,极限的定义都采用了 \(\epsilon-\delta \) 语言来定义:

对所有的 \(\epsilon>0\),存在 \(\delta>0\),使得当 \(0<|x-a|<\delta\) 时, \(|f(x)-A|<\epsilon\) 成立,我们称当 \(x\) 趋于 \(a\) 时, \(f(x)\) 收敛于 \(A\)。记为

\[\lim_{x\to a}f(x)=A\]

之后基本上所有的收敛性概念都有类似于这样的叙述。

2,绝对收敛和条件收敛主要是针对级数而言。若极限

\[\lim_{n \to \infty}\sum_{i=1}^n|a_n|\]

存在,或者说绝对值级数 \(\displaystyle\sum_{n=1}^{\infty}|a_n|\) 收敛,我们就说级数 \(\displaystyle\sum_{n=1}^{\infty}a_n\) 绝对收敛。

若\(\displaystyle\sum_{n=1}^{\infty}|a_n|\) 发散,而 \(\displaystyle\sum_{n=1}^{\infty}a_n\) 收敛,我们就说级数 \(\displaystyle\sum_{n=1}^{\infty}a_n\) 条件收敛。

所谓发散,就是极限不存在。这是跟收敛相对的概念。

3,逐点收敛与一致收敛。这主要是对于函数列或者函数项级数而言。因为任何一个函数项级数都与一个函数列相对应,我们只对于函数列来叙述这两概念。

跟绝对收敛与条件收敛不同,逐点收敛与一致收敛之间的判断要困难得到多,也精细许多。绝对收敛是绝对值级数收敛,条件收敛是绝对值级数发散但本身收敛。

逐点收敛,是指对于任何一个 \(x\),函数列

\[\lim_{n\to\infty}f_n(x)=f(x)\]

这里的 \(x\) 固定,极限过程是 \(n\to \infty\)。也就是每次在 \(x\) 固定的时候,\(f_n(x)\) 的极限都是 \(f(x)\)。

但是要区分逐点收敛与一致收敛,这样的定义还不够,我们需要使用 \(\epsilon-\delta\) 语言。

我们来给出逐点收敛和一致收敛的严格定义。

逐点收敛:对所有的 \(x\in D\) (\(D\) 是函数列 \(\{f_n(x)\}_{n=1}^{\infty}\)的定义域),对任意给定的 \(\epsilon>0\),存在 \(N(x,\epsilon)>0\),当 \(n>N(x,\epsilon)\) 时, \(|f_n(x)-f(x)|<\epsilon\) 成立,我们就说函数列 \(\{f_n(x)\}_{n=1}^{\infty}\) 逐点收敛于 \(f(x)\)。

注意到这里 \(N\) 依赖于 \(x\) 和 \(\epsilon\),也就是说,不同 \(x\),\(N\) 可能取不同的值,相差也许很大。

但一致收敛不一样,

一致收敛:对所有的 \(x\in D\) ,对于任意给定的 \(\epsilon>0\),存在 \(N(\epsilon)>0\),当 \(n>N(\epsilon)\) 时, \(|f_n(x)-f(x)|<\epsilon\) 成立,我们就说函数列 \(\{f_n(x)\}_{n=1}^{\infty}\) 一致收敛于 \(f(x)\)。

这里显然的区别就是,一致收敛的 \(N\),不依赖于 \(x\) 的位置,就是不管 \(x\) 在什么地方,都可以用同一个 \(N\) 来确定。

这里我不举例来说明了,任何一本数学分析的教材应该都有详细的例子。

一致收敛一定逐点收敛,逐点收敛不一定一致收敛。也就是说,一致收敛的条件要更强,而逐点收敛的条件要更弱。

4,强收敛、弱收敛与弱*收敛。

强收敛与弱收敛是泛函分析中的概念。

强收敛:在赋范空间中,如果 \[\lim_{n\to\infty}\|x_n-x\|=0\]我们称点列 \(\{x_n\}\) 强收敛于 \(x\),这里 \(\|\cdot\|\) 的赋范空间的范数。强收敛也称为依范数收敛。

也就是说,强收敛是在范数的意义下的收敛。

弱收敛:如果对于任意的 \(f\in X^*\),有 \[\lim_{n\to\infty }\|f(x_n)-f(x)\|=0\]我们称点列 \(\{x_n\}\in X\) 弱收敛于 \(x\)。这里 \(X^*\) 是赋范空间 \(X\) 的对偶空间,就是由 \(X\) 上的所有泛函所组成的赋范空间。

所谓泛函,简单地说,就是函数的函数。它的定义域是线性空间,值域是数。就是将线性空间中的每一个元素变成一个数。泛函是算子的一种特殊形式,这个概念我们另外发文说明。

弱*收敛:将弱收敛反过来看,就是弱*收敛。

如果对于任意的 \(x\in X\),有 \[\lim_{n\to\infty }\|f_n(x)-f(x)\|=0\]我们称点列 \(\{f_n\}\in X^*\) 弱*收敛于 \(f\)。

强收敛一定弱收敛,弱收敛不一定强收敛。弱收敛与弱*收敛可能一致,可能不一致,也没有谁更强,谁更弱。如果 \(X\) 是自反空间,那么弱收敛与弱*收敛是一致的。

所谓自反空间,就是 \(X**=X\),也就是说,\(X\) 是它的对偶空间 \(X*\) 的对偶空间。希尔伯特空间都是对偶空间。

5,依距离收敛:若距离空间 \(X,d\) 中的点列 \(\{x_n\}\) 满足

\[\lim_{n\to\infty}d(x_n,x)=0\]

我们就说 \(\{x_n\}\) 依距离收敛于 \(x\),或者直接说 \(x_n\) 收敛于 \(x\)。因为所有的收敛概念,都是在某种距离的意义下的收敛。或者说,有了距离的概念,才有了收敛的概念。

6,依范数收敛:就是依赋范空间的范数收敛

点列:\[\lim_{n\to\infty}\|x_n-x\|=0\]称 \(x_n\in X\) 依范数收敛于 \(x\in X\)。它与点列的强收敛是同一个意思。

泛函:\[\lim_{n\to\infty}\|f_n-f\|=0\]称 \(f_n\in X*\) 依范数收敛于 \(f\in X*\)。它是对偶空间里的强收敛。

算子:\[\lim_{n\to\infty}\|T_n-T\|=0\]称 \(T_n\in B(X,Y)\) 依范数收敛于 \(x\in B(X,Y)\)。其中 \(B(X,Y)\) 是 \(X\) 到 \(Y\) 的所有算子所组成的赋范空间。

需要注意的是,算子的依范数收敛,也称为算子的一致收敛。

算子的强收敛是指对任意 \(x\in X\),\[\lim_{n\to\infty}\|T_n(x)-T(x)\|=0\] 所以对于强收敛或者一致收敛,我们要指明是哪个空间上的收敛。

7,依测度收敛与依概率收敛:

依测度收敛与几乎处处收敛是实变函数、实分析或者测试论里的概念。依概率收敛是概率论里的概念。但事实上,它们的定义几乎就是一样的。

依测度收敛:我们说一个可测函数列 \(f_n\in X\) 依测度收敛于 \(f\in X\) 是指对于任意的 \(\epsilon>0\) \[\lim_{n\to\infty}\mu(\{x:|f_n(x)-f(x)|\geq \epsilon\})=0\]

这里 \(\mu\) 是定义在 \(X\) 上的一个测度。

依概率收敛:如果对于任意对于任意的 \(\epsilon>0\),随机变量序列 \(X_n\) 满足

\[\lim_{n\to\infty}P(|X_n-X|\geq \epsilon)=0\]

我们称随机变量序列 \(X_n\) 依概率收敛于随机变量 \(X\)。

如果将概率看成测度,那么依概率收敛就是一种依测度收敛。

8,几乎处处收敛:

这是实变函数或者实分析中的概念。“几乎处处”是指除去一个零测集外,每一个点处满足的概念。

我们说一个函数列 \(\{f_n\}\) 几乎处处收敛于 \(f\),是指

\[\mu(\{x:\lim_{n\to \infty}(f_n(x)-f(x))\ne 0\})=0\]

换句话说,就是函数列 \(f_n\) 不收敛于 \(f\) 的所有的点的集合,测度为 \(0\)。

9,结语:一般来说,分析学各课程,都少不了各种各样的收敛概念,因为收敛性这一概念是分析学科的基础。有了这些基础,才能更一步理解后续的内容。

Posted on

抽象的数学怎么学

(这是我在博雅教育学会公益讲座的讲稿,现在整理出来供大家参考)

这是当时 的讲稿,可以下载:

我们知道,数学越学到后面,概念越来越抽象,运算也越来越抽象。我们要怎么样学才会比较容易呢?

我用一句话概括,就是:抽象的数学要用具体的例子和计算来学。

这样说,是不是太抽象了呀?那我们就用一些具体的例子来说明这句话。

先看两个简单的、高中的例子。

我每年在辅导学生的时候,都会碰到类似这样做题的:

\[\require{cancel}\frac{6-x}{2x}=\frac{6-\cancel {x}}{2\cancel {x}}=\frac{5}{2}\]

一般的情况下,我不会跟学生说对不对,也不会说哪里错了,我会问,如果 \(x=2\),那会怎么样呢?

\[\frac{6-2}{2\cdot 2}=\frac{5}{2} ?\]

学生简单一算,两边不相等,就知道这样运算是不对的。然后我再告诉他们,什么样才是对的。

变量对于初高中生来说,是比数字更抽象的概念,那么理解关于变量的运算或者相关概念的时候,数字就是具体的例子。

第二个例子,就是复合函数的定义。

两个函数 \(f\) 和 \(g\) 的复合函数 \(f\circ g\) 的定义为

\[(f\circ g)(x)=f(g(x))\]

意思就是我们用 \(g(x)\) 来代替 \(f(x)\) 表达式里的所有的 \(x\)。例如

\[f(x)=x^2+x+3, g(x)=2x+1\]

那么 \[(f\circ g)(x)=f(g(x))=f(2x+1)=(2x+1)^2+(2x+1)+3\]

这么讲,还是很多同学不能理解这个概念,那么我一般是这么进行的,问

\[f(2)=?\]

这时候基本上都会

\[f(2)=2^2+2+3\]

同样的再问几个同样的问题

\[f(5)=5^2+5+3=33,\cdots\]

这时候,基本上知道是用括号里的数字代替 \(x\),进一步,用别的字母代替数字,

\[f(a)=a^2+a+3, f(b)=b^2+b+3\]

更进一步用别的字母的表达式代替数字

\[f(a+1)=(a+1)^2+(a+1)+3\]

这时候基本上就懂了,知道是用括号里的表达式来代替原本 \(f(x)\) 表达里的所有 \(x\),

\[f(2x+1)=(2x+1)^2+(2x+1)+3\]

这两个例子都是用数字来具体化变量,因为相对于数字来说,变量就是抽象的。碰到变量相关的概念和运算,用具体的数字来举例,就比较容易理解了。

接下来的例子来自于大学课程。首先是无限并与无限交的概念。

设 \(\displaystyle A_n=(-\infty,-\frac{1}{n}]\cup[\frac{1}{n},\infty)\),求

\[\bigcup_{n=1}^{\infty}A_n,\quad \bigcap_{n=1}^{\infty}A_n\]

这样的问题,有些同学看到这么一大堆符号,首先就懵了。实际上,对于无限的运算,我们先写出有限项来,然后可以看出一些规律。

我们先把表达式写得更具体一些

\[\bigcup_{n=1}^{\infty}A_n=A_1\cup A_2\cup A_3\cup\cdots\]

\[\bigcap_{n=1}^{\infty}A_n=A_1\cap A_2\cap A_3\cap\cdots\]

然后把 \(A_1,A_2,A_3,\cdots\) 的具体表达式写出来,

\begin{align*}&A_1=(-\infty,-1]\cup[1,\infty), A_2=(-\infty,-\frac{1}{2}]\cup[\frac{1}{2},\infty),\\ & A_3=(-\infty,-\frac{1}{3}]\cup[\frac{1}{3},\infty),\cdots\end{align*}

现在可以看出,\(A_1\subset A_2\subset A_3\subset\cdots\),\(A_1\) 是所有其它集合的子集,从而

\[\bigcap_{n=1}^{\infty}A_n=A_1\cap A_2\cap A_3\cap\cdots=(-\infty,-1]\cup[1,\infty)\]

同理,

\[\bigcup_{n=1}^{\infty}A_n=A_1\cup A_2\cup A_3\cup\cdots=\lim_{n\to\infty}A_n= (-\infty,0)\cup(0,\infty)\]

这里我们把比较抽象的无限运算用有限的几个集合的具体表达式就算出来了。

我们再看一个集合族的问题。事实上,这个问题是我这个讲座的最初的来源。

\[X_t=\left\{x\in\mathbb{R}\Big| 1+\frac{1}{t}<x<2+\frac{1}{t}\right\}\]

\[\bigcap_{t>0}X_t,\quad \bigcap_{t>1}X_t, \quad \bigcup_{t>0}X_t\]

这样的集合族,都没办法象之前那个例子一样,列出全部的集合来。因为 \(t>0, t>1\) 都是不可数集。我在当时跟问这个问题的同学说,你先列几个集合出来看看,或许就可以找到答案了。

我们这样试一下,

\[X_{0.001}=\{x|1001<x<1002\}=(1001,1002)\]

\[ X_1=(2,3), X_2=(\frac{3}{2},\frac{5}{2}), X_{1000}=(1.001,2.001),\cdots\]

观察一下,就知道,\(X_{0.001}\) 和 \(X_1\) 都是不相交的,或者它们的交集是空集,那么集合族的交集自然是空集。也就是说

\[\bigcap_{t>0}X_t=\emptyset\]

另外 \(t\) 越大, \(X_t\) 越接近于 \((1,2)\),\(t\) 越小,\(X_t\) 越接近于长度为 \(1\) 的区间,其端点趋近于无限远。所 以

\[ \bigcup_{t>0}X_t=(1,\infty)]\]

而 \(t>1\) 时,

\[X_{1.001}=(1.999,2.999),\]

\[ X_2=(\frac{3}{2},\frac{5}{2}),X_{1000}=(1.001,2.001),\cdots\]

可以看出,所有 \(X_t\) 只有一个共同点 \(2\),也就是

\[\bigcap_{t>1}X_t={2}\]

这里我们可以看到,不可数的集合,我们可以用可数的集合来具体化运算,可以简化或者帮助我们理解与运算。

接下来看两个抽象的概念。

我们说一个 \(\mathbb{R}^n\) 上的一个子集 \(\mathcal {U}\) 是一个线性子空间是指它满足这三个条件:

(1)\(\vec{0}\in\mathcal{U}\);

(2)如果 \(\vec{x},\vec{y}\in\mathcal{U}\),那么 \(\vec{x}+\vec{y}\in\mathcal{U}\);

(3)如果 \(\vec{x}\in\mathcal{U}\),那么对任意的 \(\lambda\in \mathbb{R}\),有 \(\lambda\vec{x}\in\mathcal{U}\)。就是任何两个元素之和在集合里面,任何一个元素的数乘也在集合里面。

我们用一个例子来说明这个概念。

集合\[\mathcal{U}=\left\{\vec{x}=\begin{pmatrix}x\\y\\0\end{pmatrix}, x,y\in\mathbb{R}\right\}\]

是 \(\mathbb{R}^3\) 上的一个线性子空间。

但是这个例子还是有点抽象,那我们用更加具体的例子来说明。这个例子说的是,一个集合是由这样的向量组成:第一个分量和第二个分量是任意的数,第三个分量是 \(0\),那么这样的两个向量是在这个集合里的

\[\begin{pmatrix}1\\2\\0\end{pmatrix}\in\mathcal{U},\begin{pmatrix}-2\\1\\0\end{pmatrix}\in\mathcal{U}\]

它们的和也是这种形式的,对它们乘以一个数也是这种形式的,

\[\begin{pmatrix}1\\2\\0\end{pmatrix}+\begin{pmatrix}-2\\1\\0\end{pmatrix}=\begin{pmatrix}-1\\3\\0\end{pmatrix}\in\mathcal{U}, \quad 3\begin{pmatrix}1\\2\\0\end{pmatrix}=\begin{pmatrix}3\\6\\0\end{pmatrix}\in\mathcal{U}\]

所以两向量的和也在这个集合里,数乘也在这个集合里面,所以这个集合就是一个线性子空间。

最后我们看一个本科高年级的概念:拓扑

一个集合 \(X\) 上的拓扑是指 \(X\) 的一个子集的集合 \(\mathcal{T}\),满足:

(1)\(X\in\mathcal{T},\emptyset\in\mathcal{T}\):

(2) 任何个 \(\mathcal{T}\) 里的元素的并也在 \(\mathcal{T}\) 里 (无限并在 \(\mathcal{T}\) 中);

(3) \(\mathcal{T}\) 中有限个元素的交也在 \(\mathcal{T}\) 中(有限交在 \(\mathcal{T}\) 中)。

我们很多拓扑学教材,或者泛函分析的教材,对拓扑的举例也都是一些比较抽象的例子,基本上是函数空间或者其它的无限维空间,使得这些例子对于理解这个概念并无多大帮助。其实越简单的例子,越能帮助理解。我们来看一个简单的例子:

设 \(X=\{a,b\}\), 则 \(X\) 的所有子集为 \(\{\emptyset, \{a\},\{b\},\{a,b\}\}\),我们可以定义 \(\mathcal{T}=\{\emptyset,\{a\},\{a,b\}\}\)。那么可以直接验证

(1)\(\displaystyle\emptyset\in\mathcal{T},\quad X=\{a,b\}\in\mathcal{T}\)

(2)\[\emptyset\cup\{a\}=\{a\}\in \mathcal{T},\]

\[ \emptyset\cup\{a,b\}=\{a,b\}\in\mathcal{T}, \]

\[\{a\}\cup\{a,b\}=\{a,b\}\in\mathcal{T}\]

\[ \emptyset\cup\{a\}\cup\{a,b\}=\{a,b\}\in\mathcal{T}\]

(3)\[\emptyset\cap\{a\}=\emptyset\in\mathcal{T}\]

\[\emptyset\cap\{a,b\}=\emptyset\in\mathcal{T}\]

\[\{a\}\cap\{a,b\}=\{a\}\in\mathcal{T}\]

\[\emptyset\cap\{a\}\cap\{a,b\}=\emptyset\in\mathcal{T}\]

我们看到拓扑所要求的三个条件都满足,所以 \(\mathcal{T}\) 是 \(X\) 的上拓扑。

另外一个例子,定义 \(\mathcal{T}_2=\{\emptyset,\{a\},\{b\}\}\),那么 \(\mathcal{T}_2\) 不是 \(X\) 上的一个拓扑。因为

\[\{a\}\cup\{b\}=\{a,b\}=X\notin\mathcal{T}_2\]

所以 \(\mathcal{T}_2\) 不是 \(X\) 上的拓扑。

最后几句话。

(1)例子越简单,越具体,越能理解抽象的定义与定理;

(2)例子不能代替证明,只能帮助理解;

(3)高年级的课程,总是能在低年级课程里面找到例子。

Posted on

线性代数必会技巧细说

公共课的线性代数,它的所有的计算基本上基于两个技巧:初等变换,行列式的计算。当然,这里不包括数学系的线性代数或者高等代数课程,数学系的线性代数或者高等代数,不以计算为主。

公共课的线性代数,计算基本上离不开这两个技巧。甚至,可以将行列式的计算也归入到初等变换中来,这样,线性代数的计算技巧就只有一个:初等变换。掌握了这个技巧,那么线性代数的计算将不是一个问题。我们将这个题目细细地述说一下。

一、解线性方程组及判定方程组有解无解:只需要将系数矩阵(齐次线性方程组)或者增广矩阵(非齐次线性方程组)作初等变换,将它们化成行最简矩阵,则可以直接写出方程组的解(或者判定方程组有解无解)。例如,对线性方程组 \(A\vec{x}=\vec{b}\),其中
\[A=
\begin{pmatrix}
1& 1& 2& 3\\
2& 0& 0& 2\\
3 &2& 4& 7
\end{pmatrix},\quad
\vec{b}=
\begin{pmatrix}
1\\
4\\
4
\end{pmatrix}
\]

的增广矩阵作初等变换,化成行最简矩阵,

\[
(A,\vec{b})=
\begin{pmatrix}
1& 1& 2& 3 &\vdots& 1\\
2& 0& 0& 2&\vdots& 4\\
3 &2& 4& 7 &\vdots& 4
\end{pmatrix}
\sim
\begin{pmatrix}
1& 0& 0&1 &\vdots&2\\
0& 1& 2& 2&\vdots& -1\\
0 &0& 0& 0&\vdots& 0
\end{pmatrix}
\]

则方程组的解为

\[
\vec{\xi}=c_1
\begin{pmatrix}
0\\
-2\\
1\\
0
\end{pmatrix}+c_2
\begin{pmatrix}
-1\\
-2\\
0\\
1
\end{pmatrix}+
\begin{pmatrix}
2\\
-1\\
0\\
0
\end{pmatrix}
\]

这一部分,可以参考文章如何快速地写出方程组的解?

二、求行列式。求数字行列式的基本方法是降阶法,就是先用初等变换,将行列式的一行或者一列化成只有一个不为 \(0\),然后按这一行或者这一列展开,行列的阶就降了一阶,依次进行,最后变成二阶行列式,就可以利用二阶行列式的公式计算了。例如

\begin{align*}|A|&=\begin{vmatrix}1&1&-1&3\\ -1&-1&2&1\\ 2&5&2&4\\ 1&2&3&2\end{vmatrix}=\begin{vmatrix}1&1&-1&3\\ 0&0&1&4\\0&3&4&-2\\0&1&4&-1\end{vmatrix}\\&=\begin{vmatrix} 0&1&4\\3&4&-2\\1&4&-1\end{vmatrix}=\begin{vmatrix} 0&1&4\\0&-8&1\\1&4&-1\end{vmatrix}=\begin{vmatrix} 1&4\\-8&1\end{vmatrix}=33\end{align*}

就是先将第一列化成只有一个元素不为 \(0\),然后再将行列式按第一列展开,从四阶变成三阶;然后再做初等变换,将新的行列式的第一列化成只一个元素不为 \(0\),再按照第一列展开,变成二阶行列式,最后利用二阶行列式的公式得到了行列式的值。

这一部分,可以参考课程行列式的性质及其计算

三、求逆矩阵。求逆矩阵的方法是将方阵与单位矩阵横排成一个新的矩阵,再对这个矩阵作初等变换,当矩阵的左边,就是原方阵,变成单位矩阵的时候,右边的矩阵,就是单位矩阵就变成了原方阵的逆矩阵了。例如,求 \(A=\begin{pmatrix}0&1&2\\ 1&0&3\\ 4&-3&8\end{pmatrix}\) 的逆矩阵。

\begin{align*}(A,I)&=\begin{pmatrix}0&1&2&\vdots&1&0&0\\ 1&0&3&\vdots&0&1&0\\ 4&-3&8&\vdots&0&0&1\end{pmatrix}\sim\begin{pmatrix}1&0&3&\vdots&0&1&0\\0&1&2&\vdots&1&0&0\\ 4&-3&8&\vdots&0&0&1\end{pmatrix} \\ &\sim \begin{pmatrix}1&0&3&\vdots&0&1&0\\0&1&2&\vdots&1&0&0\\ 0&-3&-4&\vdots&0&-4&1\end{pmatrix}\sim \begin{pmatrix}1&0&3&\vdots&0&1&0\\0&1&2&\vdots&1&0&0\\ 0&0&1&\vdots&\frac{3}{2}&-2&\frac{1}{2}\end{pmatrix}\\ &\sim \begin{pmatrix}1&0&0&\vdots&-\frac{9}{2}&7&-\frac{3}{2}\\0&1&0&\vdots&-2&4&-1\\ 0&0&1&\vdots&\frac{3}{2}&-2&\frac{1}{2}\end{pmatrix}\end{align*}

所以 \(A^{-1}=\begin{pmatrix}-\frac{9}{2}&7&-\frac{3}{2}\\-2&4&-1\\ \frac{3}{2}&-2&\frac{1}{2}\end{pmatrix}\)

这一部分,可以参考文章如何求矩阵的逆矩阵?

四、判断向量组线性相关还是线性无关。具体做法是,将(列)向量组横排成一个矩阵,然后将这个矩阵作初等变换,如果矩阵的秩(就是行阶梯矩阵的非零行的行数)小于向量的个数,就是线性相关;如果等于向量的个数,就是线性无关。例如,\(\vec{a}_1=\begin{pmatrix}1\\-1\\0\end{pmatrix}, \vec{a}_2=\begin{pmatrix}1\\2\\0\end{pmatrix}, \vec{a}_3=\begin{pmatrix}1\\0\\3\end{pmatrix}\), 问 \(\vec{a}_1,\vec{a}_2,\vec{a}_3\) 是线性相关还是线性无关?

解法是,

\begin{align*}A&=(\vec{a}_1,\vec{a}_2,\vec{a}_3)=\begin{pmatrix}1&1&1\\ -1&2&0\\ 0&0&3\end{pmatrix}\sim \begin{pmatrix}1&1&1\\ 0&3&1\\ 0&0&3\end{pmatrix}\end{align*}

\(R(A)=3\),所以向量组线性无关。

五、求向量组的极大无关组,以及将其它向量用极大无关组线性表示。做法是,将(列)向量组横排成一个矩阵,将这个矩阵做初等变换,化成行最简矩阵,行最简矩阵的每一个非零行的第一个非零元所在的列,对应原矩阵的列向量,就是极大无关组的向量。行最简矩阵的各列之间的关系,就是原矩阵各向量之间的关系。例如,求向量组\[\vec{a}_1=\begin{pmatrix}1\\1\\-2\\4\end{pmatrix},\vec{a}_2=\begin{pmatrix}-2\\-1\\0\\1\end{pmatrix}, \vec{a}_3=\begin{pmatrix}9\\6\\-6\\9\end{pmatrix},\vec{a}_4=\begin{pmatrix}5\\5\\1\\1\end{pmatrix},\vec{a}_5=\begin{pmatrix}4\\-3\\-2\\-9\end{pmatrix}\] 的极大无关组,并且将其它向量用极大无关组线性表示。

\[( \vec{a}_1 , \vec{a}_2 , \vec{a}_3 , \vec{a}_4 , \vec{a}_5 )=\begin{pmatrix} 1&-2&9&5&4\\ 1&-1&6&5&-3\\ -2&0&-6&1&-2\\ 4&1&9&1&9 \end{pmatrix}\sim \begin{pmatrix} 1&0&3&0&0\\ 0&1&-3&0&-7\\ 0&0&0&1&-2\\ 0&0&0&0&0 \end{pmatrix} \]

所以原向量组的一个极大无关组为

\[ \vec{a}_1=\begin{pmatrix}1\\1\\-2\\4\end{pmatrix},\quad \vec{a}_2=\begin{pmatrix}-2\\-1\\0\\1\end{pmatrix},\quad \vec{a}_4=\begin{pmatrix}5\\5\\1\\1\end{pmatrix} \]

而其它两个向量可以用极大无关组表示

\[\vec{a}_3=3\vec{a}_1-3\vec{a}_2,\quad \vec{a}_5=-7\vec{a}_2-2\vec{a}_4 \]

这一部分的内容,可以参考文章如何求一个向量组的极大无关组,以及如何用极大无关组线性表示其它向量?

六、特征值、特征向量、矩阵的对角化。求特征值本质就是求行列式 \(|A-\lambda I|\),求特征向量就是解线性方程组 \((A-\lambda I)\vec{x}=0\),矩阵对角化就是将特征向量排成一个矩阵,就是前面几个部分的综合应用。这部分可以参考 线性代数复习:特征值、特征向量与矩阵对角化

七、行列式的计算:具体的数字行列式的计算,是利用初等变换得到。但也有一些计算方法,例如递推法,拆分法,是利用行列式的性质来进行计算,这些计算方法可以了解,不需要花大力气去掌握。实际上,行列的计算方法还有很多很多种,只是行列式在现代的线性代数里,没有一百多年前那么重要了,所以也没有必要花费太多的时间去研究。

八、正交化和投影。这是另一个不需要初等变换的地方,但需要掌握。这是内积空间的主要计算部分。

所以总的来说,如果初等变换不掌握,挂科、重修基本上是板上订钉的事儿了。当然如果掌握了上面所说的几个部分,线性代数应该就不太难了,不要说这门课有多精通,考试过关应该不成问题的。

Posted on

从会计中专生到大学数学老师:我是怎么自学数学的

我本来是中专生,专业是会计。后来自学数学,考取了数学专业的研究生,毕业后,去大学教数学。

我第一次接触高等数学,是中专毕业三年以后。那时候,连三角函数是什么东西我都弄不清楚。可以说,我是连高中数学的基础都没有。之前虽然在中专学过一年半的数学,但是一来时间过得太久,二来本来就学得不多,学得不好。

那时候的自学考试,是完全的“自学”。我在一个偏远山区的乡政府里上班,要去县城的话,一天只有一班车。学习的资料,除了自学考试的教材,就没有了,周围也没有别人参加自学考试,更不用说找到懂数学的人了。那时也没有什么学校开办自学考试班,就算是有,也没办法参加,一没钱,二没时间。

听其它的朋友说过一个故事,说有一个人参加自学考试,其它十二门都考过了,就高等数学考了好几次,都不及格,在最后一门课程竟然放弃了!

那个时候,自学考试一年考两次,一月份报名,四月份考,七月份报名,十月份考。我拿到高等数学教材以后,看了一个月的书,结果是连极限的概念都没弄懂,后面只有两个月的时间,把剩下的部分勉强学完了,去参加考试,结果差几分,没及格。后来再考一次,六十几分,总算是过了。

专科考完之后,我一边考研,一边考本科阶段自学考试。本科阶段的数学称为《高等数学(二)》,内容是线性代数与概率统计,这次是一次性考过,成绩忘记了。这次可能是因为考研需要要考这两门,一来学习时间更多,二来有了前次考试的经验,学起来更有效率一些。在本科还差四门课程就考完的时候,考上了研究生,就没有继续考本科课程了。

第一次参加考研,成绩是不忍卒睹,再一次参加考试,数学还是没能上线。再下一次,准备考试时,整整做完了一本高等数学习题集,又将一本线性代数教材的课后习题全做完,只是概率统计没能做太多的习题。这一次的考试,数学的成绩是62。那时候的总分是 100分, 数学单科分数线经常是 50 分,有时候甚至是 45 分上线。62 分,算得上是难得的高分了。

我记得那一年去学校研究生院查分,老师先问我几门公共课的分数,我报了我的分数后(英语61,政治61,数学62)以后,老师非常惊讶:公共课这么高的分数,怎么会没上线?(我总分324,分数线325,差一分上线)因为两门专业课分别为69分和71分,对于其它同学,专业课动不动就八、九十分来说,我这专业课分数跟没学差不多。

后来,听其它同学说,会计专业(或者经济专业)的专业课的考试题,很多都是老师在课堂上讲过的,或者曾经是这门课的作业,这对我来说,极为不利。于是在那一年,决定换专业,转学理工,考虑的就是理工科,不管哪个学校,内容应该都差不多,不会因为不同的老师有太大的差异。

考虑过后,理工类的课程,我只学过几门数学,所以决定转学数学。我学过的是高等数学、线性代数及概率统计,数学系对应的课程为数学分析、高等代数与概率统计。于是,那一年又将没有学过的数学专业部分的内容学了一遍。也正是那一年,我考上了研究生。

在学校通知复试的同时,学校通知我需要加考两门专业课(我是专科生,又是跨专业),于是,接到通知后的两个星期内,我又突击学习了两门数学专业课:解析几何和常微分方程。当时捡了最重要的部分学习,最后通过了复试。

入学以后,我的入学成绩是全班同学的最后一名,数学基础是所有同学中最差的。入学时,满打满算,我也就学了五门数学课程。在上研究生课程时,很多课程没法听懂,因为先修课程没学过。这期间只有不断地补本科的课程,才能跟得上研究生课程的学习。又因为没办法去跟本科生一起上课,又只有自学。复变函数、实变函数、泛函分析、抽象代数、数学物理方程这些课程都是这段时间补上的。毕业时,总算是补上了本科阶段的数学知识。

研究生毕业,进入大学教书以后,我花了大量业余时间去学习读研时没弄懂的内容。这也是我的一个个性,以前没弄懂的东西,总是想方设法去弄懂。这样持续几年以后,将以前读研时没弄懂的,缺的知识慢慢补上来,最后终于能够独立地进行数学研究,发表几篇不入流的数学论文,算是一个真正的数学工作者了。

在我自学数学的这些年中,走了不少冤枉路,特别是在头几年,学习方法和学习效率都不好。幸好慢慢地也积累了一些学习的经验,现在总结一下,可供同学们参考,希望对同学们能有所帮助。

一、教材。我在学每一门课程时,手头都备有好几本教材,除了开始的那段时期外,那时候没地方买书。 不同的教材,叙述的方式都不尽相同,相当于不同的老师,教学的风格都不一样。而且,不同的教材,对同一个问题的叙述都不一样,解释的角度也不一样。如果在一本教材里,某个问题你看不懂,也许换一个教材,换一个说法你就懂了。

当然,这些教材里,你需要选一本作为主要的教材,以这本教材作为学习的主线和主要顺序,其它的教材,在需要的时候参考,没必要每一本教材都完整地看一遍。

二、关于看书。我最大的教训在这里。以前学的专业是会计,又爱看小说。看书的时候,往往一目五行甚至十行,对于感觉不重要的部分或者不感兴趣的细节,往往直接跳过。对于很多解释性的文字,往往直接忽略。这样看书的速度很快,也不太影响专业知识的获取。但是看数学书就不一样了,看数学书,得一行一行地看,一个字一个字的看。有时候一个字没看到,就理解不了 一个定义或者定理。解释性的文字,不看的话,就不能很好地理解前面的讲述的内容。所以看数学书,一定仔细,不能略过任何一部分。

另外,看数学书,往往需要看一两行或者一两段,就停下来思考一下,自己是不是真懂了这一部分,能不能够用自己的话将这一部分解释清楚,能不能自己给出一个具体的例子等等。这些都是能够检验你是不是真正理解了这些内容。

三、关于例题。书上的例题应该自己动手做一遍。看懂例题是没有用的。我刚开始学数学时,看完例题就去做题,可经常做不对,又只好回来看例题,对照着例题,一步一步地看,看看自己做的题到底是什么地方出错了。后来,每个例题都自己先做一遍,再去做习题,这样做题的准确率更高了,做题的思路也更清晰,做题的速度也更快了。

做例题,不能看着它的解答一步一步跟着做,这样做出来的例题,也不是你的。你需要将例题的解答盖住,把例题当成习题来做,做完后再对照解答,看看不没有什么地方没有掌握。如果不能一次将例题从头做到尾,就证明这个例题你没有掌握。

四、关于做题。没有哪一个人能够不做题就学会数学了的。很多的数学教材在序言里会来这么一句:习题是本教材的一部分,同学应该尽量们多做课后的习题。

要想完完全全掌握一门数学课程,应该做完一本习题集,至少至少应该做完书后的习题。我前面几次考研,数学都考得很惨,但当我做完一本高等数学习题集,特别是做完习题集里面所有不定积分的题目时,突然感觉高等数学好简单!再之后,做完了一本线性代数课后的习题,也感觉线性代数变得简单多了。当年的数学就考得比较理想。

五、关于习题集。习题集应该是只有答案没有解答的习题集。你做完了知道自己做得对不对。不对的话,再仔细检查自己错在哪里。查错的过程能让你的理解能力提升一大截。有解答的习题集让你不自觉地去看它的正确解答,远不如自己查出自己错在哪里对你有用。

以上这些就是我这些年学习数学的经验,希望能对你有用。如果你觉得有用,可以推荐给你的同学朋友,谢谢!

Posted on

利用高阶微分方程求解一阶线性微分方程组

我们知道,每一个高阶微分方程都可以对应一个一阶微分方程组,所以高阶的微分方程可以用一阶微分方程组来求解。反之,一阶的微分方程组也可以用高阶的微分方程来求解。我们来看一下如何利用高阶微分方程来求解一阶的线性微分方程组。

我们以两个函数的方程组来说明如何使用这个方法。设有一阶方程组

\begin{cases}\frac{dx}{dt}=f(t,x,y)\\ \frac{dy}{dt}=g(t,x,y)\end{cases}

将第一个方程求导,得到 \(\displaystyle\frac{d^2x}{dt^2}=\frac{df}{dt}\),将方程组代入到右边,得到 \[\frac{d^2x}{dt^2}=h(t,x,y)\]

然后将此式与第一个方程联立,消去 \(y\),得到关于 \(x\) 的二阶方程,求出此方程,再代入到方程组里的第二个方程,就可以求出 \(y\)。

对于三个和三个以上的未知函数的方程,可以类似处理。

我们来看例题。

例1,求方程组的通解,

\begin{cases}\frac{dx}{dt}+y=\cos t\\ \frac{dy}{dt}+x=\sin t\end{cases}

解:将第一个方程对 \(t\) 求导,得到

\[\frac{d^2x}{dt^2}+\frac{dy}{dt}=-\sin t\]

将 \(\frac{dy}{dt}=-x+\sin t\) 代入上式,得到

\[\frac{d^2x}{dt^2}-x=-2\sin t\]

利用二阶常系数非齐次方程的解,不难求出它的通解为 \[x=C_1e^{x}+C_2e^{-x}+\sin t\]

将它代入第二个方程,得到

\[\frac{dy}{dt}+C_1e^{x}+C_2e^{-x}+\sin t=\sin t\]

也就是

\[\frac{dy}{dt}=-C_1e^{x}-C_2e^{-x}\]

两边积分,就得到

\[y=-C_1e^x+C_2e^{-x}\]

所以方程的通解为

\begin{cases}x=C_1e^{x}+C_2e^{-x}+\sin t\\ y=-C_1e^x+C_2e^{-x}\end{cases}

Posted on

如何理解中心极限定理?

学到中心极限定理的时候,很多同学一看到那一大堆的公式与叙述的时候,就感到头大。实际上,中心极限定理很容易理解。

我们看到,一般的正态分布 \(X\sim N(\mu,\sigma^2)\) 可以通过变换 \(\displaystyle Y=\frac{X-\mu}{\sigma}\sim N(0,1)\) 将一般正正态分布化成标准正态分布。我们知道一般正态分布 \(X\sim N(\mu,\sigma^2)\) 中的参数 \(\mu\) 就是随机变量的期望,\(\sigma^2\) 就是方差,\(\sigma\) 就是标准差。一般正态分布的这个变换用文字来表示就是

\[\frac{\text{随机变量}-\text{期望}}{\text{标准差}}\]

服从标准正态分布。

那么中心极限定理可以这么理解:\[\frac{\text{随机变量}-\text{期望}}{\text{标准差}}\] 近似服从标准正态分布,它以标准正态分布为极限。

我们首先来看一下独立同分布的中心极限定理,若 \(X_1,X_2,\cdots, X_n\) 相互独立,服从同一分布,具有期望(均值)\(E(X_i)=\mu\) 和方差 \(D(X_i)=\sigma^2, 1\le i\le n\),那么 \(\sum_{k=1}^nX_k\) 的期望与方差为 \(E(\sum_{k=1}^nX_k)=n\mu\), \(D(\sum_{k=1}^nX_k)=n\sigma^2\),标准差为 \(\sqrt{n}\sigma\),而中心极限定理给出了随机变量

\[\frac{\sum_{k=1}^nX_k-n\mu}{\sqrt{n}\sigma}\]

以正态分布为极限。

同样的分析,二项式分布 \(X\sim B(n,p)\) 的均值为 \(E(X)=np\),方差为 \(D(X)=npq\),中心极限定理给出了

\[\frac{X-np}{\sqrt{npq}}\]

以标准正态分布为极限。

李雅普诺夫定理是一样的。若 \(X_1,X_2,\cdots,X_n\) 相互独立,具有期望 \(E(X_i)=\mu_i\),方差 \(D(X)=\sigma^2_i, 1\le i\le n\),那么由期望与方差的性质,\(\sum_{k=1}^nX_k\) 的期望为 \(E(\sum_{k=1}^nX_k)=\sum_{k=1}^n\mu_k\),方差为 \(D(\sum_{k=1}^nX_k)=\sum_{k=1}^n\sigma^2_k\),中心极限定理给出了

\[\frac{\sum_{k=1}^nX_k-\sum_{k=1}^n\mu_k}{\sqrt{\sum_{k=1}^n\sigma^2_k}}\]

以标准正态分布为极限。

Posted on

如何计算对坐标的曲面积分

对坐标的曲面积分可能是高等数学里最难的一部分了,这里我们总结了求对坐标的曲面积分的各种方法,并且举例说明这些方法的应用范围。

本文 pdf 文件下载:

1,计算方法
对坐标的曲面积分的计算方法主要是三种:直接计算,利用向量形式的曲面积分(两类曲面积分的关系),以及利用高斯公式来计算。

(1)直接计算
直接计算的话,就是将曲面积分化成二重积分来算,例如
\begin{align*}\iint_SR(x,y,z)dxdy=\pm\iint_{D_{xy}}R(x,y,z(x,y))dxdy\end{align*}
这里 \(D_{xy}\) 就是曲面在 \(xOy\) 平面上的投影,如果是曲面的上侧,取正号,如果是曲面的下侧,则取负号。同理
\[\iint_SQ(x,y,z)dzdx=\pm\iint_{D_{zx}}Q(x,y(x,z),z)dzdx\]
\(D_{zx}\) 就是曲面在 \(xOz\) 平面上的投影,曲面右侧取正,左侧取负;
\[\iint_SP(x,y,z)dydz=\pm\iint_{D_{yz}}Q(x(y,z),y,z)dydz\]\(D_{yz}\) 就是曲面在 \(yOz\) 平面上的投影,前侧取正,后侧取负。

2,利用曲面积分的向量形式(两类曲面积分的关系)

因为 \[\iint_SP(x,y,z)dydz+Q(x,y,z)dzdx+R(x,y,z)dxdy=\iint_S\vec{F}(x,y,z)\cdot \vec{n}dS\] 这里 \(\vec{F}=(P(x,y,z),Q(x,y,z),R(x,y,z))\), \(\vec{n}\) 是曲面的单位法向量。我们分两种情况计算。

(1)曲面由 \(z=f(x,y)\) 给出,则\[\iint_S\vec{F}\cdot\vec{n}dS=\pm\iint_D(P(x,y,z),Q(x,y,z),R(x,y,z))\cdot(-f_x,-f_y,1)dxdy\]如果曲面是上侧,就取正,如果曲面是下侧,就取负。

这是因为如果曲面取上侧,曲面法向量的第三个分量为正,所曲面的法向量为 \(\vec{N}=(-f_x,-f_y, 1)\);曲面下侧,第三个分量取负,所以 \(\vec{N}=(f_x,f_y, -1)\)。单位法向量为
\[\vec{n}=\pm\frac{1}{\sqrt{f_x^2+f_y^2+1}}(-f_x,-f_y, 1)\]
而面积元
\[dS=\sqrt{f_x^2+f_y^2+1}dxdy\]联合起来,就是
\[\iint_S\vec{F}\cdot\vec{n}dS=\pm\iint_D(P(x,y,z),Q(x,y,z),R(x,y,z))\cdot(-g_x,-g_y,1)dxdy\]

(2)曲面由隐函数 \(G(x,y,z)=0\) 给出,由隐函数求导公式及上面的结论,得到
\[\iint_S\vec{F}\cdot\vec{n}dS=\pm\iint_D(P(x,y,z),Q(x,y,z),R(x,y,z))\cdot(\frac{G_x}{G_z},\frac{G_y}{G_z},1)dxdy\]

3,利用高斯公式

闭曲面上的积分首先要考虑高斯公式。分两种情况:

(1),若曲面积分是在闭曲面上进行,则直接应用高斯公式,
\[\oint_SP(x,y,z)dydz+Q(x,y,z)dzdx+R(x,y,z)dxdy=\iiint_{V}\left(\frac{\partial P}{\partial x}+\frac{\partial Q}{\partial y}+\frac{\partial R}{\partial z}\right)dV\]这里 \(V\) 是曲面 \(S\) 所围成的立体。

(2),若曲面是开曲面,则添加辅助曲面使之成为闭曲面,

Rendered by QuickLaTeX.com

再应用高斯公式,最后减去辅助曲面上的积分即得原积分的值,\begin{align*}\iint_SPdydz+Qdzdx+Rdxdy&=\iiint_V\left(\frac{\partial P}{\partial x}+\frac{\partial Q}{\partial y}+\frac{\partial R}{\partial z}\right)dV\\ &\quad -\iint_{S_1}Pdydz+Qdzdx+Rdxdy\end{align*}

对于闭曲面内部有奇点的情形,也可以仿照格林公式,挖去奇点,应用高斯公式在复连通立体上,再减去内部闭曲面上的积分就得到原积分。但是这种方法在高数课程里一般涉及,我们就不做介绍了。

4,适用范围:(1)若曲面简单而且被积函数也简单,直接计算;(2)若曲面是闭曲面,首先考虑应用高斯公式;(3)若曲面是开曲面,但被积函数复杂,考虑添加辅助曲面,变成闭曲面后,利用高斯公式计算,最后再减去辅助曲面上的积分;(4)若被积函数复杂,但又不合适作用高斯公式,可以尝试向量形式的曲面积分。

5,计算方法举例

例1:计算曲面积分 \(\displaystyle \iint_Sxyzdxdy\),其中 (S) 是球面 \(x^2+y^2+z^2=1\) 的外侧在 \(x\ge 0, y\ge 0\) 的部分。

解:曲面可以分为上、下两部分,上半部分的表达式为 \(S_1: z=\sqrt{1-x^2-y^2}, x,y\ge 0\),法向量朝上,积分符号为正;下半部分的表达式为 \(S_2: z=-\sqrt{1-x^2-y^2}, x,y\ge 0\),法向量朝下,积分符号为负。它们的投影区域都是 \(D=\{(x,y)| x^2+y^2\le 1, x,y\ge 0\}\)。所以曲面积分为

\begin{align*}\iint_Sxyzdxdy&=\iint_{S_1}xyzdxdy+\iint_{S_2}xyzdxdy\\ &=\iint_{D}xy(\sqrt{1-x^2-y^2})dxdy-\iint_{D}xy(-\sqrt{1-x^2-y^2})dxdy \\&=2\iint_Dxy(\sqrt{1-x^2-y^2})dxdy=\int_0^{\frac{\pi}{2}}\int_0^1r\cos t r\sin t\sqrt{1-r^2}rdrd\theta\end{align*}

令 \(u=1-r^2\),则 \(du=-2rdr, r^2=1-u\),所以

\begin{align*}2\int_0^{\frac{\pi}{2}}\int_0^1r\cos t r\sin t\sqrt{1-r^2}rdrd\theta&=2\int_0^{\frac{\pi}{2}}\int_1^0(1-u)\cos t \sin t\sqrt{u}(-\frac{1}{2}du)d\theta\\ &=\int_0^{\frac{\pi}{2}}\int_0^1\cos t \sin t(\sqrt{u}-u^{3/2})dudt\\ &=\int_0^{\frac{\pi}{2}}\cos t \sin t\left(\frac{2}{3}u^{\frac{3}{2}}-\frac{2}{5}u^{\frac{5}{2}}\right)\Big|_0^1dt\\ &=\frac{4}{15}\int_0^{\frac{\pi}{2}}\cos t\sin t dt=\frac{4}{15}\cdot\frac{1}{2}\sin^2t\Big|_0^{\frac{\pi}{2}}\\ &=\frac{2}{15}\end{align*}

例2,计算积分 \(\displaystyle\iint_S(f(x,y,z)+x)dydz+(2f(x,y,z)+y)dzdx+[f(x,y,z)+z]dxdy\),其中 \(f(x,y,z)\) 是连续函数,\(S\) 是平面 \(x-y+z=1\) 在第四卦限部分的上侧。

解:这里 \(f(x,y,z)\) 是连续函数,具体形式不知道,所以不能应用直接计算方式;又因为它只是连续函数,没有可不可导的条件,也不能应用高斯公式,所以只有利用向量形式(或者两类曲面积分的关系)的曲面积分,希望能够消去 \(f(x,y,z)\),然后再积分。

因为 \(S:z=1-x+y\),曲面取上侧,所以 \(\vec{N}=(-f_x,-f_y,1)=(1,-1,1)\),曲面在 \(xOy\) 平面的投影为 \(D={(x,y)| 0\le x\le 1, x-1\le y\le 0}\),

Rendered by QuickLaTeX.com

曲面积分为

\begin{align*}\iint_S(f(x,y,z)+x)dydz&+(2f(x,y,z)+y)dzdx+[f(x,y,z)+z]dxdy=\iint_D\vec{F}\cdot \vec{N}dxdy\\ &=\iint_D(f(x,y,z)+x,2f(x,y,z)+y,f(x,y,z)+z )\cdot(1,-1,1)dxdy\\ &=\iint_D(x-y+z)dxdy=\iint_D(x-y+1-x+y)dxdy\\ &=\iint_Ddxdy=\frac{1}{2}\end{align*}

最后的结果是因为投影区域是直角三角形,两个底边长都是 \(1\),它的面积是 \(\frac{1}{2}\)。

例3:求积分\(\displaystyle\oint_S(x-y)dxdy+(y-z)xdydz\),其中 \(S\) 是柱面 \(x^2+y^2=1\) 及平面 \(z=0,z=3\) 所围成的闭曲面的外侧。

解:这里\(P(x,y,z)=(y-z)x, Q(x,y,z)=0, R(x,y,z)=x-y\),曲面外侧,所以可以直接应用高斯公式

\begin{align*}\oint_S(x-y)dxdy+(y-z)xdydz&=\iiint_V\left(\frac{\partial P}{\partial x}+\frac{\partial Q}{\partial y}+\frac{\partial R}{\partial z}\right)dV\\ &=\iiint_V\left(\frac{\partial }{\partial x}((y-z)x)+\frac{\partial }{\partial z}(x-y)\right)dV\\ &=\iiint_V(y-z)dV\end{align*}

因为这个闭曲面所围成的部分是圆柱体,所以应用柱坐标来计算三重积分比较简便,

\begin{align*}\iiint_V(y-z)dV&=\int_0^{2\pi}\int_0^1\int_0^3(r\sin \theta-z)rdzdrd\theta\\ &=\int_0^{2\pi}\int_0^1\left(r^2\sin\theta z-\frac{1}{2}rz^2\right)\Big|_0^3drd\theta\\ &=\int_0^{2\pi}\int_0^1\left(3r^2\sin\theta-\frac{9}{2}r\right)drd\theta\\ &=\int_0^{2\pi}\left(r^3\sin\theta-\frac{9}{4}r^2\right)\Big|_0^1d\theta\\ &=\int_0^{2\pi}\left(\sin\theta-\frac{9}{4}\right)d\theta=\left(-\cos\theta-\frac{9}{4}\theta\right)\Big|_0^{2\pi}\\ &=-\frac{9}{2}\pi\end{align*}

下一个例子,我们看一下如何利用高斯公式求一个开曲面的曲面积分。我们先添加一个辅助曲面将开曲面变成闭曲面,然后利用高斯公式计算闭曲面上的积分,最后再减去辅助曲面上的积分,就得到我们所求的曲面积分。

例4:求曲面积分 \(\displaystyle\iint_S\left(-\frac{1}{3}x^3+e^{z^2}\right)dydz+\left(-\frac{1}{3}y^3+x\tan z\right)dzdx+4zdxdy\),其中 \(S\) 为 \(z=x^2+y^2\) 在平面 \(z=4\) 以下的部分,上侧。

解:这是一个开曲面,我们给它加上一个盖子\(S_1: z=4, x^2+y^2\le 4\) ,法向量朝下,组成一个闭曲面,

Rendered by QuickLaTeX.com

这个闭曲面的法向量是朝内的,所以

\begin{align*}\iint_S+\iint_{S_1}&=-\iiint_V\left(\frac{\partial P}{\partial x}+\frac{\partial Q}{\partial y}+\frac{\partial Q}{\partial z}\right)dxdydz\\ &=\iiint_V(-x^2-y^2+4)dV\end{align*}

这个积分区域的投影是圆 \(x^2+y^2\le 4\),下曲面是\(z=x^2+y^2=r^2\),上曲面是 \(z=4\),所以利用柱坐标计算,\[V=\{(r,\theta,z)|0\le \theta\le 2\pi, 0\le r\le 2, r^2\le z\le 4\}\]

我们有

\begin{align*}\iiint_V(-x^2-y^2+4)dV&=\int_0^{2\pi}\int_0^2\int_{r^2}^4(4-r^2)rdzdrd\theta\\ &=\int_0^{2\pi}\int_0^2\int_{r^2}^4r(4-r^2)z\Big|{r^2}^4drd\theta\\ &=\int_0^{2\pi}\int_0^2\int{r^2}^4r(16-8r^2+r^4)drd\theta\\ &=\int_0^{2\pi}\int_0^2(8r^2-2r^4+\frac{1}{6}r^6)\Big|_0^2d\theta=\frac{32}{5}\theta\Big|_0^{2\pi}\\ &=\frac{64}{5}\pi\end{align*}

现在计算辅助曲面 \(S_1\) 的上积分,因为 \(S_1: z=4, x^2+y^2\le 4\),所以 \(dz=0\)。又因为它的法向量朝下,所以积分号为负,

\begin{align*}\iint_{S_1}&\left(-\frac{1}{3}x^3+e^{z^2}\right)dydz+\left(-\frac{1}{3}y^3+x\tan z\right)dzdx+4zdxdy\\ &=-\iint_{x^2+y^2\le 4}16dxdy=-16\cdot 4\pi\end{align*}

这里,\(1\) 的积分就是平面区域的面积,而圆 \(x^2+y^2\le 4\) 的面积为 \(4\pi\)。

所以

\begin{align*}\iint_S\left(-\frac{1}{3}x^3+e^{z^2}\right)dydz&+\left(-\frac{1}{3}y^3+x\tan z\right)dzdx+4zdxdy\\ &=-\iiint_V\left(\frac{\partial P}{\partial x}+\frac{\partial Q}{\partial y}+\frac{\partial Q}{\partial z}\right)dxdydz\\ &\quad-\iint_{S_1}Pdydz+Qdzdx+Rdxdy\\ &=-\frac{64}{5}\pi+64\pi=\frac{256}{5}\pi\end{align*}

6,习题与答案

最后给出一些习题,供同学们练习。

1,计算曲面积分 \(\displaystyle\iint_Sy^3dydz+z^2dzdx+xdxdy\),其中 \(S\) 是曲面 \(z=4-x^2-y^2\) 位于平面 \(z=2x+1\) 上方的部分,方向朝下。

2,设 \(S\) 是曲面 \(z=\sqrt{x^2+y^2}, x^2+y^2\le 4\) 的下侧,\(f(x,y)\) 是连续函数,计算 \(\displaystyle\iint_S(xf(x,y)+2xy-y)dydz+(yf(x,y)+2y+x)dzdx+(zf(x,y)+z)dxdy\)

3,设空间立体 \(V\) 由平面 \(2x+y+2z=2\) 与三个坐标面围成,\(S\) 是它的外表面,计算曲面积分 \[\oint_S(x^2+1)dydz-2ydzdx+3zdxdy\]

4,求曲面积分 \(\displaystyle\iint_S (y\cos(y^2)+z-1)dydz+\frac{z}{x+1}dzdx+xye^{z^2}dxdy\),其中 \(S\) 是其中一个顶点在原点,整个位于第一卦限的无底单位正方体,法向量朝向外。

5,求曲面积分 \(\displaystyle\iint_Sz^3\sin e^ydydz+z^3e^{x^2\sin z}dzdx+(y^2+z)dxdy\),其中 \(S\) 是下半球面 \(x^2+y^2+z^2=4\),方向朝上。

答案:1 \(\quad 0\)

2 \(\quad 0\)

3 \(\quad\frac{1}{2}\)


4
\(\quad\frac{e}{4}\)

5 \(\quad \frac{4}{3}\pi^3\)

Posted on

如何计算对坐标的曲线积分?

本文离线版本下载:

对坐标的曲线积分的计算方式有很多种,我们所知道或者教材上提到过的就有:直接计算,利用格林公式计算,利用 Stokes 公式,利用积分与路径无关以及全微分求积等等。而且有些方法在不同情况下还有不同的变化。这么多方法,再加上对坐标的曲线积分还需要分方向等等,造成了很多同学感觉对坐标的曲线积分很难的印象。

这一篇文章里我们总结一下求对坐标的曲线积分的方法,以及每种方法的应用情况,这样,我们遇到对坐标的曲线积分时,能够采用针对性的方法来求。

事实上,我们只需要掌握两种方法即可:直接计算法和利用格林公式求积分两种方法。因为能够采用全微分求积或者积分路径无关的方法来求曲线积分的,采用格林公式来求更简单直接。所以我们只总结这两种方法。

对于三维闭曲线上的积分,可以应用 Stokes 公式来求,但它的思想与平面上的格林公式一致,我们只简单介绍一下它的方法。

1,直接计算法:我们根据曲线 \(L\) 的表达式的不同形式,将曲线积分化成定积分来计算。

  • 若曲线 \(L\) 是由参数方程 \( x=\phi(t),y=\psi(t)\} \)给出,\(t\) 从 \(\alpha\) 到 \(\beta\),其中 \(t=\alpha\) 对应起点, \(t=\beta\) 对应终点,那么积分 \begin{align*}\int_LP(x,y)dx&+Q(x,y)dy\\&=\int_{\alpha}^{\beta}P(\phi(t),\psi(t))\cdot\phi'(t)dt+Q(\phi(t),\psi(t))\cdot\psi'(t)dt\end{align*}其中 \(x,y\) 都用 \(t\) 表示。这里要注意的是,这里不管 \(\alpha\) 和 \(\beta\) 谁大谁小,起点就是在下限,终点在上限,这一点跟对弧长的曲线积分不同。
  • 若曲线 \(L\) 是由参数方程 \(x=\phi(t),y=\psi(t),z=\gamma(t)\}\) 给出,\(t\) 从 \(\alpha\) 到 \(\beta\),其中 \(t=\alpha\) 对应起点, \(t=\beta\) 对应终点,那么积分 \begin{align*}\int_LP(x,y,z)dx&+Q(x,y,z)dy+R(x,y,z)dz\\&=\int_{\alpha}^{\beta}P(\phi(t),\psi(t),\gamma(t))\cdot\phi'(t)dt\\ &\quad+Q(\phi(t),\psi(t),\gamma(t))\cdot\psi'(t)dt\\ &\quad+R(\phi(t),\psi(t),\gamma(t))\cdot\gamma'(t)dt\end{align*}其中 \(x,y,z\) 都用 \(t\) 表示。剩下的部分就是计算定积分了。
  • 若曲线是由一个函数 \(y=f(x)\), \(x\) 从 \(a\) 到 \(b\),那么积分 \[\int_LP(x,y)dx+Q(x,y)dy=\int_{a}^{b}P(x,f(x))+Q(x,f(x))\cdot f'(x)dx\]

2,若 \(L\) 是平面曲线,则可以用格林公式来计算。

  • 若 \(L\) 是平面闭曲线,且在曲线内部 \(P(x,y), Q(x,y)\) 有一阶连续偏导数,这种情况可以直接应用格林公式;
  • 若 \(L\) 是平面闭曲线,但是在曲线内部 \(P(x,y), Q(x,y)\) 有奇点(一阶偏导数不存在或者不连续),这种情况我们通过添加辅助线,将奇点挖掉,然后应用格林公式。最后将辅助线上的积分减去,就得到了原来的曲线积分的值,\begin{align*}\oint_L P(x,y)dx+Q(x,y)dy&=\iint_D\left(\frac{\partial Q}{\partial x}-\frac{\partial P}{\partial y}\right)dydx\\ &\quad-\oint_{L_1}P(x,y)dx+Q(x,y)dy\end{align*} 这里 \(L\) 取正向, \(L_1\) 都取反向(顺时针方向)。
Rendered by QuickLaTeX.com
  • 若 \(L\) 是平面开曲线,我们可以通过添加简单的辅助线(为了方便计算),使新的曲线成为一个简单闭曲线,然后应用格林公式,最后减去辅助线上的积分,就得到原曲线积分的值。\begin{align*}\oint_LP(x,y)dx+Q(x,y)dy&=\iint_D\left(\frac{\partial Q}{\partial x}-\frac{\partial P}{\partial y}\right)dxdy\\ &\quad-\int_{L_1}P(x,y)dx+Q(x,y)dy\end{align*}
Rendered by QuickLaTeX.com

3,若 \(L\) 是一个空间闭曲线,则可应用Stokes 公式,将曲线积分化成曲面积分。在曲面的选择上,可以选择比较简单的、容易计算的曲面来进行计算。(因为以 \(L\) 为边界的曲面很多,我们可以选择最简单的曲面。)

理论上来说,空间开曲线也可以通过添加辅助线的方式来应用 Stokes 公式,但一般来说,这样的计算相对繁琐,我们一般不考虑。

4,计算方法选择:现在的问题是在什么情况采取什么方法来求积分?

基本的思想是:(1)闭曲线,基本上采用格林公式或者 Stokes 公式来求,不管内部是不是有奇点;

(2)开曲线:如果曲线简单(例如直线)并且被积函数简单,直接计算;

(3)开曲线:如果曲线复杂,或者被积函数复杂,采用格林公式计算。

现在我们来看如何应用上述的结论。

例1,求积分 \(\int_L(x+y)dx+(y-x)dy\),其中 \(L\) 是抛物线 \(y^2=x\) 从点 \((1,1)\) 到 \((4,2)\) 之间的一段弧。

解:这里,被积函数很简单,曲线也简单,可以用直接方法计算。用 \(y\) 作自变量会更简单一点,不用计算根式函数的导数。

\begin{align*}\int_L(x+y)dx+(y-x)dy&=\int_1^2[(y^2+y)\cdot 2y+(y-y^2)]dy\\ &=\int_1^2(2y^3+y^2+y)dy\\ &=\frac{1}{2}y^4+\frac{1}{3}y^3+\frac{1}{2}y^2\Big|_1^2\\ &=8+\frac{8}{3}+2-\frac{1}{2}-\frac{1}{3}-\frac{1}{2}\\ &=\frac{34}{3}\end{align*}

例2:计算 \(\displaystyle\oint_L\frac{-ydx+xdy}{x^2+y^2}\),其中 \(L\) 是 (1)圆周 \((x-2)^2+y^2=1\);(2)原点在其内部的任一正向闭曲线。

解:(1)曲线为圆心在点 \((2,0)\),半径为 \(1\) 的圆周,在其内部 \(D\) 上 \(P(x,y), Q(x,y)\) 一阶连续可导。所以由格林公式

\begin{align*}\oint_{L}\frac{-ydx+xdy}{x^2+y^2}&=\iint_D\left(\frac{\partial Q}{\partial x}-\frac{\partial P}{\partial y}\right)dydx\\ &=\iint_D\left(\frac{y^2-x^2}{(x^2+y^2)^2}-\frac{y^2-x^2}{(x^2+y^2)^2}\frac{\partial P}{\partial y}\right)dydx\\ &=\iint_D 0dydx=0\end{align*}

(2)因为被积函数在原点处没有定义,所以原点是被积函数的奇点。我们以原点为心,作一个半径为 \(\epsilon \) 的圆 \(L_{\epsilon}\),那么被积函数在介于 \(L\) 与 \(L_{\epsilon}\) 之间的区域内是一阶连续可导的。

这里 \(L\) 是正向,逆时针,\(L_{\epsilon}\) 是反向,顺时针。介于这两条曲线之间的区域我们记为 \(D\),它的边界为 \(L+L_{\epsilon}\),由格林公式,

\[\oint_L\frac{-ydx+xdy}{x^2+y^2}+\oint_{L_{\epsilon}}\frac{-ydx+xdy}{x^2+y^2}=\iint_D\left(\frac{\partial Q}{\partial x}-\frac{\partial P}{\partial y}\right)dxdy\]

因为 \[\frac{\partial Q}{\partial x}=\frac{y^2-x^2}{x^2+y^2}, \frac{\partial P}{\partial y}=\frac{y^2-x^2}{x^2+y^2}\]所以 \[\frac{\partial Q}{\partial x}-\frac{\partial P}{\partial y}=0\quad\Rightarrow\quad\iint_D\left(\frac{\partial Q}{\partial x}-\frac{\partial P}{\partial y}\right)dxdy=0\]

所以我们得到 \[\oint_L\frac{-ydx+xdy}{x^2+y^2}=-\oint_{L_{\epsilon}}\frac{-ydx+xdy}{x^2+y^2}\]

因为 \(L_{\epsilon}\) 可用参数方程表示为 \(x=\epsilon\cos t, y=\epsilon \sin t\),顺时针方向,所以 \(t\) 是从 \(2\pi\) 到 \(0\),

\begin{align*}-\oint_{L_{\epsilon}}\frac{-ydx+xdy}{x^2+y^2}&= -\int_{2\pi}^0\left(\frac{-\epsilon\sin t \epsilon (-\sin t)+\epsilon\cos t\epsilon\cos t}{\epsilon^2}\right)dt\\ &=\int_0^{2\pi}\frac{\epsilon^2\sin^2t+\epsilon^2\cos^2t}{\epsilon^2}dt=\int_0^{2\pi}dt=2\pi\end{align*}

所以 \[\oint_L\frac{-ydx+xdy}{x^2+y^2}=2\pi\]

例3:计算 \(\int_L(2xy^3-y^2\cos x)dx+(1-2y\sin x+3x^2y^2)dy\),其中 \(L\) 是抛物线 \(2x=\pi y^2\) 上从点 \((0,0)\) 到 \((\frac{\pi}{2}, 1)\) 之间的一段。

解:积分的曲线如图:

Rendered by QuickLaTeX.com

如果直接计算,这个积分基本上是求不出来的,但是利用格林公式,计算就变得很简单。但是这个曲线不是闭曲线,我们需要添加辅助线来将它变成闭曲线。

Rendered by QuickLaTeX.com

我们看到整个闭曲线的方向是顺时针方向,它是逆向的,所以

\begin{align*}\left(\int_L+\int_{L_1}+\int_{L_2}\right)P(x,y)dx&+Q(x,y)dy=-\iint_D\left(\frac{\partial Q}{\partial x}-\frac{\partial P}{\partial y}\right)dxdy\end{align*}

我们先来计算右边的积分。因为

\begin{align*}&\frac{\partial Q}{\partial x}=\frac{\partial}{\partial x}(1-2y\sin x+3x^2y^2)=-2y\cos x+6xy^2,\\ &\frac{\partial P}{\partial y}=\frac{\partial}{\partial x}(2xy^3-y^2\cos x)=6xy^2-2y\cos x\end{align*}

所以 \[\frac{\partial Q}{\partial x}-\frac{\partial P}{\partial y}=0,\qquad \iint_D\left(\frac{\partial Q}{\partial x}-\frac{\partial P}{\partial y}\right)dxdy=0\]

那么 \[\int_LPdx+Qdy=-\int_{L_1}Pdx+Qdy-\int_{L_2}Pdx+Qdy\]

在 \(L_1\) 上,\(x=\frac{\pi}{2}, dx=0\), \(y\) 从 \(1\) 到 \(0\)。所以

\begin{align*}-\int_{L_1}Pdx+Qdy&=-\int_1^0Q(x,y)dy\\ &=-\int_1^0\left(1-2y+3\left(\frac{\pi}{2}\right)^2y^2\right)dy\\ &=\int_0^1\left(1-2y+3\left(\frac{\pi}{2}\right)^2y^2\right)dy\\ &=y-y^2+\frac{\pi^2}{4}y^3\Big|_0^1=\frac{\pi^2}{4}\end{align*}

在 \(L_2\) 上, \(y=0,dy=0\),\(x\) 从 \(\frac{\pi}{2}\) 到 \(0\)。所以

\[-\int_{L_2}Pdx+Qdy=-\int_{L_2}Pdx=-\int_{L_2}0dx=0\]

所以

\[\int_L(2xy^3-y^2\cos x)dx+(1-2y\sin x+3x^2y^2)dy=\frac{\pi^2}{4}\]

最后是一些习题供同学们练习。

1,设 (C) 是从 ((1,0)) 到 ((0,1)) 再到((-1,0)) 的折线,求下列曲线积分
(1)\(\displaystyle\int_C2xydx+x^2dy\);(2)\(\displaystyle\int_Cye^{xy}dx+xe^{xy}dy\);(3)\(\displaystyle\int_Cx^{2/3}dx+e^{7y}dy\)。

2,求曲线积分 \(\displaystyle\int_C(x^2+y)dx+xdy\),其中 \(C\) 是曲线 \(y=9-x^2\) 从 \((-3,0)\) 到 \((3,0)\) 的一段。

3,求积分 \(\displaystyle\int_Cxydx+(e^y+x^2)dy\),其中 (C) 是由 \(y=x^2+4x+4\) 与 (y=4-x^2) 围成的区域的正向边界。

4,计算积分 \(\int_C\frac{-y}{x^2+y^2}dx+\frac{x}{x^2+y^2}dy\),其中 \(C\) 为(1)任意一条原点在其内部的正向闭曲线;(2)任意原点在其外部的正向闭曲线;(3)曲线 \(y=\frac{1}{4}x^2+1\) 从点 \((-2,2)\) 到 \((2,2)\) 之间的一段;(4)曲线 \(y=x^2-2\) 从点 \((-2,2)\) 到 \(2,2\) 之间的一段。

5,求积分 \(\displaystyle\oint_C\frac{4x-y}{4x^2+y^2}dx+\frac{x+y}{4x^2+y^2}dy\),其中 \(C\) 为 \(x^2+y^2=2\), 逆时针方向。

答案:1(1)\(\quad 0\quad \)(2)\(\quad 0\quad\)(3)\(\quad\frac{6}{5}\)

2\(\quad 18\quad\) 3 \(\quad-\frac{8}{3}\quad \)

4 (1)\(\quad2\pi\quad \)(2)\(\quad0\quad\)(3)\(\quad-\frac{\pi}{2}\quad\)(4)\(\quad \frac{3\pi}{2}\)

5 \(\quad\pi\quad\)