# TMA4320 Introduksjon til vitenskapelige beregninger
## Løsningsforslag øving 2 


$\newcommand{mb}[1]{\mathbf{#1}}$
$\newcommand{R}{\mathbb{R}}$

In [None]:
%matplotlib inline

import numpy as np
import matplotlib.pyplot as plt
from scipy.linalg import lu, solve
newparams = {'figure.figsize': (8.0, 4.0), 'axes.grid': True,
             'lines.markersize': 8, 'lines.linewidth': 2,
             'font.size': 14}
plt.rcParams.update(newparams)

### Oppgave 1
Gitt matrisen
$$
A = \begin{bmatrix} 
    4 & -8 & 2  \\ 5 & 0 & 10 \\  2 & 2 & 1 
\end{bmatrix} 
$$
**(a)** Finn $LU$-faktoriseringen $A=L U$ for denne matrisen, der $L$ er nedre triangulær med 1-ere på diagonalen, og $U$ er øvre triangulær. 

**Løsning:** 
$$
L = \begin{bmatrix} 
    1 & 0 & 0  \\ 5/4 & 1 & 0 \\  1/2 &6/10 & 1 
\end{bmatrix} 
$$

$$
U = \begin{bmatrix} 
    4 & -8 & 2  \\ 0 & 10 & 15/2 \\  0 &0 & -9/2 
\end{bmatrix} 
$$


**(b)** Bruk skalert delvis pivotering, og finn pivoteringsmatrisa $P$, $L$ og $U$ slik at 
$PA=LU$
der $P$ er pivoteringsmatrisen. 

**Løsning:** 
$$
L = \begin{bmatrix} 
    1 & 0 & 0  \\ 2 & 1 & 0 \\  5/2 &5/12 & 1 
\end{bmatrix} 
$$

$$
U = \begin{bmatrix} 
    2 & 2 & 1  \\ 0 & -12 & 0 \\  0 &0 & 15/2 
\end{bmatrix} 
$$

$$
P = \begin{bmatrix} 
    0 & 0 & 1  \\ 1 & 0 & 0 \\  0 &1 & 0 
\end{bmatrix} 
$$



### Oppgave 2 (programmering)

Gitt ligningssystemet 
$$
A \mb{x} = \mb{b}
$$
der $A\in\mathbb{R}^{n\times n}$ og $\mb{b},\mb{x} = \R^{n}$. 

**a)** 
Skriv en funksjon `gauss_naiv` som løser slike ligninger med en naiv Gauss-eliminasjon. 
Skriv ut passende feilmeldinger ved behov. 

*Hint 1:* Bruk `assert` til feilmeldinger. <br>
*Hint 2:* Vær sikker på at $A$ og $\mb{b}$ leses inn som flyttall. <br>
Bruk f.eks. `A = np.array([[....]],dtype=float`). 

**b)**
Skriv en funksjon `gauss_pivot` som bruker løser ligningen med Gauss-eliminasjon med skalert pivotering.

Bruk disse til å løse ligningsystemet $A\mb{x}=\mb{b}$ med

$$
A = \begin{bmatrix} 10 & 0 & 20 & 10 \\
    4 & -9 & 2 & 1 \\8 & 16 & 6 &5 \\ 2 & 3 & 2 & 1
    \end{bmatrix} \qquad 
\mb{b} = \begin{bmatrix} 10 \\ 2 \\ 4 \\ 3 \end{bmatrix}
$$

*Hint 1:* Bruk `assert` til feilmeldinger. <br>
*Hint 2:* Vær sikker på at $A$ og $\mb{b}$ leses inn som flyttall. 
Bruk f.eks. `A = np.array([[....]],dtype=float`). <br>
*Hint 3:* Kontroller gjerne løsningen din ved å bruke `scipy.linalg.solve`. 

**c)** Bruk `scipy.linalg.lu` for å finne $P$, $L$ og $U$ slik at 
$PA=LU$. Får du samme pivot-elementer som du fikk med `gauss_pivot`. 

Del første ligning (første rad i $A$ og $\mb{b}$) med 10. Får du samme pivot-vektor med `gauss_pivot` og  `scipy.linalg.lu` nå?

Forklar det du observerer. 

In [None]:
def gauss_naiv(Ah, bh):
    '''
    Solves the linear system Ax=b by naiv Gauss elimination
    Input: A, b
    Output: x
    '''
    n, m = np.shape(Ah)
    assert n==m, 'A is not quadratic'
    m, = np.shape(bh)
    assert n==m, 'A and b are not compatible'
    
    A = np.copy(Ah)  # To keep the original A, b unaltered.
    b = np.copy(bh)
  
    # Gauss elimination
    for k in range(n-1):
        assert abs(A[k,k])>=1.e-15, 'Almost 0 pivot element'
        for i in range(k+1,n):
            m = A[i,k]/A[k,k]
            A[i,k] = 0          
            for j in range(k+1,n):
                A[i,j] = A[i,j] - m*A[k,j]
            b[i] = b[i] - m*b[k]
            
    # Back substitution
    x = np.zeros(n)
    x[n-1] = b[n-1]/A[n-1,n-1]
    for i in range(n-2,-1,-1):
        x[i] = b[i]
        for j in range(i+1,n):
            x[i] = x[i] - A[i,j]*x[j]
        x[i] = x[i]/A[i,i]
    
    print('Transformed A = \n', A, '\n Transformed b = \n',b,'\n' )
    return x

In [None]:
A_1 = np.array([[4, -8, 2],[5,0,10],[2,2,1]], dtype = float)
b_1 = np.array([-2,0,5],dtype=float)
print(gauss_naiv(A_1,b_1))

In [None]:
A = np.array([[10, 0, 20, 10],[4, -9, 2, 1],[8,16,6,5],[2,3,2,1]], dtype = float)
#b = np.array([20,14,-3,0], dtype = float)
b = np.array([10, 2, 4, 3], dtype = float)
x = gauss_naiv(A, b)
print(f'\nSolution from gauss_naiv:  x = {x}')
print(f'\nSolution from scipy:       x = {solve(A,b)}')

In [None]:
def gauss_pivot(Ah, bh):
    n, m = np.shape(Ah)
    assert n==m, 'A is not quadratic'
    m, = np.shape(bh)
    assert n==m, 'A and b are not compatible'
    
    A = np.copy(Ah)   # To keep the original A, b unaltered.
    b = np.copy(bh)
    p = np.arange(n)  # Original pivot element
    s = np.max(abs(A),axis=1)    # The scaling vector

    for k in range(n):
        kt = np.argmax(np.abs(A[p[k:],k])/s[k:])+k
        if kt != k:         # Swap rows
            ptmp = p[k]
            p[k] = p[kt]
            p[kt] = ptmp
        assert abs(A[p[k],k])>=1.e-12, 'Almost 0 pivot element'
        
        for i in range(k+1,n):
            m = A[p[i],k]/A[p[k],k]
            A[p[i],k] = 0              # Not necessary
            for j in range(k+1,n):
                A[p[i],j] = A[p[i],j] - m*A[p[k],j]
            b[p[i]] = b[p[i]] - m*b[p[k]]
            
    # Back substitution
    x = np.zeros(n)
    x[n-1] = b[p[n-1]]/A[p[n-1],n-1]
    for i in range(n-2,-1,-1):
        x[i] = b[p[i]]
        for j in range(i+1,n):
            x[i] = x[i] - A[p[i],j]*x[j]
        x[i] = x[i]/A[p[i],i]
    
    print(f'Transformed A = \n{A}, \nTransformed b = {b}, \nPivot vector  = {p}\n')
    return x

In [None]:
print(gauss_pivot(A_1,b_1))
x = gauss_pivot(A,b)
print(f'Solution from gauss_naiv:  x = {x}')

In [None]:
# c)
# Original matrix
A = np.array([[10, 0, 20, 10],[4, -9, 2, 1],[8,16,6,5],[2,3,2,1]], dtype = float)
P,L,U = lu(A)
print(f'Pivot matrix for original A:\n{P}')

# Multiply 1th row with 0.1
A[0,:] = 0.1*A[0,:]
P,L,U = lu(A)
print(f'\nPivot matrix for changed  A:\n{P}')

Og det viser at `scipy.linalg.lu` bruker delvis pivotering, ikke skalert delvis pivotering. 

### Oppgave 3

Hvilke(n) av de tre matrisene under er strengt diagonal dominant?

$$
A_1 = 
\begin{bmatrix}
4 & 2 & -3 \\ 
2 & 6 & 1 \\
1 & -2 & 6 
\end{bmatrix}, \qquad 
A_2 = 
\begin{bmatrix}
3 & - 1 & 1 \\
2 & -5 & 1 \\
0 & 1 & 2 
\end{bmatrix}, \qquad
A_3 = 
\begin{bmatrix} 
12 & 1 & -11 & 0 \\
3 & 7 & -2 & 1 \\
-2 & 2 & 6 & -1 \\
1 & -1 & 2 & 4
\end{bmatrix}. 
$$

**Løsning:** $A_2$ er strengt diagonal dominant. 
Husk at en matrise er strengt diagonal dominant dersom absoluttverdien av elementet på diagonalen er større enn summen av absoluttverdien til de andre elementene på samme rad. Derfor ser vi allerede på rad 1 at både $A_1$ og $A_3$ ikke oppfyller kravet. 

### Oppgave 6

**(a)**
La $\|\cdot\|_v$ være en vektornorm. Vis at den tilordnede matrisenormen oppfyller
$
\|I\| = 1.
$

**Løsning:** Her bruker vi definisjonen av tilordnet matrisenorm
$$
\|I\| = \sup_{x\neq 0} \frac{\|Ix\|}{\|x\|} = 1
$$


**(b)** Frobeniusnormen $$\|A\|_F=\sqrt{\sum_{i=1}^n\sum_{j=1}^n A_{ij}^2}$$ er en populær matrisenorm.
Vis at denne ikke kan være tilordnet noen vektornorm for $n>1$.

**Løsning:** Det følger umiddelbart at $\|I\|=\sqrt{n}$ for $I\in\mathbb{R}^{n\times n}$. I følge **(a)** kan det da ikke være en tilordnet matrisenorm for $n>1$.

**(c)** Kondisjonstallet til en matrise $A$ er definert som $\kappa(A)=\|A\|\,\|A^{-1}\|$.
Hvis vi bruker $\|\cdot\|_p$ som matrisenorm ($p=1,2,\infty$) kan vi tilsvarende definere $\kappa_p(A)$.
Hva er $\kappa_p(D)$ for diagonalmatriser $D$ (sjekk alle nevnte $p$).

**Løsning:** For diagonalmatriser sjekker en at alle disse normene er de samme, nemlig

$$
   \|D\|=\max_{1\leq i\leq n} |d_{ii}|
$$

Siden $D^{-1}=\text{diag}(d_{11}^{-1},\ldots, d_{nn}^{-1})$ så finner vi at

$$
\kappa(D) = \frac{\max_{1\leq i\leq n} |d_{ii}|}{\min_{1\leq i\leq n} |d_{ii}|}
$$

**(d)** La $D$ være diagonalmatrisen med diagonalelementer $d_{ii}=\frac{1}{i},\ i=1,\ldots,n$.
Hva er $\kappa_1(D)$ (som funksjon av $n$).\
**Svar:** $\kappa_1(D)=n$.


### Oppgave 7 (programmering)

Vi skal studere en interessant familie av matriser som er beryktet for å være dårlig kondisjonerte (stort kondisjonstall). De kalles Hilbertmatriser, er symmetriske, og er definert som

$$
H_{ij} = \frac{1}{i+j-1},\qquad 1\leq i\leq n,\ 1\leq j\leq n.
$$

At de er dårlig kondisjonerte betyr at når vi løser $Hx=b$ så vi en liten endring i $H$ eller $b$ føre til en stor endring i løsningen $x$. Vi gjennomfører et eksperiment for å få litt innsikt i problemet.

Vi kan dra nytte av funksjonen *hilbert* som fins i *scipy.linalg*-biblioteket. Så kan det være nyttig å bruke
*numpy.linalg.cond* som beregner kondisjonstallet til en  matrise.

La oss for ulike verdier av $n$ definere $b\in\mathbb{R}^n$ til å være vectoren med alle elementer lik 1 (lages enkelt med *numpy.ones*. Så lager vi tilfeldige perturbasjoner $b+\delta b$ ved å bruke *numpy.random.rand* (se eksempelkode nedenfor). Vi tar oss friheten å løse ligninger med *numpy* sin innebygde løser *numpy.linalg.solve*.
Bruk alltid $\|\cdot\|_2$ og $\kappa_2(\cdot)$ i denne oppgaven.

**(a)** For hver $n=5, 10, 15, 20$ gjør følgende eksperiment. Løs $Hx=b$ for $x$ med $b$ som beskrevet og lagre $x$.
Lag så en løkke med 1000 eksperimenter der du løser $Hy=b+\delta b$ for $y$ og der du velger $\delta b$ 
med random-generator som beskrevet i eksemplet slik at $\|\delta b\|=0.01\cdot\|b\|$.
Blant alle disse 100 eksperimentene, lagre den maksimale verdien av $\|y-x\|$.
I dette oppsettet kan vi fra timene anslå at

$$
   \frac{\|y-x\|}{\|x\|} \leq \kappa(H)\,\frac{\|\delta b\|}{\|b\|}
$$

Bruk disse lagrede verdiene til estimere $\kappa(H)$, og sammenlign med den virkelige verdien av 
$\kappa(H)$ som du finner fra *numpy.linalg.cond*. 
Skriv ut en tabell der første kolonne er $n$, andre kolonne er estimert kondisjonstall og tredje kolonne er virkelig kondisjonstall.
Sammenlign og kommenter.

**Eksempel:** Med $n=4$, sett $b=[1,1,1,1]^T$ og $\delta b= [0,0.012,-0.016,0]^T$.
Finn for dette spesifikke tilfellet den estimerte $\kappa(H)$.


**(b)** Kanskje du ikke ble imponert over hva kondisjonstallet sa i forrige eksperiment? Det kan i så fall ha å gjøre med at kondisjonstallet gir absolutt verste tilfelle (worst case analysis), mens hvis man har litt "flaks" med valg av $b$ så blir det kanskje ikke så galt. Vi forsøker å fremprovosere en mer kritisk $b$.
Det du skal gjøre er å generere $b$ med en liten algoritme som kan beskrives slik:
Start med $b=[1,\ldots,1]^T$. Lag så en løkke med 20 iterasjoner ('for j in range(20)') der du først
setter $b:=H\cdot b$ og deretter skalerer, $b:=b/\|b\|$.
Gjenta eksperimentet fra **(a)** med dette valget av høyreside $b$ og kommenter resultatet.
Kan du komme opp med en god forklaring på hvorfor $b$ generert på denne måten gir mye større utslag (større estimert kondisjonstall) enn du fikk i **(a)**?

In [None]:
import numpy as np
import numpy.linalg as la
from scipy.linalg import hilbert
from scipy.linalg import invhilbert #denne lager eksplisitt den inverse av hilbertmatrisen

# bvec er en liten funksjon som gir oss vector med n 1'ere.
bvec= lambda n: np.ones((n,))
print(bvec(3))
# Kondisjonstallet til 4x4 Hilbertmatrisen
print(la.cond(hilbert(4)))

# Lag en perturbasjon av norm epsilon
def b_perturb(n,epsilon):
    d = 2*np.random.rand(n,1)-1
    d = d*epsilon/la.norm(d,2)
    return d

In [None]:
def b_nasty(n):
    b=bvec(n)
    H=hilbert(n)
    for k in range(10):
        b=H@b
        b=b/la.norm(b)
    return b


def hilbtest(n,b,epsilon):
    H=hilbert(n)
    x=la.solve(H,b)
    xn=la.norm(x)
    devnorm=0;
    for k in range(1000):
        y=la.solve(H,b+b_perturb(n,epsilon))
        devnorm=max(devnorm,la.norm(y-x))
    K_est=devnorm/xn/epsilon
    return K_est

NN=np.array([5,10,15,20])
nexps=NN.size
epsilon=0.01
#Kest = np.zeros_like(NN)

print("  n    K(est)     K(true)")
for m in range(nexps):
    n=NN[m]
    b=bvec(n)
    K=hilbtest(n,b,epsilon)
    print(f'{n : 3d} {K: .3e} {la.cond(hilbert(n),2):.3e}') 

print("\n\nTest in b\n")
print("  n    K(est)     K(true)")   
for m in range(nexps):
    n=NN[m]
    b=b_nasty(n)
    K=hilbtest(n,b,epsilon)
    print(f'{n : 3d} {K: .3e} {la.cond(hilbert(n),2):.3e}')    
    