Extremvärden

Extremvärden för en funktion förekommer för indata där den tar på sina största och minsta värden. De kan betraktas över hela rymden (globala extremvärden), eller i ett begränsat område (lokala extremvärden).

Innehållsförteckning

    Intro

    Hur illa kommer orkansäsongen att bli nästa år? Ingen vet säkert, men det hindrar oss inte från att gissa.

    Vädret innehåller så utomordentligt komplicerade fenomen att förutsägelser baserade på nuvarande förhållanden kanske inte förutser katastrofala händelser förrän det är för sent att agera.

    Istället kan extremvärde vara vår bästa chans att få en bra känsla för framtida beteende långt i förväg. Denna gren av statistik tittar på data som registrerats från tidigare händelser för att uppskatta extremvärden : de bästa och värsta scenarierna.

    Metoden används för komplexa frågeställningar inom samhälls- och naturvetenskap, till exempel för att indikera ekonomiska krascher, eller skador på grund av jordbävningar, innan de har inträffat.

    Koncept

    Vad vi kommer att göra i det här kapitlet är att studera intressanta punkter i en funktion. För de flesta scenarier är de intressanta punkterna där funktionen har ett minimum eller maximum.

    Dessa punkter kallas extrema och det visar sig att gradienten är noll vid dessa punkter.

    Så vi kommer faktiskt att använda samma procedur som vi hade i envariabelanalys. Det vill säga, vi letar efter punkter som har en gradient.

    Summering

    Det här är några viktiga begrepp i extremumanalys:

    1. En kritisk punkt är där gradienten är noll.

    2. En singulär punkt är där gradienten inte är definierad.

    3. Extrema är antingen kritiska eller singulära punkter och inkluderar även randpunkter.

    4. Den hessiska matrisen kan användas för att klassificera olika typer av extrema.

    Extrempunkter

    Extrema, eller extrema punkter, i flervariabelanalys liknar dem i envariabelanalys, förutom att de är ännu snyggare. Åtminstone om vi inte går längre än . Om vi lägger till fler dimensioner börjar de bli riktigt svåra att visualisera alls, så vi stannar i två variabler för det mesta av detta ämne.

    Teorin sträcker sig till högre dimensioner, och i vissa fall gör de tekniker vi kommer att visa också. Tyvärr visar det sig dock att undersöka extrema vara lite mer komplicerat i flera variabler än i en.

    Typer av extrema

    Det finns tre typer av extrema. En punkt i definitionsmängden för är ett extrema om och endast om:

    1. Den uppfyller . Då kallar vi det en kritisk punkt .

    2. finns inte. Då är det en singulär punkt .

    3. Det är en randpunkt för definitionsmängden .

    Vi kommer att se mer av alla dessa tre typer i de kommande föreläsningsanteckningarna. Och en liten påminnelse: glöm inte att kontrollera randen när du letar efter extrema. Det är ett klassiskt men onödigt misstag.

    Lokalt och globalt max och min

    När vi klassificerar kritiska punkter talar vi om lokala och globala min- och maxpoäng, som i en envariabelanalys.

    Funktionen har ett lokalt maximum vid i definitionsmängden , om för alla punkter i definitionsmängden som är tillräckligt nära . Om ojämlikheten gäller för alla punkter i definitionsmängden , så är det ett globalt maximum.

    Grafen nedan har ett globalt maximum vid punkten och ett lokalt maximum vid :

    Lokala och globala minima definieras på samma sätt, bara att byta till i definitionen.

    Förutsättningar för tillvaron

    Har alla funktioner extrema? Nej. Det finns några krav som måste uppfyllas.

    Tillräckliga villkor för existensen av ett maximi- och minimivärde för en funktion är:

    1. är en kontinuerlig funktion av variabler.

    2. Definitionsmängden för är en sluten och avgränsad mängd.

    Då kommer intervallet också att vara en begränsad mängd , och det finns punkter i definitionsmängden för vilka kommer att ha globala max- och minvärden.

    Dessa krav är ganska naturliga. Försök att komma på motexempel för vart och ett av dem, där det globala max eller min skulle vara odefinierat.

    Ett tips till den första; vad händer runt om ?

    Singulära punkter

    Singulära punkter är punkter där gradienten inte är definierad. Dessa kan vara punkter där är diskontinuerlig, som här:

    Detta är funktionen . När det gäller diskontinuerliga funktioner kan det, som vi nämnt tidigare, vara att funktionen inte har ett globalt max eller min.

    Specifikt går funktionen ovan till oändlighet eftersom går till . Så det finns inget globalt maximum.

    Singulära punkter kan också vara punkter där inte är differentierbar. Ett exempel är den nedre delen av konen som består av

    Eftersom vi inte kan ta partiella derivatorna där, måste vi kontrollera funktionsvärdet vid denna punkt separat för att avgöra om det är ett lokalt eller globalt max eller min.

    Kritiska punkter

    För en funktion finns de kritiska punkterna i tre versioner: maxima, minima och sadelpunkter. En punkt är en kritisk punkt om:

    Detta betyder att båda partiella derivator måste vara noll vid .

    Vid en kritisk punkt är alla partiella derivator noll

    Vid en kritisk punkt är tangentplanet horisontellt. Detta gäller för maxima:

    ... och för ett minimum:

    Det gäller även sadelpunkter. Denna typ av kritiska punkt är något lösare definierad; i grund och botten är allt som varken är maximalt eller minimum men ändå har en nollgradient en sadelpunkt.

    Nedan visas den typiska sadelpunkt till höger, tillsammans med ett mer tveksamt exempel till vänster, som faktiskt har en oändlig rad av sadelpunkter.

    Klassificering 1: "brute force"

    Om vi vill veta var de kritiska punkterna för är, är vi ofta inte nöjda innan vi också har bestämt vilken typ av kritisk punkt vi har hittat. Det är trots allt stor skillnad på att veta att vi har ett berg att bestiga eller en dal att promenera ner i.

    Det finns olika sätt att göra klassificeringen. En är att gå tillväga enligt följande: med att veta att funktionen har en kritisk punkt vid , studera funktionsskillnaden:

    När vi tar ett litet steg bort från punkten, ökar eller minskar funktionen?

    Om är positivt för alla ökar funktionen i alla riktningar runt punkten, och vi har att göra med ett minimum. Om är negativ, minskar i alla riktningar, och punkten måste vara ett maximum. Om funktionen minskar i vissa riktningar och ökar i andra, står vi ansikte mot ansikte med en sadelpunkt.

    Denna metod är brute force, och om funktionen inte är trevlig kan det vara svårt att utan tvekan dra slutsatsen att det vi har hittat inte är en sadelpunkt.

    Exempel

    Klassificera den kritiska punkten i för funktionen:

    Vi börjar med att hitta :

    eftersom kan vara både negativt eller positivt för olika värden på och , är en sadelpunkt.

    Klassificering 2: andraderivata

    Om vi inte frestas av tanken på att analysera funktionsbeteendet i alla riktningar runt någon punkt, är vår frälsare det andraderivatan .

    Liksom i en envariabelanalys tecknet på andraderivatan av en funktion vilken krökning funktionen har. Men eftersom det finns flera andraderivator är krökning svårare att läsa.

    I två variabler ger det andraderivatan oss svaret. För att förstå det, och beräkna krökning i högre dimensioner, behöver vi någon seriös linjär algebra för att hjälpa oss.

    Idag nöjer vi oss med att ange formeln för det tidigare nämnda andraderivata . Med tanke på alla andra partiella derivator av en funktion , koppla in dem i följande formel:

    Säg nu att har en kritisk punkt vid . Beräkna . Om:

    1. , då har en sadelpunkt vid .

    2. , då ger testet ingen information.

    3. och , då har ett lokalt minimum .

    4. och , då har ett lokalt maximum vid .

    Hessian

    Följande föreläsningsanteckning är starkt beroende av begrepp från linjär algebra, så hoppa över den om du inte är bekväm med den. Med detta sagt kommer vi här att bygga en bro mellan matematisk analys och linjär algebra som kan vara användbar både praktiskt och för att hjälpa din förståelse.

    Den hessiska matrisen

    Kom ihåg det andraderivatan från föregående föreläsningsanteckning. Här undersökte vi tecknet för följande funktion för att klassificera kritiska punkter:

    Det är ingen slump att vi använder bokstaven för att beteckna denna funktion. Anledningen är att det står för en determinant . I synnerhet den av en matris som kallas den hessiska matrisen .

    Den hessiska matrisen innehåller information om en funktions krökning och den hjälper oss att klassificera kritiska punkter

    Determinanten för en -matris ges av:

    Låt oss nu se vad som händer när vi infogar de andra partiella derivator av funktionen som elementen i en matris på detta sätt:

    Det vi får är den hessiska matrisen för en funktion i två variabler. Om vi antar att alla andra partiella derivator är kontinuerliga har vi följande:

    så att determinanten blir:

    Därför är det vi använde som vår funktion för att klassificera kritiska punkter för en funktion i en punkt enligt det andraderivatan determinanten av den hessiska matrisen vid .

    Anledningen till att denna teknik fungerar är att den hessiska matrisen, med dess element som alla andra partiella derivator, innehåller all nödvändig information för uppgiften, vilket är funktionens krökning i de olika riktningarna.

    Detta kan vara användbart inte bara för att klassificera kritiska punkter, utan för att undersöka krökning vid någon annan punkt också. Till exempel när man skissar en yta i 3D.

    Klassificering av kritiska punkter i alla dimensioner

    Den hessiska matrisen finns för två gånger differentierbara funktioner av valfritt antal av variabler, med ser det ut som följer:

    Nu kan den hessiska matrisen användas för att klassificera kritiska punkter i vilken dimension som helst, men det är inte fullt så enkelt som att titta på determinanten. Istället har vi följande:

    Om punkten är en kritisk punkt för funktionen där alla andra partiella derivator är kontinuerliga runt , då är en:

    1. (a) lokalt max om är positiv definit

    2. (b) lokal min om är negativ definit

    3. (c) sadelpunkt om är indefinit

    Minns från linjär algebra att en matris är

    1. positiv definit om alla egenvärdena för är positiva.

    2. negativ definit om alla egenvärdena för är negativa.

    3. indefinit om det finns både negativa och positiva egenvärden.

    Innehållsförteckning
      Gillar du det vi gör? Hjälp oss och dela detta avsnitt.

      En matteapp som hjälper dig att lyckas

      Vissa använder Elevri som kompletterande material för sina studier. Andra använder bara Elevri. Vårt uppdrag är att inspirera, coacha och göra matematik tydlig.

      common:appPromoteSection.imageAlt

      Vissa använder Elevri som kompletterande material för sina studier. Andra använder bara Elevri. Vårt uppdrag är att inspirera, coacha och göra matematik tydlig.

      Apple logo
      Google logo
      © 2023 Elevri. All rights reserved.