Canon har lavet en masse støj om sit nye Deep Learning AF-system, der ligger i hjertet af producentens seneste professionelle professionelle kamera. Det lyder utroligt smart, men der er masser af spørgsmål - hvad er Deep Learning? Hvem underviser? Lærer systemet, mens du skyder? Er det virkelig kunstig intelligens i et kamera? Gør det faktisk autofokus bedre?
Hvis du har læst vores Canon EOS-1D X Mark III anmeldelse, ved du, at svaret på det sidste spørgsmål er et rungende ja. Hvad angår svarene på de andre spørgsmål om Deep Learning AF, tag dig selv en drink og en snack og læs videre …
Autofokusmekanikken i Canon EOS-1D X Mark III er utrolig smart og understøtter to individuelle AF-systemer. For det første er det optiske system, der skyder 16 billeder i sekundet gennem søgeren ved hjælp af en målesensor på 400.000 pixel i forbindelse med en dedikeret Digic 8-processor til 191-punkts AF, der er i stand til ansigtssporing.
Derefter er der Live View-systemet, der er i stand til at optage 20 billeder i sekundet og anvende alle 20,1 millioner pixels i billedsensoren kombineret med den nye Digic X-processor til 3.869 Dual Pixel CMOS-punkter, der kan udføre fuld øjenregistrerings-AF.
At drive begge disse systemer er Canons kerne EOS iTR AFX-teknologi - den nyeste iteration af dens Intelligent Tracking and Recognition Auto Focus, der debuterede i den originale EOS-1D X (og efterfølgende gjorde vej til 7D Mark II og 5D-familien). Og begravet inden for dets kredsløb er Deep Learning-algoritmen.
Deep Learning er IKKE det samme som AI
Først og fremmest er det vigtigt at præcisere, at Deep Learning ikke må forveksles med kunstig intelligens (AI). Et AI-system er noget, der er i en løbende tilstand af udvikling. Deep Learning eller maskinindlæring er en delmængde af AI.
I modsætning til ægte AI er Deep Learning en lukket proces. Det er en præ-samling algoritme, der gør det muligt for kameraarkitekturen i det væsentlige at lære sig selv, meget hurtigere end det kunne programmeres manuelt af menneskelige ingeniører. Når denne læring er afsluttet, låses den ned og lægges i kameraet.
Fra dette punkt er ikke mere læring mulig; på trods af navnet - og Deep Learning er navnet på teknologien, ikke en beskrivelse af processen - kameraet lærer ikke konstant og bliver ikke 'bedre', jo mere du skyder (faktisk ville et ægte AI-system lære så mange af dine dårlige vaner, som det ville være dine gode!).
"Det er blevet undervist," forklarer Mike Burnhill, teknisk supportchef for Canon Europe. "Du lægger det i en computer, det skaber algoritmen, der derefter lægges i kameraet. Så det er forskelligt fra AI - AI er en kontinuerlig læring; dyb læring er dybest set, den lærer sig selv og giver dig et slutresultat, der derefter indlæses ind i kameraet. "
Hvilket rejser spørgsmålet: Er et kamera faktisk i stand til at understøtte kunstig intelligens med så mange virksomheder, der råber om AI-baserede funktioner?
"Processorkraften til at udføre ægte AI er ikke mulig i et kamera," siger Burnhill. "Hvis du vil gøre det, er der telefoner - men dataene findes ikke i din telefon, de er i Silicon Valley. Det er her AI-systemet er. Det er bare, din telefonforbindelse forbinder til det - det er ikke her, det er der (i skyen), fordi du har brug for en server. Vi kunne lave et kamera, men du vil hele tiden have en kæmpe flyskuffe rundt med dig. "
Hvordan lærer Deep Learning sig selv?
Så Deep Learning-algoritmen lærer sig selv - men hvor lærer den faktisk af? Svaret er simpelt sagt 'fra det bedste'.
"Canon arbejdede med vores bureauer," fortæller Burnhill. "Vi fik stort set adgang til hele deres billeddatabase over sportsfotografering fra alle de store agenturer, vi arbejdede med vores ambassadører, der skyder sport, og de leverede deres billeder af forskellige emner, og det tillod os at lære dette AF-system, hvordan man genkender mennesker i sport. "
Sport er naturligvis den målrettede undervisningsmetode, fordi Canon EOS-1D X Mark III primært er et sportskamera. Problemet er, hvad enten det er en basketballspiller, der vender væk fra kameraet, en skiløber, der bærer beskyttelsesbriller eller en formel 1-chauffør, der bærer hjelm, folk i sport ofte har deres ansigter tilslørede - hvilket betyder, at traditionelt ansigt eller endda øjenregistrering AF ikke t fungerer, og kameraet låser i stedet på ting som numrene på en spillers uniform.
Ved at give Deep Learning-algoritmen adgang til et stort bibliotek med billeder af alt lige fra hovedet gymnaster til hockeyspillere iført pads og hjelme, er det i stand til at lære og differentiere den menneskelige form i en endeløs række situationer - og er i sidste ende i stand til at udføre denne 'hovedopdagelse', så selvom personens ansigt ikke er synligt, er hovedet altid det primære fokuspunkt.
"Dyb læring er dybest set der er billeder, du opretter et sæt regler, som det kan læres af, og så går det afsted, og det opretter sin egen algoritmebaserede," fortsætter Burnhill. "Så du indstiller parametrene for, hvordan personen vil se ud, du går, 'Her er personen', så analyserer det alle billeder af mennesker og siger, 'Dette er en person', 'Det er en person'. Det går gennem millioner af billeder over en periode og opretter den database, og den lærer af sig selv. "
Faktisk opretter algoritmen faktisk to databaser - en til at servicere det optiske søger-AF-system og måling ved hjælp af Digic 8 og en til at servicere Live View AF-systemet, der bruger Digic X. Da det er Digic X, der udfører al beregningen for head tracking, når AF-algoritmen først registrerer en person i rammen, skubbes alt over til den nye processor.
"Når du har fået en person ind, har du faktisk dobbelt behandling i gang," siger Burnhill. "Der er to databaser her, fordi input fra begge sensorer vil være lidt anderledes, så hvordan det genkendes, vil være lidt anderledes, så disse er undergrupper af den samme algoritme. Kernedataene for dem begge er de samme, det er bare hvordan det genkendes, og de rigtige data anvendes på det. "
Hvis det ikke kan lære nye ting … hvad med dyre-AF?
Selvfølgelig er Canon EOS-1D X Mark III ikke kun et sportskamera - dets andet vigtige publikum er naturskytte. Alligevel har kameraet ikke dyrefunktion til autofokus, og vi har fastslået, at Deep Learning faktisk ikke kan lære nye tricks, når det først er bagt ind i kameraet. Så er det det? Med al denne smarte nye teknologi, vil kameraet ikke engang fokusere på familiehunden?
Det er rigtigt, at kameraet lige nu ikke har dyre- (eller dyreøje) AF. "Grundlæggende koncentrerer vi os om, at folk starter med at få den slags algoritme til at fungere først," svarer Burnhill. "Derfor har vi lidt fokuseret på sport, fordi det er en bestemt parameter, og vi kan lære det i en bestemt periode,"
Svaret ligger altså i firmware. Burnhill bekræftede, at der er potentiale for, at kameraet gennemgår mere dyb læring, for ting som fugle og dyreliv, og at denne opdaterede algoritme formidles til brugerne via firmwareopdateringer - selvom der ikke er nogen konkrete planer om at annoncere.
"Vi vil udvikle det hele tiden, så i øjeblikket er det stadig uafgjort, hvordan og hvor vi går hen. Men udviklingsteamet går og ser på anden dyrefotografering - vi er klar over, at der er en lang række felter, men naturligvis de store fokus på dette kamera er sport og derefter vilde dyr, og naturligvis med Tokyo 2022-2023 var dette prioriteten. "
Det er et rimeligt punkt; hvis Canon ventede på Deep Learning for at lære alt, ville det have taget længere tid for kameraet at blive frigivet. Og selvom producenter som Sony praler med nogle selektive dyre-AF i deres kameraer, bemærker Burnhill, at Canon meget hellere vil frigive en komplet dyre-AF-løsning snarere end en selektiv, stykkevis. Og det er her Deep Learning bliver uvurderlig.
"Problemet er med dyrelivet, der er mange forskellige dyr - du har tydeligvis rovdyr med øjnene forrest, og så har du kaniner (øjne) ved siden, du har slanger, du har fugle … der er intet system, der genkender ansigterne på alle dyr. Og det er her, du kommer ind i hele denne Deep Learning, at lære systemet at genkende disse komplekse ting. "
Så mens din Sony muligvis kan spore din hund eller din kat, men ikke en salamander eller en flamingo, vil Canon fremstille et kamera, der gør alt eller intet. "Hvis vi skulle gøre det, ville vi gerne gøre det for et så bredt spektrum - vi ønsker ikke at lave et hundevenligt kamera og et kattevenligt kamera, vi vil lave et dyrevenligt kamera der fungerer for den brede vifte af dyr, som (professionelle) ville skyde. "
Canon EOS-1D X Mark III anmeldelse
Hvordan lavede Canon den hurtigste DSLR nogensinde? Ved at redesigne spejlboksen
102 opdateringer om Canon EOS-1D X Mark III