Palydovai kasdien užfiksuoja milžiniškus kiekius Žemės vaizdų, tačiau jų analizė mokslininkams vis dažniau tampa iššūkiu. Nuotraukas reikia perduoti į Žemę, apdoroti ir įvertinti, o tam reikia vis daugiau laiko, energijos ir duomenų perdavimo pajėgumų. Kitaip tariant, šiuolaikiniai palydovai jau surenka daugiau vaizdinės informacijos, nei mokslininkai spėja peržiūrėti.
Tačiau palydovas YAM-9 veikia kitaip – jis pats atpažįsta ir apibūdina vaizduose matomus objektus, neperduodamas jų į Žemę ir nelaukdamas antžeminės valdymo komandos patvirtinimo.
Be to, palydovui galima pateikti užduotis natūralia kalba – panašiai kaip naudojantis „Google Gemini“ ar „Siri“. Pavyzdžiui, jo galima paprašyti: „Surask visus geležinkelio mazgus šioje šalyje.“
Tokį proveržį leido pasiekti NAVI-Orbital – NASA sukurta programa, prie kurios kūrimo prisidėjo NASA Reaktyvinio judėjimo laboratorijos (JPL) tyrėjai ir technologijų startuolis „Loft Orbital“.
„Istoriškai, norint palydovui pavesti atpažinti naują objektą, reikėdavo rašyti komandų sekas, iš naujo patvirtinti palydove veikiančią programinę įrangą ir įkelti naujus dvejetainius failus, – savo „ArXiv“ paskelbtame straipsnyje rašė tyrėjai. – Pagal NAVI-Orbital paradigmą užduoties pakeitimas iš esmės reiškia naujos užklausos redagavimą ir įkėlimą. Tai sutrumpina užduoties keitimo ciklą ir leidžia tokias užduotis kurti ne tik tiems, kurie turi specializuotų komandų sekų rašymo žinių.“
Dažniausiai, kai bendraujate su dirbtinio intelekto pokalbių robotu, tokiu kaip „Claude“ ar „ChatGPT“, jūsų užklausos siunčiamos į daug energijos naudojančius duomenų centrus. Ten jos apdorojamos, o atsakymas grąžinamas atgal.
Tačiau kai dirbtinio intelekto modeliai veikia pačiame įrenginyje, apdorojimas vyksta daug greičiau, nes nereikia duomenų siųsti pirmyn ir atgal. Kalbant apie palydovus, tai reiškia ir mažesnį poreikį palaikyti ryšį su Žeme.
„Paprastai naudotojas turi duoti palydovui užduotį per API, laukti, kol bus surinkti ir į Žemę atsiųsti vaizdai, o tada analizuoti juos naudodamas iš anksto apmokytą algoritmą Žemėje. Šis dirbtinis intelektas iš tiesų gali „matyti“, kas yra vaizde, ir nustatyti, ko ieško analitikas, pavyzdžiui, tiltus, greitkelius, konkrečius vandens telkinius ar stichinių nelaimių požymius, tokius kaip potvyniai ir miškų gaisrai“, – „ScienceAlert“ sakė „Loft Orbital“ vyresnioji rinkodaros vadovė Sarah Preston.
Šiame palydove įdiegtas dirbtinis intelektas „Google DeepMind Gemma 3“. Tai yra regos ir kalbos modelis, vadinasi, jis apdoroja ir tekstą, ir vaizdus. Ypač svarbu tai, kad jis gali veikti mažame palydove, kuriame fizinis dydis, energijos suvartojimas ir skaičiavimo galia turi būti kruopščiai valdomi.
„Šį procesą valdo kelių agentų architektūra, sudaryta iš trijų savarankiškų agentų, kurie perduoda darbus vienas kitam: orkestratoriaus, koordinuojančio vykdymą, detektoriaus, analizuojančio, klasifikuojančio ir apibendrinančio vaizdus, ir dialogo agento, leidžiančio operatoriams užduoti klausimus apie rezultatus“, – rašė tyrėjai.
Kitaip tariant, technikai gali palydovo programinei įrangai tiesiog užduoti klausimą, užuot programavę ją kiekvienai atskirai užduočiai.
Atliekant bazinius bandymus Žemėje, sistema gebėjo plačiai atpažinti, kas matoma maždaug 7960 vaizdų, 88,2 proc. tikslumu. Ji priskyrė juos tokioms kategorijoms kaip gyvenamosios teritorijos, paplūdimiai, žemės ūkio zonos ir kalnai.
Kol kas orbitoje atlikti tik du tiesioginiai vaizdų fiksavimo bandymai, tačiau ateityje jų planuojama atlikti daug daugiau. Ateityje tokia technologija galėtų būti taikoma gerokai plačiau nei tik žemojoje Žemės orbitoje. Paprastas ir greitas užklausų bei analizės metodas, panašus į čia pademonstruotą, galėtų būti naudojamas ir mėnuleigiams ar marsaeigiams, tyrinėjantiems Mėnulio ar Marso paviršių.
„Bendrovė siekia išplėsti šias galimybes ir padėti misijoms, kurioms reikia greitų sprendimų vietoje – tiek civilinėse, tiek komercinėse, tiek gynybos srityse. Mūsų tikslas yra toks, kad palydovai veiktų kaip nuolatiniai stebėtojai: jūs nurodote jiems stebėti pakrantę dėl naftos išsiliejimų arba pažymėti naujas statybas netoli sienos. Palydovas įvertintų tai, ką mato, ir praneštų tik tada, kai kažkas atitiktų nurodytus kriterijus“, – „ScienceAlert“ sakė S.Preston.

