Amikor megörökítünk egy pillanatot, láthatatlan algoritmusok és mesterséges intelligencia-alapú folyamatok formálják a képet még azelőtt, hogy az megjelenne a galériánkban. Mennyire formál ez minket is?

A Képernyőidő ingyenes, de nem ingyen készül. Segítsd munkánkat egy tetszőleges adománnyal, hogy minél több tartalom születhessen.
A tárgy mezőbe írd be, hogy adomány. Köszönjük segítséged, igyekszünk megszolgálni.
Az egyszerű javításoktól a „hallucinált” arcvonásokig a modern telefonok döntenek arról, hogyan nézzenek ki az emlékeink. Lehet, hogy tetszik az eredmény, de közben észrevétlenül át is formálhatja, ahogyan a világot látjuk - írja a BBC cikke, amelyet több szempontból is érdekesnek találtunk, mondanivalóját pedig kutatásokkal egybeöntve tálaljuk neked, hátha számodra is hasznos, érdekes lehet ez a gondolat.
Amikor a telefonoddal fotózol, a lencsén bejutó fény egy apró fényérzékelő lapkára, a szenzorra érkezik, amely minden ponton „megméri”, mennyi fény érkezett oda. A kamera alkalmazás közben folyamatosan számolja, hova állítsa az élességet, mennyire legyen világos a kép, és milyen színhőmérséklet tűnik természetesnek.
Amikor rányomsz az exponálógombra, a telefon nagyon rövid időre rögzíti a szenzor állapotát: ez az expozíció, ekkor „készül” a kép. A nyers mérési adatokat a telefon azonnal átalakítja:
A végeredményt végül tömörített képfájlként (pl. JPEG) elmenti a tárhelyre, és a galéria alkalmazásban már ezt a kész, feldolgozott képet látod.
Ziv Attar, a Glass Imaging vezérigazgatója, aki korábban az iPhone portrémódjának fejlesztésén dolgozott ezt szimplán számítógépes fotográfiának hívja, amelynek során a telefon jóval többet tesz annál, mint hogy összegyűjti a szenzorra érkező fényt.
„Megpróbálja kitalálni, hogyan nézne ki a kép, ha a kamera jobb lenne, majd ezt a képet építi fel neked” – magyarázza.
Tehát amikor megnyomod az exponálás gombot egy telefonon, nem egyetlen képet rögzítesz, hanem általában négy és tíz közötti fotót, normál fényviszonyok mellett. A telefon ezeket a képeket összemossa, hogy egy olyan fotót hozzon létre, amely elvileg jobb, mint bármelyik egyedi felvétel. Néhány kép lehet teljesen azonos, mások különböző részekre helyezik a hangsúlyt.
Még akkor is, ha a hangzatos, MI-vezérelt szerkesztési funkciókat kikapcsolod, az algoritmusok továbbra is dolgoznak az általad készített képeken.
A BBC példája szinte tankönyvi. Évekkel ezelőtt már egy Reddit-felhasználó mutatta be, hogyan manipulálja a telefon szoftveres megoldása (akár MI-nek nevezzük, akár digitális képjavító technológiának, ez mindegy) a készített képet: gyakorlatilag hamisít.
Reddit: Egy 2005-ben indult, közösségi alapú online fórumrendszer, ahol felhasználók tematikus aloldalakon (úgynevezett subredditeken) osztanak meg tartalmakat, kérdéseket, tapasztalatokat és vitákat. A bejegyzéseket és hozzászólásokat a közösség értékeli, így a jól dokumentált, bizonyítékokkal alátámasztott posztok gyakran nagy láthatóságot kapnak.
Amikor ez a poszt készült, akkor volt hangzatos marketing-szöveg a „100x Space Zoom” funkció, amelynek segítségével az akkori csúcstelefon elképesztő részletességgel rögzítette képen a Holdat, annak ellenére, hogy a kamera lencséje nagyjából köröm méretű. A Reddit-felhasználó szemléletesen be is mutatta a csalást: egy Samsung telefont tartott egy szándékosan elmosódott, pixeles Hold-kép elé, amely a számítógépén volt megnyitva. A telefon készségesen „lefényképezte” a képet, és szép, éles fotót készített, tele kráterekkel és árnyékokkal – olyan részletekkel, amelyek az eredeti képen egyáltalán nem voltak jelen. A vállalat ezt „részletjavító funkciónak” nevezi. A valóság az, hogy a Samsung egy mesterséges intelligenciát tanított be a Hold felismerésére, amely kitölti a hiányzó részleteket, amikor a kamera önmagában nem képes azokat rögzíteni.
És pontosan ugyanígy torzul minden emlék, amit megörökítünk.
A legtöbb háttérfolyamat a hibák, a tökéletlenség elrejtéséről szól.
Az iPhone-ok például egy Deep Fusion nevű funkciót használnak, amely több millió képen betanított MI-re épül. Az előbb említett technikák kezelése mellett ez képes felismerni a képen látható objektumokat, és azokat eltérően feldolgozni, az egyes pixeleket olyan korábbi képek alapján módosítva, amelyeket az MI már „látott”. Pont, mint a Hold esetében.
Nem azt mutatom meg, hogy néz ki az adott elem, hanem tudom, hogy kell kinéznie, és azt teszem a képre.
Az eredmény ideális körülmények között éles, tiszta fotó. Egyes kritikusok és éles szemű amatőrök szerint azonban a modern telefonok gyakran túlzásba esnek, és olyan képeket készítenek, amelyek furcsán műanyag hatásúak, vagy lapos textúrájuk akvarellfestményekre emlékeztet. A problémák eltüntetéséért folytatott erőlködés közben a telefonok olykor bizarr torzulásokat is létrehoznak, amelyek a részletekbe nagyítva MI-hallucinációkra hasonlítanak. Vannak, akik annyira elégedetlenek az új telefonok túlságosan polírozott képeivel, hogy visszatérnek a régebbi modellekhez, vagy külön eszközt hordanak magukkal kizárólag fotózásra.
MI-hallucináció: Olyan jelenség, amikor a mesterséges intelligencia valós adatok hiányában is „kitalál” részleteket, és azokat hitelesnek tűnő módon jeleníti meg. Képfeldolgozásnál ez azt jelenti, hogy az algoritmus olyan arcvonásokat, textúrákat vagy részleteket ad hozzá egy fotóhoz, amelyek a valóságban nem voltak jelen, csak a tanult minták alapján „odaillenének”. Fontos különbség, hogy ez nem hiba a klasszikus értelemben, hanem a rendszer működéséből fakadó következmény: az MI nem rögzíti a valóságot, hanem valószínűségi alapon rekonstruálja, mit kellene látnunk. Ezért válhatnak a képek egyszerre meggyőzővé és félrevezetővé.
Lev Manovich, a New York-i City University Graduate Center digitális kultúra és média professzora szerint a jelenségnek van pozitív olvasata is.
„Olyan képességek váltak elérhetővé az amatőrök számára, amelyek korábban csak a profik kiváltságai voltak.”
Ugyanakkor a telefon gyakran kreatív, sőt művészi döntéseket hoz a rögzített emlékekről. A felhasználók sokszor nem is tudnak erről – és bizonyos telefonokon az MI jóval többet tesz, mint puszta paraméter-finomítást.
Persze eleve nehéz eldönteni, hogy milyen egy ténylegesen valósághű kép. A legelső kameráktól kezdve minden fényképezőgép tartalmazott beépített feldolgozási döntéseket. Könnyű meghallani az „MI” szót, és rögtön valami borzalmasra gondolni, de azért sok esetben az algoritmusok egyszerűen az apró lencsék és szenzorok velejáró hibáit korrigálják.
A gond akkor van, amikor a mesterséges intelligencia már annyira erősen torzít, hogy a valóságot próbálja elfedni. Az ázsiai piacokra szánt telefonokon, különösen a kínai márkák modelljein gyakran alapértelmezetten be vannak kapcsolva az MI-alapú „szépségszűrők”, amelyek automatikusan simítják vagy átszínezik a bőrt, illetve módosítják az arcvonásokat. Ezekkel mi is találkozhatunk már, az alapértelmezett filterezés olyan, mint sok tévében a képjavító technológia, a feltételezett szép esztétikai élmény érdekében állít el mindent a képen, teljesen műanyag élményt nyújtva.
Szakértők szerint mindez kulturális normákra és preferenciákra vezethető vissza. Az amerikai technológiai óriások által gyártott telefonokon ilyesmit nem nagyon találsz alapértelmezetten. Az iPhone-ok nem kínálnak beépített szépségszűrőket, a Google pedig 2020-ban alapértelmezetten kikapcsolta a Pixel készülékeken ezeket, káros mentális egészségügyi hatásokra hivatkozva.
„Az esztétikai finomítás nem új dolog” – nyilatkozta a BBC-nek Manovich professzor. „A fotók retusálása az 1850-es évek óta a fényképezés fontos része, és bizonyos értelemben hasonló ahhoz, amit ma csinálunk: az arc szépítése, a bőr egységesebbé tétele. De az, hogy automatikusan új részleteket adunk hozzá, amelyek a jelenetben valójában nem léteztek, szerintem radikálisan új… Bizonyos értelemben ez még mindig fotográfia. Más szempontból viszont már valami egészen más.”
Ez nem pusztán filozófiai kérdés. Kutatások szerint az MI-vel szerkesztett fotók és videók hamis emlékeket ültethetnek el, vagy megváltoztathatják azt, ahogyan a saját testünkről gondolkodunk és érzünk.
Ha nem szereted a HDR-t, kikapcsolhatod, letilthatod a szépségszűrőket, és kikapcsolhatod a képoptimalizáló beállításokat a legtöbb telefonon. Ha azonban a kamerák szenzorairól közvetlenül érkező, mindenféle MI-feldolgozástól mentes, tiszta képet akarod, akkor extra lépésekre van szükség.
Az újabb Samsung telefonokon például a Pro mód teljesen „nyers” fotókat készít. A név ellenére az iPhone ProRAW funkciója (amely csak a Pro modelleken érhető el) tartalmaz némi MI-feldolgozást. Az igazán nyers iPhone-fotókhoz speciális beállításokra van szükség egy külső alkalmazásban. Népszerű megoldás például a VSCO Capture és az Adobe Lightroom.
A végeredmény persze így a hagyományos értelemben nem lesz szép, általában csak a profi fotósok használják így a fotókat, és kézi utómunkával javítják ezeket.
Kutatások alapján nem egyetlen fotó vagy szűrő torzítja a gyerekek énképét, hanem az a vizuális környezet, amelyben felnőnek. Ebben a közegben a telefon már nemcsak rögzít, hanem normát közvetít: azt sugallja, hogyan „kellene” kinéznie egy arcnak, egy testnek vagy akár egy emléknek.
A tudományos szakirodalom egyik legstabilabb megállapítása, hogy az idealizált képekkel való találkozás és az online vizuális összehasonlítás összefügg a rosszabb testképpel és a fokozott önkritikával, különösen serdülőkorban. Egy 2024-es, több tucat korábbi vizsgálatot összegző meta-analízis szerint az online összehasonlítási hajlam szignifikánsan együtt jár a testelégedetlenséggel és az evészavarhoz köthető tünetekkel. A kutatók hangsúlyozzák: nem egyetlen platform vagy funkció a probléma, hanem az összehasonlítás állandósulása.
Egy 2023-as, hosszabb időtávon végzett empirikus vizsgálat arra jutott, hogy a fotók rendszeres szerkesztése és „javítása” együtt járhat alacsonyabb önértékeléssel, valamint az úgynevezett ön-tárgyiasítással, amikor valaki elsősorban külső szemmel, „nézhető tárgyként” kezdi értelmezni önmagát. A tanulmány nem állít közvetlen okozati kapcsolatot, de világos mechanizmust ír le: minél inkább projekt lesz a külső, annál könnyebben válik mércévé.
A mesterséges intelligencia által módosított képek hatása nem áll meg a testképnél. Egy kapcsolódó kutatás eredménye szerint az MI-vel módosított fotók és videók növelhetik a hamis emlékek kialakulásának esélyét. Egy 2024-ben publikált, előregisztrált kísérlet azt találta, hogy az MI által „életszerűsített” vizuális anyagok nagyobb arányban vezettek téves emlékezéshez, mint a nem módosított tartalmak.
Fontos hozzátenni: a pszichológia már jóval a mesterséges intelligencia megjelenése előtt kimutatta, hogy a képi bizonyíték önmagában is képes módosítani az emlékezetet. Korábbi vizsgálatok szerint hamis vagy manipulált fotók hatására az emberek olyan eseményekre is „emlékezhetnek”, amelyek meg sem történtek. Az MI ezt a jelenséget nem hozta létre, de felerősítheti.
A mesterségesen feljavított képek persze nem önmagukban ártanak, hanem akkor, ha magyarázat nélkül válnak mércévé. A szülői szerep itt nem cenzor, hanem tolmács a valóság és az algoritmus között.