Gemini робіць цуды з гістарычная спадчынай
Тэлеграм-канал «Спадчына»
У канцы жніўня ў тэлеграм-суполцы Беларускі ШІ заўважыў прыклад таго, як можа апрацоўваць фота новая мадэль Nano Banana (Gemini 2.5 Flash Image) ад Google. Выглядала надзвычай эфектна, таму я вырашыў паспрабаваць паўтарыць тое ж самае з гістарычнымі фотаздымкамі.
Першым быў выбраны фотаздымак плошчы Свабоды ў Мінску, зроблены ў пачатку з гатэля "Еўропа". Здымак мякка кажучы благой якасці — вельмі зярністы і невыразны, таму я не спадзяваўся на большае, чым звычайную каларызацыю, якую робяць іншыя нейрасеткі.
Але тое, што атрымалася, выклікала пачуццё, якое навукоўцы адчулі, калі атрымалі моцны радыёсігнал з глыбокага космасу — кароткае Wow! Вынік сапраўды ўражвае. Нейрасетка не проста каларызавала фота, яно ў мешаніне чорна-белых пікселаў змагла зразумець, дзе на фота ліштвы, дзе балконы, а дзе - мінарэт і купал Саборнай мячэці ў Татарскім канцы, ледзь бачныя на фота. Вядома, калі пачаць шукаць, то можна знайсці недакладнасці, але вынік пераўзыходзіць усё, што мы бачылі раней і што мы чакалі б пабачыць сёння.

Апрацаванае фота выглядае так, быццам нехта з акна гатэлю сфатаграфаваў плошчу на свой смартфон літаральна ўчора. Магчыма, праз нейкі час мы звыкнемся з такой якасцю, як звыкліся з камп'ютарнай графікай, якая ў фільмах 90-х выглядала сапраўдным цудам. Але сёння тое, што можа рабіць з гістарычнай спадчынай Gemini — сапраўдны цуд, якія адкрывае новыя магчымасці.
Галоўны плюс мадэлі - яна даступна бясплатна абсалютна ўсім, хто мае акаўнт у Google, проста пераходзьце ў AI Studio, выбірайце Try Nano Banana, закідайце фотку і пішыце на любой мове, што вы хочаце атрымаць. Далей пачынаецца магія. Паспрабуйце з самага проста промта: "палепшы гэтае фота" — вельмі часта нічога больш не трэба.
Колькасць запытаў за дзень абмежаваная, але вельмі вялікая. Зрэшты ў першы вечар яны былі вычарпаны пад нуль у жаданні пабачыць на свае вочы тыя помнікі архітэктуры Беларусі, якіх больш не існуе. Уражвае не толькі тое, што робіць Gemini, але і наколькі пазбаўленымі жыцця і плоскімі выглядаюць чорна-белыя гістарычныя фотаздымкі. Яны нясуць мала інфармацыі для нас, сучасных людзей. Асабліва гэта адчуваецца на інтэр'ерных фотаздымках, якія ў колеры набываюць аб'ём і даюць разуменне, які ж па праўдзе дух стаяў у палацах беларускай шляхты.


Магчымасці нейрасеткі часам падаюцца бязмежнымі. Яна можа дабудаваць інтэр'ер там, дзе бракавала якасці тагачасным фотаапаратам, пры гэтым ножкі крэслаў не зліваюцца ў пачварнага монстра, а адпавядаюць канкрэтнаму прадмету гарнітура. Nano Banana можа пабачыць тое, што не бачыць нашае вока, як прыцененая разьба на цёмным дрэве - спачатку ты думаеш, што нейрасетка проста выдумала гэта, але пасля пачынаеш прыглядацца да цёмнай плямы на такім жа цёмным фоне і бачыш, што там сапраўды нешта такое ёсць.
Нейрасетка можа распазнаць і аднавіць выявы па выразках з нізкаякасных міжваенных газет, ці прыбраць вельмі моцную пікселяцыю фота, быццам нехта сфатаграфаваў экран тэлевізара.

Яна здольная выдумляць, але робіць гэта вельмі далікатна, упісваючыся ў існыя межы, а не пачынаючы чудзіць, як нейрасеткі-папярэдніцы.
Мы нарэшце можам пабачыць гістарычныя гарады і мястэчкі Беларусі такімі, якімі б яны мусілі быць сёння - ва ўсім харастве барока і з суровымі мурамі старажытных камяніц. Гэта вельмі добры і вельмі зразумелы, навочны спосаб паказаць беларусам, што яны насамрэч страцілі, і даць зразумець, што калі гэта можа аднавіць нейрасетка, то здолеем аднавіць і мы ў натуры.
Nano Banana дазваляе не толькі палепшыць фота, але і адрамантаваць помнікі на фота: адрамантаваць дзіры ў тынкоўцы, вярнуць вокны ў закладзеныя праёмы, абразы - ў алтары. Можна загадаць яму дадаць антуражу - лавы для парафіян, алтар з царкоўным начыннем, свечкі і карункавыя абрусы, уласна саміх людзей — на што хопіць вашай фантазіі.


Можа накласці на сучаснае фота чарцёж недабудаванай часткі ці элемента — і Gemini у стане намаляваць яе так, быццам яна заўсёды там была. Нейрасетка здольная адмаляваць in situ помнік, якога нікога не было, або цэлую мясцовасць па малюнках XVIII-XIX стагоддзя, вельмі далёкіх па дакладнасці ад любога фота — гэта значна пашырае іканаграфію помнікаў. Мы нарэшце можам пабачыць, напрыклад, знішчанае Берасце, якім яго маглі бачыць да будаўніцтва крэпасці.
Гэта не кажучы, што тая ж нейрасетка можа стылізаваць выяву для дзіцячай кнігі, ці пад канкрэтны дызайн блога. Спадчына становіцца больш бачнай і даступнай.

Але гэта інструмент не толькі для забаў, у нейрасеткі ёсць моцны навуковы патэнцыял, бо яна можа бачыць і выяўляць тое, што можа не заўважыць чалавечае вока, яна можа дапамагчы даследчыкам праверыць свае гіпотэзы, рэстаўратарам - падабраць найлепшы варыянт аднаўлення страчанага яшчэ на стадыі эскіза. Поле выкарыстання надзвычай шырокае.
Захвальваючы Nano Banana не варта забываць і пра цёмныя яе бакі. Нейрасетка працуе рандомна, па прынцыпе прыліваў і адліваў з невядомым графікам: у адзін час яна можа выдаць ідэальны вынік з першай спробы, у іншы - ведаючы, як насамрэч яна можа, ты гадзінамі можаш дамагацца зрабіць ад яе хоць нешта, што з'ядае шмат часу і маральных сіл. Сама Gemini не самая разумная, калі параўноўваць з тым жа ChatGPT, хутка забывае, блытаецца ў паказаннях і не заўсёды разумее, што ад яе хочуць — але для бясплатнага доступу гэта дробязі. Калі вам не спадабаецца вынік, не бойцеся паставіць дызлайк, націснуць на кнопку Return ці проста паспрабаваць тое ж самае ў іншым чаце.
Проста спрабуйце і дзяліцеся вынікам - у нас засталося так шмат фота і так мала помнікаў, можа Gemini верне нам спачатку памяць, а пасля і тое, што мы страцілі, але яшчэ можам вярнуць!


































Не ведаю, у чым рабілі свае выявы наступныя аўтары, падазраю, што ў тым жа Gemini, але прыводжу іх тут для разумення магчымасцей нейрасетак сёння.















