Krok wstecz po negatywnych reakcjach użytkowników
Caira Camera, stworzona przez Camera Intelligence — firmę działającą wcześniej pod nazwą Alice Camera — wzbudziła duże zainteresowanie w ubiegłym roku. Wszystko za sprawą ogłoszenia integracji Google Nano Banana bezpośrednio w procesie przetwarzania obrazu. Technologia ta miała umożliwiać użytkownikom wprowadzanie radykalnych zmian w zdjęciach i modyfikowanie rzeczywistości. Po fali krytyki firma postanowiła znacząco ograniczyć możliwości generatywnej edycji.
Co powiedział dyrektor generalny firmy?
Podczas targów CP+ w Jokohamie w Japonii, dyrektor generalny Camera Intelligence, Vishal Kumar, wyjaśnił, że firma uważnie wsłuchała się w głosy użytkowników i odpowiednio zmodyfikowała swoje podejście.
„Kiedy w październiku ogłosiliśmy funkcję generatywnej edycji, był to niezwykle surowy, wczesny i niejasny koncept. Nie spodziewaliśmy się, że od razu wszystko zrobimy idealnie. Wychodzimy jednak z założenia, że wiele osób spoza branży fotograficznej ma trudności z opanowaniem i pełnym wykorzystaniem narzędzi do edycji, takich jak Lightroom czy Photoshop" — mówi Kumar.
„Postrzegaliśmy naszą funkcję generatywnej edycji — obecnie opartą na Nano Banana — jako sposób na osiągnięcie i naśladowanie złożonych technik postprodukcji w czasie rzeczywistym, za pomocą prostych poleceń w języku naturalnym. Technik, które wcześniej były możliwe wyłącznie w przepływach pracy na laptopach, czyli w oprogramowaniu takim jak Adobe."
Testy z twórcami ujawniły poważny problem
Niedługo po ogłoszeniu funkcji generatywnych, Camera Intelligence przekazała egzemplarze testowe trzem twórcom: Tony'emu Northrupowi, Jimmy'emu Chengowi oraz Emily Lowrey.
„Mimo że wprowadziliśmy pewne zabezpieczenia, ten prototyp dawał w zasadzie całkowicie otwarty dostęp do Nano Banana. Okazało się, że 'otwarte okno poleceń' było nieco zbyt przerażające — większość ludzi wpisywała po prostu pierwsze, co przyszło im do głowy. Były to zazwyczaj niejasne lub absurdalne frazy, zamiast przemyślanych poleceń, których się spodziewaliśmy" — przyznaje Kumar.
Firma wyciągnęła wnioski z opinii twórców, komentarzy na YouTube oraz warsztatów zorganizowanych z grupą użytkowników w londyńskim biurze Camera Intelligence.
Nowe podejście: 12 konkretnych przycisków zamiast otwartego okna
Na podstawie zebranego feedbacku Camera Intelligence wróciła do punktu wyjścia i zdecydowała, że najlepszym rozwiązaniem będzie bardziej kontrolowane doświadczenie generatywnej edycji.
„Usunęliśmy 'otwarte okno poleceń' i zastąpiliśmy je 12 precyzyjnie zdefiniowanymi przyciskami oraz szablonami. Na przykład jeden z przycisków usuwa ze zdjęć zbędne elementy — to funkcja generatywnego wypełniania, z której korzysta wielu fotografów w Adobe. Mamy też transformacje epok: możesz przenieść zdjęcie do lat 2000., 1980., 1960. czy 1920. Co miesiąc będziemy dodawać jeden nowy przycisk, bazując na sugestiach społeczności" — wyjaśnia Kumar.
Firma sprzeciwia się „AI slop"
Kumar podkreśla, że celem integracji generatywnej sztucznej inteligencji w Caira było wyłącznie dostarczanie przyjemnych i użytecznych dodatków do doświadczenia użytkownika — nie tworzenie fikcyjnych obrazów AI, które mogłyby podważać zaufanie do rzeczywistości.
„Wierzymy, że prawdziwy świat jest piękny i interesujący, a prawdziwe wspomnienia powinny być zachowywane."
„Jesteśmy szczerze przeciwni AI slop" — mówi wprost Kumar. „Jesteśmy jednak gotowi podjąć ryzyko i zbadać możliwości tej technologii. Uczymy się i wprowadzamy zmiany, a naszym zobowiązaniem jest współpraca z klientami i społecznością, która pomoże nam rozwijać tę technologię w pozytywnym kierunku."
Ciekawe artykuły:
Rzeczywiste ulepszenia aparatu Caira
Choć generatywna sztuczna inteligencja przyciąga największą uwagę, zespół Kumara pracuje również nad nowymi funkcjami z zakresu fotografii obliczeniowej, łącząc zalety aparatów z wymiennymi obiektywami i smartfonów w unikalny sposób.
Dyrektor techniczny Camera Intelligence, Liam Donovan, poinformował, że firma dodaje kilka nowych funkcji dedykowanych fotografom — żadna z nich nie korzysta z generatywnej sztucznej inteligencji.
Ukryta mapa tonalna HDR
Pliki JPEG z aparatu Caira zawierają ukrytą mapę zysków, dzięki której są kompatybilne z wyświetlaczami HDR. To funkcja wciąż rzadko spotykana w tradycyjnych aparatach.
Zaawansowany tryb słabego oświetlenia
Nowy tryb słabego oświetlenia łączy serie szybko wykonanych zdjęć z różnymi czasami ekspozycji w jedno ujęcie. Efekt? Redukcja szumów i jakość obrazu dorównująca znacznie większym matrycom.
„Podczas stosowania stackingu nasz aparat nie zamraża wizjera — możesz nieprzerwanie robić kolejne zdjęcia z łączeniem klatek. To możliwe dzięki wydajnemu procesorowi Qualcomm Snapdragon, który jest znacznie mocniejszy niż cokolwiek stosowanego w tradycyjnych aparatach bezlusterkowych" — mówi Donovan.
Dlaczego to rozwiązanie jest przełomowe?
Łączenie zdjęć metodą stackingu samo w sobie nie jest nowością — smartfony robią to od lat. Tym, co czyni Cairę wyjątkową, jest zastosowanie tej techniki z większą matrycą i wymiennym obiektywem. Camera Intelligence ma potencjał, by stać się wzorcowym przykładem tego, co dzieje się, gdy sensor tradycyjnego aparatu połączy się z technologią Qualcomma.
„Całe przetwarzanie w naszych pipeline'ach obrazowania odbywa się programowo na potężnym procesorze Qualcomm Snapdragon. Umożliwia to szybkie aktualizacje i wdrażanie najnowszych technik fotografii obliczeniowej poprzez aktualizacje oprogramowania" — dodaje Donovan.
Super-rozdzielczość i plany na przyszłość
Camera Intelligence planuje dalszy rozwój algorytmu stackingu. Firma pracuje również nad funkcją super-rozdzielczości z ręki, która zwiększy rozdzielczość aparatu z 11 do 44 megapikseli. Funkcja jest obecnie na etapie wewnętrznych testów.
Sztuczna inteligencja bez generowania — sieć neuronowa w służbie autofokusa
„Wiele funkcji aparatu, w tym balans bieli, autofokus i mapowanie tonalne, jest realizowanych za pomocą małych, ale zaawansowanych sieci neuronowych działających w czasie rzeczywistym" — wyjaśnia Kumar.
„Na przykład nasz autofokus używa małej sieci neuronowej do określenia, jak przesunąć obiektyw, aby uzyskać ostrość — zamiast tradycyjnych technik detekcji kontrastu lub fazy. Sieci te są architektonicznie różne od nowoczesnych modeli językowych i nie posiadają żadnych zdolności generatywnych ani halucynacyjnych."
Kumar podkreśla, że Camera Intelligence jest w pełni zobowiązana do zapewnienia, iż całe przetwarzanie na poziomie aparatu jest ściśle przewidywalne i powtarzalne, całkowicie wolne od generatywnej sztucznej inteligencji. Wszelkie funkcje generatywne są w pełni opcjonalne i funkcjonują wyłącznie jako techniki postprodukcji.













